EPIDEMIOLOGIA INTERMEDIA Conceptos y Aplicaciones
Moyses Szklo Profesor de Epidemiolog ia Escuela de Higiene y Salud Publica Johns Hopkins University Baltimore, Maryland
F. Javier Nieto Profesor y Jete de Departamento Ciencias de la Salud Poblacional Escuela de Medicina Universidad de Wisconsin Madison, Wisconsin
I
EPIDEMIOLOGIA INTERMEDIA Conceptos y Aplicaciones
Tr.. ducci6n ; Luis Carlos Silva Ay,aguer Doctor en Ciencias Matematicas. Investigadm Titular. In.tituto Superior de Ciencia. M&lica;. La Habana . Cuba. Rosa Jim~nez P~neque Doctora en Ciencia. M&lic~ •. E'r...ci~li,ta en Bioestadi.tic~ . Hospit~1 Hermanos Ameijeira,. La Haban~ . Cuba.
Tflulo original: Reservados tOOos los derechos. «No esta permit ida Ia reproducci6n total 0 parci~1 de este libro, ni su trutamienlo informatico. ni Ia transmisi6n de ninguna forma 0 ror cual'luier medio. ya SCa electronico. mednico por fotocopia. por registro u otros metOOos. si n cl permiso previo y por escrito de los tilUlares del Copyright.
c Edicione. Diaz de Santos. S. A. Juan Bravo. 3-A. 28006 Madrid E'pana Internet: http: / www.diazdesanto •.es/ediciones E-Mail:
[email protected] ISBN ; Dep6sito legal: M. Discno de cubierta: Angel Cal\"Cte Fotocomposicion: FER. S . A. Impresion: Edigrafos. S . A. Encuadernacion: Riistica-H ilo IMPRESO EN ESPANA
A Hilda y Marion
CONTENIDO
xxi xx iii . . xxvii
Presentaci6n . . Prefacio . . Reconocimientos PARTE I
I NTRODUCCI6N
CAPITULO I Los disefios basicos de estudios en epidemiologia analitica 1.1. Introd ucci6n: Epidem iolog fa analftica y epidemiolog fa descri ptiva . . 1.2 . Analisis del efecto de la edad, la cohortc de nacimiento y el periodo . 1.3 . Est udios eco16g icos . . . . .. . .. . . .. . .. . .. . 1.4 . Est udios basados en los individuos como unidades de observaci6n . . 1.4 .1. Estudiode cohonc .. .. . .. . .. . . .. . .. . .. . 1.4.2 . Estudios de casos y comroles . . . ..........
3 3 4 15 20 21 25
ESludio de casos y confroleJ" basado ell los casos E.~·tlldios de casus yconrroles dellfro de /lila collO rfe
26
(Jefi nida . . . . . . . 1.4.3. Estudios transversales . . 1.4.4. Disefio Caso-C ruzado . . . 1.4 .5. El emparejamiento EI emparejamienlO en los e.l'tudios de casm-commles y de co/wrle. TijJOJ'de emparej amiellfO .. . Vellraj u.\" y desvellraja.\" del emparejamiellfO . . Bibliograffa ....... ....... .......
29 33 35 35 36 36
38 42
PARTE II MEDlCI6 N DE LA OCURR ENCIA DE ENFERMEDADES Y DE LA ASOCIACI6 N ..
45
CAPITULO 2 Medici6n de la ocurrencia d e la enfermedad . . . 2 .1. Introducci6n: Elementos ba.sicos de inferenc ia epidemiol6gica definici6n y comeo de los resu ltados de la enfermedad 2 .2. Medidas de incidencia . . .. . .. . . .. . .. . .. . 2.2. 1. Incidencia basada en individ uos en riesgo .. . /ncidencia aeulllu/(jda basuda en el enJoque de tabla.\" de vida por intervalos (tabla.\" de vida ehisica.l') . . . . . ....... /ncideneia aeumulalia basada en el enJoque de Kaplan -Meier (eventos de riellljJo.\ exacto.\) . .. . .. . Sl/jJue.l'to.l' ell la e.l'rilllaei611 de fa ineideneia ael/IIII/fada basada en el amilisis de .wperviveneia . . .. .
47 47 49 49 51
53 55
x
CONTENlDO
2.2 .2 . Tasa de incidencia basada en tiempo-persona .. . .. . Tasa de incidellcia ba.wuia ell daros agregado.\· . . .. . Densidad de incidencia basada ell datos intiivitiuales . . SlIposiciones para la estimaci6n de las rasas de incidencia basadas en (iempo-persona . .. . .. . . .. . .. . .. . Relaci6n entre la densuiad (basada en datos individua/e.\) y rasa (basada ell datos agrupados) . .. . .. . .. . E.\·rrariJicaci6n de los tiell/pas-persona y rasas de aeuerda al (iempo de segllimienfo y covariable.\" 2.2.3 . Comparacion entre medidas de incidencia .. . 2 .2 .4 . La tasa de riesgo instantaneo 2.3 . Medidas de pre valencia .. .
2 .4 . Odds Bibliog raffa .. .
CAPITULO 3 Medici6n de asociaciones entre exp osiciones y d esenlaces 3 .1. Introd ucci6n .. .. . .. . .. .. . .. .. . .. . .. . 3 .2 . Med ici6n de asociaciones en un estudio de cohorte 3 .2 .1. Riesgo relat ivo (Razon de Riesgos) y Odds Ratio 3 .2 .2 . RiesgoAtribuible . .. . .. .. . .. . .. . Riesgo Atribuible en Indi viduoJ· £~puestos (RA ,~p) . . RA,~p porcentllal . . . . . . . . . . . . . . . . . .. . .. . .. . Riesgo Atribllible Poblacional de Levin . .. . .. . 3.3 . Estudios de cone transversal: estimacion punt ual de la raz6n de tasas de prevalencia 3 .4 . Medicion de la asociac ion enest udios de casas y controles . .. . 3 .4 .1. Odds Ratio . .. . .. . . .. . .. . . .. . .. . Odds ratio en estlldios de casos y commIes elllparejados Odd.\· ratio COIIIO IIlIa estilllaci6n del riesgo relativo: eI sllpllesto de baja prevalencia ... ......... .......... ......... . Inflilencia del marco lIlue.\·tral para la J·elecci6n de commIes sobre la estimaci6n de parametroJ· mediante eI oddJ· ratio de la eJ.posici6n: incidencia aCllmllladafrellte a dem·idad de lIIueJ·treo .. . .. .. . .. .. . .. . .. . . .. . .. . .. . Clilc!llo de los odd.\· ratio c!lando hay mas de dos categorfas lie eJ.posici6n . . .. .. . .. .. . .. . .. . . .. . .. . 3 .4 .2 . Riesgo atrib uible en estudios de casas y controles . . 3 .5 . Evaluacion de la fuerza de las asociaciones . .. . .. . .. .. . .. .. . .. . .. . Bibliograffa .. .
58
59 60
62 63 65 71
73 73 75 76
79 79 79 80
85 86 86 88
92
92 92 96 %
100
102 102 103
105
P ARTE III AMENAZAS A LA VA LIDEZ Y PROBLEMAS DE INTERI' RETAC I6N
107
CAPITULO 4 Falta d e validez: S esgo
109
4 .1. Generalidades 4 .2 . Sesgo de selecci6n .. . .. .
109 11 2
CONTENIDO
XI
4.3 . Sesgo de informacion ....... ....... 4.3 .1. Sesgo en la identi ficac ion de la exposic ion . . Sesgo de reCilerdo .. .. . .. . .. . SeJ·go del elltreviJ·rador . .. . .. . 4.3.2. Sesgo de identi ficadon del desenlace Se.\·go del observador .. . .. . .. . Se.\·go del que responde . .. . .. . 4.3.3. EI resu ltado del sesgo de informaci6n : el error . .. . .. . de c1asificacion Error de clasificaci6n 110 diferencial ....... Error de clasificaci611 liiferellcial . . ....... Efecto del error de clasificaci6n de ulla variabie confusora Prevenci6n del error de dasificaci6n .. . .. . 4 .4 . Sesgo de informacion!selecci6n combinados .. . .. . 4 .4 .1. Sesgo de vigilancia medica (0 de detecci6n) 4.4.2. Sesgos t ransvers ale~ . .. . .. . Se.\·go de incidencia-prevalellcia Sesgo temporal ....... 4.4.3. Sesgos relacionados con la evaluaci6n de las intervenciones de tam izaje . .. . .. . .. . Se.\·go lie selecci6n .. .. . .. . Se.\·go de illcidellcia-prevaiellcia Se.\·go de anricipaci611 en eI diagll6stico 4.5. Sesgos al comunicar los resultados del estud io : sesgo de publicaci6n Bibliograffa
117 118 11 9 120 122 122 123
CAPITULO 5 La identilicacion de asociaciones no causales: confusion 5 .1. Introduccion . . .. . . .. . .. . . .. . .. . .. . 5 .2. La naturaleza de la asoc iadon entre el confusor, la exposic ion y el desenlace . .. . .. . . .. . .. . .. . 5.2. 1. Regia general . . . .. . .. . .. . 5.2.2. Elementos de la regia general para la defi nic ion de la presencia de confusi6n .......... .......... ........ «La variable de confusion esta causalmente asociada con e l desenlace» . .. .. . .. . «EI desellillce eJ·1li asociado, casualmellte 0 no, COli la eJ.pOJ"ici6n» .. .. . .. . .. . .......... «Pero 110 es ulla variable intermedia en ia cadena callsal entre ill eJ.posici611 y eI desenlace» . . .. . .. . 5.2.3. Excepc iones de la reg ia general para la presencia de confusi6n .. . . .. . .. . .. . . .. . .. . .. . «Confllsi611» debida a asociaciolles aleatorias . . El «confusor» como variable illten lledia ell la cadella causal lie la relaci6n entre exposici611 y deJ·elllace . . . . . Correlaci611 excesira entre eI ("ollji/sor y la exposici611 de inreres . . .. . . .. . .. . .. . . .. . .. . .. .
ISS ISS
123 123 129 132 133 134 134 136 136 139 14 1 14 1 142 144 149 lS I
157 157 159 159 160 160 16 1 16 1 162 164
XII
CONTENlDO
5.3 . Evaluaci6n de la presencia de confusion . . . .. . .. . 5.3 .1. i,Esta relacionada la variable de confusi6n con la exposici6n y con e l desen lace de l proceso estudiado? . . . .. . .. . .. . 5.3 .2 . i,T iene la misma direcci6n e identica magnit ud la asociaci6n exposici6n-desenlace observada en el analisis crudo que las asoc iaciones observadas dentro del estrato de la variable confusora? . .. . .. .. . .. .. . .. . .. . . .. . .. . 5.3.3 . i. Tiene la asociaci6n exposicion-desenlace observada en el analisis cmdo idemica direcci6n y magnitud a la observada des pues del control (aj uste) por la variable confusora? . . 5 .4 . Elementos adic ionales relacionados con la confusion . . .. . 5 .4 .1. La importancia de utilizar diferentes estrategias para evaluar ....... la confusion .. . .. .. . .. .. . .. . .. . 5 .4 .2 . La confusion no es un fenomeno de «Iodo 0 nada~) . . . .. . .. . 5 .4.3 . Confusion residual . . . . . . . . .. . .. . 5 .4 .4 . Tipos de efec(Os de confusion : confusion negativa, posit iva ............. ....... y «cualitativa>, 5 .4 .5 . Signifi cadon estadfstica en la evaluac ion de la confusion 5 .4 .6 . Confusion condidonal 5 .4 .7 . Confusion y sesgo .. . .. .. 5 .5 . Concl usion Bibliog raffa .. .
CAPITULO 6 Definicion y eVlllullcioll de III heterogeneidlld de erect os: Interaccion . .. . .. . 6 .1. Introd ucd6n .. .. . .. . .. .. . .. .. . .. 6 .2 . ~C6mo se mide el efec(O? . . . . . .. . .. 6.3 . Estrategias para evaluar la interacd6n 6.3 .1. Evaluad6n de la homogeneidad de efectos . . Defeccion de interaccion adifivu : la diferencia absolufa . .. . .. . .. . o lIIodelo de riesgo atribllible . . .. . Defeccion de interaccion IIIl1lfiplicativa: la diJerencia relativa ....... o lIIodelo lie razon .. . .. .. . .. . .. .
6 .3 .2 . Comparacion de efectos conj umos observados yes perados Defeccion de interaccion adifiva : la diferencia absolufa . .. . .. . .. . o lIIodelo del riesgo atribllible . . Defeccion de interaccion IIIl1lfiplicariva: la diferencia relativa ....... o eI lIIodeio de razon . .. .. . .. . .. .
6.3.3 . Ejemplos de evaluacion de interaccion en un estudio ....... ....... de cohorte . . . . . . . . 6 .4 . Evaluacion de la interacd6n en estudios de casos y comroles 6.4 .1. Evaluaci6n de homogeneidad de efectos . .. . .. . 6 .4 .2 . Comparacion de efectos conj umos observados yes perados Defeccion lie interaccion adifiva .. . Defeccion lie interaccion IIIl1lfiplicariva
6 .5 . Mas acerca de la intercambiabilidad de las defin iciones de interaccion
166 167
168
169 172 172 173 174 175 177 178 178 18 1 182
183 183 184 184 184 186 188 189 189 192 193 195 196 198 198 20 1
203
CONTENI DO
~Cu aJ es el modelo relevante?: Interacci6n aditiva frente a interaccion mu ltiplicativa . . . . . ....... .......... 6 .7. La naturaleza y rec iproc idad de la interacci6n . . .. . 6.7. 1. Interacci6n cualitativa frente a interacci6n cuant itativa 6.7.2. Reci procidad de la imeracci6n . . ....... 6 .8. Interaccion, efecto de confusion y aj uste .. . .. . .. . 6 .9 . Modelaci6n estadfstica y pruebas estadfsticas para la interacc i6n 6.10. Interpretaci6n de la interaccion .. . ....... 6. 10 .1. Heterogeneidad debida a variabilidad aleatoria 6. 10 .2. Heterogeneidad debida a la confusi6n . . .. . 6. 10 .3. Heterogeneidad debida al sesgo .......... 6. 10 .4 . Heterogeneidad debida a la intensidad diferencial delaexposicion . . . .. . .. . .. . . .. . .. . 6. 10 .5. Interacci6n y fac(Qres del huesped 6.11. Imeracci6n y busqueda de nuevos facto res de riesgo en grupos de bajo riesgo ....... .......... . .. . .. . .. . 6.12. Imeracci6 n y «representat iv idad» de las asociaciones Bibliograffa ....... ....... . .. . .. .
X I[[
6 .6 .
PARTE
204 206 206 208 209 2 11 2 11 2 12 2 12 2 14 2 14 2 15
216 218 2 19
IV
EL DESAFio DE LA VALIDACI6N
Estratilicaci6n y ajuste: Amllisis multivariante en epidemiologia .......... . .. . .. . Introducci6n . . .. . ....... . .. . .. . .. . Tecnicas de estratificaci6n y ajuste para resolver el problema de la confusion .. . .. . . .. . .. . .. . 7.2. 1. ESlratificaci6n y ajllste: supues(Os . . Me(odos de aj uste basados en la estratificaci6n . .. . .. . .. . 7.3. 1. Ajuste direc(o . . 7.3.2. Ajuste indirecto . .. . .. . 7.3.3. Metodo de Mante l-Haenszel para ajustar la estimaci6n de una med ida de asociaci6n . .. . .. . Razon de tasa.\· ajusradas seglin Mantel- Haenszel . . . M etoda de Mamel- Haem·zel y el odds rat io para daro.\· de casos y commIes emparejados . .. .. . .. . 7.3.4. Limitaciones del aj uste con metodos basados en la estratificaci6n .. .. . .. . Tecnicas de regresi6 n multiple para el ajuste .. . 7.4. 1. Regresi6n lineal: Conceptos generales .. . 7.4.2. Regresi6n lineal mult iple .. . 7.4.3. Regresi6n logfstica mu ltiple 7.4.4. Modelo de riesgos proporcionales de Cox 7.4.5. Regresi6n de Poisson .. . .. . .. . 7.4.6. NOla sobre modelos para e l an
22 1
CAPITULO 7
7 .1. 7 .2 .
7.3 .
7 .4 .
223 223 223
228 229 229 235
238 240 240
242 244 245
252 258 265 269
27 1
XI V
CONTENlDO
7.4 .7. Modelaci6n de las relaciones no lineales con modclos de regresi6n lineal .. . .. .. . .. . .. . ....... Usa de variables indicadams (dummy) . . .. . .. .
275 277
Teenicas alfernarivas IJa ra fa motielaci6n de asociaciones
lineale.\" . .. . .. .. . .. .. . .. . .. . . .. . .. . 7.4 .8. Pmebas estadisticas e imervalos de confianza para las esti maciones de la regresi6n 7 .5 . Ajuste incompleto: Confu si6n resid ual 7 .6 . Sobreaj ustes ....... 7 .7 . Conclusion . . ....... 110
7.7.1. Selecc i6n del modelo estadfstico correcto Bibliog raffa .. . .......................
C APITULO 8 Aseguramiento y control de la calidad
8 .1. Introducci6n .. .. . .. . .. .. . .. .. . .. . .. . 8 .2 . Aseguramiemo de la calidad .. .. . .. . .. . 8.2.1. Protocolo del est udio y manuales de operacion . . 8.2.2. Instrumentos para la recolecci6n de los datos 8.2.3 . Entrenamiento del equipo de investigadores 8.2.4 . Estudios pilolO y pruebas previas . . . 8.3 . Control de calidad . .. . .. . . .. . .. . 8.3.1. Verificac ion de las observaciones y valoraci6n de las tendencias . . . . . . . . . . . . . . . . 8.3 .2. Estudios de validez . . . . . .. . .. . .. . !ll ezclas estalldarizadas para mediciones de laboratorio ............. Dtros enfoques para naminar la validez Disponibilidad y validez de los dato.\· de e.\·tudio.\· previo.\· Importancia y limitacione.\· de 10.\· e.\·rudio.\· de validez 8.3.3 . Estudios de fiabilidad . . . . . . . . . . . . .......... 8.4 . indices de validez y fiab ilidad . . . . . . . . . . . .......... 8.4 .1. indices de validezlfiabilidad para datos categ6ricos Semihilidad y especiJicidad El estadfstico J de YOllden . . .. . Po rcenraje de aCi/erdo .. .. . .. Po rcenraje de aCllerdos posirivo.\· E.\·tadfstico kappa. . . . . . . . . . . Kap/Ja IJonderado . . Dependencia de kaPIJa de la prevalencia 8.4 .2. indices de validez y fi abilidad para datos continuos Gr(ijico de correlaci6n (Diagrama de dispersi6n}.. . Coejiciente de correlaci6n lineal, Correlaci611 de rall1;0.\·, ....... Regresi6n lineal .. . Coejicienre de correlaci6n intraclcisico Diferencia media y prlleba ( pareada Coejicienre de variahilidad Grcijico de Bland-Altman . . . . . . . . .
28 1
284 285 288 288 292 293
297
297 299 300 30 1 30 1 302 303 303 304 305
306 307 307
309 3 13 3 13
3 13 320 320
324 324 327
332 335
336 338
342 343 344 345
CONTENI DO
8 .5. Regresion a la media Bibliograffa . .. . .. .
COMUNI CACl6N DE RESULTADOS
xv 346 347
PARTE V ....... ..................... .
351
La comunicaci6n de los resultados de la investigaci6n epidemiol6gica 9 .1. Introduccion . . .. . ....... . .. . .. . .. . 9 .2. Que com unicar .. . . .. . .. . .. . 9.2. 1. Objetivos del est udio y/o hip6tesis que se desarrollan durame su concepci6n . . .......... . .. . .. . .. . 9.2.2. Descripcion de la validez y la fiabilidad de los instmmentos para la recolecci6n de datos ....... . .. . .. . 9.2.3. Razonamiento para la selecci6n de las variables confusoras . . 9.2.4. Criterios para Ia seIecci6n de puntos de corte cuando se establecen categorfas para variables cominuas u ordinales 9.2.5. Datos no modelado~ y parsimon iosamente modelados fre nte a completameme modelados 9 .2.6. Evaluaci6n de la inleracci6n . .. . 9 .3. Como comun icar . . . .. . .. . 9.3. 1. Evitar la arrogancia cientffica .. . 9.3.2. Evitar la verbosidad 9.3.3. Faci litar la leclUra . .. .. . .. . M etOl/OS Y resulfado.~ 9.3.4. Realizar inferencias apropiadas La presencia de /lIW a.wciaci6n (mil/que sea eJ·rad6·ficamenfe significuriva) /10 rejleja lIecesariamente cau.wlidad La sigllificaci6n eSfadfsrica no es tllla medida de lafuerza lie IIna asociaci6n . . . . . . . . . . . . . .. . .. . .. . La magnirud de 10.\· eJ·rimadore.\· de la asociaci611 de la.\· disrinta.\· variables pilule 110 ser direclamellre comparable 9.3.5. Tablas y figuras Tablas . . Figuras 9.4. Conclusiones . . Bibliograffa
363 364 364 366 37 1 372
Errores estandar, intervalos de confianza, y pruebas de hip6tesis para medidas seleccionadas de riesgo y de osocioci6n Contenidos . .. . .. . .. . Introduccion . .. .. . .. . . .. . .. . .. . A.1. Estimaci6n de supervivencia acumu lada Varianza y error estandar (formu la de Greenwood) Intervalo de confianza aI 95% . .. . .. .
375 375 375 377 377 377
CAPITULO 9
353 353 353 353 355 356
357 357 35 8 358 358 358 359 360 360 360 36 1
APENDICE A
XVI
CONTENlDO
A.2. Tasa de incidencia (por persona tiempo) Intcrvalo de confianza al 95% . .. . .. . A.3. Riesgo relativo y raz6n de tasas .. . .. . Riesgo relat ivo (raz6n de probabilidades) Error csflintiar . .. . .. . Infervalo de conjiullZu af 95% . .
Prucha de hil'orc.I'is .. . Ejcmplo . .. .. . .. . .. .
Raz6n de tasas (raz6n de densidades de incidencias) . . Infervalo de cOl/jiuuza a195% . . .. . .. . Pruchas de hiporcsiJ" . .. . .. .. . .. . .. .
A.4. Odd.\" ratio (emparejados y no emparejados) Estud io de casos y controles no emparejados Error esflindar . .. . .. . infer valo de confiullZu af 95% . . .. . .. .
Prucha de hiporesis .. .. . .. .. . .. . .. . Estudio de casos y controles emparejados Error esflindar . .. . .. . infer valo de conjianza al 95% . . Prueba de hil'ofesis .. .
A.5. Riesgo atribu ible Riesgo atribuible en expuestos Riesgo atribuible porcentual en los expuestos (%RAoxp) Riesgo atribuible porcentual en la poblaci6n (%RApob) Error esflindar . .. . .. . Infer valo de conjianza al 95% . . .. . .. . Prueba de hil'ofesis .. .. . .. .. . .. . .. .
A.6. Diferenda entre dos tasas ajustadas 0 probabilidades (metodo directo) Error esflindar . .. . .. . Infer valo de conjianza al 95% Prueba de hil'ofesis .. .
A.7 . Raz6n estandarizada de mon alidad Minima va riunza esflindar infervalo de conjianza al 95%
A.8.
Odd.~· rafio.~·
de Mantel-Haemzel (y raz6n de tasas)
Error esflindar . .. . .. . Infer valo de colljiallza al 95% . . P/"lleba de hil'ofesis .. .
A.9. Coeficiente de regresi6n .. . .. .. Infer valo de conjiunza al 95% . . P/"lleba de hil'ofesis Regresi6n lineal .. . .. . Regresi6n /ogfsfica . . . .
Estadfstico de Wald para la interacci6n A.iO. Sensibilidad, especificidad y porcentaje de acuerdo Error esflindar, infervalo de conjianza al 95% Sensibilidad .. . .. . .. . ESl'ecijiciliad . . .. . Porcentaje de ao/erdo .. . .. . ,
378 378 379 379 380 380 380 38 1 38 1 38 1 382 383 383 383 383 384 384 385 385 383 384 384 384 384 385 385 385 388 388 389 389 390 390 39 1 39 1 392 392 393 393 393
394 394 395 395 395 396 396 396
CONTENI DO
A .1I . Estad fstico J de Yo uden Error estandar, intervalo de confianza A.1 2. Kappa . .. .. . .. . .. . . .. . .. . .. . Error estandar e imervalo de co nfi anza al 95% Bibliograffa ....... . .. . .. .
APENDICE B l'ruebas de tendencia (dosis-respuesta) Eje mplo . . . . .. . .. . . .. . .. . .. . Notas . . .. . Prueba multivariada de tendencia Bibliograffa
APENDICE C l'rueba de homogeneidad de estimados estratificados (prueba de interaccion) . .. . .. . Ejem plo : pmeba de homogene idad de OR eSlralificados Bibliograffa ....... ....... . .. . .. .
APENDICE D Manual de procedimientos para el aseguramiento de la calidad y control de la calidad de las mediciones de presion arterial y la recoleccion de orina y sangre en el estudio ARIC to . • • . • • . • • . . •• . •• . Tension anerial sentado ....... . .. . .. . I . Breve descri pci6n de los proced im ientos para la medic i6n de tensi6 n arteria l sentado y med idas relacionadas para el . .. ... . aseguramiento de la caUdad y control de caUdad . 2 . Mantenim iento de l equipo . .. . .. . 3 . Control de l desem pefio de l tecnico por pane del centro cl fnico . . . 4 . Recogida de los datos de identificaci6 n del part icipante . .. . .. . . 5 . Med ici6n de la circun ferencia de l brazo y selecci6n del manguito de tensio n arterial .. .. . .. . .. . ....... . .. . .. . 6 . Postura del part ici pante y descanso antes de la med ici6n de tensio n arterial .. .. . .. . .. . . .. . .. . 7 . AnaUsis del control de caUdad del centro coordinador . . Reco lecci6 n y procesamiemo de sangre y orina .. .. . .. . .. . 1. Breve descripci6n de la reco lecci6 n y procesamiento de sangre y las medidas relacionadas con el aseguramiemo de la caUdad y control de la calidad . . .. . .. . 2 . Mantenim iento de l equipo 3 . Adhesi6n de los panici pantes al protocolo 4 . Mantenimiento de la suficienc ia 5 . Observacion peri6dica .. .. . .. . 6 . EI fonn ulario de laboratorio .. . 7 . Datos repUcados de control de caUdad 8 . AnaUsis de los datos de veni puntura y procesamiento . .. . .. . para control de calidad . .. . .. .
XVII
397 397 397 397 399
40 1 402 402 404 404
405 406 407
409 409 409 4 10 4 10 4 11 4 11
4 12 4 12 4 12 4 12 4 13 4 13 4 14 4 14 4 14 415 415
XVIII
CONTENlDO
9 . Muestras de paq uetes para el embarque a los laboratorios . . . . . . . . . . . . . . . . . . .......... ..... 10 . Descripci6n de la recolecci6n y del procesam iento de orina y medidas relacionadas para el aseguramiento de la calidad y el control de la calidad . . . . . . . . . . . . II. Preparaci6n de las muestras para control de calidad 12 . Programa del control de calidad de la orina . .. . .. . 13. Requerimientos de control de calidad de la muestra 14 . Fonn ularios de laboratorio y fantasma 15 . Preparaci6n de la muestra . . . . . . . . . . . 16 . Procedimiento para muestras pequefias 17 . Instmcciones de almacenamiento . . .. . 18. Aseguramiento de la calidad y control de calidad . .
E Calculo del coeficiente de correlaci6n intraclasico Analisis de la varianza Metodo de Deyo Bibliograffa
4 16
4 17 4 17 4 17 4 17 4 18 4 18 4 18 4 19 4 19
APENDI CE
42 1 42 1 42 1 42 1
I NDIC E
425
.. . .. .
PRESENTACION
El papel de la epidemiologfa, los conceptos que maneja y los mNodos con que opera han venido recibiendo creciente atenci6n y reconocimiento, tanto por parte de personas procedentes de la medicina academica y las agendas gubemamentales, como de la industria y e l mundo de la polftica . ES(Q ha dado lugar a la publicaci6n de nLl merosos libros y a la aparicion de abundantes programas para graduados, incl uyendo media docena de C lIfSOS de verano. Tales esfuerzos se orientan a mejorar la preparacion de estudiantes y personal de la salud publica y la medic ina y se proponen sat isfacer lIna notable demanda practica al proveerlos de las habilidades y los conoc imientos necesarios para desempefiarse en esta materia. Hay vados libros sobre epidemio logfa de nivel introducfQrio y tambien textos dedicados a areas especfficas de aplicaci6n; pero hay pocos libros de nivel avanzado. Este volu men de Epidemiologfa inlermedia: conceptos y aplicacione.~· resulta en este contexto significat ivo, p uesto que procura cubrir una lag una de larga data y q ue reclama la existencia de un libro de nivel intermedio. En este libro usted adquirira conocimientos acerca de estud ios de cohone yestudios de casos y controles anidados, anaJisis de cohone de recien nacidos, estudios ecol6gicos, incidencia acumu lada. medidas de asociaci6n, confusi6n, interacci6n, medidas de fiabilidad y validez, y muchas noc iones conexas. Hallara una ex pl icacion clara sobre las diversas formas que puede asumir el sesgo, fen6meno tan frecuentemente encontrado en epidemiologfa, y de las diferentes maneras para evitar 0, al menos, mitigar sus efectos de manera efect iva . Conceptos complejos como la confusi6n, las interacciones y la modelaci6n estadfstica se presentan de manera tal q ue se toman no solo faci lmente comprensibles sino tambien diffc iles de o lvidar, 10 cual se consigue mediante e l uso flexib le y expresivo que hacen los autores de graficos y diagramas, el manejo oportuno de ejemplos y el empleo de una redacci6n clara. EI lector oblendra buena comprens i6n de los mdodos epidemiol6gicos y del fmct uow papel que e llos desempefian en las ciencias medicas y la salud publica. EI profesional de la salud del fut uro necesitara tener una amplia comprensi6n de aspectos metodol6gicos, asf como una capacidad crftica en lomo a su aplicaci6n adecuada con la fina lidad de investigar la causa de la enfermedad y desarrollar y evaluar estrategias de intervencion . Si eI propOsito es hallar la causa de la enfermedad, evaluar e l impacfQ de un programa en e l estado de salud de la poblaci6n 0 desarro llar una polffica apropiada, la epidemiologfa es la c iencia que corresponde emplear, Michel A.lhrahim, MD, PhD Profnor de t'J!idemiologra y Medicina Social Unil'CfJidad de North Carolina at Chapel Ifill Chapel Ifill, North Carolina
PREFACIO
Este !ibro fue concebido como un tcxto de epidemiologfa intermedia . Como taL explora y discute conceptos y metodos claves de la epidemiologfa con mayor profund idad que la que predomina en lexlOS basicos de esta materia . Como texto dedicado a metodos intermedios. el li bro aspira a comar con una ampli a garna de lcctores potencialmente imeresados. Algunos seran estud iantes de e pidem iologfa q ue pueden emplearlo como un puente e ntre los metodos e pidem io16gicos basicos y los mas avanzados . Tambien puede abarcar a quienes procuran Icner un conocimiento avanzado. mas ali a de los princi pios epidemiol6gicos basicos y de los me!Odos mas simples pero que no tienen la versaci6n estadfstica nccesari a para comprender alguno de los texlOs sobre epidemiologia q ue. siendo excelemes, pueden resultar para ellos demasiado «matematicos» . Aunque la demostraci6n de m uchos conceptos y metodos e pidem iol6gicos han de descansar ineludiblememe en fonn ulaciones estad fsticas, en este li bro tales formu laciones estan extensameme apoyadas en ejemplos de la vida reaL con 10 que se imenta faci litar e l proceso de comprens ion a traves de la imuici6n . Por su parte, e l epidemi610go pni.ctico tambitn puedc hallar zonas sclcccionadas dc cste libro que resulten titHes para comprender nociones que van mas alia de 10 basico . Asf. los rasgos com unes de los lectores a quienes se dirige e l texto son: la fam ili aridad con las estrategias fundamemales de la epidem iolog fa analftica y el deseo de incrementar e l nive l de dom inio de diversas nociones q ue son cubiertas de manera mas 0 menos insuficiente en muchos libros de texlO basicos. La manera en q ue se o rgan iza e l li bro debe comribuir a q ue se comprenda faci lmente 10 q ue acaba de expresarse . En el Capitu lo I se revisan las estrategias basicas de investigaci6n epidemiol6g ica en e l marco observac ional, inc luyendo tanto las que se ocupan de est udios de grupos como de individuos , Aunque la epidemiologfa descri ptiva no constituye el centro del libro, los analisis de cohortes generacionales se disc uten con alguna profundidad en este capitu lo, puesto que se (rata de un enfoque escasamente abordado en detalle en los libros basicos , Un rec urso que se ubica en la fromera entre la epidemiologia analftica y la descriptiva, los estudios ecol6gicos, se examina desde una perspectiva mas abarcadora q ue la mera discusi6n sabre la posibilidad de comeler un sesgo inferencial (ecoI6gico) . A cominuaci6n, e l capitulo examina los est udios obscrvac ionalcs donde las unidades dc obscrvaci6n son los individuos - esto es - , estud ios de casos y controles y de cohorte . Se revisan dife rentes disefios de estudios de casos y comroles (basados en casos. est udios de casos y comroles dentro de una cohone defin ida). Tambien se considera brevememe la estrateg ia de realizar emparejamiemos como procedimiento para lograr por antic ipado una colecci6n de datos comparables .
XX II
PR EFACIO
Los Capftulos 2 y 3 cubren aspectos relacionados con las maneras de cuamificar la frec uencia con que se producen los desenlaces ' de los procesos estudiados y de medi r la asociacion . En el CapItu lo 2 se estud ian las medidas absolutas de la frec uencia de los desenlaces y los metodos de calculo correspondientes, 10 cual incl uye el enfoque de persona-tiempo para e l d lculo de la densidad de incidencia y el calcu10 de la incidencia acumu lada. tanto por e l metoda de las lablas de vida clasicas como por el de Kaplan-Meier. EI Capitulo 3 aborda el lema de la medicion de la asociacion; en especial se ocu pa de las medidas que se basan en dife rencias re lalivas (por ejemplo. riesgo relativo y odds ratio!) y diferencias absolutas (riesgo atri buible). Se pone enfasis en e l ex amen de la conexion ex istente entre medidas de asociacion oblenidas en estudios de cohorte y estudios de casos y comroles . En particular. se da una descripcion de las dife rentes medidas de asoc iacion (es decir, odd.\· ratio. riesgo re lativo y razon de riesgos) que pueden obtenerse med iante est udios de casos y controles como una funcion de las estrategias de seleccion de controles introducidas en el Capitulo I . Los Capltulos 4 y 5 se concentran en el escrutinio de los problemas que amenazan la validez de los estudios epidemiologicos: los sesgos y la confusion . Las forma<; mas comunes de sesgos son objeto de discusion en el CapIt ulo 4. donde se encaran tanto los de seleccion como los de informaciOn . En la discusion de estos Uitimos se exponen ejemplos sencillos con la fina lidad de incrementar la comprension del lector acerca de los fenomenos de clasificacion equivocada 0 erronea, resultantes del hecho de que tan(0 la sensibilidad como la especificidad distan de ser perfectas en los enfoques q ue se emplean para evaluar la exposicion. los desenlaces, y/o la<; variables de confusion . Este capItulo tambien recoge una discus ion acerca de sesgos Iransversales y sesgos asoc iados con la evaluacion de procedimientos de cri bado: con respec(O a estos Liltimos se ofrece un rec ufSo simple para est imar e l sesgo de tiempo (lead tillle bias), potencialmente uti! para qu ienes estan envueltos en estudios de evaluacion de este tipo . En e l Capitu lo 5 se introduce el concep(O de confusion y se desarrollan diversa<; altemativas para evaluar su presencia . Se consideran asimismo a<;pectos especiales relacionados con este importante concepto, en especial e l de confusion resid ual y el papel de la significacion estadlstica para la evaluacion de los efectos de confusion . La interaccion (modificacion de efectos) se aborda en e l CapItu lo 6. donde e l concepto se discute poniendo enfasis en un enfoque pragmatico y en las estrategias para evaluar la presencia de interacciones aditivas y mu ltiplicativas . En este capItu lo se valoran aspectos practicos tales como la pertinencia de realizar aj ustes c uando se sospecha la existencia de imeraccion. aSI como la importancia de los modelos aditivos en el marco de la salud publica . I EI tcrmiJl{} Oil/COllie, cuya tr..!duccion liter..!1 se rfa «resu ltado », por 10 gener..!1 se tr..!duce a 10 largo de este libro como «desenlace», tcrnli no que nos parece mas espccffico y mas acordc al espfri tu del em~leo qu e ti ene en epidcmiologia. para indicar e l modo en que cond uye cierto proceso. (N de los T) - Es preci~o aclar.lr qu e en este libro Se ha oplado por no traduci r al cas tellano algunas pocas expresiones inglesas. Tal es e l caso de odds ratio. Aunqu e se han re alizado propuestas parcialmente atractivas (por ejemplo. «r.lzon de pos ibilidades» 0 «razo n de oportun idades») y a pesar de las difi cu lt ades fonet icas que entr.liia la expre sion ing!esa. hemos optado por JI{} traducirla. Dicha decision se basa en que w nsideramos que la locuci6n ori ginal ha alcanzado difusion tan ex tendida qu e ya const ituye un re fe rente se mant ico incorporado para la mayoria de los leclores y. sobre tOOo. en qu e no hemos conside rado optima ninguna de las altern ativas valoradas. (N de los T )
XX II
PR EFACIO
Los Capftulos 2 y 3 cubren aspectos relacionados con las maneras de cuamificar la frec uencia con que se producen los desenlaces ' de los procesos estudiados y de medi r la asociacion . En el CapItu lo 2 se estud ian las medidas absolutas de la frec uencia de los desenlaces y los metodos de calculo correspondientes, 10 cual incl uye el enfoque de persona-tiempo para e l d lculo de la densidad de incidencia y el calcu10 de la incidencia acumu lada. tanto por e l metoda de las lablas de vida clasicas como por el de Kaplan-Meier. EI Capitulo 3 aborda el lema de la medicion de la asociacion; en especial se ocu pa de las medidas que se basan en dife rencias re lalivas (por ejemplo. riesgo relativo y odds ratio!) y diferencias absolutas (riesgo atri buible). Se pone enfasis en e l ex amen de la conexion ex istente entre medidas de asociacion oblenidas en estudios de cohorte y estudios de casos y comroles . En particular. se da una descripcion de las dife rentes medidas de asoc iacion (es decir, odd.\· ratio. riesgo re lativo y razon de riesgos) que pueden obtenerse med iante est udios de casos y controles como una funcion de las estrategias de seleccion de controles introducidas en el Capitulo I . Los Capltulos 4 y 5 se concentran en el escrutinio de los problemas que amenazan la validez de los estudios epidemiologicos: los sesgos y la confusion . Las forma<; mas comunes de sesgos son objeto de discusion en el CapIt ulo 4. donde se encaran tanto los de seleccion como los de informaciOn . En la discusion de estos Uitimos se exponen ejemplos sencillos con la fina lidad de incrementar la comprension del lector acerca de los fenomenos de clasificacion equivocada 0 erronea, resultantes del hecho de que tan(0 la sensibilidad como la especificidad distan de ser perfectas en los enfoques q ue se emplean para evaluar la exposicion. los desenlaces, y/o la<; variables de confusion . Este capItulo tambien recoge una discus ion acerca de sesgos Iransversales y sesgos asoc iados con la evaluacion de procedimientos de cri bado: con respec(O a estos Liltimos se ofrece un rec ufSo simple para est imar e l sesgo de tiempo (lead tillle bias), potencialmente uti! para qu ienes estan envueltos en estudios de evaluacion de este tipo . En e l Capitu lo 5 se introduce el concep(O de confusion y se desarrollan diversa<; altemativas para evaluar su presencia . Se consideran asimismo a<;pectos especiales relacionados con este importante concepto, en especial e l de confusion resid ual y el papel de la significacion estadlstica para la evaluacion de los efectos de confusion . La interaccion (modificacion de efectos) se aborda en e l CapItu lo 6. donde e l concepto se discute poniendo enfasis en un enfoque pragmatico y en las estrategias para evaluar la presencia de interacciones aditivas y mu ltiplicativas . En este capItu lo se valoran aspectos practicos tales como la pertinencia de realizar aj ustes c uando se sospecha la existencia de imeraccion. aSI como la importancia de los modelos aditivos en el marco de la salud publica . I EI tcrmiJl{} Oil/COllie, cuya tr..!duccion liter..!1 se rfa «resu ltado », por 10 gener..!1 se tr..!duce a 10 largo de este libro como «desenlace», tcrnli no que nos parece mas espccffico y mas acordc al espfri tu del em~leo qu e ti ene en epidcmiologia. para indicar e l modo en que cond uye cierto proceso. (N de los T) - Es preci~o aclar.lr qu e en este libro Se ha oplado por no traduci r al cas tellano algunas pocas expresiones inglesas. Tal es e l caso de odds ratio. Aunqu e se han re alizado propuestas parcialmente atractivas (por ejemplo. «r.lzon de pos ibilidades» 0 «razo n de oportun idades») y a pesar de las difi cu lt ades fonet icas que entr.liia la expre sion ing!esa. hemos optado por JI{} traducirla. Dicha decision se basa en que w nsideramos que la locuci6n ori ginal ha alcanzado difusion tan ex tendida qu e ya const ituye un re fe rente se mant ico incorporado para la mayoria de los leclores y. sobre tOOo. en qu e no hemos conside rado optima ninguna de las altern ativas valoradas. (N de los T )
PREFACIO
XXIII
Los ultimos tres capltulos se destinan a examinar alternativas para manejar las asechanzas que se ciernen sobre la validez de los resultados epidemiol6gicos. En el Capitulo 7 se presentan estrategias para el ajuste de los factore s de confusion. incluyendo tanto los enfoques mas parsimoniosos (por ejemplo, el ajuste directo, el de Mantel y Haenszel) como los mas complejos (por ejemplo. regresi6n multiple). Nos detenemos en la selecci6n del metodo mas acorde para el est udio que se lleva adelante teniendo en c uenta el disefio e mpleado (por ejemplo. el metodo de riesgos proporcionales de Cox para el an.i.lisis de datos de supervivencia 0 la regresi6n de Poisson para el analisis de tasas por personas-tiempo). EI Capitulo 8 contempla las estrategias fundamentales para el control de calidad en funcion de la prevencion y del control de los errores de medici6n y los sesgos, asf como los enfoques cualitativos y c uantitativos apropiados para el control de la calidad . Se consideran asimismo las estrmegias analftica s mas frecuentemente empleadas para estimar la validez y la fiabilidad de los datos obtenidos en los estud ios epidemiologicos (por ejemplo. coeftciente s de concordancia ponderado y no ponderado y coeficiente de correlacion). Finalmente, el Capitu lo 9 centra la mendon en un asunto crucial : la comunicaci6n de resultados en los est udios epidem iol6gicos . Para subrayar la importancia de que tales infonnes sean claros. se exponen ejemplos de errores que a menudo se presentan cuando se informa acerca de datos epidemiologicos. Tambien se agregan algunos anexos. Los apendices A, B, C Y E describen procedimientos seleccionados de estadistica (por ejemplo. errores estandar y niveles de confianza. pruebas de tendencia. pruebas de heterogeneidad de efectos, correlaci6n intraclase) con la fina lidad de ayudar al lector a evaluar mas detenidamente las medidas de riesgo y de asoc iacion disclllidas en el texto y para comunicar de manera simple algunos procedimientos que no son faci les de hallar en los paquetes estadist icos mas regu lannente empleados tanto por los estudiantes de epidemiologfa . como por quienes emplean esta disdplina con fines practicos . Finalmente. el apendice 0 incluye dos secciones sobre el aseg uramiento de la calidad y procedimientos de control tomados de los correspondientes manuales del Atherosclerosis Risk aflli Com · mllnitie.\" Study (est udio ARIC); estos constituyen ejemplos de aplicaciones en la vida real de algunos de los procedimientos discmidos en el Capitulo 8. Instamos a que los lectores visiten la pagina web creada para este libro (hUp:llpublichealthJbpub.com/epidemiology/szklo) y a que nos envfen por correo electr6nico sus comentarios. Agradeceremos en especial que nos comuniquen los errores que pudieran hallar. las advertencias sobre pasajes no sufici entemente claros y las sugerencias de mejorfa que nos pudieran hacer. Todas las contribuciones significativas seran debidamente reconocidas en la proxima edici6n y cualquier correcci6n a los errores en eI texto sera consignada en dicho sitio.
RECONOCIMIENTOS
Este libro cs un dcrivado del curso de epidcmiologfa intcrmcdia (informa[mcntc cOllocido como «Epi 2») impartido por [os au/orcs en [a Escuela de Salud PUblica de [a Univcrsidad John Hopkins. A [0 largo de los an()s, cl cursu se ha beneficiado del significativo apoyo intclectual brindado por muchos profcsores. Nuestro recollocimiento por clIo abarc a, e nt re olms, a George W. Comstock, Helen Abbey, James Tonascia y Mary Meyer. Los autorcs agmdecc n espccialmcnte a George W. Comstock. mentor de ambos, quicn ha cstado comprometido con cl cursu a [0 largo de muchas dccadas y min com parte [a actividad doccnte con nosotros. Su profundo conocimiento de los metodos cpidemiol6gicos y su sabidurfa han sido de gran valor instrumental a [0 largo de los anos pam nuestro crecimiento profesiona!. EI doctor Comstock tambien nos ha provcfdo amablemente de muchos de los materiales y ejemplos empleados en cl ultimo capitulo de este libro. Los jefes (actual y anterior) de nuestro departamento, Jon Samet y Leon Gordis respectivamente. han apoyado consistenteme nte este empeno, por 10 cualnos sentimos profundamente agmdecidos. Nuestra gmtitud tambicn alcanza a nuestros buenos amigos Alfonso Mele, Paolo Pasquini, Rosa Maria Corona y a otros colegas de la Divisi6n de Epidemiologia dcllnstituto Superior Ita[iano pam [a Sa[ud, quicnes tan amab[cmentc nos pro porcionaron un aporte logistico clave dumnte un ano sabatico disfrutado por uno de nosotros (MS) cuando se bosquejaban [as primeras versiones de algunos capitu[os. Estamos en deuda con varios colegas, incluyendo a Eliseo Guallar, Joseph Coresh y Woody Chambless, quienes leyeron secciones parcia[es del texto y nos dieron orientaci6n pam [a soluci6n de problemas conceptuales 0 estadisticos, y a Michacl Silverberg por su cuidadosa lectum del manuscrito y las fecundas sugerencias editoria[es y sustantivas que nos hizo llegar. Tambien agradecemos a [os revisores, especia[mente a Ana Diez- Rou x y a Eyal Shahar, a quienes [a Editorial Aspen Publishers envi6 una de [as versiones mas tempmnas del texto: nos sentimos en deuda por la laboriosa revisi6n y las criticas y sugerencias nacidas de ese esfuerzo, muchas de las c uales tuvieron un impacto tangible en el texto. Finalmente . expresamos nuestro agradecimiento a Jingzhong Ding por su ayuda en el desarrollo de los grMicos y las tabla~, y a Rodney Palmer por su eficiente apoyo administrativo. Haber tenido cl privilegio de ensenar «Epi 2» dumnte tantos anos nos permiti6 comprender cuanto hemos aprendido de nuestros estudiantes, a quienes tambicn expresamos nuestro sincero agradecimiento. Finalmente, cube dejar constancia de que, sin cl apoyo y la extraordinaria paeiencia de todos los miembros de nuestras familias , desde fuego, no hubieramos podido dedicar tanto tiempo y esfuerzo a la redacci6 n de este libro.
PARTE
I
INTRODUCCION
CAPITULO 1 Los diseiios basicos de estudios en epidemiologfa analftica 1.1. INTRODUCCION: EI'IDEMIOLOG IA ANALITICA Y EPIDEMIOLOGiA DESCRII'TIVA La Epidemiologia ha sido tradicionalmente definida como el es(udio de la distribucion y los detenninantes de los estados de salud 0 los eventos de salud en poblaciones especfficas y la aplicacion de este est udio al control de los problemas de saiud(' ). La epidemiologfa se ha clasificado como «descriptiva>, 0 «analft ica». En terminos generales. la epidemiologia descripfivQ haec uso de los datos disponibles para examinar c6mo las tasas (por ejemplo: de monalidad) varian de acuerdo a variables dcmograficas (por ejemplo, las obtenidas de los ccnsos). Cuando la distribuci6n de las tasas no es uniforme de acuerdo a persona, tiempo y lu gar, el epidemi610go es capaz, no solamente de definir grupos de alto riesgo con propositos preventivos (ej, la hipertension tiene mayor prevalencia en los negros norteamerieanos que en los blancos, 10 que define a los primeros como un gmpo de alto riesgo), sino de generar hipotesis causales basadas en el paradigma chisieo: agente-huesped-medio (por ejemplo, la hipOtesis seglin la c ual un factor ambiental al cual estan expuestos los negros, tal como el consumo exces ivo de sal, es el responsable del riesgo mayor de hipertension arterial a que estan sometidos). Una revision minuciosa de los enfoques de la epidem iologia descriptiva puede encontrarse con facilidad en numerosas fuentes(! 3) . Por esta razon y, dado e l alcance general de este libro, este capitu lo se centra en los disefios de los estudios relevantes para la epidemiol ogfa analfrica. L1 uniea excepc ion se encuentra en la Secci6n 1.2 de este capitulo, donde un tipo especial de estrategia descriptiva, el analisis de collOrres de nacimienfOs, se discute brevemente. Las razones para esta excepci6n son las siguientes : I) aunque la evaluaci6n de los datos de una cohorte de nacimientos descansa a menudo, al igual que otros enfoques descriptivos, en la infonnaci6n usualmente disponible, requiere de la aplicacion de un enfoque analitieo con un nivel de complej idad que no es tfpieo de la epidemiolog fa descriptiva; y 2) este tipo de analisis es no pocas veces la clave para la comprension de la asoc iacion observada entre la edad (con frec uencia fuertemente asociada con la oc urrencia de muchas enfermedades y con sus detenninantes) y la enfennedad en analisis transversales. (Una raz6n adie ionaL de naturaleza mas pragmatiea. es que el analisis de una cohorte de nacimientos no es por 10 general considerada en detalle en los textos basieos). En los estudios epidemiologicos analftieos se evallian hipOtesis relacionadas con asociaciones entre posibles exposiciones a ciertos fac(ores de riesgo y los desen laces de procesos relacionados con la salud. Aunque alg unos de los conceptos que se discuten en los capitulos subsig uientes, (ales como las medidas de aso-
4
EPIDEMIOLOGiA INTERMEDIA; CONCEPTOS Y APLlCAC[ONES
dad6n y la interaccion, son lambicn relevames para los estudios experimentales (ensayos clfnicos aleatorizados), este libro se concentra en la epidemiologfa observaciollal. Se utilizan dos estrategias generales para 1a evaluaci6n de las asoc iaciones en los estudios observacionales: 1) los estudios que utilizan poblaciones 0 gru pos de ind ividuos como unidades de observaci6n - los lIamados estlltiios ecol6gicos - y 2) aquellos en que las unidades de observaci6n son los individuos: disefio prospecfivo (0 de cohorte), est udio de casas y controles y est udio transversal.
1.2. ANALlSIS DEL EFECTO DE LA EDAD, LA COHORTE DE NACIMIENTOS Y EL PERIODO L.1S encuestas de salud praclicadas a una mucslra de derta poblad6n bajo esmdio, usualmente se aplican a sujetos ubicados en un amplio espectro de edades. La edad es un trascendente factor de riesgo para muchos desenlaces de salud y a la vez Sllele estar asociado con numerosas exposiciones . Por 10 tanto. aun cuando el efecto de la edad no sea uno de los objetivos princi pales del estudio. es a menudo import ante evaluar su relaci6n con exposiciones y desenlaces dado su reievante efecto potencialmente confusor. La Tabla 1.1 muestra los resu ltados de un est udio transversal h ipotetico conducido en 1995 para estimar las tasas de prevalencia de una enfermedad Y, de acuerdo a la edad ' . En la Figura 1.1 se ubican estos resu ltados en los puntos medios de grupos de edad de 10 afios (par ejemplo, para las edades 30-39, a los 35 afios; para las edades 40-49, a los 45 afios; y asf sucesivamente). Los datos muestran que la prevalencia de Yen esta poblaci6n decrece con la edad . i,Sign ifica esto que las tasas de prevalencia de Y decrecen a medida que el individuo envejece? No necesariamente. Para muchas enfennedades, las ex po~iciones tienen efeclOs acumulat ivos que solo se expresan tras largos intervalos de tiempo. Numerosas asociaciones ex posici6n/enfermedad se caracterizan por producirse tras prolongados periodos de latencia y como res ultado de efectos acumulat ivos. Tal es el caso, por ejemplo , del
Tabla 1.1 Datos hipotCticos de un estudio transversal de prevalencia de la enfe rmcdad Y en la pohlacion , por cdad , 1995 Grupo de edad (ai'ios)
Punto medlo (ai'ios)
Prevalencla en 1995 (por 1.000)
30·39
35
45
40·49 SO-59
45 55
40 36
60-69
65
70·79
75
31 27
• Un uso mas estriclo del termino lam como medida de la ocurrencia de evenlos incidentes. sc define en la Secci6n 2.2.2. Este termino se uliliza lambien ampliamente en un senlido mas general para aludir a proporciones tales como la prevalencia!l ). Es en esle senlido mas general que empleamos el termino aqui y en otrds partes del libro.
LOS DlS ENOS BAslCOS DE ESTUDIOS EN EPIDEMIOLOGIA ANALlnCA
5
50
40
§
b
30
• 20 • "• 0 0
>
"
10
0 0
10
20
30
40
50
60
70
80
Edad (anos)
Figura I .1. Datos hipotCticos de UII estudio transversal de prevalencia de la enfermedad Yen la poblacion , por edad, 1995 (basado ell los datos de la Tabla 1.1)
vincu lo entre habilO de fumar y cancer de pulm6n, radiaciones y cancer de tiroides e ingesti6n de grasa sat urada y enfennedad ateroscler6tica. Por tanto, el estado de salud de una persona que tiene 50 afios de edad en el momenta de la encuesta puede depender parcial mente de sus eX jX)siciones pasadas (por ejemplo. habito de fumar durante la edad adultajoven) . Esta variabilidad de las ex posiciones pasadas en generaciones sucesivas (cohortes de nacimiento' ) puede distorsionar las asoc iaciones entre la edad y los desenlaces de salud que se observan en un punto c ualquiera del tiempo . Este concepto se ilustra como sigue. Supongamos que el mismo investigador que recogi6 los datos que se muestran en la Tabla 1.1 es capaz de recuperar los datos procedentes de encuestas previamente aplicadas en la misma poblaci6n en 1965, 1975 Y 1985 . Los datos resultantes se presentan en la Tabla 1.2 y la Figura 1.2; para cada una de estas encuestas se pueden apreciar tendencias consistentes de decrecimiento en la prevalencia de Y en la med ida que aumenta la edad . Considercmos ahora el grMico de estos dalOs ut ilizando un enfoque diferente, tal como se haec en la Figura 1.3 . Los puntos en la Figura 1.3 eslan en los mismos lugares que ocupan los de la Figura 1.2 pero ahora las lfneas se conectan por cohorte de nacimiento.\· (la enc uesla de 1995 tambien se ha incluido en la Figura 1.3) . Cada una de las lfneas discont inuas representa una cohone de nacimientos que converge en la encuesta de 1995 . Por ejemplo, el punto de la edad «mas joven» en la curva transversal de 1995 representa la tasa de la enfermedad Y para individuos de 30 a 39 afios (promedio 35 afios) que nacieron entre 1955 y 1964: es decir, en promedio en 1960. Los individuos en eSla cohone de nacimientos de 1960 tenian en promed io 10 afios menos; esto es, 25 afios
• CohortI' de lIacimiefllo (del latin cohon. guerreros, la dccima parte de una legion) 1'1 componente de la poblacion nacido durante un periodo particular I' identificado por periodo de nacimiento de manera que sus cardcteristicas (por ejcmplo. causas de muerte y numero todavia vivo) puede controlarse a medida que entrd en periodos sucesivos de tiempo y edad.
6
EPIDEMIOLOGiA INTERMEDIA; CONC EPTOS Y APLlCAC[ONES
Tabla 1.2 Datos hipotcticos de una serie de estudios transvefsales de prcvalcncia de 13 cllfcrmedad Y en una poblacioll , por edad y fceha de la cncuesta (ticmpo calcndario), de 1965 a 1995 Fecha de la encuesta Grupo de edad (arios)
Punto medlo (anos)
1965
1995
1985
1975
Prevalencia (por 1.000) 15 25 35 45 55 65 75
10·19 20-29 30-39 40-49 50-59 60-69 70-79
17 14 12 10
28 23 19 18 15
35 30 26 22 20
45 40 36 31
27
de edad en el momenta de la enClIcsta de 1985 , y 15 afios de edad en eI momenta de la encuesta de 1975. Por 10 tanto, 1a linea para 1a cohortc de nacimientos de 1960 permilc apreciar como la prevalencia de Y cambia con e l 3umento de la edad para los individuos nacidos, en promedio, en 1960. Evidentemente, el patron de 1a cohortc mostrada en 1a Figura 1.3 es muy d ifereme del que sugieren los datos transversales puesto que hace pensar que la prevalencia de Y realmente aI/menta a medida que la poblacion envejece, fenomeno que se produce consistentemente para todas las cohortes de nacimientos mostradas en la fi gura . El hecho de que se observe una tendencia inversa en los datos transversales se debe en este ejemplo a un fue rte «efecto de cohorte,, : vale decir, la prevalencia de Y esla acusadameme determinada por el ano de nacimiento de
50
40
§ g 30
1995
•
.• ·0
~
1985
20
~1 965
10
1975
0 0
10
20
30
40
50
6(1
70
80
Edad (anos)
Figura 1.2. Datos hipotCticos de una serie de cstudios transversalcs de prevalencia de la enfermedad Y en una poblacion , por edad , y fecha de la encuesta (tiempo calendario), 1965 , 1975 , 1985 Y 1995 (basado en los datos de la Tabla 1.2)
LOS DlSENOS BAslCOS DE ESTUDIOS EN EPIDEMIOLOGIA ANALlnCA
7
50
40
~ 30
•g ~
...
1950--
.'
20
~
~
10
Edad (anas)
Figura 1.3. Datos de 13 Figura 1.2 por cohorte de nacimientos (vease tambien la Tabla 1.3). Las lineas punteadas representan la, diferentes cohortes de nacimientos (desde 1920 a 1960) a medida que convergen a la encuesta transversal de 1995 (]fnea s6lida como en la Figura 1.1)
la persona . Para c ualqu ier edad dada, la [asa de prevalencia es mayor en las cohorles mas j6venes (mas recientes) q ue en las mas viejas . Por 10 tanto. en la encuesla transversal del ano 1995 (Figura 1. 1), los sujetos mas viejos provenfan de cohorles de nacimientos con tasas relativamente mcnores. mientras que los mas jovenes proven fan de cohortcs con tasas mas al[as. Esto puede apreciarse claramente en la Figura 1.3 seleceionando una edad (por ejemplo 45 anos) y observando que la [asa es la menor para la cohorte de nacimientos de 1920 y que aumenta para cada cohorle de nacimientos subsecuente: es decir, las cohorles de 1930, de 1940 y de 1950 respectivamente. Una exposici6n grafica alternativa de estos datos se puede apreciar en la Figura 1.4 . En esta figu ra, las cohortes de naeimientos se ubican en la abscisa (eje x), y cada !fnea re presenta el cambio a 10 largo de la cohorte de nacimientos para un gmpo de edad dado . A menudo. la selecci6n entre es[as representaeiones graficas alternativas es una cues[i6n de preferencia personal: es decir, depende de cual sea el patron q ue el invest igador desea resaltar. Mienlras que en la Figu ra 1.4 se muestran las tendeneias de acuerdo a las cohortes de naeimientos mas explkilamente (es decir, para cualquier gmpo de edad, la prevalencia aumenla en la medida que se va de las cohortes mas viejas a las mas recientes), la Figura 1.3 tiene un alract ivo intu itivo en virlud de que cada !fnea re presenta e l envejecimiento de una cohorte de nacimientos . S iempre que se preste atenci6n cuidadosa a los r6[ulos del grafico, c ualqu iera de eSlas al[ernat ivas grMicas es apropiada para identificar los patrones de las cohortes. Notese q ue los mismos patrones que emergen en las Figu ras 1.3 y 1.4 pueden verse en la Tabla 1.2, si vamos mirando hacia abajo para examinar las tendencias transversales, y d iagonalmente de izquierda a derecha para exam inar las tendencias de las cohortes de naeimientos. La Tabla 1.3 ofrece una ilus[raeion tab ul ar al[ernativa de los mismos datos, probablemente mas faei l de leer, q ue pennite el examen de las tendeneias de acuerdo a la edad (<
8
EPIDEMIOLOGiA INTERMEDIA; CONC EPTOS Y APLlCAC[ONES
50 35 40
§ 30 b •0
0 ~
•>
•
"
20
45 55
25
%
7
. 75
10
0 1920
1930
1940
1950
1960
Cohorte de nacidos
Figura 1.4. Exposicion a ltcrnati va de los datos de las Figuras 1.2 y 1.3. Las cohones de nacimientos eSlan representadas en et eje x. Las lfneas representan grupos de edad (identificados pof e t punto medio. en aiios)
nacimientos (las Ifneas horizontales en dicha tabla) . Adicionalmente y en concOfdancia con la Figu ra 1.4, las lasas de prevalencia aumentan para carla grupo de edad en la Tabla 1.3 desde las cahanes mas viejas a las mas rec ientes (efecto de cohorte)(q ue se detecta al mover los ojos de arriba abajo en carla columna de grupo de edad en 1a tabla) . Por 10 lamo, los datos del ejemplo anterio r eMan afectados simu ltaneamente por dos efec!Os de gran magn itud: e l de cohorte y e l de edad (para las defi niciones, vease el Esquema 1. 1). Estas dos tendencias son responsables conjuntamente de la tendencia aparentemente parad6j ica observada en el an.i.lisis transversal de este ejemplo hipotetico (Figuras 1.1 y 1.2), en las cuales las tasas parecen decrecer con la edad. EI hecho de que las cohortes mas recientes tengan tasas sustancialmente mayores (efecto de cohorte) no permite apreciar eI aumento debido a la edad y explica e l patr6n transversal.
Tabla 1.3 Reorganizacio n de los datos de la Tabla 1.2 segun cohortes de nacidos Grupos de edad (punto medio en anos) Recorrido de ta cohorte de nacidos
Punt o medio
1915·24 1925-34 1935·44 1945-54 1955-64
1920 1930 1940 1950 1960
15
25
35
45
55
65
75
20 31
27
Prevaiencia (por 1.000) 10
17 28
14 23 35
12 19 30 45
16 26 40
15 22 36
LOS DlS ENOS BAslCOS DE ESTUDIOS EN EPIDEMIOLOGIA ANALlnCA
9
Esquema 1.1 Definicioncs de edad, cohorte y crectos de periodo Eleelo de edad :
Cambio en la tasa de una condici6n de acuerdo a edad, independientemente
de la cohorte de nacimientos y det tiempo calendario. Eleelo de eohorte: Cambio en la tasa de una condici6n de acuerdo al ano de nacimiento independientemente de la edad y del tiempo calendario. Eleelo de perlodo: Cambio en la tasa de una condici6n que alecta a toda una poblaci6n en algun momento del tiempo, independientemente de la edad y de la coMrte de nacimientos.
Ademas de los efectos de cohorte y de edad, los patrones de las tasas pueden estar inlluidos por el lIamado efeclo de periodo. EI lermino efeero de I'eriodo se usa frecuentemente para aludir a un cambio global en las tendencias que afectan a las lasas a traves de cohones de nac imientos y grupos de edad (Esquema 1.1). Cualquier fen6meno que ocurra en un punto espedfico del tiempo (0 durante un periodo espedfico) que afecle a una poblaci6n entera (0 a un segmento significativo de ella), tal como una guerra, un nuevo tratamiento 0 una migraci6n masiva, puede producir este cambio independientemente de la edad y de la cohone de nacimientos . Un ejemplo hipoletico se recoge en la Figura 1.5. Esta figura mueSlra datos similares a los utilizados en el ejemplo anterior (ej . Figura 1.3) excepto que en este caso las tasas red ucen su nivel en 1985 para lodas las cohortes (esto es, c uando la cohorte de 1960 liene 25 afios de edad en promed io, cuando la cohone de 1950 liene 35 afios de edad en promedio, y asf sucesivamente). Los efectos de periodo en las lasas de prevalencia pueden ocurrir, por ejemplo, cuando se introd ucen nuevos medicamentos 0 medidas prevent ivas para enfermeda50
40
...... 1960"-
.. '
•'
.e .....
195q/ .. .' "
.'
......
1940./ 1995 .. " 1930.. ·· .. · ··· ·~~~
~:: .... ~.~9 .. · 10
o
10
211
30
40
50
60
70
80
Edad (arios)
Figura 1.5. Ejemplo hipotctico del crccto dc periodo: ocurri6 un evento en 1985 que afect6 a todas las cohortes de nacimien\()s (de 1920 a 1960) de manera similar y disminuy61a tasa de crecimiento con la edad. La linea s6lida representa el patr6n observado de edad transversal en 1995.
10
EPIDEMIOLOGiA INTERMEDIA; CONCEPTOS Y APLlCAC[ONES
des q ue previamente tcnian un pron6stico sombrfo, como en e l caso de la introduccion de la insulina, los ant ibi6ticos y las vac unas para la po lio. Es importante entcnder que los llamados cfcctos de cohorte de nacimientos pueden tener poco que vcr con las circunslancias que rorlean al momenta del nacimiento de una cahone dada de ind ividuos. Los cfcctos de cahone pueden resultar mas bien de una experiencia de toda la vida (que incluye las cond iciones q ue rodean al nacimiento, aunquc no se limita a e ll
LOS DlSENOS BAslCOS DE ESTUDIOS EN EPIDEMIOLOGIA ANALlnCA
II
A
SIlO 0
8
~
700
600
8. 500
~
Ano 1880
~ 400
•
~300
.. ...................... Aflo 1910
"
~ 200
••• 100
" . " ...•..:~:.~.:.:.... ....
~
0 0
10
20
AnO 19~.9. ..•..... ................ .... ........... .
30
40
50
60
70
80
70
80
Edad en anos B
SIlO
§700
8 -
600
8. o 500 ~ 400 g300
~ 200 ~: :
~
100
.o
.. COI]o
COliorre
.
\
~ ~:~·~-"'yhorle 1900 ~ Cohorte 1910
o
10
20
30
40
187 0 CoMrte 1890
50
60
Edad en anos
Figura 1.6. AmHisis de Frost de la edad en relacion a la mortalidad por tuberculosis (solo hombres). A: lasas de mortalidad por tuberculosis de Massachusetts. por edad. 1880. 1910.1930. B: tasas de mortalidad por tuberculosis de Massachusetts. por edad en cohor· les sucesivas de 10 aiios. Fuente: tmpreso con permiso de WH Frost, The age-setection of Tuberculosis mortality in successive decades. American Journal of Hygiene. vol. 30, 91 -96. © 1939.
O[ro ejemplo mas reciente se recoge en la Figu ra 1.7, basado en un analisis de efeclos de la edad, la cohorte y e l periodo sobre la incidencia de cancer colorrectal en una region de Espafia(b) . Notese que en estas figuras las cohortes de nacimienlos se colocan en el eje x (como en la Figura 1.4). Estas fi g uras revelan fuertes efectos de cohorte: para cada grupo de edad, las lasas de incidenc ia de cancer colorrectal [ienden a aumentar desde las cohortes de nacimientos mas viejas a las mas recientes. Tambien se manifiesla claramente un efeclo de la edad, ya q ue para cada cohone (cualquiera que sea e l valor del ano de nacimiento dado en e l eje horizontal), las [asas son mayores para los individuos de mayor edad que para los mas j6venes. N6tese [ambien que , probablemente debido al amplio recorrido de las lasas que han
EPIDEMIOLOGiA INTERMEDIA; CONC EPTOS Y APLlCAC[ONES
12
§ r"H"'m~b'"'"'______________--,
1885
1900
1915
1930
ana de nacimiento
1945
Mujeres §F="------------,
1885
1900
1915
1930 1945
ana de nacimiento
Figura 1.7. Tcndcncias en las tasas de incidcncia espccificas por cdad de cancer colorrectal en Navarra y Zaragoza (Espana) Fuente: Publicado con pe rmiso de G. L6pez -Abenle Dt a/.. Age-period cohort modeling of colometal cancer incidence and mortality in Spain, Cancer Epidemiology. Biomarkers, and Prevention, vol 6, 999 -1005, © 1997, American Association for Cancer Research. Inc.
de ubicarse en el grafico , se utiliz6 Ll na escala logarftmica en la ordenada . (Para LI lia disc lIsi6n mas amplia del uso de escalas logarftmicas como aiternativa a las aritmeticas, vease e l Capitu lo 9, Secci6n 9.3 .5). En la Figura 1.8 se incluye un ejemplo ad icional del analisis por edad , cohorte y periodo de datos de incidencia . Esta fi gu ra muestra la incidencia de demencia entre los residentes de Rochester, Minnesota, de 1975 a 1984(7). Se trata de un ejemplo en e l cual hay un fuerte erecto de la edad - es decir, las tasas se incrementan notablemente con la edad para {Qdas las cohones de nacimientos - pero virtualmente no existe efecto de cohorte, como indican los datos practicameme superpuestos de los pares de cohones de nacimientos sucesivas para cada grupo de edad. Deberfa quedar claro a part ir de la Figura 1.8 q ue, en ausencia de efec{Qs de cohorte, se encuentran los mismos patrones de tasas por edad en las curvas transversales q ue en las curvas de cohorte . Los erectos de pericKlo asociados a las tasas de incidencia tienden a ser mas prominentes para enfermedades para las c uales los efectos ac umulativos de exposic iones previas, tales como enfermedades infecciosas y dafios accidentales, tienen relativamente poca importancia . Comrariamente, en las enfermedades cronicas como e l dncer y las cardiovascu lares, los efec{Qs acum ul at ivos son generalmente imponantes y, consec uentemente, los efectos de cohorte tienden a afectar las tasas de incidencia en mayor grado q ue los efectos de periodo.
13
LOS DlSENOS BAslCOS DE ESTUDIOS EN EPIDEMIOLOGIA ANALlnCA
Demencia
Enfermedad de Alzheimer
8.000
8.000
,~ ~
,~
§
6.000
4.000
;; ~,
4.000
2.000
•
8 6.000 ~ ~
, • • 0
~
"
I /"
g
8
0
..
0 50
60
/
70
"•
./ 80
Edad en anos
" 90
100
2.000
.--"
..
0 50
60
70
80
90
Cohorte de nacidos ....... 1930 ...... 1925 ..•. 1920 ....... 1915 ..• . 1910 _ 1905 ..• . 1900 __
1~95
..• .. 1890 ___ 1885
100
Edad en anos
Figura 1.8. Tasas promcdio en cinco alios de incidencia de demencia (casas nuevos por 100.000 alios-persona) por edad y cohorte de nacimientos , ambos sexos combinados , en Rochester, J\.1inncsota. Para cada cohorte de nacimientos se representan dos punlOS que corresponden a la incidencia de 1965 a 1979 y de 1980 a 1984. respeclivamente. Fuente: Impreso con permiso de VIA Rocca et al., Incidence of dementia and Alzheimer's disease: A reanalysis of the Rochester, Minnesota 1975·1984 Data. American Journal of Epidemiology, vol 148, n." 151·62, © 1998.
Finalmente, procede consignar que estos metodos tambien pueden utilizarse para cSlUdiar otras variables adcmas dc las lasas dc inc idcncia, como sc ilustra en la Fig ura 1.9. All f se refl eja el analis is de los cambios en los niveles de colesterol serico re lacionados con la edad, hasados en los datos del Programa de Investigaci6n Geriatrica de la Florida (Florida Ceria/ric Research Program), un programa en ejecuci6n, disei'tado para proveer cribado medico grat uito a los ancianos( ~) . Esta figu ra revela ligeros efeclos de cohOrle, ya que los niveles de colesterol serico tienden a ser mas altos en las cohorles mas viejas que en las mas recientes para la mayorfa de los gru pos de edad . Tambien se aprecia un patron de edad en forma de J 0 de U: esto es, para cada cohOrle de nacimientos, los nive les de coleslerol serico tienden primero a dism inuir 0 a mantenerse estables, y luego a aumentar hasta alcanzar su va lor maximo en los integrantes mas viejos de la cohorte. A unque a primera vista eSle patron podrfa considerarse derivado de un «efecto de la edad», n61ese que para cada cohorte los valores max imos de coleslerol en el g ru po de mayor edad coinciden en solo un punto en e l tiempo calendario: de 1985 a 1987 (es decir, para la cohorle de nacim ientos de 1909- 1911 a los 76 ai'tos de edad, para la cohorte de 1906- 1908 a los 79 afios de edad, y asf sucesivamente) . Esto llev6 a Newsc ha ffer et al . a observar que: cabe sospechar la presencia de un efecto de periooo cuando se observa un cambio consistente en la altura de la curva en un momento dado del tiempo para IOdas las cohorles ... Por 10 tanto. sobre la base de una inspecci6n visual simple de las curvas. no es posible atribuir el aumento consislente del colesterol en fonna de U al envejecimiento. ya que parte de dicho patr6n se debe a efectos de periood8 .p.OJ. 16).
14
EPIDEMIOLOGiA INTERMEDIA; CONC EPTOS Y APLlCAC[ONES
MUJEAES
250 240
" g'
~
.~
.~
"•••
8
230 220 210 200 190 160
....... 1909·191 1
~
1906-1908
-e- 1903-1905
··e· 1900-1902
~
1897-1899
-+- 1694-1 896
170 67
70
73
76
79
82
85
88
91
88
91
Punta media del g rupo de edad (al'1os) HOMBRES
250 240
~
f
"§
.§
230
__ 1909·1911
-+- 1906-1908
-e- 1903- 1905
··e· 1900-1902
__ 1897-1899
....... 1694-1896
2" 210
.~
""•
• 0
200 190
U
160 170 67
70
73
76
79
82
85
Punta media del g rupo de edad (al'1os)
Figura 1.9. Nivcles mcdios de colestero! sCrico cspcdficos par sexo, par cdad y cohortc de nacimientos: datos longitudinaies dt'l Programa de Investigacioll de F1orida, COlldado de Dunedin , Florida, 1976 a 1987 Fuente: Impreso con permiso de CJ Newschatler, TL Bush . WE Hale, Aging and total cholesterol levels: cohort, period, and survivorship effects, American Journal of Epidemiology, vol 136. 23-34, © 1992.
En situaciones complejas tales como la il ustrada en la discusi6n precedente, las tecnicas de regresion mu ltiple pueden utilizarse para desenmarafiar los efectos de la edad , la cohone y el periodo. La descripcion detallada de estas tecnicas esta fuera de
LOS DlS ENOS BAslCOS DE ESTUDIOS EN EPIDEMIOLOGIA ANALln CA
15
los Ifmites de este libro. (Una discusi6n general de los metodos de regresi6n mu ltiple se presenta en el Capitulo 7, Secci6n 7.4.2). El lector interesado puede encontrar otras referencias y mas ejemplos en los trabajos originales ya citados (L6pez-Abente et al .(6) y Newschaffer etal.(8)). Finalmente, cabe enfatizar que los efectos de la cohorte de nacimientos pueden afectar las asociaciones entre los desen laces de la enfermedad y otras variables que no sean la edad . Considerese, por ejemplo, un estudio de casos y controles (vease la Secci6n 1.4.2) en el c uallos casos y los controles estan estrechamente emparejados por edad (vease la Secci6n 1.4 .5). Supongamos que en este estudio los casos se idendfican en un periodo de 10 afios (por ejemplo , de 1960 a 1969) y los controles al final del reclutamiento de los casos . En este estudio , la edad per se no ac[ua como confusora, ya que los casos y los controles estan emparejados por edad (vease la Secci6n 5.2.2); sin embargo, el hecho de que los casos y los controles se ident ifican a partir de distintas cohortes de nadmientos puede afectar la evaluaci6n de variables tales como el nivel educacional, que puede haber cambiado rapidamente a traves de la cohorte de nacim ientos. En este caso, la cohorte de nacimientos y no la edad, confund irfan la asoc iaci6n entre la educaci6n y la enfermedad de interes .
13. ESTVDIOS ECOLOGICOS Las unidades de observaci6n en un estudio ecol6gico son generalmente poblaciones geograficamente definidas (tales como pafses 0 regiones dentro de un pafs) 0 las mismas poblaciones geograficamente consideradas en diferentes momentos. Se obtienen valores medios' tanto para el factor de riesgo dado como para el desenlace de interes. para cada unidad de observad6n con prop6sitos comparat ivos. Tfpicamente, el analisis de datos ecol6gicos comprende la ubicaci6n en un sistema de ejes de los valores relacionados con el factor de riesgo y con el desenlace para todas las unidades de observaci6n con el fin de valorar si emerge una relaci6n discernible. Por ejemplo, la Figura I .1 0 muestra las lasas de muerte por enfennedad coronaria en hombres de 16 cohortes induidas en el Estudio de Siete Paises (Seven Countries Study) asociadas con las estimaciones correspondientes del valor medio de consumo de grasa (porcentaje de calorias procedentes de la grasa)(9). Los datos sugieren una relad6n positiva entre estas dos variables, ya que existe una tendenda de las tasas de muene a ser mas alIas en los pafses con medias mas elevadas de consumo de grasas saturadas . En los estudios ecol6gicos pueden emplearse variables de diferente lipo('O), las cuales se resumen brevemente a continuaci6n: • MetficioneJ" agregadas que resumen las caracterfsticas de los indiv iduos dentro
de un grupo , tales como el valor medio de cierto parametro, 0 la propord6n de la poblad6n 0 grupo de interes que posee dena caracterfstica. Como ejemplos pueden mencionarse la tasa de dena enfermedad . el consu mo promedio de grasa (Figura 1.1 0), la propord6n de fumadores y la mediana de ingresos .
* Un valor medio puede calcularse I~nlo pard variables continuas como para variables discretas (por ejemplo. dicot6micas). Una lasa 0 una proporci6n es un valor medio cuando los valores indivi· duales son dicot6micos.
EPIDEMIOLOGiA INTERMEDIA; CONC EPTOS Y APLlCAC[ONES
16
® 600 Y::--83+25.1X r :0 0,84
400
® @J 200
®
®
5 x
:0
10
15
20
% de las calorias de la dieta procedenles de grasas saluradas
Figura 1.10. Ejcmplo de UII estudio ccol6gico. Puntos formados por las lasas de mortalidad de 10 alios por enfcrmcdad coronaria de las cohortcs del Estudio de Sicte Pafses y porccntajes de calorias dietCticas suministradas por los acidos grasos saturados. Cohorles: B. 8 elgrado: C. Crevalcore; D. Dalmatia: E. East Finland: G , Corfu: 1, Ushibuka: K. Creta: M . Momegiorgio: N. Zuphen: R. Ro me railroad: S, Slavonia: T. Tanushimaru: U, American railroad: V: Velika Krsna: W. West Finland: Z, Zrenjanin. En 1a Figura se muestran los coeficientes de correlaci6n r y de regresi6n lineal (vease Capitulo 7. Secci6n 7.4. 1) correspondientes a esta nube de puntos. Fuente: Impreso con permiso de Seven countries: A mullivariate analyses of death and coronary hearl disease, by A Keys, Cambridge, Mass: Harvard University Press, copyright © 1980 by Ihe President and Fellows of Harvard College .
• Muficiolles ambientales que representan caracterlsticas ffsicas del lugar geografico del grupo de interes. Los individuos dentro del grupo pueden tener diferentes grados de exposic ion a una caracterfstica dada teoricamente med ible. Ejemplos de tales variables son la intens idad de la poluci6n ambiental y las horas de luz solar. • Mediciones globales que representan caracterfsticas gmpales no reducibles a los individuos (es decir, que no tienen analogos a nivel individual), como ocurre con el tipo de sistema politico 0 de atenci6n sanitaria , con ciena ley 0 con la presencia y magnitud de desigualdades de salud. En un estudio ecol6gico tradic ional, se examina la posible asociaci6n de dos variables ecol6gicas. Tfpicamente, se comparan una medida ecologica de exposic i6n y una medida agregada de enfermedad 0 mortalidad (por ejemplo, Figura 1.10) . Tales medidas ecologicas pueden {ambien utilizarse en est udios de individuos (es decir. estudios transversales,de casos y controles 0 de cohones; vease la Secc i6n 1.4) en los cuales eI investigador escoge defin ir la exposicion utilizando un criterio ecol6gico sobre la base de su validez ••de constmcto» su puestamente superior. Por ejemplo, para examinar la relacion entre nivel soc ioeconomico y prevalencia de enfermedad cardiovascular en individuos, el investigador debera seleccionar un indicador agregado de nivel socio-
LOS DlSENOS BAslCOS DE ESTUDIOS EN EPIDEMIOLOGIA ANALlnCA
17
econ6mico (por ejemplo, mediana del ingreso familia r en el entomo del vecindario) para definir el estado soc ioecon6mico de cada individuo, 10 cual es mejor que, por ejemplo, su nivel educacional (individual) 0 su ingreso . Aun mas, las med idas individuales y las medidas agregadas pueden combinarse en un antilisis lIIulrillivei tal como cuando se examina eI efecto conjunlo de niveles individuales y agregados de ingresos y educaci6n con relaci6n a la prevalencia de la enfennedad cardiovascularOl). Aunque una asociaci6n ecol6gi::a pudiera reflejar con exaclitud un vIncu lo causal entre un presunto factor de riesgo y una enfermedad (por ejemplo, la asociad6n positiva entre consumo de grasas y enfennedad coronaria presentada en la Figura 1.1 0). con frecuencia se invoca el fen6meno de la/alacia eco16gica como una desagradable posibilidad si se emplean las correladones ecol6gicas como prueba bOlla fide de hip6lesis etiol6gicas . La falacia ecol6gica (0 se.\·go de agregaci6n) ha sido definida como «el sesgo que puede ocurrir debido a que una asociaci6n observada entre variables a nivel agregado no representa necesariamente la asoc iad6n que ex iste a nivel individual,,('). EI fen6meno de la fa lacia ecol6gica se ilustra esquematicamente en la Figura 1.11 ; eSla se basa en un ejemplo propuesto por Diez-Roux('2). En un est udio ecol6gico hipoletico que examina la relaci6n entre el ingreso per Clipira y el riesgo de danos por accidente de vehfcu lo de motor en Ires poblaciones hipoteticas, compuesta cada una por siele individuos, se observa una correlaci6n positiva entre la media de ingresos y el riesgo de danos. Sin embargo, una inspecci6n mas c uidadosa de los valores individuale.\· revela que los casos oc urrlan solamente en personas de bajos ingresos (inferiores a 20 .000 USO). En este ejemplo extremo de fa lacia ecol6gica, la asociaci6n detectada c uando se uti lizan poblaciones en calidad de unidades de observaci6n - es dedr, que el promedio mas alto de ingresos se relaciona con un mayor riesgo de dano por accidentes por vehfculo automotor liene una direcci6n diamelralmente opuesta a la que expresa la relaci6n entre ingresos y danos por ese concepto en individuos - esto es, que un mayor ingreso individual se relaciona con
Poblaci6n A: Ingreso medio, US $23.940; incidencia de heridos por accidentes de trafico 4n:o 57 %
[§J
1 34,5 1
1 28 ,51
~
1 45 ,6 1
~ ~
Poblaci6n B: Ingreso medio, US $22.430; incidencia de heridos pCIf accidenles de Iralico 317::: 43 %
~
1 32.5 1
1 24,31
~
~
1
38 .0
1
~
Poblaci6n C: Ingreso medio, US 521,410; incidencia de heridos por accidenles de Ira/ico 2n:o 29 %
1 28 ,7 1
1 30,2 1
~
1 23 ,51
[§J @!J
~
Figura 1.11. Represcntacion esquematica de un estudio hipotctico donde sc produce la ralacia ccologica. Las cajas representan individuos hipoteticos: las cajas mas gruesas representan casos incidentes de daiios por vehfculos de motor (VM): los numeros dermo de las cajas indican ingresos anuales individuales (en miles de d61ares norteamericanos). Ecol6gicamente. la correlaci6n es positiva: la poblaci6n A tiene los valores mayores tanto de ingreso como de incidencia de dana por VM: la poblaci6n B tiene val ores intermedios tanto de ingreso como de incidencia de dana por V\1 y la poblaci6n C tiene los valores menores tanto de ingreso como de dano por VM. Sin embargo. entre los individuos. la relaci6n es negativa: para las tres poblaciones combinadas.el ingreso medio es $13.230 para los casos y $32.310 para los no accidentados.
18
EPIDEMIOLOGiA INTERMEDIA; CONCEPTOS Y APLlCAC[ONES
un riesgo menor de dano. Por tanto, la conclusion del analisis ecol6gico de que un nivel de ingresos mas alto es un fac!Qr de riesgo para sufrir dana por vehfculo automotor bien puede ser fa laz (vease mas adelante). GIro ejemplo de una situaci6n donde puede haber ocurrido este tipo de falacia viene dado por un estudio ecol6gico donde se detecta una correlaci6n directa (posiliva) entre el porcentaje de poblaci6n protestante y las tasas de suicidio en varias comunidades prusianas a finales del siglo XIX(lOI'). Sabre la base de esta realidad, la inferencia de que ser protestante es un factor de riesgo de suicidio puede bien ser erronea - pucde resultar de una falacia ecol6gica - ya que es posible que la mayorfa de los suic idios dentro de estas comunidades correspondan a individuos catolicos que, en minorfa (es decir, cuando la proporci6n de protestantes es alta), tienden a estar mas aislados soc ialmente y por tanto tienen mayor riesgo de hacer intentos su icidas. Estos ejemplos demuestran que el error asociado con los est udios ecol6gicos es un res ultado de la inferencia a traves de niveies, que ocurre cuando los datos agregados se utilizan para hacer inferencias a nivel individual(lO). El error en el ejemplo que acaba de discmirse consiste en utilizar la correlaci6n entre la proporci6n de protestantes (que es una medida agregada) y la tasa de su icidios para inferir que el riesgo de su icidio es mayor entre los individuoJ" protestantes que entre los catolicos . Sin embargo, si se fuera a hacer una inferencia a nivei poblacional, la conclusion de que las comunidades predominantemente protestantes con minorfas catolicas tienen tasas mayores de su icidio, mantendrfa su validez (supuesto que otros sesgos 0 factores confusores no estuvieran presentes) . Simi lannente, en el ejemplo de ingresos y danos, la inferencia a partir del analisis ecologico es err6nea solamente si se extiende a los individuos. Si, por otro lado, e l prop6sito del investigador es comprender el entramado de causalidadO) involucrado en los danos causados por vehfcu lo de motor, la informacion ecol6gica puede ser valiosa. ya que puede brindar claves en cuanto a las causas de danos por vehfcu lo de motor que no son brindados por los datos a nivel individual. Por ejemplo, la media poblacional de ingresos mas alta puede asociarse con un aumento del volumen de tciftco. Ademas, la asociacion inversa entre bajos ingresos a nivel individual y danos por vehfcu lo de motor puede ser mas fuerte en los pafses que posean un alto ingreso per capita , esto es, en el contexto de un volumen alto de tciftco aparejado con vehfcu los inseguros utilizados por individuos de bajos ingresos. Debido a la visi6n prevaleciente de que la inferencia a nivel individual es el esttin· lJar de oro (gold .~"tandard) c uando se estudian las causas de las enfennedades(l4J, asf como la posibilidad de incurrir en la falacia ecol6gica. los esrudios ecol6gicos se consideran a menudo como meros sustitutos imperfectos de aquellos en los cuales los individuos constituyen las unidades de observaci6n. Esencialmente, los est udios ecologicos se conceptuan como est udios preliminares «que pueden sugerir promisorias avenidas de invest igacion al arrojar luz sobre relaciones etioI6gicas»(3 p'-s-70) . Los ejemplos que se acaban de exponer prueban, sin embargo, que aun cuando suele ser verdadero, tal silog ismo puede ser fa laz. Las siguientes dos sit uaciones ilustran e l hecho de que un analisis ecologico puede en ocasiones conducir a conclusiones mas exactas que la utilizacion de datos a nivel individual (aun c uando e l prop6sito inferencial del estudio ecol6gico en cuesti6n se ubique al nivel individual). La primera situaci6n se produce cuando la variabilidad de la exposicion de interes dentro de la poblacion es baja pero la variabilidad entre poblaciones es alta. Por ejemplo, si el consumo de sal de los individuos de una poblacion estuviera por encima del umbral necesario para causar hipertensi6n, una relaci6n entre la sal )' la hipertensi6n podrfa no ponerse de maniftes-
LOS DlSENOS BAslCOS DE ESTUDIOS EN EPIDEM[OLOGIA ANALlnCA
19
[0 en los estudios individuales aunque sf podrfa emerger en estudios ecol6gicos, induso en poblaciones con habilOs dieteticos diversos(IS). (Un fen6meno similar ha sido enarbolado como explicacion de que las correlaciones ecol6gicas, y no los estudios individ uales, hayan detectado una relacion entre el consumo de grasa y eI riesgo de cancer de mama(16)) . La segunda situacion se presenta cuando, aunque se intente un nivel de inferencia individual, las implicaciones /Xlrll la prevencion 0 la illfervencion conciernen en rigor alnivel poblacional. Algunos ejemplos que ilustran esta ultima posibilidad son los siguientes: • En los est udios clasicos sobre pelagra, Goldberger et al . (17) evaluaron no solamente los indicadores individuales de ingresos, sino tambien la dis ponibilidad de alimentos en los mercados del area . Encontraron que, independiememente de los indicadores socioecon6micos ind ividuales, la dispon ibi lidad de alimentos en los mercados locales de los pueblos estaba relacionada fuertemente con la incidencia de pelagra, 10 que los llevo a cond uir q ue: Los factores mas potentes que intluyen sobre la incidencia de pelagra en los pueblos estudiados eran: a) bajos ingresos familiares: y b) condiciones desfavorables relacionada<; con la disponibilidad de suplementos alimentarios.lo que sugiere que bajo las condiciones prevalecientes en algunos de estos pueblos en la primavera de 1916. muchas familias no tenlan suficientes ingresos para procurarse una dieta adecuada y que una mejorfa en la disponibilidad de alimentos (particulamlente leche y came fresca) se necesitaba urgentemente en tales localidades ol 7 M;. 27t!) . Este ejemplo deja claro que un imponante (y polencialmente modificable) eslab6n en la cadena causal en la ocurrencia de pelagra - precisamente la disponibilidad de alimento - podrfa haber resultado inadvert ido si los invest igadores se hubieran limitado exclusivamente a estudiar los ingresos individuales. • Los eSllldios de los factores de riesgo para e l comienzo 0 e l abandono del habilO de fumar pueden centrarse en las reg ulaciones relacionadas con la publicidad de los cigarrillos 0 con los impuestos q ue condicionan su consumo a nivel poblacional. Aunque los faclOres individuales pueden inll uir sobre la predisposic i6n personal al habilo de fumar (por ejemplo, perfil psicologico, habito de fumar de amigos 0 fam iliares), los factores «ecologicos» regulalOrios pueden ser delerminantes fuertes y modificadores de las conductas indiv id uales . Por lanto, un invest igador puede oplar por centrarse en estos factores globales 0 por 10 menos por considerarlos j unto con el examen de los condicionantes individuales. • En las indagaciones sobre faclOres que explican la transmisi6n de ciertas enfermedades infecciosas para las cuales la inmunidad de la comunidad es import ante, los eSlUdios que ut ilizan a los ind ividuos como unidades de observacion pueden ser inapropiados . Tal como 10 discuten Koopman y Long ini(l 8), los est udios ecologicos pueden ser la unica manera para est udiar estos patrones y descubrir los faclores de riesgo para la transmision de enfermedades infecciosas. Debido a q ue, en ult ima instancia, todos los factores de riesgo deben operar a nive l individual, e l enfoq ue reducc ionista' a ultranza se oc uparfa solamente de los
* EI reduccionismo es una teoria que postula que tOOos los sistemas complcjos pueden ser completamenle comprcndidos en terminos de sus componenles. ignorando en buena medida las interacciones entre eslos.
20
EPIDEMIOLOGiA INTERMEDIA; CONC EPTOS Y APLlCAC[ONES
e lementos causales q ue apcran a nivel bioqufmico 0 intracelular. Por ejemplo, e l esmdio de los cfcctos carcinogenicos del habito de fumar podrfa cemrarse en los efectos de subproductos de l tabaca a nivel celular - csto es - , a la alteraci6n del ADN celu lar. Sin embargo, i,convertirfa esto en irre levante e l estudio del habito de fumar? Obviamente no . Por supuesto, desde lIna perspecti va de salud publica , e luso de un mode lo tearico abarcador de la causalidad - uno q ue considere todos los factores que inll uyen en la oc llrrencia de 1a enfennedad - requiere a menudo tener en Cllenta el papel que desempefian los raclores ecol6gicos (ambientales, socia-polIticos y culturales) en 1a cadena causal. Como se enuncio al principio de esle capilu lo. el objelivo final de la epidemiologfa es el de acluar efeclivameme como herramiema para mejorar las condic iones de salud de la poblaci6n; en esle contexto los factores que operan a un nivel global pueden represenlar eslabones relevantes en la cadena causal, particulannenle cuando pueden ser objeto de imervencion (por ejemplo. mejorando e l acceso a los ali menlos frescos en los poblados, 0 eslableciendo leyes que limilen la publicidad de cigarr illo~). Como resu ltado, los esludios que se centran en faclores a nivel individual pueden ser insufic ienles porque sus resu ltados no tienen impaclo sobre estos lazos ecol6gicos en la cadena causaL Este conceplo puede ser ilustrado ulilizando el ejemplo de la religion y el suic idio previamente discutido. Un esludio basado en los ind ividuos podrfa «correclameme» enconlrar que el riesgo de suicidio es mayor en los cat6licos que en los proleslanles(IO) . Esle hallazgo sugerirIa l6gicamente ex plicaciones de por que la tasa de su icidio difiere enlre dichos grupos religiosos . Por ejemplo, i,se debe esla lasa mayor en los cat6licos al catolicismo per se? Alternativameme, i,sera por alguna diferencia etnica entre cat6licos y prOlestantes? Si es asf, i,se debe a alglin componente genetico que dislingue a estos grupos etnicos? El problema radica en que eslas pregunlas que apuntan a caraclerizar e l riesgo a nivel individuaL atmque imporlames, son insuficienles para ex plicar completamenle el «enlramado de ca u salidad ~~( 2) , ya que no consideran la dimension ecol6g ica impifcita en la posibilidad de q ue e l carac{er m inorilario de la comunidad cat6lica explique y de{enn ine el riesgo aumenlado de suicidio . Esle ejemplo subraya e l preceplo de que ambos lipos de esludio. los individuales y los ecologicos, son necesarios para estudiar una delerminaci6n causal compleja como la del su icidio, y an
1.4. ESTUDIOS BASADOS EN LOS INDIVIDUOS COMO UNIDADES DE OBSERVACION Existen {res tipos basicos de disefio para estudios no experimenlales (observacionales) en los cuales los individ uos son las unidades de observaci6n: el estud io de cohone 0 prospecl ivo, el esludio de casos y conlroles y e l estudio Iransversal. En esta secci6n se revisan los aspeclos claves de cada uno de e llos . Para una discusi6n
LOS DlSENOS BAslCOS DE ESTUDIOS EN EPIDEMIOLOGIA ANALlnCA
21
mas completa de sus diversos aspectos operacionales y anaifticos, se rem ite el lector a lextos especializados('
1 AJ. Estudio de cohorte En un eswdio de cohorte un gru po de ind ividuos sanos, 0 cohorte' , se ident ifica y se s igue por un cierto periodo para evaluar la ocurrencia de eventos relacionados con la salud (Fi gura I .12) . EI objet ivo de un est udio de cohortes es usualmente dirim ir si la incidencia de un evento se relaciona con una exposic i6n dada. Los grupos que son objeto de atenci6n en los est udios de cohortes pueden ser muy diversos; por ejemplo, podrfa Iratarse de una muestra de la poblacion general de ciena area geografica (por ejemplo. el estudio de Framingham(2S) ; de una cohone ocu pacional, tfpicamente definida como un grupo de trabajadores con una ocupaci6n o de una industria. que se clasifican de acuerdo al grado de exposici6n a agentes de los cuales se sospecha que son riesgos ocupacionales; 0 de un gmpo de personas que, debido a ciertas caracterfsticas. tienen un riesgo reconoc idamente alto de padecer una enfennedad dada (por ejemplo, la cohorte de hombres homosexuales que se siguen en el Estudio Multicentrico sobre SIDA lEMSII26) . Alternativamente, las
COHORTE Exposicion sospechada
1 - - - - - - - - - - - - - - Desenlace Muerte Enfermedad Recidiva Recuperaci6n
------------------------------+ Tiempo F igura 1. 12. Componenlcs basicos de un estudio de coborle: cxposicion, ticmpo y dcsenlace
• Una definici6n del termino cohone mas amplia que la encontrada en la nota al pie de la Secci6n 1.2 es: cualquier grupo de individuos que son objcto de examen a 10 largo de un intervalo espccifica· do de tiempo,l).
22
EPIDEMIOLOGiA INTERMEDIA; CONCEPTOS Y APLlCAC[ONES
cohortes pueden estar formadas por muestras de «conveniencia», 0 const ituir grupos q ue se han conformado atendiendo a Sli deseo de panic ipar, 0 por causa de otras ventajas logfsticas tales como la facilidad de seguimiemo; como ejemplos pueden mencionarse la cahorte del Est udio de Salud de Enfermeras(27) , la cohorte del est udio de Profesionales de la Salud(28), y la cahone de est udios de voluntarios de la Sociedad Americana de Cancer<29) . Una vez que se define la cohortc y se seleccionan los participantes, un elememo c rft ico para su esw dio es e l registro de la ocurrencia de los eventos que se vayan produciendo d urante e l tiempo de seg ui miemo (cuando el evento de imen!s es la primera aparicion de derta enfermedad en e l sujeto, los casos prevalemes se excluyen de la coho rte a la entrada). Tal es la razon por la que dic hos est udios se conocen tambien como e.\·ludio.\· prosl'ectivos(YJ) . En la Fi gura 1.1 3 se expone la represemad6n esquem:hica de una cohorte de 1.000 ind ivid uos. En este ejemplo hipotetico los miembros de la cohorte se s ig uen d urame un pe riodo dado d urante e l c ual ocurren c uatro eventos, ta les como casos de incidencia de una enfermedad o muerte (q ue aparecen en la Figura 1.13 como cajas «E»). Ademas de estos c ualro evemos, siete individuos se pierden d urame e l pe riodo de seguim iento . Estas perd idas (representadas en la fig ura con flec has) se designan usualmeme como observaeioneJ' eel/sllmdus 0 I'erdidus, Como se describe en el Capit ulo 2, tales perd idas del seguimiemo han de tenerse en cuema para e l dlculo de las tasas de incidenda, Utilizando el metodo de la tabla de vida actuaria l como ejemplo (vease la Secd6n 2.2.1), la incidencia puede est imarse como e l numero de eventos dividido ent re e l numero de sujetos en la cohorte al inicio menos la mitad de las perd idas, Por lamo, para la cohorte hipotetica de la Fig ura 1. 13, la incidenc ia de E es 4/ l l.000 - e ll x 7)1 = 4,0 1/ 1.000 .
CO HORTE
inicial
linal del seguimiento
(n '" 1 ,(00)
(n '" 989)
Tiempo
Figura I .13. Diagrama dc una rohortc hipotCtiea dc 1.000 snjctos. Durante el seguimiento ocurren cuatro eventos de enfermedad (E) y siete perdidas del seguimiento (flechas). de manera que el numero de sujetos bajo observaci6n al final del seguimiento es 989.
LOS DlS ENOS BAslCOS DE ESTUDIOS EN EPIDEMIOLOGIA ANALlnCA
S. enferman
E,p""'"
I
Se mantienen sin enfermedad
•
f 'ooidoooi, Riesgo relativo
tiempo
No "P""'"
I
•
23
f
'ooidoooi,
Figura 1.14. Enroque analftico M.sko en un cstudio de cohorte
En el fonnalO mas represenlalivo de un eSflldio de cohorfes, se identifica una poblaci6n especffica, sus sujetos se clasifican de acuerdo a su sit uaci6n en {erminos de ex posic i6n, y la incidencia de la enfermedad (0 cualquier otro desenlace de salud que interese) se evalua y se compara entre las categorfas de exposici6n (Figura 1.14). Por ejemplo, sobre la base de la cohone hipotetica de la Figura 1.1 3, Y suponiendo que la prevalenc ia de la exposic i6n de interes es 50 %, la Figura 1.15 esboza el segu imienlo para los expuestos (n = 500) Y los no expuestos (n = 500) por separado. EI analisis de los dalos en esta silUaci6n es relativamente simple: involucra una comparaci6n enlre la incidencia de E en los expueslOs y los no expuestos utilizando como denominador la «poblaci6n en riesgo», {omando una vez mas en consideraci6n las perdidas durante el seguimiento (vease Capitu lo 2) . Porejemplo . utilizando el procedimiento de la {abla de vida actuarial como ante~ para la cohone hipotetica del estudio mostrado en la Figura 1.15 , la incidencia de E en los individuos expuestos es 3/1500 - e/2 x 4)1 = = 6,02/ 1.000, Y en los no expuestos es 1/1500 - ('/2 x 3)1 = 2,01 / 1.000. A partir de estos estimados de incidencia, el riesgo relalivo (vease Capitulo 3, Secci6n 3 .2.1 ) se estima como 6,0212,0 I = 3.0, 10 que sugiere que los individuos expuestos tienen un riesgo {res veces mayor que los no expuestos en la misma cohorte. Como se discute en el Capitulo 2, una suposici6n imponante para el dlculo de las {asas de incidencia en un estudio de cohones es que los individuos que se pierden durante el seguimienlo (las l1echas en las Figuras 1.1 3 Y 1.15) son similares a los que se mantienen bajo observaci6n en 10 que concierne a las caracterfsticas que afectan el desenlace de inleres. La rawn es que, aunque existen tecnicas para «corregir» el denominador teniendo en cuenta el nlimero de perdidas (y el momenlo en que se producen) (vease Capllllio 2, Secci6n 2 .2), si cl riesgo promedio de los que se pierden difiere del de los que pennanecen en la cohone, la incidencia basada en estos ultimos no represenlara con su ficiente precisi6n la verdadera incidencia en la cohorte inicial (vease CapItulo 2, Secci6n 2.2.1). Sin embargo, si el objetivo del estudio es una colIIl'aracion interna de la incidencia enlre expuestos y no expuestos. incluso en caso de que los sujetos perdidos difieran del resto de los miembros de la cohorte, siempre que los sesgos debidos a las perdidas sean similares en el gmpo de expuestos y el de no expuestos, dichos sesgos se cancelaran mutuamente al calcular el riesgo relalivo (vease Capitulo 4, Secci6n 4.2). Un riesgo relativo sesgado debido a perdidas del seguimiento se presenla solo cuando las perdidas son diferentes entre sujelOs expuestos y no expuestos con respecto a las
24
EPIDEMIOLOGiA INTERMEDIA; CONC EPTOS Y APLlCAC[ONES
EXPUESTOS
Cohorta inicial (n '" SOO)
Cohorta al final del seguimiento
Cohorta inicial (n '" SOO)
Cohorte al final del seguimiento (n '" 496)
(n '" 493)
NO EXPUESTOS
Tiempo
Figura 1.lS. EI mismo estudio de cohorte de la Figura 1.13, pero hacienda scparadamcnte la cvaluacioll de los cventos y las perdidas del scguimiento entre los expuestos y los no cxpucstos
caracterfsticas que infl uyen sobre el desenlace de inten!s - en alras palabras - . solo cuando las perdidas estan afecladas tanto por la exposici6n como por 1a enfennedad . Los estudios de cohortes se definen como cOllcurrenfe.\{ l) (0 verdaderamente «prospectiVOS>,(30)) cuando la cahone se confonna en el momenta presente - csto es, el tiempo calendario cuanda el estudio comienza - y se sigue hacia e l fut uro (Figura 1.16). La ventaja principal de los estudios de cohortes concurrentes estriba en que el examen inicial, los mdodos de segu imiento y la evaluaci6n de los eventos se planifican e implantan para los propOsitos del estudio, y sirven mejor por tanto a sus objetivos; ademas, las medidas de control de calidad pueden ponerse en practica a medida que se necesiten (vease Capft ulo 8). Las desventajas de los estudios concurrentes se relacionan con la cantidad de tiempo necesario para desarrollarlos (los res ultados estaran disponibles solo cuando se acumule un numero suficiente de eventos) y con el hecho de que su costo us ualmente res ulta muy elevado. Allernativamente, en los est udios de cohortes no COIIcurrellle.\· (tambh!n conocidos como estudios de cohortes hiJ·r6r icoJ· 0 rerroJpecrivos), se identifica una cohorte y se confonna en el pasado sobre la base de infonnaci6n que fuera oportunamente registrada y este disponible, y se «sigue» hasta el presente, esto es, hasta el momento en q ue se conduce el esmdio (Figura 1. 16) . Un ejemplo de este tipo de d isefio 10 ofrece un estudio realizado en 1992 en el c ualla relaci6n entre el peso en la infancia y la mortalidad subsecueme en la etapa adu lta se examin6 no concurrentemenIe sobre la base de registros existentes con los valores de peso y talla obtenidos entre 1933 y 1945 en ninos de edad escolar<.311. El d iseno no concurrente tambien es uti! en la epidemiologfa ocup..1cional, ya que 105 expedientes de ocupaci6n 0 censales pueden enlazarse con los registros de cancer 0 de mortalidad: por ejemplo, una cohorte de todos
LOS DlSENOS BAslCOS DE ESTUDIOS EN EPIDEMIOLOGIA ANALlnCA
Selecci6n de parlicipantes
25
Seguimienlo
L
1
ESludio concurrenle
T EI invesligador comienza el eSludio
ESludio no concurrcnto (hist6rico) EI investigador comienza al asludio Diseno mixto EI invesligador comienza el estudio
Figura 1.16. Tipos de estudios de cohoMe
los e lectricistas q ue trabajaban en Nomega en 1960 se siguio no concurrentemente hasta 1990 para esmd iar la relacion entre la radiaci6n eleclromagnetica y la incidencia de cancerm ). Tambien es posible aplicar disefios mixfO.\·, que contienen tanto componentes de seguimiento conc urrentes como no concurrentes (Figura 1. 16). Los eSllld ios de cohortes no concurrentes son obviamente mas economicos y pueden hacerse de manera mas expedita q ue los est udios concurrentes . Su desventaja principal consiste en que depende ineludiblemente de la informaci6n disponible; como consecuencia, la calidad de los datos sobre la exposici6n 0 el desenlace d isla a veces de ser 6ptima a los efectos de cumplir con los objetivos de estos estudios.
1 A.2. Estudios de casos y controles Como demostro Cornfield(33) y se ha discutido mas tarde en Iibros basicos de epidemiologfa (p. ej., Gordis(J) . el d isefio de casos y controles es una alternativa al estudio de cohorles para investigar asociaciones entre una exposici6n y una enfennedad . En contraste con un estud io de cohortes, en el cuallos participantes expuestos y no expuestos de la cohorIe se comparan en relaci6n a la incidencia de la enfermedad (0 cualqu ier otra medida de lendenc ia central del desenlace) (Figura 1. 14). en un estudio de casos y con troles generalmente se compara el odds de una exposici6n pasada a un posible factor de riesgo entre los casos (ind ividuos enfermos) con e l de los controles (generalmente individuos no enfennos) . (Aunque la comparacion de los odds de exposicion es el enf
26
EPIDEMIOLOGiA INTERMEDIA; CONC EPTOS Y APLlCAC[ONES
Enfermos (casDS)
No enfermos (controlesj
•
•
Cddsde
Odds de exposici6n
Expueslos
No expuestos
exposici6n
Odds ratio
Figura I .17. Enroquc ana litico basico en
UII
estudio de casos y con troles
cohortes, patticulannente sabre el estudio de cohorte conCLLrrente , ya que se evita la necesidad de un liempo de seguimiemo. lo que optimiza la rapidez y 1a eficiencia(3).
Estudio de casos y controles basado w los casos En 1a estrategia mas simple para 1a selecci6n de los gmpos de un estudio de casas y comroles, los casas y los no casas se idemifican en un momenta dado entre individuos vivos. Un ejemplo de esta estrategia. a veces Hamada estudio de caSM y controle.\" basado ell caSO.\', es un estudio en e l cual los casos se idenlifican como los individuos a quienes se diagnostico la enfennedad de interes (por ejemplo, cancer de mama) en d elto hospital 0 servicio medico durante un ano dado, en tanto que los controles se selecdonan entre los miembms de la comunidad atendida por dicho hospital 0 servido que no Ulvieron eI diagnostico de la enfennedad de interes al final de este mismo ano. Debe notarse que, aunque este estudio se lIeva a cabo «transversalmente» (es dedr, los casos y los controles se identifican en e l mismo momento), los casos necesariamente deben ocurrir durante un lapso dado ames de su inclusion en e l estudio. Asf, es necesario suponer que los casos que sobreviven mientras dure eI es{udio (Figura 1.18) son representat ivos de {odos los casos en relad6n a la experienda de exposid6n, y que si los datos sobre la exposidon se obticnen a {raVeS de entrevistas, los sesgos (el de recuerdo u olros) no interferiran (vease Capitulo 4). Ademas, para que la comparaci6n entre casos y conlro les sea legftima en 10 que condeme a la si{uacion que presenten en terminos de exposic i6n, es necesario suponer que {odos proceden de la misma poblad6n de referenda, es decir, de una cohorte mas 0 menos explfcitamente identificada,
LOS DlSENOS BAslCOS DE ESTUDIOS EN EPIDEMIOLOGIA ANALlnCA
27
como se mueslra en la Figura 1. 18. En otras palabras, para que una comparad6n entre casos y controles represente una altemativa valida al eSludio de cohortes, se espera que los casos y los controles pertenezcan a una pobladon de referenda comlln (0 a pobladones de referenda similares, comQ se vera mas adelante). Sin embargo, a menudo es difidl definir cual es la cohorte que sirve de fuente en un eSludio de casos y controles. Tal es el caso, por ejemplo, de un estudio basado en casos en el cual estos proceden de derto hospital A, en lanto que los controles se selecdonan de una muestra de una poblad6n . Siendo asL es importante considerar la correspondenda entre la poblad6n de padentes del hospital A y la pobladon del area geografica de la cual se selecdonan los casos. Por tanto, si, por ejemplo, el hospital A es la uniea inst itud6n a la cual pueden acudir todos los residentes del area y lodos los casos se hospitalizan, una muestra de la misma area poblacional representa un gmpo de control valido . Sin embargo, si los residentes milizan hospilales fuera del area, entonces deben considerarse estrategias altemativas para seleccionar los controles, de suerte que se consiga que estos sean representativos de la poblaci6n le6rica que provee los casos (por ejemplo, discado de dfgitos al azar 0 emparejamiento por zona de residencia). EI hecho de que los casos y los controles se originan en la misma cohone fuente hipotetiea es un supuesto crftieo que afecta la validez de los datos de casos y contro-
•
Casos
"
hipotetica Tiempo det estudio
-----------------------_ ._----------- ------------------,.. Tiempo
Figura 1.18. Estudio hipotCtico de casos y contro les basado en casos, suponiendo que los casos y los controles se seleccionan de una cohorte hipotetica, como en la Figura l.l3. Se supone que el grupo de casos incluye lodos los casos que ocurrieron en esa cohorte hipotetica hasla el momento en que se produce el estudio (<
28
EPIDEMIOLOGiA INTERMEDIA; CONCEPTOS Y APLlCAC[ONES
les . Debe notarse que no es estrictameme necesario que los casas y los controles se seleccionen exactamente de la mislllti poblaci6n de referenda; sin embargo, deben provenir de poblaciones q ue {cngan caracferiJ"ricas relevallfes similares. Baja estas circunstancias, e l gru po de control puede aceplarse como si fuera una muestra razonablemente representat iva de la poblad6n de referenda de los casas . Cuando los casas y los comroles no se seleccionan de la misma (0 similar) poblaci6n o poblaciones de referenda, puede producirse el se.\Xo de selecci611, fen6meno que se discute detalladamente en e l Capitu lo 4 . EI sesgo de selecci6n puede ocurrir incluso cuando casas y controles provengan de la misma cohorte «hipolelica>,: tal anomalla se verifica cuando las perdidas que ocurren antes de que se seleccionen los grupos de estudio comprometen la comparabilidad entre unos y otms. Por ejemplo, si las perdidas entre los commies potenciales abarcan una proporcion mas alta de individuos con bajo nivel socioeconomico que las q ue se producen entre los casos, emonces se pueden encontrar asoc iaciones sesgadas al examinar exposic iones relacionadas con e l nivel socioeconomico. Este ejemplo subraya la estrecha relaci6n entre e l sesgo de seleccion en los estudios de casos y commies y las perdidas diferenciales durante el segu imiento en los est udios de cohorte . En este comexto, debe considerarse la similitud entre las Figuras I .1 8 Y 1.13, en que la validez de las comparaciones hechas en el esmdio de ambas cohortes (Figura 1.13) y en los estudios de casos y controles (Figura 1.18) depende de si las perdidas (represemadas por flechas diagonales en ambas figuras) afectan la representatividad de la cohorte de base (bien definida en la Figura 1.13, hipotetica en la Figura I .1 8) con relaci6n tanto a las variables de exposici6n como a las de desenlace. Un tipo particu lar de «perdida» (previa) q ue puede afectar la comparabilidad de los casos y los comroles concierne a las lIIuerfes debidas a otras enfermedades 0 a la enfermedad de interes . Para el tipo de diseno re presentado en la Figura 1.18, caracterizado por una evaluacion transversal de los sujetos. los controles q ue mueren antes de poder ser incl uidos en e l estudio pueden tener una experiencia de exposici6n diferente al resto de la poblaci6n fuente. Adic ionalmeme, este diseno ident ifica primordialmeme casos prevalemes, esto es, aquellos con la supervivencia mas larga (Figu ra I .1 9) . Estos tipos de sesgos de selecci6n const ituyen problemas genericos q ue introd ucen conflictos para la adecuada evaluaci6n transversal de los part ici pames en e l estudio; otro problema es e l J·esgo de recuerdo, que resu lta de la obtenci6n de datos sobre exposiciones pasadas mucho despues del comienzo de la enfermedad. (Para una discusi6n detallada de estos y otros sesgos en los esmdios de casos y comroles, vease Capitulo 4) . Debe enfat izarse q ue, aunque la eva luacion transversal de casos y controles a menudo se lleva a cabo transversalmente, este no es un rasgo sille qua /1011 de los estudios de casos y controles basados en los casos. Una estrategia alternativa, que pretende minimizar los sesgos de seleccion y de rec uerdo, y que debe ser empleada siempre que sea posible, es evaluar los casos concurrentemente; esto es, idemificar (y obtener informaci6n sobre la exposici6n de) los casos tan pronto como sea posible despues del inicio de la enfennedad. Un ejemplo de esta estraregia 10 ofrece un estudio sobre factores de riesgo de fis uras orales realizado en D inamarca(3~) . En este estudio las madres casos e ran mujeres hospitalizadas que dieron a luz un nino nacido vivo con fis ura labial 0 palatina (sin otras malformaciones) entre 199 1 y 1994. Los controles se e ligieron del modo siguiente: para cada caso, se tomaron las dos mujeres que habfan parido en ese mismo hospital exactamente ames q ue la madre caso . Tanto las madres caso como las comroles fueron entrevistadas concurrente-
LOS DlSENOS BAslCOS DE ESTUDIOS EN EPIDEMIOLOGIA ANALlnCA
29
____ , : Tiempo de supervivencia
Cohorle hipotelica Momento del estudio
.......................................................... Tiempo
Figura 1.19. Scsgo de supervivencia en un estudio de casos y controles basado en casos Ilevado a cabo «transversal mente»: solo los casos con una supervivencia larga despues del diagn6stico (de mejor pron6stico) se incluyen en el grupo de casos. En este ejemplo hipotetico. las lfneas horizontales que comienzan en las cajas «E» de los casos representan tiempos de supervivencia: n6tese que solo dos de los cuatro casos se incluyen en el estudio. Las lineas diagonales discontinuas con flecllas representan perdidas del seguimiento. mente por enfermeras entrenadas con respecto a embarazos previos. medicamentos. habito de fu mar, dieta, y olras ex posiciones ambientales y ocu pacionales.
Estudios de casos Y cOlllroies detllro de una cO/lOrte definida Cuando los casos se identifican dentro de una cohorte bien definida, es posible llevar a cabo estud ios de casos y controles al/idados 0 est udios caso·cohorte. Estos d isefios han recibido considerable atenci6n en afios recientes(3S.37) al calor de varios estudios de cohorte de gran magnitud, bien eslablecidos, que se han inic iado y continuado durante las ulti mas decadas. Notables avances metodol6gicos y anaiflicos recientes se han ven ido verificando en este contex to. Los estudios de casos y controles dentro de una cohone se conocen tambien como d isefios hfhridos () alllhidireccionale.\~jS) porque en ellos influyen algunos de los rasgos presentes en los disefios de cohorte y en los de casos y controles . En estos eSllldios, aunque la selecci6n de los participantes se lleva a cabo con un enfoque propio de los est ud ios de casos y controles (Figura I .1 7), e lla se veri fica dentro de una cohorte bien definida. EI grupo de casos se confonna con todos los individuos (0 una muestra representativa de e llos) para los que se produce e l desen lace de interes en la
30
EPIDEMIOLOGiA INTERMEDIA; CONC EPTOS Y APLlCAC[ONES
cohortc de fin ida durante un periodo de segu im iento especificado (las cajas «E» de la Figura 1.13). Como se discute mas adelante, hay esencialmente dos opc iones para la selecci6n de los controles en esta situaci6n: I) seleccionarlos de 1a cohortc inic ial , 0 2) elegirlos de entre los individuos en riesgo en el momenta en que ocurre cada caso. La primera alternativa se ha denominado diseiio caso-collOrfe y la segunda se ha baulizado como diseiio de casos y comroles flnidadd 36 ). Debe notarse que, independientemente de la estrategia de selecci6n de controles que se discule a cont inuacion, debido a que los casas y controles se seleccionan de 1a misma cohorte fuente en estos esrudios. la posibilidad de sesgo de seleccion tiende a ser menor en comparacion con el estud io tradicional de casos y controles basado en los casos. Alternativa para la seleccioll (ie comlVles en lin e.~·tlldio de casos y conflVles dellfro de IIna cohorte. La primera altemativa para seleccionar controles consiste en
{OmM una muestra aleatoria de la cohorte {Otal en el momento inicial. EI tennino (fjs eiio cm-o-cohorfe se ha uti lizado cuando el marco muestral para la selecci6n de
los controles esta representado por la cohorte {Otal en e l momento inicial (Figu ra 1.20) , 10 que trae como consec uencia que alg unos casos que surgen durante e l seguimiento ocurren entre los miembros seleccionados para integrar de las mues(ras de ambos grupos, de los casos y de los controles (cajas «E» de la Figura 1.20). Resulta hasta cieno punto peculiar, sin embargo, que aunque alg unos de los casas se seleccionan para integrar la muestra de la cohon e (el grupo control), otros no. Tecnicas analfticas que toman en cuenta este rasgo especial en e l contex to del anaJisis de supervivencia se han desarrollado recientemente (vease Secci6n 7.4.6(37)). Una ventaja importante del disefto de casos y controles es que la disponibilidad de una mues(ra de la cohone (el grupo control), permite estimar las distribuciones de fac{Ores de
_.. Contrrnes
---------------------------_._------------------------- ~ Tiem~o
Figura 1.20. Est udio de casos y controles en e l cuallos cont roles se scleccionan de una coho rte de base (estudio caso-cohorte). Los casos sc representa n por cajas «E». Las ]fneas diagonales discontinuas con tlechas representan perdidas del seguimiemo.
LOS DlS ENOS BAslCOS DE ESTUDIOS EN EPIDEMIOLOGIA ANALlnCA
31
riesgo y las lasas de prevalencia necesarias para eslimar los riesgos atribui bles poblacionales (vease Capitulo 3, Secc i6n 3.2.2). La segunda altemativa es que los comroles constituyan una muestra aleatoria de la cohorte seleccionada en el momento en que ocurre cada caso . Se trata deillamado diseiio (ie casas y controle.~" allidado (Figura 1.21) Y se basa en un esquema muestral conocido como IIIlIestreo de dellsidad de incidellciai 3S38 ) 0 lIIuestreo de cOl/junto ell rie.\"gr/1fJ). La idea en la que se basa este esquema de muestreo es que pennite la comparaci6n de los casos con un subconjunto de los miembros de la cohorte que estan en riesgo de convertirse en casos en el momento en que cada caso ocurre. por: esto es. un «conjumo en riesgo» de todos los miembros de la cohorte bajo observaci6n en el momento de la ocurrencia de cada caso. Mediante esta estrategia, los sujetos que se convierten en casos mas tarde en el seguimiento son elegibles como controles a los efectos de su comparaci6n con individuos que pasaron a ser casos mas tempranamente. EI muestreo de densidad de incidencia es el equivalente de parear los casos y los comroles en cuanto a duraci6n del segui miento (vease Secci6n 1.4.5) y pennite el uso de tecnicas estadlsticas anaifticas relativamente poco complejas (por ejemplo. procedimiemo de regresi6n multiple estandar para el analisis de datos pareados y de supervivencia; ,ease Capitulo 7, Secci6n 7 .4 .6) . Hasta el momento la discusi6n ha considerado solo estud ios de casos y controles demro de la cohorte en la cual se incl uyen los casos en e l marco muestral para la selecci6n de los comroles; en esta situaci6n puede demostrarse que el odd.\" ratio de exposici6n estimado es un estimado r estad lsticamente insesgado del riesgo relativo o la raz6n de tasas . Sin embargo, si los casos se exclu ye ran del grupo contro l poten-
..................••...•••.............................
~
Tiempo Figura 1.2 1. Estudio de casos y controlcs anidado cn eI cuallos controlcs se selcccionan en eI momento cn que ocurre un caso (muestreo dc dcnsidad de incidcncia). Los casos se representan por cajas «E». Las lfneas diagonales discontinuas con flechas. representan perdidas del seguimiento.
32
EPIDEMIOLOGiA INTERMEDIA; CONC EPTOS Y APLlCAC[ONES
cial, entonces los enfoques analfticos e inferenciales sed an analogos a los de ellalquier estudio de casas y controles: vale decir, e l d.lculo del odd.~· ratio de exposici6n produce un estimado del oddJ' ratio de enfermedad . Una discusi6n mas dctallada de la influencia del marco muestralutilizado para la selecci6n de los controles sabre los paramctros estimados por el odds ratio de exposici6n se encuentra en el Capitulo 3 (Secci6n 3.4. 1). ;. Cuando debe Iweerse UII eSfudio de casos Y cOllfmles dentm de IIna collOrfe? En la disc llsi6n precedente, los terminos estutiio caso-cohorfe y estutiio de caso.\' y confrole.\' anitJado han sido ut ilizados para distingu ir las situaciones en que los controles son tornados de la cohol1e de base (Figura 1.20) de aq ue llas en q ue se usan conjuntos de riesgo (Figura 1.2 1), respectivamente . Esta terminologfa es probablemente la mas comunmente usada hoy en este campo07J9) . Desafortunadamente, sin embargo, estos {erminos no se usan de manera consistente; por ejemplo, las expresiones esfudio de cu.w.\· y contmles anidado y eSfudio CGSO cohorte se utilizan ocasionalmente para clasificar los estudios anidados en funci6n de que se incluyan 0 excluyan casos como controles potenciales (vease arriba). Independientemente de la terminolog fa utilizada, 10 imponante es comprender por que serfa ventajoso comparar casos y controles seleccionados de una cohorte fuente en lugar de analizar los datos de toda la cohone (como en la Figu ra 1.15). Una razon es que los estudios de casos y controles dentro de una cohone constituyen un recurso eficiente cuando se necesita informacion adicional que no se obtuvo 0 midio para toda la cohorfe . Una sit uacion {fpica es un estudio de cohorfe concurrente en el cual se recogen muestras de suero y se g uardan en congeladores . Una vez que se ha rechllado un numero suficiente de casos durante e l segu imiento, las mues{ras de suero congeladas para los casos (0 para una muestra de los casos) y para una muestra de los controles pueden descongelarse y analizarse. Esta estrategia no solamente reduce eI costo en q ue se hubiera incurrido si los analitos de intert's se hubieran ident ificado en la cohorte completa, sino que ademas es a{ract ivo en la medida que se preservan muestras de suero para analisis futuros. Una situaci6n similar surge c uando la evaluaci6n de exposiciones claves 0 de variables confusoras (vease Capftu lo 5) requiere ac{ividades intensivas de recolecci6n de datos tales como resumenes de registros medicos u ocupacionales . L1 recolecci6n de esta informaci6n adicional en los casos y en una muestra de la cohorfe total (0 de los no casos) es una opcion beneficiosa desde el punto de vista costo-efectividad en lugar de milizar la cohorte completa. Algunos ejemplos se presentan a continuaci6n: • Se condujo un estudio para examinar la relaci6n entre rango militar yex posicion a radiaciones con e l riesgo de tumor cerebral dentro de una cohone de miembros varones de la Fuerza Aerea de los Estados Unidos que habfan (enido por 10 menos un ano de servicio entre 1970 y 1989(40). En este estudio se compararon 230 casos de tumor cerebral con 920 no caso.\· (controles), pareados por ano de nacimiento y raza, que aun estaban empleados en la Fuerza Aerea ell el momento ell que se diagnostico el ca.\·o, La raz6n para optar por un diseno de casos y controles an idado (es decir, muestreo de densidad de incidencia: vease Figura 1.2 1) en lugar de utilizar la cohorfe entera de los 880.000 miembros de la Fuerza Aerea de los Estados Unidos es q ue se hubiera req uerido un {rabajo intensivo de resumen de registros ocupacionales para obtener datos exactos sobre ex posici6n a radiacion electromagnetica, asf como infonnaci6n relevante adicional sobre variables potencialmente confusoras, Una estrategia
LOS DlSENOS BAslCOS DE ESTUDIOS EN EPIDEMIOLOGIA ANALlnCA
33
alternat iva podrfa haber sido no excluir casos del marco mueslral de controles elegibles (vease arriba). Aun otra estrategia podrfa haber sido utilizado por un disefio caso-cohone con comroles seleccionados de entre la cohone de miembros de las Fuerzas Annadas al pri ncipio de su empleo (es decir, en el momento basal; vease Figura 1.20) . • Un ejemplo de muestreo de controles a panir de la cohorte total de partida (por ejemplo, un d isefio caso-cohorte; Figura 1.20) puede hallarse en el estudio de Nieto et al. (4 1), q ue evalua la relaci6n entre los anticuerpos a Clumidiu I'nellmolliae en suero recogidos en el momenta inicial e incidencia de EC (enfennedad coronaria) en el estudio Riesgo de Aterosclerosis en las Comunidades (ARIC) . Se trata de un estudio de cohorte de aproximadamente 15.800 hombres y mujeres que tenian entre 45 y 64 MOS de edad cuando se inici6 el estudio (1986- 1989). Durante el seguimiento de 3 a 5 afios se identificaron 246 casos de cardiopatfa isquemica incidente (infarto de miocardio 0 muene coronaria). EI grupo de comparaci6n en este eSllld io consisti6 de una muestra de 550 particip..1ntes de la cohorte total, la cual realmente incluia a lOde los 246 individ uos q ue mas tarde desarrollaron cardiopatia isquemica (casos incidentes), hecho que ha de tenerse en cuenta en el analisis estadfstico de los datos (vease tambien la Secci6n 7.4 .6). Para este estudio, en lugar de valorar la presencia de anticuerpos IgG de C. I'llellmoniue en todos los integrantes de la cohone, los niveles de anticuerpos se determinab..1n solamente en el suero de los casos y en la mencionada muestra de la cohorte; esto es, en aproximadamente 800 individ uos y no en los casi 16.000 partidpantes de la cohorte. Ademas de la estimacion de las razones de riesgo que expresan la relacion entre anticuerpos de C. I'nellmoniae y cardiopatfa isquemica incidente, la selecci6n de una muestra aleaton a de la cohorte en el est udio de Nieto et al . permili6 la estimacion de la prevalencia de condiciones relevantes para e l total de la cohorte, que, como ya se consign6, pueden usarse para la detenninacion de nesgos atn bu ibles poblacionales (vease Capitu lo 3).
1 A3. Estudios transversales En e l disefio de un estud io transversal, una muestra (0 el total) de la poblad6n de referenda se examina en un punto dado del tiempo . Al igual q ue e l estudio de casos y comroles. e l estudio transversal puede concept ualizarse como una manera de analizar datos de una cohorte, aunque a menudo ella es incorrecto, ya que consiste en tomar una dnstantanea>, de una cohorte mediante reg istro de informacion sobre e l desenlace de la enfennedad y las exposiciones en un unico punto del tiempo (Figura 1.22)". De acuerdo con esto, e l estudio de casos y controles basado en casos re presentado esquematicamente en la Figura I .19 puede ser tambien apredado como si fuera un estudio transversal, ya q ue incluye casos transversalmente identificados a la vez q ue incluye no casos (es decir, panici pantes de la cohone q ue sobrevivieron durante un lapso suficientemente largo como para estar vivos en e l momenta del
• Los estudios transversales pued~n tambien hacerse peri6dicamente con el prop6sito de supervisar el componamiento de las tasas de prevalencia de la enfermedad 0 del factor de riesgo. como en el caso de las encuestas nacionales de salud de los Estados Unidos (41.4) ).
34
EPIDEMIOLOGiA INTERMEDIA; CONCEPTOS Y APLlCAC[ONES
____ .. : Tiempo de supervivencia
Cohorle hipolt'llica Tiempo del estudio
---------------------------- -------------------------. Tiempo
Figura 1.22. Rcprcscntacio n esquc matica de UII cstudio transversal conceptual y mctodologicamcnte a lla iogo al estudio de casos y controles bas ado en casos re prcsenta do ell 13 Figura 1.19 , excepto que en vez de se leccionar explfcitamente los casos y los comroles. se selecciona una muestra de tada 1a poblaci6n. Las lfneas diagonales discontinuas con flechas representan perdidas del seguimicnto. Los casos se representan por cajas «E».
estudio). De aq uf se deduce que cuanda los datos transversales se oblienen para Llna poblaci6n 0 Ll na cohorte de referencia definida, el enfoq ue analftico puede consistir, bien en la comparaci6n de tasas de prevalencia puntuales para e l desenlace de inten!s entre ind ividuos ex puestos y no expucstos, bien en la utilizacion de la estrategia de casos y controles, en la cual los casos prevalentes y los no casos se comparan con respecto al odds de exposic ion (veanse Capft ulos 2 y 3). Aunque las encuestas transversa les(44) de morbilidad ofrecen una o ponunidad para examinar las asociaciones exposici6n/desenlace, los analisis transversa les de la informacion de part ida en los estudios de cohorte son especialmente ventajosos, ya q ue permiten obtener confirmaciones una vez que se disponga de los datos recog idos prospectivamente . Por ejemplo, en e l estudio AR IC se encontraron asociaciones transversales en eI momento basal entre la aterosclerosis coronaria asin(omatica definida por ult rason ido modo 8 y e l habito de fumar. tanto activo como p asivo(~S) . Estas asociaciones se contlrmaron s ubsiguientemente med iante Ia evaIuacion de datos relativos a la progresion de la ateroscierosis en fumado res y no fumadores(,u,). Las condic iones que inll uyen sobre la validez de las asociaciones q ue se infieren a partir de datos transversales se discuten en de{alle en e l Capitu lo 4 (Seccion 4.4.2).
LOS DlSENOS BAslCOS DE ESTUDIOS EN EPIDEMIOLOGIA ANALlnCA
35
1 AA. Diseiio Caso-Cruzado Inic ia lmeme propuesto por Maclure(471, este diseno cons iste en la comparaci6n del eSlado de exposic i6n de un caso inmediatamente antes de su ocurrencia con e l del mismo caso en algun momento amerior (ej., durame e l ano prev io). Es especialmente apro piado para eSludiar exposiciones agudas (breves) q ue producen un cambio transitorio en eI riesgo de sufrir una condici6n ag uda. Por ejemplo, este diseno se ha utilizado para eSludiar desencadenantes agudos para eI infarto de miocardio. ta les como episodios de ira (~8 ) y act ividad sex ua l(49). Este d iseno emrana un lipo especial de emparejamiemo (vease la secci6n siguieme), ya que los indiv iduos s irven como comroles de sf mismos: por 10 tan[0, [odas las caraclerfslicas individuales fijas que podrfan confundir la asociaci6n (por ejemplo, sexo, susceptibilidad genetica) estan controladas. Sin embargo, eSlo reposa en dos supuestos: que los efectos de la exposic i6n no son acumu lat ivos y que la enfermedad no tiene una e[apa precl fnica que pudiera inadvenidamente afectar la ex posici6n de imeres . Como en los esrudios de casos y comroles, la caUdad de la informaci6n sobre la exposici6n previa se su pedita a la memoria de l caso, de manera que dichos esludios eslan sujetos a l sesgo de recuerdo (vease Secci6n 4.3. 1) .
1 AS. EI emparejamiento En la epidemiologfa observacional, consliwye una preocupaci6n importante la contingencia de que los gru pos estudiados pudieran no ser comparables con respecto a caracterislicas q ue pueden distorsionar (<
36
EPIDEMIOLOGiA INTERMEDIA; CONC EPTOS Y APLlCAC[ONES
El emparejamiento en los estudios de casos-controles y de cO /lOrte El recurso del emparejamiemo es particulanneme lilH en el contex{Q de los esrudios de caso.\' Y collfroles con e l fin de lograr q ue los casas y los controles sean tan similares como sea posible con respecto a factores confusores polcnciaimente imponantes. Otro ejemplo de emparejamiento 10 encontramos en el ya cilado estudio de factores de riesgo para fisuras oraies(34) , en e l que los casas y los controles se emparejaron de acuerdo al lugar de nacimiento (seleccionando los controles del mismo hospital donde la madre habfa tcnido el parto) y momenta (seleccionando los dos nacimientos precedentes). Un ejemplo especial de emparejamiento es c l diseno de l eSllldio de casos y comroles anidados basado en el muestreo por densidad de incidencia (vease Secci6n 1.4 .2, Figura 1.2 1). Como ya se explic6, la aplicaci6n de esta estrategia resulta en un emparejamiento de casas y controles de acuerdo al tiempo de segu imiento. Ademas del tiempo en el estudio, los controles pueden ser emparejados a los casos empleando otras variables que podrfan confundir la asoc iaci6n de interes . Por ejemplo, en el estudio de la Fuerza Aerea de los Estados Unidos sobre tumores cerebrales ya mencionado(-IO), la muestra de controles seleccionada de los conjuntos de riesgo en e l momenta de oc urrencia de cada caso (y por 10 tanto emparejados por tiempo de segu imiento) se emparejaban adic ionalmente por ano de nacimiento y raza . En contraste, en los estudios de cohorte per se, el emparejamiento por variables potencialmente confusoras no es comun . Los estudios de cohorte son a men udo voluminosos y examinan numerosas exposic iones y varios desenlaces. Por tanto, usualmente se milizan medios altemativos para controlar la confusi6n (por ejemplo, tecnicas de aj uste; vease Capitulo 7). Entre los relativamente escasos ejemplos en q ue se ut iliza el emparejamiento en los eSllld ios de cohorte estan los estudios sobre faclOres utiles para e l pron6stico de superv ivencia des pues del diagn6stico de cancer en ciertos ambientes . Por ejemplo, en un estud io que examina la edad (la «exposicion» de interes) como factor pron6stico en pacientes con mieloma mUlt iple despues de un trasplante autologd S' ), los ind ividuos de mayor edad (65 anos 0 mas) se emparejaron con individuos mas j6venes (65 anos 0 menos) con respecto a otros faclOres que afectan e l pron6stico y podrfan por tanto confundir la asociaci6n edad-superv ivencia (niveles de fh-microglobu lina, albumina, creatinina y protefna C-reactiva y la presencia 0 ausencia de anonnalidades cromos6micas).
Tipos de emparejamietlto Todos estos ejemplos se referian a eSllldios en los cuales los casos y los commies estaban indivitiualmellfe emparejados: esto es, para cada caso, uno (0 mas) controles con las caracterfsticas relevantes emparejadas con los casos se eligiemn del conjumo total de no casos. EI emparejamiento individual bas..1do en variables natural mente categ6ricas (por ejemplo, sexo) no tiene mayor complicacion. Cuando el emparejamiemo concieme a variables continuas (por ejemplo. edad). usualmente se define un recorrido de emparejamiento (por ejemplo,el control emparejado por edaddebe ser igual a la edad del caso fndice ± 5 aftos) . En esta silllacion, asf como cuando las variables son arbitrariamente categorizadas (por ejemplo, hipertensolnonnotenso 0 aClllal fumador/ex-fumador/nunca fum6), las diferencia." entre los casos y los contmles pueden no haberse eliminado, 10 que resulta en una confusion residual (veanse Capitulo 5, Secci6n 5.4.3 y Capfnllo 7, Secci6n 7.5) .
LOS DlSENOS BAslCOS DE ESTUDIOS EN EPIDEMIOLOGIA ANALlnCA
37
EI emparejamienlo indiv idual puede ser logfsticameme difk il en ciertas siluaciones, partic ularmente c uando hay un numero li mitado de controles potencialmenIe elegibles y/o c uando el emparejamiento se basa en multiples variables . Una estrategia alternativa es lIevar a cabo el emlHlrejamiellfo por grulJos (frequency matching) que consiste en seleccionar un grupo cOnlrol de lal manera que la distribuci6n de la variable (0 variables) de emparejamienlo sea similar a la de los casos pero sin hacer un emparejam iento caso por caso. Para lIevar a cabo el emparejamiento por grupos se necesita usualmente un conocimiento previo de la distribucion del grupo de casos para las variables de emparejam iemo. de manera que puedan est imarse las fracciones de mueslreo necesarias dentro de cada estrato de la poblaci6n de referencia con vistas a la adecuada se lecci6n del grupo control. Por ejemplo, si el emparejamienlo debe hacerse atendiendo a sexo y edad (clasificada en dos grupos de edad, < 45 anos y O!: 45 anos), se definirfan 4 estratos: mujeres menores de 45 anos, mujeres de 45 anos 0 mas, hombres menores de 45 anos, y hombres de 45 anos 0 mas . Una vez que se obtiene la proporci6n de casos en cada uno de estos 4 grupos, el numero de controles que debe seleccionarse para cada eSlrato de edad y sexo se escoge de manera que la proporcion de controles en cada estrato sea la misma que en eI cDrrespondiente grupo de casos. Si los controles deben se leccionarse de un marco poblacional amplio para el cual esta disponible la informaci6n sobre las variables de emparejamiento, este proceso puede ser realizado faci lmente mediante muestreD aleatorio estrat ificado con las fracciones de muestreo deseables de cada estrato especffico . Por otro lado, si esta informaci6n no eSluviera disponible previamente (por ejemplo, cuando los comroles se seleccionan entre personas que ac uden a ciena clfnica de consulta externa), la selecci6n de los controles puede hacerse por muestreo sistematico, con 10 c ual pud ieran sucesivamenle irse anadiendo los individuos se leccionados a cada estrato hasta que se completen los lamanos previs(Qs . Gtra eSlralegia, c uando la dist ribuci6n de los casos segun las categorfas de las variables de emparejamiento no se conocen previamente pero el investigador desea seleccionar y obtener informaci6n sobre casos y controles concurrenlememe, es obtener (y peri6dicamente actualizar) dislribuciones provisionales de casos, permiliendo asf que la selecci6n de comroles sea lIevada a cabo antes de que se identifiquen todos los casos . Un metodo alternativo de emparejamiento por un numero grande de variables, incl uyendo variables cont inuas. es el lIamado metodo de la medida de minima di.\·· fllllcia ew.;lidianaf52l. Por ejemplo. en el eswdio de la edad como factor pron6stico despues del trasplame en pacientes con mieloma multiple que se describio ameriormente(S!), los individuos mas j6venes y mas viejos se emparejaban de acuerdo a cinco fac(Qres pron6stico (cuatro de el los, variables cominuas) . EI emparejamiento de acuerdo a definic iones categ6ricas de todas esas variables hubiera sido baslante engorroso; ademas, para algunos individuos «expuestos», podrfa haber sido difk il encontrar pares emre las personas «no expuestas» . Por 10 tamo, los autores de eSle eSludio emparejaron por el metodo de la med ida de mfnima distancia euclidiana que se ilustra esquematicameme en la Figura 1.23. Para simplificar. en la fig ura se consideran solo dos factores de emparejamienlo. Para cada caso ex puesto, se escoge como control la persona eleg ible mas cercana (por ejemplo, pacieme no expuesto) en eSle espacio bidimensional definido por los niveles de albumina y creat inina . En el est udio de Siegel et al .(SI ), los autores emparejaron por mas de dos variables (niveles de fh-microg lobulina, alblimina, creatinina, proleina C-reacliva y la presen-
38
EPIDEMIOLOGiA INTERMEDIA; CONCEPTOS Y APLlCAC[ONES
o
0 0.......
o
o o
o o
o
o
o
o
o
•
: Expuestos
o :No expuestos Albumina
Figura 1.23. Emparejamiento de acuerdo al metodo de la medida de minima distancia euclidiana. Ejemplo hipotetico de un est udio de coholtes de superv ivencia despues del trasplante en paciemes con mieloma mu ltiple en el ellal los individuos expuestos (ej ., individuos de mayor edad) se emparejan a los pacientes no expucstos (los mas j6venes) atcndiendo ados factores pron6stico: niveles de albumina serica y creatinina. Para cada caso se escoge como control el individuo no expucsto mas cercana en el espacio bidimensional definido por las dos variables de emparejamiemo . Fuente: Los autores. basado en el esludio de Siegel el al.I"I.
cia 0 ausencia de anormalidades cromosomicas) utilizando este metodo . (El espacio multidimensional requerido cuando se utilizan multiples variables en el emparejamiento no es susceptible de ser represcntado en un diagrama .) Este metodo puede ser ut ilizado tambien en estud ios de casos y controles basados en casos 0 en estudios de casos y controles dentro de una cohorte, tal como ocurre en la aplicacion original debida a Smith ef al J S2), 10 que constituye una forma alternativa conven iente y eficiente cuando se necesita emparejar por variables multiples y/o cont inua.,>.
Velltajas y desvelltajas del emparejamiellto Aunque existen pocas dudas acerca de que el emparejamiento sea una estrategia ut il para controlar el fenomeno de confusion, ella esta lejos de ser la unica . El Capitulo 7 se destina totalmente a describir algunos de los procedimientos que pueden ser aplicados en la etapa analftica para encarar el problema de la confusi6n - concretamente, la estratificacion y los ajustes - . Manejar la confusi6n antes de la recolecci6n de los datos por medio del emparejamiento durante la fa se de recl utamiento 0 hacerlo mediante estrat ificacion 0 ajuste en la fase del analisis es una decisi6n que depende de numerosas consideraciones .
LOS DlSENOS BAslCOS DE ESTUDIOS EN EPIDEMIOLOGIA ANALlnCA
39
Entre las venraja.\· del emparejamiento se hallan las siguientes: I. Ademas de ser facH de entender y de describir, el emparejamiento puede ser la unica manera de garantizar algun grado de control de la confusion en ciertas situaciones. Esto puede ser paniculannente imponante en los est udios en los cuales una variable de confusion potencialmeme fuerle puede producir un desbalance tal en la composici6n de los grupos de est udio que el ajuste es diffci l 0 directamente imposible. Por ejemplo, en un estudio de casos y controles para evaluar posibles factores de riesgo para el cancer de prostata. tendrfa senlido emparejar los controles a los casos con acuerdo a la edad; por 10 menos, dado que la mayorfa de los casos de cancer prostatico eSlan en los gmpos de edad mas avanzados, el investigador deberfa resrringir la elegibilidad de los miembros del grupo control a un cierto recorrido de edad. (La restriccion es una fo rma algo "debil " de emparejamiento) . De otra forma, si los controles se seleccionaran de la poblacion general, el recorrido de edades podrfa ser tan amplio, panic ulannente si la muestra fuese pequefia, que no habrfa la suficiente superposici6n con el reslringido recorrido de edades de los casos (es decir, no habrfa suficientes sujetos de las edades mas alias en la muestra control) para penn itir el ajuste (veanse Capitulo 5, Secci6n 5 .2.3) . 2. C uando el emparejamiento se hace a panir de variables de confusion fuertes (variables que estan relacionadas con la exposic i6n y con el desenlace; vease Capitulo 5), el emparejamiento tiende a incrementar la potencia estad fstica (eficiencia) del est udio(S354). 3. EI emparejamiento (especialmeme el de naturaleza individual) es una manera logfsticamente directa para obtener un gmpo control comparable cuando los casos y los controles se identifican de una poblaci6n de referencia para la cual no existe un listado como marco mueslral. Por ejemplo, en un eSllldio de casos y controles que uliliza casos de diabetes identificados en la consulla externa, cada caso debe emparejarse al proximo control sin diabetes con las mismas caraclerfsticas que el (por ejemplo, el mismo sexo y con edad similar). Tambien deben considerarse las de.wentajas del emparejamiento, de las c uales las mas imponantes son las siguientes: I. En ciertas siluaciones puede ser diffc il 0 imposible encontrar un control emparejado (0 controles emparejados, si la raz6n de controles a casos es mayor que I: I) para un caso dado, paniculannente cuando la selecci6n se realiza de una poblaci6n fuente limitada, 0 cuando se empareja por multiples variables . Ademas, inciuso si se tuvieran controles disponibles para emparejar, el proceso de identificarlos puede ser engorroso e incrementar los costos de la fase de recimamiento. 2. Cuando se empareja, no puede evaluarse la asociaci6n entre el desenlace y las variables usadas para emparejar: clio se debe a que una vez que se consuma el emparejamiento por cierta variable, los grupos de estudio (por ejemplo, casos y comroles) se fuerzan a ser iguales por disefio (0 similares) con respecto a eSla variable 0 a eSle conj unlo de variables, 3, Se deriva de (2) que en los estud ios de casos y controles emparejados no es posible evaluar la interacci6n adiliva entre las variables de emparejamiento y
40
EPIDEMIOLOGiA INTERMEDIA; CONCEPTOS Y APLlCAC[ONES
la exposici6n de interes. Como se discute en e l Capitulo 6 (Secci6n 6 .4 .2), la evaluaci6n de la imeracci6n aditiva en un estudio d pieo de casas y comroles recae sabre la f6 rmula para el cfeclo esperado conjunto de dos variables A y Z, RR A+z+= RRA+z- + RR".z+- 1,0 (usando los odds ratio como estimados de los riesgos relativos IRRJ) . Suponiendo q ue A es la variable de emparejamiento, su cfccto independ iente (RRA+z-) no puede ser est imado, ya que ha sido fijado en 1,0 por disefio (vease 121 arriba) . Por 10 tanto, la formula anterior no puede apl icarse . 4. Para e l analisis de datos que han sido emparejados, deben utilizarse tecnicas estadislicas especiales, como se detalla en eI Capitu lo 7 (Secci6n 7.4 .6) . 5. El emparejamiento implica delto grado de precaudon en eI proceso de selecdon de los gmpos de estudio para hacerlos tan comparables como sea posible; esta «comparabilidad interna» aumentada puede, sin embargo, implicar una falta de representatividad. Por ejemplo, un grupo control que se tome identico a los casas con respecto a caracterfsticas sododemografi cas y variables confusoras puede dejar de constitu ir una muestra representativa de la pobladon de referenda . Por tanto, tal gmpo control puede ser de uso limitado para estudios adidonales que podrfan ser de interes. Por ejemplo, en los estud ios que examinan la asoc iadon entre factores de riesgo n uevos y una enfermedad, un objet ivo secundario, pero importante, puede ser eI estudio de la distribudon de estos factores en la poblad on de referenda . Si los controles se emparejan a los casos, utilizar las distribudones observadas en e l gmpo control para hacer inferendas al total de la poblad6n puede ser una tarea compl icada (se req uieren analisis complejos que exigen ponderadones que contemplan las fracdones de muestreo asadadas con el proceso de emparejamiento). Por otro lado, si se escogiera una muestra aleatoria de la pobladon de referenda (como se hace en los est ud ios de caso-cohorte), serla legfti mo extrapolar la dislribudon de los factores de riesgo en e l gru po control a la pobladon de referenda. Obtener estas distribudones (por ejemplo, la prevalenda de la exposid6n en la pobladon) es particularmente imponante para la est imadon del riesgo atribu ible pobladonal (vease Capftu lo 3, Secd6n 3.2.2). Ademas, un gmpo control q ue se selecdona como una muestra aleatoria de la poblad6n fuente puede ser utilizado como grupo de comparacion para Olro grupo de casas seleccionado de la misma cohorte 0 de la poblaci6n de referenda. Por ejemplo, en e l esmdio casocohone q ue evaluo la reladon entre C. p"el/moniae y la enfennedad coronaria inddente(~') , el grupo control (n = 550) se selecdon6 como muestra aleatoria de la cohorte inidal; la presencia de antic uerpos sericos de C. pllel/moniae entre esos controles se compara con la de los 246 individuos que se convirt ieron en casos de enfennedad coronaria durante e l seguimiento . El mismo grupo control puede ser utilizado para la evaluaci6n del papel de C. pneumolliae para un desenlace diferente como. por ejemplo, los accidentes vasc ulares encefalicos. Por tanto, a medida q ue se extiende el tiempo de seguimiento en este estlld io de cohorte. y una vez que se desarrolla un numero imponante de casas (de accidentes vasculares encefalicos), puede lIevarse adelante un analisis subsiguiente de caso-cohorte que evalue la asociacion entre los anticuerpos de C. pllellmoniae y el accidente vasc ul ar encefalico midiendo los anticuerpos solo en los casas de accidentes vasculares encefalicos y utilizando para la comparaci6n, nuevamente, los datos obtenidos en el gmpo control.
LOS DlSENOS BAslCOS DE ESTUDIOS EN EPIDEMIOLOGIA ANALlnCA
41
6. Debido a que, una vez concrelado un emparejam iento, este no puede ser «deshecho», es imponame que las variables empleadas para el emparejamiemo no esten fuertemente correlacionadas con las variables de interes; de otra forma, puede aparecer el fen6meno de «sobremparejamiento» . Por ejemplo, emparejar casos y comroles por raza puede en buena medida dar lugar a que unos sean muy similares a los olros en cuanto a variables de imeres relacionadas con el nivel socioecon6mico. Para conocer mas consideraciones y ejemplos sobre este t6pico, vease Capit ulo 5 (Seccion 5.2.3) . 7. Finalmente. debe deci rse que no se gana pOlencia estadislica si las variables de emparejam iemo son confusores debiles. Si las variables de emparejam iento estan escasamente re lacionadas con la exposicion, aun cuando estas variables eSlen relacionadas con el desen lace, la ganancia en eficiencia puede ser m uy pequefia . Ademas, si las variables de emparejam iento estan debil mente re lacionadas 0 no eSlan relacionadas con el desen lace de interes, la aplicaci6n de este procedimiemo puede dar lugar a una perdida de pOlencia(H.S4). Cuando el emparejamiemo se aplica a partir de definiciones categoricas de variables cominuas, las diferencias residuales entre casos y controles pueden no ser eliminadas (collfusi611 residual; vease Capflu lo 5, Seccion 5 .4.3, y Capitulo 7, Seccion 7.5) . En estas situaciones, puede resullar necesario realizar ajustes por la variable en cuesti6n a posteriori (en la fase de analisis) para eliminar la variaci6n dentro de las categorias de emparejamiemo . Porejemplo. en el est udio sobre la relaci6n emre ant ic uerpos de cilOmegalovims en mueslras de suero recogidas en 1974 (y analizadas retrospectivameme) y la presencia de aterosc lerosis carotfdea medida por ultrason ido modo-B de las arterias car6tidas como parte del examen de partida en el estudio ARIC (l987- 1989)(SS), ISO comroles (seleccionados emre individuos con arterias car6t idas nonnales) se emparejaron por gmpos a lSO casos con alerosclerosis carOlidea de acuerdo al sexo y a dos grupos de edad relativamente ampIios (45-54 afios, 5564 afios). Por lamo, por disefio, ambos gmpos, el de casos y el de comroles, tenian identico numero de individuos en los cuatro grupos de edad-sexo; sin embargo, los casos en este estudio lenian en promedio 58,3 afios de edad, mientras que la edad promedio entre los comroles fue de 56,7 afios . Consec uentememe, aun cuando los gmpos de est udio eSlaban emparejados por dos categorfas de edad, la diferencia residual en las edades Ilevo a que los autores ajustaran por edad como ulla variable comillua en el analisis de regresi6n logfstica mult ivariada (vease Capitulo 7, Secci6n 7.4.3) . Las mismas diferencias res iduales pueden pennanecer incluso en los estudios donde se aplic6 emparejam iento indiv idual si las categorfas de emparejam iento no son suficientemente estrec h a~. La raz6n de este fen6meno se il ustra en la Figura 1.24 . Aun c uando los casos y controles estan ig ualmente representados en ambos gru pos de edad, dentro de cada uno de eslOs, los casos tienden a ser de mayor edad, prod uciendose asi una diferencia global. En resumen. los invest igadores deberfan siempre considerar cuidadosamente si deben hacer uso de emparejamiento 0 no . A diferencia de los procedimientos post hoc para controlar la confusion (estratificaci6n y ajuste), el emparejamiento es irreversible una vez que se aplica. Aunque esta puede ser la eSlrategia de eleccion en eSludios con tamafios de muestras limitados y un conj unto claro de objetivos, deberia ev itarse en la mayoria de las situaciones en las cuales se espera que exisla una
42
EPIDEMIOLOGiA INTERMEDIA; CONC EPTOS Y APLlCAC[ONES
JL--+--i
Casas
I
45
47
49 '
51
53
55
Mueslra del eslralo, n '" 25
57 59 '" 61 63 65 Edad Muestra del estrato, n ,,40 ",dad media " 62 anos
edad media " 5211tlos
2
1-----+-------., z .~
Controles
I
45
47 49 '" 51 53 Mueslra del eslralo, n '" 25 edad media", 50 anos
55
57
59 '" 61
63
65 Edad
Muestra del estrato. n '" 40 edad media", 60 atlos
Figura 1.24. Rcprescntacion esquematica de ulla situacioll hipotctica en la enal el cmparejamicnto de casos y controles de acucrdo a catcgorfas de edad amplias (45-54 aiios: 55-64 aiios) da Ingar a ulla dircrcncia residual ell los promcdios de edad (confusi6n residual). Los casos eslan escorados hacia las edades mayores. pero la distribuci6n por edades de los controles es plana. Como resultado. e l promedio de edad denlfO de cada grupo de edad es mayor en los casos que en los controles, 10 que resulta en una media de edad global de 58,2 aiios para los casos y 56.2 alIOS para los commIes.
superposici6n razonable de va riables potencial mente confusoras (y que permiten e l aj uste) 0 en los c uales se es(udian hip6tes is secundarias,
BlBLIOGRAFiA I. Last 1M. A didionar), of epidemiology. 3.' ed. New York, Oxford University Press. 1995. 2. MacMahon B. Pugh TE. Epidemiology: Prindples and Methods. Boston, Little. Brown and Co, 1970. 3. Gordis L. Epidemiology. Philadelphia, WB Saunders, 1996. 4. Strong 1P. McGil l HC. The pediatric aspects of atherosclerosis. J Atherosd Res 1969: 9: 251·265. 5. Frost WH. The age-selection of tuberculosis mortality in successive decades. Am J Hyg 1939: 30: 91-96. 6. L6pez.Abente G, Polhin M, Vergara A et al. Age-period-cohort modeling of colorectal cancer incidence and mortality in Spain. Callcer Epidemiol Biolllarkers Prey 1997: 6: 999-1005. 7. Rocca WA, Cha RH. Waring SC, Kokmen E. Incidence of dementia and Alzheimer's disease: a reanalysis of the Rochester. Minnesota 1975·1984 data. Am J Epidemiol 1998: 148: 5 1-62.
LOS DlSENOS BAslCOS DE ESTUDIOS EN EPlDEM10LOGIA ANALlnCA
43
8. Newschaffer CL Bush TL Hale WE . Aging and total cholesterol levels: cohort. period. and survivorship effects. Am J Epidemiol 1992: 136: 23-34. 9. Keys A. Sel'en cOllntries: A mllltivariate allalysis of dealh and L'orollary heart disease. Cambridge, Harvard University Press . 1980. 10. Morgenstern H. Ecological studies in epidemiology: concepts. principles. and methods. Ann Rev Public Heallh 1995: 16: 61-81. II. Diez-Roux AV. Nieto FJ. Muntaner C el al. Neighborhood environments and coronary heart disease: a multilevel analysis. Am J Epidemiol 1997: 146: 48-63. 12. Diez-Roux AV. Bringing context back into epidemiology: variables and fallacies in multilevel analysis. Am j Public Heallh 1998: 88: 216-222. 13. Durkheim E . Suicide: A study ill .\"Ociology. New Yo rk. Free Press: 1951. 14. Piantadosi S. Byar DP. Green SB. The ecological fallacy. Am J Epidemiol 1988: 127: 893·903. 15. Elliott P. Design and analysis of multi centre epidemiological studies: the INTERSALT study. En: Marmot M. Elliot p. (eds). Corollary hear! disease epidemiology: From aetio· logy 10 public heallh. Oxford. England: Oxford University Press: 1992: 166-1 78. 16. Wynder EL Cohen LA. Muscat 1E et al. Breast cancer: weighing the evidence for a promoting role of dietary fat. J Natl Canar IIISI 1997: 89: 766-775. 17. Goldberger J. Wheeler GA. Sydenstrycker E . A study of the relation of family income and other economic factors to pellagra incidence in seven cotton mill villages of SOUlh Carolina in 1916. PlibliL' Health Rep 1916: 35: 2673-27 14. 18. Koopman 1S. Lo ngini 1M . The ecological effects of individual exposures and nonlinear disease dynamics in populations. A.m J PlibliL' Health 1994: 84: 836-842. 19. Breslow NE. Day NE. Slatistical Methods ill Callcer Research. Vol I. The Allalysis of Case·Conlml Studies. Lyon. France: IARC Scientific Publications. 1980. 20. Breslow NE. Day NE. StatisliL-a/ methods ill callcer research. Vol 2. The desigll alld analysis of cohor! studies. Lyon. France: IARC Scientific Publications: 1987. 21. Samet J. Muiioz A, Cohort studies. Epidemiol ReI' 1998: 20( I). 22. Schlesselman JJ . Case cOlllrol studies. New York. Oxford University Press: 1982. 23. Amlenian H. Applications of the case-control method. Epidemiol ReI' 1994: 16(1): 1-164. 24. Hill AB. The environment and disease: association or causation? Proc Royal Soc Med 1965: 58: 295-300. 25. Dawber TR . Th e Framillgham Stl
44
EPIDEMIOLOGiA INTERMEDIA; CONCEPTOS Y APUCACIONES
34. Christensen K. Olsen l . Norgaard-Pedersen B el al. Oral clefts. transforming growth factor alpha gene variants. and maternal smoking: a population-based case-control study in Denmark. 1991-1994. Am J Epidemio/l999: 149: 248-255. 35. Kleinbaum DG. Kupper LL. Morgentern H. (1982). Epidemiologic researdl: PrinL"iples and q1lanlilalive methods. Belmont. Lifetime Learning Publications. 36. Langholz B. Thomas DC Nested case-control and case-cohort methods of sampling from a cohort: a critical comparison. Alii J Epidemiol 1990: 131: I 69-176. 37. Thomas D. New techniques for the analysis of cohort studies. Epidemiol Rev 1998: 20: 122-134. 38. Checkoway H . Pearce NE . Crawford_Brown 01. Resellrch melhods in occuptllionlll epi_ demiology. New York. Oxford University Press. 1989. 39. Roth man Kl . Greenland S. Modern epidemiology. 2.' ed. Philadelphia. Li ppincott-Raven Publishers. 1998. 40. Grayson lK. Radiation exposure. socioeconomic status. and brain tumor risk in the US Air Force: a nested case-control study. Am J Epidellliol. 1996: 143: 480-486. 41. Nieto FJ. Folsom AR. Sorlie Pel al. Chlamydia pllellmolliae infection and incident coronary heart disease: the Atherosclerosis Risk in Communities (ARIC) StUdy. Alii J Epide111;0/1999: 150:149-156. 42. Flegal KM. Carroll MD. Kuczmarski RJ. el al. Overweight and obesity in the United States: prevalence and trends. 1960-1994. Inl JObes Relal Melab Di.wrd 1998: 22:3947. 43. Hickman TB. Briefel RR, Carroll MD. el al. Distributions and trends of serum lipid levels among United States children and adolescents ages 4-19 years: data from the Third National Health and Nutrition Examination Survey. Prev Med 1998: 27: 879-890. 44. Lister SM. Jonn LR . Parental smoking and respiratory disease in Australian children aged 0-4 years: ABS 1989-90 National Health Survey results. AIISI NZ J Pllblic Heallh 1998: 22: 781-786. 45. Howard G. Burke GL . Szklo M. el al. Active and passive smoking are associated with increased carotid wall thickness: the Atherosclerosis Risk in Communities study. Arch InlernMed 1';1'14: 154: 1 277- 1 2~2. 46. Howard G . Wagenknecht LE. Burke GL. el al. Cigarette smoking and progression of atherosclerosis: the Atherosclerosis Risk in Communities (ARIC) study. JAMA. 1998: 279: 119- 124. 47. Maclure M . The case-crossover design: a method for studying transient effects on the risk of acute events. Alii J Epidemiol 1991: 133: 144-153. 48. Mittleman MA. Maclure M. Sherwood lB el al. Triggering of acute myocardial infarction onset by episodes of anger: Determinants of Myocardial Infarction Onset Study Investigators. Circllialioll 1995: 92: 1720-1725. 49. Muller lE. Mittleman MA . Maclure M el al. Triggering of acute myocardial infarction by sexual activity: low absolute risk and prevention by regular physical exertion. Detenninants of Myocardial Infarction Onset Study Investigators.JAMA 1996: 275: 1405-1409. 50. Ridker PM. Cushman M . Stampfer r-.U el al. Inflammation. aspirin. and the risk of cardiovascular disease in apparently healthy men. N Engl J Med 1997: 336: 973-979. 51. Siegel OS. Desikan KR. Mehta J el al. Age is not a prognostic variable with autotransplants for multiple myeloma. Blood 1999: 93: 51-54. 52. Smith AH. Kark 10. Cassel l C. Spears GFS. Analysis of prospective epidemiologic studies by minimum distance case-control matching. Am J Epidemio/1977:105: 567-574. :'\1 . Smnllel~ MI . Miltchin~ ilnfl rle~i~n efficiency in epirlemio lo£icill stllflie~. Ri()lt1P1ri/w 198]: 68: 577-588. 54. Thompson WD . Kelsey lL . Walter SO. Cost and efficiency in the choice of matched and unmatched case-comrol study designs. Alii J Epidemiol1982: 116: 840-851. 55. Nieto FJ. Adam E. Sorlie P. el al. Cohort study of cytomegalovirus infection as a risk factor for carotid intimal-medial thickening. a measure of subclinical atherosclerosis. Circulalioll 1996: 94: 922-927.
PARTE
II
MEDICION DE LA OCURRENCIA DE ENFERMEDADES Y DE LA ASOCIACION
CAPITULO 2 Medici6n de fa ocurrencia de fa enfermedad
2.1. INTRODUCCION' ELEMENTOS BASICOS DE INFERENCIA EPIDEMIOLOG ICA·DEFlNICION Y CONTEO DE LOS RESULTADOS DE LA ENFERMEDAD Los desenlaces de la invest igaci6n epidemiol6gica se han definido tradic ionalmeme en terminos de enfennedad, aunqlle la credente apl icaci6n de la epidemiologfa a la salud publica y a la medic ina preventiva requiere cada vez con mas frec lIencia del uso de indicadores que midan desenlaces de los procesos vincu lados a la salud en general (por ejemplo, medidas del estado funciona l en est udios epidemiol6gicos relacionados con e l envejecimiento) . Tales resu ltados 0 desenlaces pueden expresarse por conducto de variables discretas (por ejemplo, oc urrencia 0 gravedad de la enfermedad) 0 cont inuas . Variables conrinllfl.\", tales como la tensi6n arterial 0 los niveles de glucosa, son frec uentemente empleadas para med ir desenlaces en epidemiolog ia. Las herram ientas estad isticas fundamentales que se emplean para operar con este tipo de resultados son los coeficientes de correlaci6n, e l analisis de la varianza y el analisis de regresi6n lineal, las cuales se explican en numerosos libros de texto de estadistica. Una breve revisi6n de la regresion lineal p uede hallarse en e l Capitulo 7 (Secci6n 7.4. 1) como un antecedente para introd uc ir las tecnicas de analisis de regresion mu ltivariada en epidem iologia . Otros aspectos metodol6gicos concernientes al uso de variables continuas en epidemiologia, tratadas en el Capit ulo 8, se relacionan con e l control de calidad y las med i cione ~ de fiab ilidad . EI presente capitulo se oc upa en 10 fundamental de variables categ6ricas con resu ltado dicotomico, las mas frecuentemente empleadas en estudios epidemiol6gicos . La frec uencia de este tipo de resu ltado puede ser genericamente definida como eI nu mero de sujetos con una de [as posibles condic iones (el n umerador) d ividido por el de individ uos en riesgo de desembocar en dicha condic ion (el denominador). Existen dos tipos de medidas absolutas de la frecuencia de resultados: incidencia y prevalencia (Tabla 2.1). Aunque el termino incidencia ha sido trad icionalmente empleado para aludir a una proporcion de casos n uevos (incidentes) de una enfennedad, en rigor, €I abarca b freclJenci;) cie c lm l'1 lJier nlJevo aconlec imienfo relac ionacio con la ~allJci 0 con I;) enfermedad, y por tanto, tambien incluye la muerte, la recaida de enfennedad entre los pacientes, la curaci6n, la menopausia, y asi sucesivamente . La incidencia es particul annente importante para la investigacion epidemiologica anaiftica, puesto q ue consiente la estimacion del riesgo, necesaria a su vez para evaluar asociaciones causales .
48
EPIDEMIOLOGiA INTERMEDIA; CONCEPTOS Y APLlCAC[ONES
Tabla 2.1 Medidas absolutas de frecucllcia de 13 enfermcdad Medlda
Expresa
Tlpos de Event os
Incidencia
Frecuencia de un avento nuevo
Irrupci6n de una enfermedad Muerte en la poblaci6n en riesgo (mortalidad) Muerte en pacientes (Ietalidad) Recurrencia de una enfermedad Aparici6n del electo colaleral de un medicamento
Prevalencia
Frecuencia de un avento existente
Prevalencia puntual: Numero de casas en un instante Prevalencia de periodo: Numero de casas durante un periodo dado (por ejemplo un ano) Prevalencia acumulada (a 10 largo de la vida): Numero lolal de casas producidos en cualquier momenta del pasado
La prevalencia, por olra parte, mide 1a frecuencia de un resul lado exislente, en derta momenta - prevalencia punt ual- 0 durante un lapso dado - prevalencia de un periodo . Un tipo especial de prevalencia de periodo es la prevalencia a 10 largo de la vida, la cual mide la frecuencia ac umulada desde el com ienzo de la vida de cierto resu ltado hasta el presente (es decir, la proporcion de personas que han tenido tal evento en algun momento en el pasado) . Tanto para la prevalencia como para la incidencia, es necesario contar con una definici6n clara del resultado 0 desenlace como un evenfo (un «suceso notable» como se define en un dicc ionario de ingles(')). En epidem iolog fa, un evento se define como la ocurrencia de cualq uier fenomeno morboso 0 de salud que pueda ser caracterizado. Para la incidencia (vease Secci6n 2.2), ineq ufvocamente esta caracterizacion demanda de una definicion precisa del momento de ocurrencia del inequfvocamente evento en c uesti6n . Algunos eventos se definen y localizan en el tiempo muy hi.cilmente, tales como «eI nacimiento», d a muerte», «un acto qu irurgico» y «un infano ag udo del miocardio». Otros no eslan tan nitidamente delimitados y requieren de una definici6n operacional mas 0 menos arbitraria para el estudio; tal es el caso de eventos como «menopausial", «recuperacion», «demencia~) y enfermedad por citomegalovims (CMV) (Tabla 22). Un ejemplo de la complejidad que entrafia la definicion de ciertos sucesos cl fnicos se presenta con la defi nicion ampliamente aceptada de un caso de sfndrome de inm unodeficiencia adq uirida (SIDA), la cual emplea vados criterios clfnicos y de laboratorio(6) . Las pr6x imas dos secciones de este capftu lo describen las dife rentes alternativas para calcular la incidencia y la prevalencia . La ultima seccion describe el odd.\·, una manera alternat iva de medir la frec ucncia de la enfermedad. EI odd.\· constituye la base para la constmcci6n de herramientas analfticas frec uentemente empleadas en epidemiologfa, particularmente en los estudios de casos y controles (Capitu lo I, Seccion 1.4 .2); mas concrctamente, son relevantes para el examen de los odds rclat ivos (Capitulo 3, Seccion 3.4.1) y para el analisis de regresion logfstica (Capftu lo7, Seccion 7.4.3).
49
MEDICION DE LA OCURRENCIA DE LA ENFERMEDAD
Tabla 2.2 Ejemplos de definicion operacional de eventos en cstudios epidcmiologicos Evento
Definicion
Referenclas
Fecha del ultimo periodo menstruat despues de que una mujer ha dejado de menstruar par espacio de 12 meses. Dos dias tibres de diarrea (diarrea :0 etapa con 3 o mas depasiciones liquidas 0 semis6lidas en un dial .
Bromberger el al.
Damencia
Ingreso hospilalario, inslilucionalizaci6n 0 admisi6n en un hospital de dia 0 en un hospital psiquilttrico con diagn6stico de demencia (CIE·9·CM c6digos 290.0·290.4. 294.0. 294.1. 331 .0-331.2).
Bralelar at al.
Enfermedad
Evidencia de inlecci6n por CMV (antigeno CMV en celulas blancas de la sangre. cu llivo de CMV o seroconversi6n) acompai1ado par cualquier expresi6n de fiebre en picas no e~plicada por Olra raz6n par mas de 48 horas y malestar general 0 una caida en los conteos de neulr6filos por mas de 3 dias conseculivos .
Gane el al.
Menopausia
Remisi6n de diarrea
eMV
Mirza el al.
(2)
(3)
«)
(5)
2.2. MEDlDAS DE INClDENCIA La incidencia se entiende mejor en el contexto de los estudios pros pectivos (0 de cohon e) (Capitulo I . Secci6n I .4 .1 ). La estructu ra basica de cualqu ier indicador de incidencia es la siguiente: el nlimero de sucesos que ocurren en una poblaci6n definida a 10 largo de un lapso especffico (numerador) se divide por la poblaci6n en riesgo de experimentar tal evento durante dicho lapso (denominador) . Hay dos tipos de medidas de incidencia que se definen seglin el tipo de denom inador: I ) medidas de incidencia. basadas en personas en riesgo; y 2) med idas de incidencia basadas en unidades persona-tiempo en riesgo .
2.2.1. Incidencia basada en individuos en riesgo Este es un Indice definido en tenninos de la probabilidad de un evento, tambien conocido como incidencia aClllllulada . base para aplicar las tecnicas estadfsticas universalmente conocidas como muilisi.~· de slIl'ervivencia. Si el segu imiento es complew para cada individuo de la cohorte, la estimaci6n de la incidencia acumulada es simplemente el numero de eventos ocurridos durante eI seg uimiento dividido por la poblaci6n inic ial. Sin embargo. a menudo en los es(Udios epidemiol6gicos. el seguimiento es incompleto para muchos 0 para todos los ind ividuos en el estudio . En un estudio de cohorte Ifpico . hay individuos que se pierden, aquellos que mueren por cau sas diferentes a la de interes, y aquellos c uyo seg uimiento es mas corto en vinud de que son rec1utados para el esmdio mas tarde en el periodo de rec1utamiento; lodos ellos producen las lIamadas observacioneJ' cen.\"urada.~· y requieren enfoques analflicos especiales . Las tecnicas tradicionales para la estimaci6n de incidencia acumu lada (0 de su complemento. la supel" vivencia
50
EPIDEMIOLOGiA INTERMEDIA; CONCEPTOS Y APLlCAC[ONES
-
M (1)
I
M (17)
2
M (20)
3 M (9)
4
(24)
5 C (16)
6
-
7 B
C(2)
M {13} C (10)
9 M (3)
10
j ~
~
• 0
W
~
~
~
~
,• ,
~
~
~
~
~
~
~
~
~
~
~
~
~
~
~
~
~
~
~
~
• W
~
0
• W
~
~
>
•
W
,• ,•
~
~
~
>
~
~
• 0
w
Tiempo calendario
Figura 2.1. Cohorte hipotctica de to personas seguidas por es pacio de 24 meses entre cnero de 1996 y diciembre de 1997. M, muerte: C , observaci6n censurada: (). duraci6n del segUlmlcnto en meses (se asume en IOOos los casas niimeros enteros exactos).
(leI/lilli/ada 0 laJimci6n de slIpervivencia) cuando existen observaciones censuradas
son las tablas de vida de tipo act uarial (ind ist intamente denom inadas en esle capitulo como tab las de vida dusica.\' , aCfuariales 0 basatias ell infervulos) y e l metoda de Kaplan-Meier(7 ) . Como un ejemplo, 1a Figura 2. 1 afrece una representaci6n esquematica de un estud io cuyo res ultado de inten!s es la mucrte: 10 individuos son segu idos por espacio de dos afios (1996- 1997). Cada linea horizontal en la figura representa el tiempo de seguimiento de un unico individ uo . EI seguimiento puede conclu ir ya sea porque se produce e l evento (M) 0 POf abandono del estudio (C, aludiendo a una observaci6n censllratia, tal como se d ijo anteriormente) . Adviertase que los individuos se rec lutan en diferentes momentos, aSI como q ue abandonan el est ud io (ya sea por muerte, por abandono,o por la raz6n q ue sea) en distintos momentos . Por ejemplo, el individ uo numero 1 es reclu{arlo en noviemhre rle 1QQn y mllere en rl iciemhre rle 199n, I ra~ ~ol o lin me~ rle ~ guimiento, en tanto q ue eI individuo nLl mero 5 vive a 10 largo de todo el periodo de
seguimiento (dos afios). La Figura 2.2 muestra una reorganizaci6n de los datos de la Figura 2. 1, donde la escala temporal ha sido transformada al tiempo de seguimiento en lugar de emplear el tiempo calendario . ASI, el momento 0 ahora representa el comienzo del seguimiento para cada individuo (independientemente de la verdadera fecha en la
51
MEDICION DE LA OCURRENCIA DE LA ENFERMEDAD
r- 'M(1 } I M (17)
2
M (20)
3 M (9)
4
(24)
5 C (16)
6 7
C(2) M (13)
8 C (10)
9 M (3}
10
1
o
2
4
6
8
10
12
14
16
18
20
22
24
Tiempo de seguimienlo (meses)
Figura 2.2. La misma cohorlc de la Figura 2.1 con los licmpos-pcrsona rcprcscnlados de acucrdo al licmpo dcsdc cI comicnzo del csludio. M. muerte: C. observaci6n censurada: 0, duraci6n del seguimiento en meses (en tooos los casos se supone que se trata de numeros enteros exactos).
que comenz6 a ser observado) . Gran parte de la discusi6n que sigue sobre indices de incidencia se basa fundamenta lmente en la Figura 2.2 .
Incidellcia aculIlulada basada ell el enfoque de tablas de vida por illtervalos (tablas de vida cltisicas) La probabilidad acumulada de un evento durante un intervalo dado (que comienza en el momento X y dura 11/ unidades de tiempo) es la proporci6n de nuevos eventos durante dicho lapso (donde los evemos se denotan como md,), donde el denominador es la poblaci6n inicial (Ix) corregida por las perd idas (mc,) . En la tabla de vida ciasica, esta medida corresponde a la probabilidad basada en intervalos del evento mqA(8). Sll ctimpllfo es inmeci ialo. r omo ~ ve en la Figllra 2.2, OCll rren 0 mlle rles entre los 10 ind ividuos que estaban vivos al com ienzo del seguimiento. Si no se hubieran perdido sujetos durante la observaci6n, 2qO(con tiempos especificados en afios) serfa simplemente el numero de muertes a 10 largo de este intervalo de dos afios (2do) dividido por el numero de individuos al com ienzo del intervalo (10) : vale decir, 6/10 = 0,60 0 60 %. Sin embargo, puesto que los tres indiv iduos perd idos
52
EPIDEMIOLOGiA INTERMEDIA; CONC EPTOS Y APLlCAC[ONES
(que aportan datos censurados), M, no estaban en riesgo a 10 largo de todo e l seguimientQ, su limilada participaci6n debe ser adecuadamente comemplada en e l denominador para eSlimar la probabilidad acumu lada . Por convenio , la mitad de tales individuos se sustraen del denominador, y la probabilidad estimada se calcula entonces como: IEcuaci6n 2 .I J 0,7 1
El enfoque convencional consistente en SlISlraer de l denominador la mitad del numero total de observaciones censuradas se basa en el supuesto de que la censura ocurri6 de manera uniforme a 10 largo del periodo, de manera tal q ue. en promedio. estos individuos estuvieron en riesgo solo d urante la milad del perkKio de segu imiento. EI complemento de esta probabil idad acumulada del evento es la probabilidad acum ulada de supervivencia: esto es, '1jJo =
I-
2qO
= 0,29
Es importante advertir que a la probabilidad acumu lada de un evento (0 supervivencia acumu lada) no Ie corresponde un lapso intrfnseco: el tiempo ha de ser especi fi cado . As!, en este ejemplo, uno debe describi r q como <
de sobrevivir a 10 largo del segundo (es decir, por la probabilidad de sobrevivir a 10 largo del segundo intervalo supuesto que no se ha prod ucido la muerte d urante el primero, ya que aquellos que no pudieron sobrevivir todo e l primer intervalo no tienen oponunidad de entrar en e l segundo) . En este ejemplo,
La probabilidad acumulada de haber ten ido el evento es e l complemento de esta probabilidad conjunta de su pervi vencia: IEcuadon 2.2J
Esto es anaJogo al d lculo de la fund6n acumulada de supervivenda que emplea e l metodo de Kaplan-Meier que se ilustra en la proxima secci6n. N6tese que no es necesario que los intervalos en una tabla de vida clasica (basada en intervalos) sean de ig ual du raci6n . La longitud del intervalo debe determinarse teniendo en cuenta el ritmo al q ue se modifica la incidenda a 10 largo de l tiempo. Por ejemplo, para estudiar la supervi\'enda despues de un infarto agudo de miocard io, los intervalos deben ser muy cortos. inmediatamente des pues de comenzar los
MEDICION DE LA OCURRENCIA DE LA ENFERMEDAD
53
sfmomas, cuando la probabil idad de muerte es muy alta y cambia rapidamente . Sin embargo, los intervalos subsiguientes podrfan ser mas largos, en la med ida q ue la probabilidad de eventos recurremes y de muerte tiendan a estabil izarse. Ejemplos del uso del mdodo de tabla de vida actuarial pueden hallarse en los infonnes de los est udios epidemiol6gicos ciasicos (por ejemplo. Pooling Project Research Group('}) . En otros libnlS de texto de epidemiologfa pueden hallarse mas detalles y ejemplos adic ionales (por ejemplo, veanse Gord is(IO) y Khan y Sempos(II) .
In cidellcia aculllulada basada ell el enfoque de Kaplall.Meier (e ventos de tielllpos exactos) EI enfoque de Kaplan·Meier supone el dlculo de la probabilidad de cada evemo en el momento en que ocurre. EI denominador para tal dlcu lo es la poblaci6n en riesgo en e l momento en que se produce dicho evento(7). Como en la tabla de vida actuarial, se trata de computar «probabilidades condicionales>,: esto es, probabilidades condicionadas al hecho de haber estado en riesgo (vivos y no censurados) en el momemo de cada evemo. Si cada evemo (primero, segundo, etc .) se designa por su momemo de ocurrencia i, emonces la f6rm ul a para la probabilidad condicional se reduce, simplememe, a: tl i qi = -
n,
donde d, es el numero de muertes (u otro tipo de evento) q ue ocurren en e l momemo i (un numero que sera siempre I salvo que haya empates) y IIi es e l numero de suje(OS '1lJe rUIn se hall an hajo ohse rv~citin (es flec ir, en riesgo fie (ener e l even/o) en e l momento i. Por ejemplo, en la Figura 2 .2, cuando oc urre la pri mera muerte, exactameme al fina l del primer mes (persona N° I), hay 10 indiv iduos en riesgo; consec uentememe, la probabilidad condic ional es: ]
ql = - -
]0
Cuando se produce la segunda muerte despues de tres meses de seguimiemo (persona N° 10), hay solo 8 sujetos en riesgo; ello se debe a que, ademas de la muerte anterior, un individuo se habfa perdido del est udio (C) despues de dos meses (persona N° 7), Y por 10 tanto ya no estaba en riesgo en e l momento de esa segunda muerte . Asf, la probabilidad condicional en ese momemo de la seg unda muerte se estima mediame: ]
q3= '8 = 0, 125 La Tabla 2.3 (columna 4) sintetiza el dlculo de dichas probabilidades cond icionales para cada momemo . Adv iertase que para las observaciones previamente censuradas no se realizan dlc ulos de probabilidad (elias no re presentan un evemo como tal) pero son contabi lizadas en e l denominador para calcular la probabil idad de cada evento ocurrido ames de esa perdida del seguimiemo . Esto representa e l uso mas eficiente posible de la infonnaci6n disponible(7).
54
EPIDEMIOLOGiA INTERMEDIA ; CONC EPTOS Y APLlCAC[ONES
Tabla 2.3 Ciilculo de las cstimaciones de snpcrvivcncia por Kaplan-Meier para cI cjcmplo de la Figura 2.2 Tlempo (meses) (1) I
Indlviduos en rlesgo (2)
n,
Numero de eventos (3) d,
Probabilidad co ndiclonal de un evento (4) ql " d~nl
Probabilldad condiclonal de supervivencla (5)
Probabilidad acumulada de supervivencia (6)
PI ",l-QI
S,
1
10
1110",0.100
9/10 ,,0,900
0,900
3
8
1/6",0,125
7/8 '" 0,875
0.788
9 13 17
7 5 3
117",0,143 1/5 ::: 0,200
617 '" 0,857
0.675
4/5 "O,BOO
0,540
1/3::: 0,333
213 =0,667
0,360
20
2
112 ::: 0,500
112 =0,500
0,180
La columna 5 en la Tabla 2.3 recoge los complememos de las probabilidades condicionales del evento en carla momenta, es decir, 1a probabilidad condicional de superv ivencia (1',) la eual , como en el metoda de la tabla de vida chisica, representa la probabilidad de sobreviv ir mas alia del momento i entre aquellos que aun estaban bajo observaci6n en dicho momenta (es decir, condicionado a haber sobrevivido hasta el momento i) . La colu mna 6, tambien graficamente representada en la Figura 2.3, presenta las probabilidades acumu ladas de supervivencia: es(O es, la lIamada filllciOIl de .,upe/"vivem;iu de Kaplan-Meier (us ualmellte denotada med iante Si). Es ta
represema la probabi lidad de supervivencia desde el comienzo de l segu imiento hasta despues de l momenta i, calculada como el producto de todas las probabilidades de su pervivencia condic ionales hasta el momenta i. Por ejemplo, la probabilidad de superv ivencia ac umulada hasta el final de l seg uimiento durante dos afios (Si' donde i = 24 meses) es : 97642 1 S' 4= - - X - X - x - x - x - =0 180 -108 7532' As!, la estimaci6n de la probabilidad acumulada del evento ( I -Si) es: I - SN= 1- 0, 18=0,82
Tal y como oc urrfa con la probabilidad acumulada basada en el enfoque de tabla de vida actuarial (Ecuaci6n 2.2), el intervalo de tiempo para la probabilidad acumulada usando el enfoque de Kaplan-Meier tambicn necesita ser especificado (en este ejemplo. 24 meses 0 2 afios). Para conocer sobre metodos que pennitan estimar Ifmites de confianza para las probabi lidades de superv ivencia acumu lada, vease el Apendice A, Secci6n A. I. lndependientemente del metodo empleado para el calcu lo (actuarial 0 de KaplanMeier), la incidencia ac umulada es una proporci6n en el sentido estric(O del termino. Carece de unidades, y su valor se ubica entre 0 y 1 (0 100 %) .
MEDICION DE LA OCURRENCIA DE LA ENFERMEDAD
55
Supuestos ellia estimaci6n de fa incidencia aCllmulada basada en el antilisis de supervivencia Vni/ormidad de eventos Y I'erdidas dentm de auia intervalo (Tabla de vida ctasica, como se acaba de explicar). Implfcito en eI calculo de la tabla de vida c hisica esta el supuesto generico de que los eventos y las perdidas se producen de manera aproximadamente uniforme a 10 largo de carla intervalo definido. Si eI riesgo aumenta 0 disminuye demasiado ra pidamente dentro de un intervalo dado (es decir, si el intervalo es demasiado largo en relaci6n con los cambios de los riesgos que tienen lugar en su seno), entonces un riesgo promedio a 10 largo del intervalo no es completamente informativo . La aplicacion de la correcci6n por concepto de perdidas (es decir, sustraer del denominador la mitad de las perdidas, Ecuacion 2. 1) tambitn depende del supuesto de unifonnidad que se aplic6 a las perdidas. EI supuesto de uniformidad de eventos y perdidas dentro de un intervalo dado esta fntimamente relacionado con el modo en que se define la tabla de vida y su cumplimiento puede consegu irse ajustando la definicion de los intervalos de manera que sean adecuadamente unifonnes en tenninos de riesgo por ejemplo, acortandolos - . Ademas, este supuesto no procede cuando se usa el metodo de Kaplan-Meier, donde los intervalos no se definen de antemano . Si bien este supuesto basado en intervalos se aplica solo a las estimaciones de la tabla de vida clasica, los sig uientes dos supuestos son pertinentes tanto para estas Lillimas como para las estimaciones de Kaplan-Meier, y son ciertamente cruciales a los efectos de las tecnicas de analisis de supervivencia y de los analisis de datos procedentes de cohortes en general: I) independencia entre la supervivencia y la censura: y 2) ausencia de tendencias seculares durante el periodo de reclutamiento . Indel'endencia entre la silpervlvencia Y la cenJw"a . Para los calculos de la incidencia condicional y acumulada utilizando los metodos descritos. los individuos censu rados se incluyen en el denominador durante todo el tiempo durante el c ual pennanezcan bajo observaci6n; una vez censurados, se ignoran en los calculos subsigu ientes . Por tanto , si uno desea inferir que la superv ivencia total acumulada estimada (por ejemplo, 5 24 = 18 %, como en la Figura 2.3) sea generalizable a la poblacion total presente en el momento del comienzo del estud io (en el momento 0), se
Figura 2.3. Curva de Kaplan-Meier cor rcspondiente a los datos de la Tabla 2.3, columna 6
56
EPIDEMIOLOGiA INTERMEDIA; CONC EPTOS Y APLlCAC[ONES
necesila suponer que las observaciolle.~· ce/lSl/radas rimen fa /IIi.wl/a I'robabilidad del evento (desl'uis de fa eensllra) que las que permal/ean hajo observaci6n. En a lms palabras, la censura debe ser independieme de 1a supervivencia; de Dlro modo, se producira un sesga . Por ejemplo, si el riesgo fuese mayor para las observaciones censuradas que para las no censuradas (por ejemplo. los sujctos abandonan e l estudiodebido a que eSlan mas enfennos) , en el transcurso del liempo la poblaci6n en estudio induirfa una proporcion progresivameme mayor de sujetos de bajo riesgo; como resultado, la incidencia total acumulada (verdadera) resultaria subestimada (es decir, se sobrestimarfa la supervivencia). EI sesgo opucs(O ocurri ria si las observaciones censuradas tendiesen a producirse preferememente entre los individuos mas saludables. La direccion probable del sesgo atendiendo al motivo por el cual se produce la censura , se resume en la Tabla 2 .4 . Las observaciones censuradas debido a mllerfe I'or arras CUI/SUS en los esmd ios de resultados por causas especfficas, si la enfermedad de interes comparte los factores de riesgo con otras enfennedades que se asocian con la mortalidad, podrian producir un sesgo, ya que la censura puede no ser independiente de la supervivencia. Un ejemplo es un estudio en el cual e l desenlace estudiado es la muen e por cancer pulmonar. Supongamos que los participantes que mueren por otras causa.~, incluyendo muen es por enfennedad coronaria, son censurados en el momento de su muene (jya que no estan en riesgo de morir de un dncer de pu lm6n!). Debido a que el cancer de pulm6n y la enfennedad coronaria comparten un factor de riesgo importante, el habito de fll mar, es posible que los individuos que mueren de enfermedad coronaria hubieran tenido un mayor riesgo de cancer de pulm6n si no hubieran muerto de cardiopatfa isquemica , 10 que manifiesta una violacion del supuesto de independencia entre censura y supervivencia. Entre otras razones frecuentes de censura se incluyen que los participantes en e l estudio se nieguen a permitir contactos ulteriores en el seg uimiento (en un estudio donde la evaluacion de los desenlaces depende de tales contactos) y la perdida de
Tabla 2.4 Rclacion entre la razon para la censura y el supucsto de independencia entre la censura y la supcrvivencia en e l aniilisis de supervivencia <..Pued e produclr una vio laclon del supuesto de Independencia entre censura V supervlvencla?
SI el supuesto es vlolado, direccion probable del sesgo sobre la estlmaclon de la incidencla acumulada
Muertes par otras causas cuando hay tactores de riesgo comunes'
SI
Subestimaci6n
Rechazo a la continuaci6n de contactos
SI
Subestimaci6n
MigraciOn
SI
Va riable
Improbable+
Va riable
Tlpo de censu ra
Censura administrativa
• En la incidencia espe<:ifica por causas 0 los estudios de mortalidad. .;. Mas probable en estud ios con un perkldo de captad6n prolongado cuando exi sla teooencia secular.
MEDICION DE LA OCURRENCIA DE LA ENFERMEDAD
57
contacto debido a la migracion fuera del area de estudio. Los individ uos q ue se niegan a sostener nuevos contactos en el seguimiento pueden tener un estilo de vida menos saludable que los q ue satisfacen las demandas de un estud io prospectivo; si ese es eI caso, la censura puede lIevar a una subestimacion de la incidencia acumu lada . La d ireccion del sesgo que res ulta de la perdida del segu imiento de individuos debido a migraci6n es una funcion del contexto sociodemogrMico en e l cual ocurre la migracion; por ejemplo, si los individuQs q ue migran tienen un estatus socioeconomico (SS E) mas alto 0 mas bajo . Por ejemplo, si las perdidas ocurren principal mente entre los q ue estan en el SSE mas alto. que tienden a ser mas saludables. los que permanecen en el estud io tenderfan a tener una supervivencia menor. Por otro lado, si las perdidas ocurren princi pal mente entre individuos con un menor SSE y, por tanto, peor salud, la supervivencia calcu lada a partir de los q ue se mantienen en e l est ud io estarla inllada . Para las lIamadas perdidas administrativlls, q ue se definen como las que ocurren debido a q ue concluyo el periodo de segui miento (por ejemplo, personas numero 7 y 9 en la Figura 2.1), la suposicion de independencia entre la censu ra y la supervivencia se considera mas j ust ificada, ya que cabe pensar que por 10 general estas perdidas son independientes de los individuQs per se. (Sin embargo. las perdidas administrat ivas estan sujetas a cambios temporales q ue ocurren d urante el periodo de reclutamiento; veanse mas adelante las consideraciones que se hallan bajo el tft ulo «A usencia de tendencias seculares») . En resumen, la crucial slIpOJ'icion de q ue existe independencia entre censura y supervivencia para eI dlcu lo de los estimados de incidencialsupervivencia acumulada depende de las razones q ue hayan producido la censura (Tabla 2.4) . Esta suposicion es particularmente relevante cuando la magnitud del estimado de incidencia absolma es el centro del est udio; puede ser menos impol1ante si el investigador esta principalmente interesado en obtener estimaciones relativas (por ejemplo. cuando se comp..1ran incidencialsupervivencia en dos grupos definidos por los niveles de exposici6n en un estudio de cohorte), dado q ue puede esperarse q ue los sesgos que pudieran resu ltar de las perdidas habrfan de ser razonablememe ~im il ares en los grupos comparados. (para una discusion de un sesgo relacionado, vease «Sesgo de Seleccion» en el Capit ulo 4, Seccion 4 .2) . Finalmente, notese que esta suposicion puede a menudo ser verificada. Por ejemplo, usualmente es posible comparar caracterfsticas generales relacionadas con el desenlace de interes entre los individuos perdidos y los no perdidos durante la observac i6n . Porejemplo, es posible milizar el fndice Nacional de MOl1alidad para comparar la experiencia de mortalidad de los perdidos con la de los q ue completan el seguimiento. AI/sencia de tendellciaJ' secillares. En los estudios en los cuales e l tiempo de reclutamiento es prolongado, la decision de lIevar a todos los indiv iduos al tiempo 0 (como en la Fig ura 2.2) supone que no existen tendencias seculares con respecto al ti po y caraclerlsticas de estos individ uos que afecten e l resultado de interes. Este, sin embargo, puede no ser el caso en presencia de efectos de cahorte de nacimiento y de periado (tiempo calendario) (vease Capitu lo I , Seccion 1.2). Los cambios con e l tiempo de las caracterfsticas de los part ici pantes reclutados, aSI como los cambios seculares significat ivos en las exposic iones relevantes y/o tratamientos pueden introducir sesgo en las est imaciones de incidencialsupervivencia acumulada con d ireccion y magnitud dependientes de las caracterfsticas de estos efectos de cohorte 0 periodo . Por ejemplo, no serfa apropiado est imar la superv ivencia posterior al d iagn6stico para todos los pacientes identificados con diabetes insul inodepend iente entre 1915 y 1935 como un solo gruPQ. ya q ue este extenso periodo de reclutamiento
58
EPIDEMIOLOGiA INTERMEDIA; CONCEPTOS Y APLlCAC[ONES
combinarfa inapro piadamente dos cohortcs de pacientes mlly distintas: la de aquelias diagnosticadas ames de la introducci6n de la insulina y las que fueron diagnost icadas despues de dicha introducci6n . Similarmente, no serfa apropiado llevar a cabo un an.i.lisis de superv ivencia uniendo en e l momenta 0 a todos los ind ividuos VIHseropositivos en una sola cahone reclutada entre 1995 y 1999, esto es, antes y despues de que un nuevo tratamiento efectivo (inh ibidores de la proteasa) est uviera disponible.
2.2.2. Tasa de incidencia basada en tiempo-persona En vez de emplear individuos, el denominador de este tipo de medida de incidencia esta formada por e l numero de unidades de tiempo (r) con q ue los individuos en riesgo contri buyeron al periodo de seguimiento (II) . Por ejemplo, consideremos una cohorte hipotetica en la cual ocurren 12 eventos y que la cantidad total de tiempo de seguimiento ac umu lado por todos los individuos asciende a 500 dfas. La tasa de incidencia en este ejemplo es 12/500 = 0,024 por dfas-persona, 0 2,4 por 100 dfaspersona . N6tese q ue e l ntl mero de indiv iduos en el grupo no se brinda; por tanto e l monto del «t iempo-persona>, en el ejemplo podrfa haberse originado por 50 indiv id uos cada uno de los c uales haya sido observado durante 10 dfas (50 x 10), 5 indiv id uos observados durante 100 dfas (5 x 100) 0 cualqu iera de un sinnumero de variantes similares . Las tasas de incidencia 110 son proporciones. Se miden en unidades de tiempo·1 y pueden ir desde 0 a infinito, depend iendo de las unidades de tiempo empleadas . Por ejemplo, la tasa de incidencia anterior podrfa expresarse de varias maneras: 12/500 dfas-persona = 12/ 1.37 anos-persona = 8.76 por ano-persona (u 876 por cien anospersona) . EI ultimo valor es mayor que I (0 que 100 %) solamente debido a la un idad de tiempo q ue se e ligi6 para ser ut ilizada en el denominador. Por tanto, e l valor q ue asume la tasa de incidencia depende de la unidad para tiempo-persona seleccionada para la construcci6n del denom inador. Si una persona tiene un evento de interes despues de un seg uimiento de 6 meses y e l invest igador elige expresar la tasa en terminos de anos-persona, la tasa sera 110,50200 por 100 anos-persona. La unidad de tiempo ut ilizada q ueda a discred6n del invest igador y se selecdona usualmente sobre la base de la frec uenda del evento bajo est udio . L1 raz6n principal por la q ue muchos est udios epidemiologicos milizan los aiios-per.wlla para e l analisis es q ue se trata de un recurso conveniente para expresar eventos raros . Por otro lado, cuando se estan estudiando enfennedades 0 eventos de salud mas 0 menos frecuentes, puede ser mas conveniente utilizar alguna otra unidad de tiempo (Tabla 2.5). La selecci6n es totalmente arbitraria y no afectara las inferencias que se deriven del estudio . Mas que una proporci6n sin unidades de los individuos que tuvieron el evento respecto al total de los que estaban en riesgo (vease incidencia acumulada explicada arriba), la estimaci6n de la tasa de incidenda expresa la «Iasa~) a la c ual oc urren los eventos en sujetos de la poblaci6n en riesgo en cualq uier momento . A este tipo de tasas tambitn se Ie llama (iellsidad de incit/ellcia, un concepto analogo al de velocidad: la tasa de cambio instantaneo 0 la «rapideb) con la que e l individuo desarroll a e l evento (enfennedad, muerte, etc.) en la poblaci6n. Este concepto es la base para algunas de las tecnicas matematicas de modelaci6n uti lizadas para el analisis de tasas de incidenda (por ejemplo, modelos de regresi6n de Poisson; vease Capitulo 7,
MEDICION DE LA OCURRENCIA DE LA ENFERMEDAD
59
Tabla 2.5 Ejemplos de unidadcs tiempo-persona de aeuerdo a la rrct:ucncia de evcntos bajo illYestigacion Ellento estudlado
Unldad persona tlempo tlplcamente empleada
General
Cancer de mama incidente
Alios persona
General
Infarto de miocardio incidente
Alios persona
Ninos malnutridos
Oiarrea incidente
Meses persona
Enfermos de cancer putmonar
Muerte
Meses persona
Pobtaci6n afectada por inftuenza epidemica
Inftuenza incidente
Semanas persona
Ninos con diarrea aguda
Recuperaci6n
Dias persona
Poblacl6n
Secci6n 7 .4.5). Sin embargo, debido a que la tasa instantanea para cada individuo no puede ser calcu lada directamente, la incidencia promedio a 10 largo de un periodo para una poblaci6n se suele emplear como valor aproximado . La incidencia promedio puede calc ularse a partir de datos individuales 0 agregados del seguimiento, como se discutira mas adelante . Por razones practicas, los tcnninos rasa y densidad se utilizan indistintamente; sin embargo, en Ia discusion que sigue, el termino rasa se utilizara principalmente en el contexto de datos agntpados, en tanto que demidad se usara para aludir a una tasa basada en datos obtenidos de cada individuo en el estudio .
Tasa de incidellcia basada ell datos agregados
Este tipo de incidencia se obt iene tfpicamente para un lugar geografi co ut ilizando como denominador el promedio de la poblacion estimada para cierto lapso dado . Si este periodo no es excesivamente largo y si la poblacion del area de interes y su composici6n demografica son relativamente estables, la poblaci6n promedio puede estimarse como la poblaci6n a mitad de periodo (por ejemplo, 1° de j ulio para un periodo de un ano). En un estud io de cohortes, el promedio de la poblacion al principio y al final del periodo pueden obtenerse para un intervalo del seguimiento dado. Por tanto, para un intervalo de tiempo especifi cado, se tiene: Tasa de incidencia =
Numero de eventos en el intervalo Poblaci6n promed io
En la Figura 2.2, por ejemplo, 10 individuos estan vivos y presentes en el estudio al principio del periodo de seguimiento (<
6()
EPIDEMIOLOGiA INTERMEDIA; CONCEPTOS Y APLlCAC[ONES
10 + 1 11=
2
=5,5
EI tamana promedio /I de la poblacion p uede tambicn calcularse slIstrayendo la mitad de los eventos (M) y de las perdidas (C) de la poblaci6n inicial: 11=
10 - 112(6+3)=5,5
Como con {odos los valores medios. la suposic i6n subyaceme cuando se ut iliza este recurso es que, en promedio, habfa 5,5 personas a 10 largo del estudio (2 afios). Para que se cumpla tal suposici6n, los eventos y las salidas deben ocurrir un iformemente a traves del periodo de seguimiento. La tasa de nueVQS eventos en relaci6n a la poblaci6n promedio se calcula entonces asf: Tasa de incidencia = _ 6_ = 1,09 por persona - 2 afios j~
N6tese que en este ejemplo, la lasa se basa en una unidad tem poral de 2 afios y no en el nLl mero de individuos (vease mas adelante) . La suposic i6n que subyace cuando se emplea la poblaci6n promedio es que 5,5 individ uos fueron observados durante todo e l periodo de 2 MOS, a 10 largo del cual se prod ujeron 6 eventos. EI ejemplo subraya nuevamente e l hecho de q ue este tipo de tasas no es una proporcion y, por tanto, no esta forzada a ser menor que I (0 100 %) . En este ejemplo particular, la tasa, aparentemente contraria a la intuici6n, de 109 por 100 tiempo-personas obviamente res ult6 del hecho de que se esta ut ilizando «2 anos~) como la un idad de tiempo; si en lugar de e llo se hubiese utilizado como unidad e l «ano-persona», la tasa hubicra sido 1,0912 anos = 0,545 por ano-persona (0 54,5 por 100 afios-pcrsona). EI ejemplo anterior ilustra la est imaci6n de una tasa de incidencia c uando se usa la poblacion promedio de una cohone definida (es dec ir, la cohone hipotetica representada en la Figura 2.2). Sin embargo, esta no es su apl icacion usual. La habit ual es que e l d lculo de la incidencia se realice con datos agm pados. Tal es el caso cuando se estud ia la monalidad usando infonnaci6n de las estadfsticas vitales, 0 c uando se estima la incidencia de casos nuevos de una enfennedad usando registros poblacionales (por ejemplo, cancer): en otras palabras, cuando se necesita estimar la incidencia p..1ra agregados de individuos, defi nidos par su residencia en un area geografica en un perkKio dado . E.<>tos agregados se conocen como cahortes dil/{imicas 0 abierfas porque incluyen individuos q ue son afiadidos 0 sustrafdos del total de la poblaci6n en riesgo a medida que migran hacia fuera 0 haciadentro del area (es decir, una situaci6n mas claramente representada por el d iagrama en la Figura 2. 1 q ue por e l de la Figura 2.2).
Detlsidad de illcidetlcia basada en datos individuales Este tipo de incidencia p uede est imarse cuando se tienen datos relativamente precisos del momenta en que se producen los eventos 0 las perdidas para cada ind ividuo de una cahone definida. EI tiempo-persona total para el periodo de esmdio es simplemente la suma de los tiempo-persona con los q ue contribuy6 cada individuo. La densidad de incidencia promed io se calcula entonces como:
61
MEDICION DE LA OCURRENCIA DE LA ENFERMEDAD
Numero de eventos Densidad de incidencia = -=- :-:-------:-Total de personas-tiempo Para eada ind ividuo en e l ejemplo que se il ustra en las Figuras 2.1 y 2.2, la longitud de la ]fnea horizomal representa e l lapso transeurrido entre el eomienzo del seguimiento y e l momento en que e l ind ividuo muri6 (M) 0 se perdi6 de la observaci6n (C). Por ejemplo, para e l ind ividuo N° I la muerte ocurri6 exaetamente despues de un mes o Por tanto, su contribue i6n a l total de afios-persona en cl primer ario de seg uim iento (vease Fig ura 2.2) serfa 11 12 = 0,083 ; obviameme, esta persona no hizo comribuci6n alguna al seg ui miemo d urante el segundo ano. Por otro lado, el ind ividuo N° 2 mu ri6 despues de permaneee r en e l estudio por espacio de 17 meses, 0 un ano y 5 meses. Por tamo, su contribuci6n al primer ario de seguimiento fue de 12/ 12 y al segundo ano fu e de 5/ 12, para un total de 1,4 17 arios-persona . La contribuci6n de los individ uos eensurados se ea lcul a de identic a manera . Por ejemplo, la comribuci6n de l ind ividuo N" 6 al numero total de anos-pe rsona fue equ iva lente a 16 meses, 0 un ano-pe rsona completo en e l primer ano y 4/ 12 en el segundo, para un total de 1,333 anos-pe rsona . El dlculo de anos-persona para los 10 participantes de l est udio se muestra en la Tabla 2.6. En este ejemplo, la densidad de incidencia apl icable al pe riodo de seguim iemo tota l es, por 10 tanto, 6/9,5 83 = 0,63 por ano-persona (0 63 po r 100 arios-persona) . Alternativamente, la densidad de incidencia podrfa ex presarse como 6/(9,583 x 12 meses) = 0,052 por mes-pe rsona (5,2 por 100 meses-pe rsona) . Un metodo para est imar los lfmites de eonfianza de las tasas de incidencia se brinda en e l Apendice A, Seecion A.2 .
Tabla 2.6 Calculo del numero de a lios-personas basado en la Figura 2.1
..
Co ntrlbuclon al numero total de an os-persona s por los partlcl pantes en:
Indilliduo
Tiempo total del segulmiento (meses)
Primer ano de segulmiento
Segundo ano de segulmlento
Period o total de segulmlento
2 3 4 5 6 7 8 9 10 Total
17 20 9 24 16 2 13 10 3 115 meses
1112=0,083 12/12 : 1,000 12/12:1 ,000 9112 :0,750 12/12:1 ,000 12/12 : 1,000 2/12:0,167 12/12 : 1,000 10112:0,833 3112 :0,250 7,083 alios
0 5112 :0,417 8112 :0,667 0 12112", 1,000 4112: 0,333 0 1112:0,083 0 0 2.500 anos
0,083 1,417 1,667 0,750 2,000 1,333 0,167 1,083 0,833 0,250 9,583 alios
62
EPIDEMIOLOGiA INTERMEDIA; CONC EPTOS Y APLlCAC[ONES
Suposiciones para fa estimaci6n de las lasas de incidencia basadas en tiempo-persona Las suposiciones de independencia entre la censlIra y la supervivencia y la allsencia de tcndencias secul ares que fueran discutidas en la Secci6n 2.2 .1 lambien son relevames en el contexto del analisis liempo-persona . Estos supuestos tienen que ver con la ausencia de sesgo de selecci6n y se aplican a clIalquier tipo de analisis estadislico de un estudio de cahone. Ademas, al igual que para la incidencia basada en la tabla de vida act uarial (Ec uac i6n 2. 1) (Secci6n 2 .2. 1). un supuesto imponante c lIando se ul iliza el enfoque tiempo-persona es que el riesgo del evento pennanece aproximadamente constante en el tiempo durante eI imervalo de inten!s, 0, en otras palabras, que el riesgo estimado ha de poder aplicarse igualmente a cualqllier ullidad de tiellll'o denlro liel illfervalo. Esto significa que II personas seguidas durante t unidades de tiempo son equivalentes a t personas observadas durante n unidades de tiempo: por ejemplo, el riesgo de un individuo que vive 5 unidades de tiempo dentro del intervalo es equ ivalente a 5 individuos cada uno de los cuales vive una unidad (Figura 2.4). Cuando los individuos estan expuestos a un factor de riesgo dado , otra interpretaci6n de este supuesto es que el efecto resultante de la exposic i6n no es acumulat ivo dentro del intervalo de seguimiento de interes . A menudo es diffcil aceptar que este su puesto se c umple como, por ejemplo, cuando se realizan esmdios de riesgo de enfennedad respiratoria cronica en fu madores: el riesgo de bronq uitis cr6nica para
Individuo N,"
Ano 1
M02
Ano3
Ano4
Ano 5
2 3
4 5
6 7
8
Figura 2.4. Ticmpo dc scguimicllto para 8 illdividuos cn un cstudio hipotCtico, Se supone que la suma de los tiempos-persona para los individuos N DI aND 5 (con un periodo de seguimiento corto de un aiio cada uno) es equivalente al que aportan los individuos N° 6 Y 7 (con tiempos de seguimiento de dos y tres a110s respectivamente) y al tiempo total para e l individuo N° 8 (quien tiene e l tiempo de seguimiento mas largo, 5 a11os). Para cada grupo de individuos (N° 1-5 , 6 Y 7, Y8), el nlimero total de aiios-persona de observaci6n es 5.
63
MEDICION DE LA OCURRENCIA DE LA ENFERMEDAD
algu ien que ha fumado sostenidamente durante 10 anos ciertamente no es el mismo que el de 10 personas que han fumado a 10 largo de un ano, ya que el efecto del habito de fumar liene un caracter marcadamente acumulativo. Para disminu ir la dependencia que de este supuesto liene el enfoque riempo-persona, eI periodo de segu imiento puede dividirse en intervalos mas pequenos y calcular las densidades para cada uno de ellos. Por ejemplo, utilizando los datos de la Tabla 2.6 y de la Figura 2.2, es posible calcular las densidades separadamente para eI primero y el segundo ano de segu imiento como sigue: Primer ano de scgu imiento: 317,083 = 42,4/ 100 anos-persona (0 3/85 = 3,6/100 meses-persona) . Segundo ano de seguimiento: 3/2,500 = 120/ 100 anos-persona (0 3130 = 10/ 100 meses-persona) .
Relaci6n entre fa densidad (basada en datos individuafes)
y tasa (basada en datos ag rllpados) Tiene interes praclico el hecho de que cuando las salidas (0 adiciones en una poblacion abierta 0 en una cohorte dinamica) y los eventos oc urren unifonnemente, la tasa (datos agmpados) y la densidad (datos individuales) son virtualmente iguales, en tal caso, la densidad por tiempo-persona se corresponde con una tasa para una poblaci6n promedio, promediada para la unidad de tiempo correspondiente (por ejemplo, anualmente). Nli mero de eventos (x) Tasa =
Poblacion promed io (11) tiempo (1)
x
.
= - - = Densldad /I
x1
Esra idea puede entendersc inruitivamente. Para una unidad de tiempo dada, tal como un ano, el denominador de la tasa (la poblaci6n promedio) es Malogo al nlimero total de unidades de tiempo vividas por lodos los individuos en la poblaci6n en esc lapso . Se da un ejemplo en la Tabla 2.7 conformada con los datos de 4 personas seguidas por un maximo de 4 anos . Un individuo se pierde del scgui miento (censurado) despues
Tabla 2.7 Correspondencia entre densidad y tasa en un estudio en el eual 4 personas son seguidas durante un ma ximo de 2 anos y los eventos y las pcrdidas se distribu yen unirormemente Indllliduo N°
Desenla ce
Momento de ellentoJperdlda
muelle
a los 0,5 aiiQS (6 meses)
2
perdida de observacicn
a un ano
3
muerte
a los 1 ,5 arios (18 meses)
4
censura administrativa
a los 2 anos
numero total de arios-persona:
Numero de anos persona
0.' 1.0 1.' 2.0 '.0
64
EPIDEMIOLOGiA INTERMEDIA; CONCEPTOS Y APLlCAC[ONES
de un ana; dos individuos mueren, uno despues de media ana y el alro despues de 1,5 anas; y e l cual1Q individuo sobrevive hasta el fina l del est udio. Hay, por tanto, una sime{ria perfecta en la distribuci6n de las salida.>; 0 de los eventos que ocllrrieron despues de 0,5, 1, l ,..s Y 2 afios despues del comienzo del estudio . Sumando la contribuci6n al tiempo de seguimiemo hecha por carla participante se abl iene un total de 5,0 anos-persona. L1 densidad es por tanto de 2 muertes por 5 afios-persona, 0 0,40 . La poblaci6n promed io (n) en este ejemplo puede estimarse como (poblaci6n in icial + poblaci6n final)I2,Q (4 + 1)/2 = 2,5. La tasa para el liempo total (1) = 2 anas es emonces 212.5 . La lasa promedio anual es por lamo equ ivalente a la densidad uti lizando el tiempo-persona como denominador:
x Tasa anual = -n- = -x- = t
/I X
t
_-,--_0"___ anos persona
= Densidad = ---:-::-2--;:- = _2 = 0 40 2,5 x 2
5
'
Porotro lado, c uando las perdidas y los eventos no oc urren de una fonna aproximadamente unifonne, la tasa de incidencia basada en la poblacion promedio y la densidad de inddenda basada en la misma pobladon pueden ser discrepames en 10 que conderne al penodo de segu imiento correspondiente. Por ejemplo, basados en los datos de la Figura 2.2, la inddenda anual promedio que se obtiene empleando la poblad6n media ascendi6 a 54.5/ 100 anos-persona: sin embargo usando la densidad de inddenda esta resul{o ser 6311 00 anos-persona. EI ejemplo hipotetico ilustrado esquematicamente en las Fi gura.~ 2.1 y 2.2 se basa en un {amano de muestra muy pequeno y, por tanto, la falta de unifonnidad puede deberse a la variabilidad muestral. Cuando el tamano de la mues{ra es grande, y siempre que e l intervalo sea razonablemente estrecho, la suposici6n de unifonnidad de evemos/perdida.~ se cumple con mayor probabilidad. La nocion de que la poblad6n promedio es equ ivalente al nlimero total de personastiempo cuando los eventos y las salidas son uniformes es analoga al supuesto que se hace en relad6n con las salidas en la tabla de vida actuarial (vease Secci6n 2.2 .1 , Ecuad6n 2. 1). Si no se conoce exactamente cuando ocurrieron los evemos en un periodo dado, cada persona que 0 bien sufre un evemo 0 bien sale del estudio se supone que comribu ye al tiempo de segu imiento con una mitad de una unidad de tiempo dada. (Se pres upone que este sera el promedio cuando se tenga un gran nlimero de individuos entrando y saliendo en diferentes momcntos a 10 largo de cada unidad de tiempo). En una cohorte abierta (dinamica), ademas de las perdidas debidas a eventos y salidas, se suman otros individuos (porejemplo, por concepto de inmigracion). Estas adiciones {ambien son contempladas al utilizar la poblad6n promedio, que se corresponde con el tiempo-persona al que estos individuos afiadidos contribuyen. supuesto que entraron en la poblaeion unifonnemente a traves del periodo. La eorrespondencia entre tasa (basada en datos agrupados) y densidad (basada en tiempos-personas individuales) haec posible eomparar una tasa promedio anual basada en una poblacion promedio - que, en estadfsticas vitales es usualmeme e l punto medio,o la poblad6n estimada cli o de julio - con una densidad basada en afios-
65
MEDICION DE LA OCURRENCIA DE LA ENFERMEDAD
persona . Po r ejemplo. es pr:ktica comlin en los estud ios de epidemiolog fa oc upacional obtener un nlimero esperado de evemos necesarios para el d lculo de la raz6n estandarizada de mortalidad med iante la aplicaci6n de tasas por edad especfficas tomadas de las estad fsticas vitales de poblacion al numero de afios-persona acumulados por edad especffi ca por una coho rte expuesta (vease Capitulo 7, Secci6n 7.3.2).
Estratificacioll de los tielllpos-persolla y tasas de aClierdo al tielllpo de segllillliellto y covariables EI d lculo del tiempo-persona vivido por una poblaci6n 0 grupo es simplemente la suma de los tiempos-persona vividos por los diferentes integrantes del grupo durante el periodo de seguimiento . En la mayorfa de los estudios analfticos prospectivos relevantes en epidemiologfa. el riesgo del evemo cambia con el tiempo. Por ejemplo, la incide ncia de even(Os fata les 0 no fatales puede aumentar con el tiempo, al igual que se siguen individuos sanos a medida q ue envejecen. En otras situaciones, los riesgos disminuyen a medida que progresa el seguimiento. tal y como ocurre en el estudio de complicaciones despues de la cirugfa 0 con la mOl1alidad de los casos de infarto de miocardio. Debido a que calcular una ta&'1 global promedio en un periodo largo cuando la incidencia no es unifonne no tiene mucho sentido, es necesario estimar la ta&'1 de eventos para intervalos dentro de los cuales se puede suponer homogeneidad en el riesgo. Por tanto, como se discuti6 antes, a menudo es impol1ante estratificar el tiempo de seguimiento y calcular la tasa de incidencia para cada estrato (por ejemplo. Tabla 2.6) . En un estudio de cohorte. uno puede adicionalmente desear controlar las variables confusoras potenciales. EI tiempo y las variables confusoras pueden tenerse en cuenta estratificando el tiempo de seguimiento para cada indi viduo de acuerdo a otms variables de tiempo (por ejemplo, edad) y categorfas de las variables confusoras. y luego sumar los tiempos-persona dentro de cada estrato. Los siguientes ejemplos ilustran el d lculo de tiempo-persona y las tasas de incidencia correspondientes basadas en los datos que se muestran en la Tabla 2.8, correspon-
Tabla 2.8 Datos hipotcticos de cuatro mujeres postmellopausicas seguidas despucs de ulla operacion de cancer de mama para evaluar mortalidad Mujer N° '
Mujer N" 2
Mujer N° 3
Mujer N° 4
Fecha de la operaci6n
1983
1985
1980
1982
Edad cuando se opero
58
50
48
54
Edad cuando la menopausia
54
46
47
48
Hltbito de fumar cuando se oper6
Sf
N4
Sf
N4
Cambio en el hltbilo de 'umar (ano)
Abandono {1986}
N4
N4
Empieza (1983)
Desenlace
Muerte
Pt'lrdida
Aun viv ia al 'inalizar
Muerte
Fecha del evenlo
1989
1988
1990
1984
EPIDEMIOLOGiA INTERMEDIA; CONCEPTOS Y APUCACIONES
1980
81
83
B2
84
I
1985
86
87
88
89
1990
I
I M
.•,.
2
~
3
•
'.
M
4
,
2
~
•
2
Tiempo desde que se aper6 (anas) 3 4 5 6 7 I
I
I
I
I
9,
10
I
____________~-"M
,...-----+•
.~ ~
3 >---------+--------~., M 4 ; -_ _---"
Figura 2.5. Represcntacion esquematica de tiempos-persona para datos hipotCticos de la Tabla 2.8, de acuerdo a una escala de tiempo: tiempo calendario (arriba) y tiempo de seguimiento (debajo) (las observaciones censuradas se indican con flechas).
diente a un est udio hipotetico de cuatro mujeres postmenopausicas seguidas para evaluar la mortalidad despues de una operacion de dncer de mama ( 1980- 1990) . L1 Tabla 2.8 expone las fechas de la cimgia (<,), la fecha del evento (muerte 0 censura) , las edades en el momenta de la cirugfa y de la menopausia y el habito de fumar. Una escala de tiempo. A partir de los datos de la Tabla 2.8, el seguimiento de estas cuatro mujeres se muestra en la Figura 2.5. EI panel superior de la Figura muestra el segu imiento de acuerdo al tiempo calendario para cada una de las cuatro mujeres; el panel inferior muestra e l tiempo de seguimiento despues de la cirugfa. Notese que en la Figura 2.5, arriba, como no se conocen las fechas de la cirugfa y e l desenlace se supone que estas coinciden con la mitad del ano correspondiente (vease antes). Si pudiera suponerse que el riesgo del evento fue aproximadamente unifonne dentro de los intervalos de 5 anos. estarfamos Just ificados al calcular e l tiempo-persona separadamente para e l primero y el segundo periodo calendario de 5 anos (Figura 2.5, arriba); el dlc ulo de las tasas se muestra en la Tabla 2.9. Notese que a los individuos c uyos seguimientos comienzan 0 tenninan en alglin momemo durante un ano dado se les asigna la mitad del ano-persona: por ejemplo, una comribuci6n de 0,5 Mos-persona proviene de la mujer nO I en 1983, ya que su operaci6n se lIevo a cabo en alglin momento del
67
MEDICION DE LA OCURRENCIA DE LA ENFERMEDAD
Tabla 2.9 Eslralificacion de liempo-pcrsona y lasas de acuerdo al liempo calendario, de acuerdo con la Tabla 2.8 y la Figura 2.5 , parle superior liempo caiendario
Mios-personas
Deseniaces
ra sa
1980·1984
8
1985·1989
12,5
1
0,125 0,080
(1990-1994)
(0,5)
(0)
(0)
ano 1983 . Por tamo, el total de tiempo-persona para eI periodo 1980- 1984 es de 1,5 anos (mujer nOI) + 4.5 anos (mltier nO3) + 2 MOS (mujer nO4) = 8 Mos-persona. Alternat ivamente, uno podrla estar imeresado en examinar las tasas de este esludio de acuerdo al tiempo de seguimiemo, como se muestra en la Tabla 2.1 0 . Por ejemplo. como la m ujer nO I se sigu i6 desde 1983,5 a 1989,5, puede suponerse que ella fue seguida durame 6 anos completos (Figura 2.5, debajo). Dos 0 lIIas escalas lie fielllpo . Las cohortes epidemiol6gicas eslan usualmeme constimidas por indiv iduos independientes que interactuan y estan sujetas a variadas circunslancias biol6gicas y ambiemales. Por tamo, es con frecuencia imponame tamar en consideraci6n mas de una escala de tiempo; la selecci6n de las escalas utilizadas para la estratificaci6n del tiempo de seguimiento varIa de acuerdo a las caracterfsticas y objet ivos del est udio (Tabla 2. 11 ).
Tabla 2.10 Eslralificacion de tiempo_pcrsona y tasas de ac uerdo al segui mi('nto
(tiempo desde la opcracion), basada en la Tabla 2.8 y la Figura 2.5 , parte inrerior llempo transcurrido desde la operacl6n
Aii os-personas
0·4 arios
15
0,0667
5-9 anos
6
0,1667
Eventos
lasas
Tabla 2.11 Ejemplos de escalas de tiempo rcle va nles rrecuentemenle empleadas en el conlcxlo de esludios de cohortI' Escala de tiempo Tiempo de seguimiento (tiempo desde
l lpo de estudio lOOos los estudios
la eaplaei6n) Edad
lOOos los estudios
Calenda rio
lOOos los estudios (si la eaptaei6n se haee sab re un periOOo extendido)
Tiempo desde que se liene un empleo
Estudios ocupaaonales
Tiempo desde la menarquia
Estudios de desenlaees reprOOuctivos
Tiempo desde la seroconversi6n
Seguimiento de paeientes con infecci6n VIH
68
EPIDEMIOLOGiA INTERMEDIA; CONC EPTOS Y APLlCAC[ONES
64,5
1985 L-______ I
13'~21 -"'=2~,;;' --_o~~--_r--O<"c""07F_--------1 131
(0,5
\
14
(1,5
1989,5
1983,5
I~OL---~~--L---------~----~--~------~
45
50
60
55
65
Edad (anos) 58,5
Figura 2.6. Represcntacion esqucmatica de los ticmpos-pcrsona para las 4 mujcres de 13 Tabla 2.8 de acuerdo ados escalas de ticmpo, edad y ticmpo calcndario, catcgorizados en intervalos de 5 alios. Debido a que los datos de tiempo se dan en alios completos. se supone que la entrada. los eventos , y las salidas ocurren exactamente a mitad de aiio. Las observaciones censuradas se representan por una flecha. El tiempo IOtal deniro de cada estrato de tiempo para las 4 mujeres se muestra entre parentesis . Los tiempos de entrada y salida para la mujer NQ I se dan en itaticas .
En la Figura 2.6, el tiempo-persona y los resultados de las 4 mujeres de la Tabla 2.8 se re presentan de acuerdo ados escalas de tiempo, la edad y el tiempo calendario. En este tipo de representacion grMica (conoc ida como (Jiagmmll de Lexi.\"), la trayectoria de cada individuo se representa por lfneas d iagonales a traves de las dos escalas de tiempo. Como en e l ejemplo previo, y dado que los datos sobre el tiempo son aproximados (a anos completos), se supone q ue la entrada y el desenlace (0 la censura) ocurren en e l punto medio del intervalo de un ano. La Tabla 2.12 muestra los estimados correspondientes de tiempo-persona total para cada estrato de dos dimensiones . Estos se obtienen mediante la suma del tiempo total Tabla 2. 12 Estratifieacion de tiempo-persona y tasas de aeuerdo al tiempo calcndario, y cdad (vease Figura 2.6) Tlempo calendarlo 1980-84
1985-89
Edad (ail os)
Ailos·Persona
45-49 SO-54 55-59 60·64
1,5 3,5 3 0
45-49 50· 54 55-59 60·64
0 5 3 4 ,5
Eventos
o o
Tasa
o o 0.3333
o o
o o 0.2222
69
MEDICION DE LA OCURRENCIA DE LA ENFERMEDAD
vivido por los individuos en el estud io en cada estrato edadltiempo calendario representado por 8 cuadrados en la Figura 2.6: por ejemplo, para aquellos que tenian de 55 a 59 afios de edad entre 1950 y 1984, se trata de la suma de I j afios vividos por la mujer nO4 (entre la edad 55 y la edad 56j, la edad supuesta de su muerte) y I j afios vividos por la mujer nOI en esc estrato . Adviertase que los desenlaces tambien se asignan a cada estrato correspondiente, 10 que pennite por tanto el calculo de las tasas de incidencia espec ffi cas por calendario y edad, tambicn mostrados en la Tabla 2. 12. Otras escalas de liempo pueden ser atractivas . En epidemiologia oc upacionaL por ejemplo. puede ser de interes obtener tasas de incidencia de ciertos res ultados, teniendo en Cllenta Ires escalas de tiempo simu ltaneamente: porejemplo, la edad (si la incidencia depende de e lla), tiempo calendario (si ha habido cambios seculares en las dosis de exposici6n), y el tiempo desde que el sujeto se desempefia es este empleo (ya que este puede influir en la dosis acumulada). Para tal situaci6n, podrfa hacerse un d ibujo tridimensional analogo al de la Figura 2.6: cubos definidos por estratos de las tres escalas de tiempo y cada tiempo-persona individual atravesando las diagonales lridimensionales. EI procedimiento para el calculo de los tiempos-persona y las tasas de incidencia asociadas antes descrito puede ser lIIilizado para realizar comparaciones internas 0 externas de tasas estratificadas usando razones de mortalidad 0 de incidencias estandarizadas (vease Capitulo 7, Secci6n 7.3.2) .
Tiempo y covariablesfijas y dependientes del fiempo. En ciertos casos, puede ser apro piado estrat ificar segun covariables espedficas ademas del tiempo. Por ejemplo, la Figura 2.7 muestra los tiempos-persona y los eventos para las c uatro mujeres de la
Fumador allnleio Menopausia 00 5 arios
Menopausia <5 atlos 19oo
1990
1985
1985
V
121 (1,5 If.3
198{)
45
~51
50
~'(
:7
""i 1
If.3
1980 55
60
65
45
55
50
60
65
No fumador al Inleio Menopausia 00 5 arios
Menopausia <5 atlos 19oo , - , - - , - - , - - - ,
1990
10/
Iv 1985 1--* - -+--+---1
1985
198{)
1980
'---_'---_-L_--'-_~
45
50
55
60
65
2
0
(0.5
45
#4 50
10.5)
55
60
65
Figura 2.7. Tiempos-pcrsona de acuerdo a tiempo calendario, ro ad , tiempo desde la menopausia , y lul.bito de fumar en el mo mento de la opcracion para las mujercs de la Tabla 2.8
70
EPIDEMIOLOGiA INTERMEDIA; CONC EPTOS Y APLlCAC[ONES
Tabla 2.8 de acuerdo a Ires escalas de tiempo: 1a edad, el tiempo calendario y el tiempo transcurrido desde los cambios meno pausicos (definidos arbilrariameme como una variable dicot6mica), ademas de la situaci6n en relaci6n al habito de fumar a1 comienzo (en el momenta de 1a operaci6n) . N6tese que en la Figu ra 2.7, 1a m ujer nO I cambia de d iagrama a med ida que se mod ifica su situaci6n en ClIanto a tiempo transclirrido desde la meno pallsia (cuando llega a 59,5 - es decir, un ana dentro del est udio - se conv iene en una mujcr que esta en el gmpo <(Oi!: 5 anos desde 1a meno pausia>,) . De fanna parecida, la mujer nO3 (que cn tro en e l est udio en 1980 - 0 mas bien, 19805 - un ana despues de la menopausia) cambia de «menopausia < 5 afios» al estrato «O!: 5 afios desde la menopausia» 4 afios despues de l inicio del seguimiento (es decir, en algun momento en 1984,0 en 1984,5) . Reparese que en la Figura 2 .7, el habito de fum ar se usa como una covanable fija. en la medida en que solamente se considera el estado en e l momenta inicial; sin embargo. la infonnacion sobre eI cambio en eI habito de fumar esta d isponible en los datos del estudio hipotctico mostrado en la Tabla 2 .8 . Los cambios en materia de exposici6n para algunas covariables pueden ser tenidos faci lmente en cuenta c uando se lIIi1iza la estrategia de l tiempo-persona. Por ejemplo, utilizando la informacion inicial y el cambio en cuanto al habito de fumar mostrado en la Tabla 2.8, la asignaci6n del tiempo-persona de ac uerdo al habito de fumar como una covariable dependiente del tiempo puede representarse como se ilustra en la Figura 2 .8. Utilizando este enfoque, cada evento se asigna al estatus de exposicion en el tn)mento del evento . Por 10 tanto, la muerte de la mujer nO I se as igna al grupo «no fumador», mientras que la de la mujer nO4 se as igna al grupo «fumador» . (Adviertase que las ultima.~ a.~ i gnaciones son opuestas a las basada.~ en e l estallls de fumador en e l momento inicial, Figura 2 .7) . Eluso de l enfoque tiempo-persona para tener en cuenta I a.~ exposiciones cambiantes implica una suposici6n anaJoga a la que se hace en los ensayos cifnicos cruzados: una vez que cambia la exposici6n, tambien cambia el riesgo a.~ociado . E.~to es simplemente otra manera de enunciar que no existe acumulaci6n del nesgo y que por tanto el efecto de una exposicion dada es <
Tiempo calendario
1980
81
82
83
~
1985
86
87
88
-----.;-- ..................... . o.
o
1990
M
.....................................
~
2
.~ ,
89
•
3 M
4
Figura 2.8. Representacion esquematica de los tiempos-persona para las 4 mujercs de la Tabla 2.8 de acuerdo al habito de rumar dependiente del tiempo. Las Uneas s6lidas representan la situaci6n de ser fumadora. las lineas interrumpidas representan la situaci6n de ser no fumador.
71
MEDICION DE LA OCURRENCIA DE LA ENFERMEDAD
exposicion y del resultado espedfko que se este considerando. Por ejemplo, para el habito de fumar, la suposici6n puede ser razonable cuando se estudian eventos tromboemb6licos probablemente resultantes de los efectos agudos del tabaco (por ejemplo, los que Ilevan a muerte cardiaca subita). Por otro lado, dados los rasgos bien conocidos de latencia y efectos acumulativos que conducen al cancer de pulm6n relacionado con el habito de fumar, la suposicion de un efeclo <
2.23. Comparaci6n entre medidas de incidencia Para la estimacion de las diversas medidas de incidencia, el numerador (numero de muertes) es constante; la diferenciac i6n entre las medidas estriba en la manera en que se calcu la el denominador. Los patrones pri ncipales que distinguen la probabilidad
acumulada por un lado y la densidad
0
la lasa por otro se muestran en el Esquema 2.1 .
Esquema 2.1 Comparacion de medidas de incidencia: Incidencia aeu mula da rrente a Tasa de incidencia Inciden cla acurrulada Si el seguimiento es completo Numerador
Numero de casas labia de vida clasica
Denominador Poblaci6n inicial Unidades Recorrido Sin6nimos
Si el seguimiento es ircompleto
Kaplan-Meier
Sin unidades
" 1 Proporcion Probabilidad
ra sa de Inclden cla Datos individuales (cohorte)
Datos agrupados (area)
Numero de casos
Numero de casos
Tiempo-persana
Poblaci6n promedio •
Tiempo·1 o a inlinito Densidad de incidenc ia ••
Equ1valente a t1empo-persona cuando los eventos y las perd1das (0 ad1cKmes) se d1stnbuyen homogeneamen· te en el intervalo de tiempo de interes . .. En el texto. el termino densidadse util iza para releriroos a la situaci6n en la cual se conoce el tiempo exacto de s~uimiento para cada individuo; 10 mas Irecuente, sin embargo, es que se usen los termioos "tasa. y "densi· dad" ind istintamente.
72
EPIDEMIOLOGiA INTERMEDIA; CONC EPTOS Y APLlCAC[ONES
Como se disc uti6 previamente, e l Ifmite superior de los valores para una tasa 0 una densidad puede exceder al 100 %, algo imposible para las probabilidades. Las tasas a menudo se calculan como fusuS promedio anuales 0 tasas pOl' 100 aiios-persolla; la ultima alude a una tasa por 100 personas por ana , 10 que subraya la correspondencia entre las estadfslicas vitales - tasa deri vada y una tasa por ana-persona como se discU li6 en la secci6n previa - en este caso, se [rata de la correspondencia entre una «tasa an ual" y una o{[asa por afio(s)-persona» . Por alro lado no se adjuman unidades de tiempo a una incidencia ac umul ada (una probabilidad), la ellal debe ser siempre especificada (por ejemplo, da probabilidad acumulada para los Ires aiios iniciale.\· de seguimiento») . Finalmente , otm diferencia de imponancia practica entre los enfoctues de tiempopersona y de incidencia ac umulada es q ue, como los propios tenn inos sugieren. no es posible obtener una rasa ac umu lada global de vad os intervalos de tiem po (Ulilizando una poblaci6n promedio 0 un enfoque tiempo-persona), anaJoga a una incidencia ac umulada calc ul ada por med io de tecnicas de supervivencia; esto es. por supuesto, una consecuencia del caracter <
E~quema
2.2
Supucstos ncccsarios para cI amllisis de supcrvivencia y cl tiempo-pcrsona Anallsls de supervlvencla
Tiempo-persona
Si hay plndidas durante et seguimiento:
La probabilidad de tener et desentace para observaciones censuradas es simitar a ta de los individuos que permanecen bajo observaci6n .
Si se utilizan intervalos, y hay perdidas durante un intervalo dado:
Las perdidas son uniformes a 10 largo del intervalo.
Si el riesgo se calcula en los intervalos:
EI riesgo es uniforme durante el intervalo
Si el reclutamiento de los sujetos de estudio se hace durante un periodo relativamente largo:
No hay tendencias seculares a 10 largo del periodo calendario cubierto por el reclutamiento.
N individuos seguidos a!o largo de T unidades de tiempo tienen los mismos riesgos que T individuos seguidos durante N unh1aC1es Cle tlempo.
MEDICION DE LA OCURRENCIA DE LA ENFERMEDAD
73
investigacion de epidem iolog la ocu pacional- la estimacion de densidades, mas que de probabilidades, penn ite utilizar tasas de poblacion disponibles como tasas de control. Por otro lado, las probabi lidades se estiman tfpicamente en los estudios con centrandose en el comportamiento temporal de una enfermedad - como en los estudios de supervivencia despues del diagnostico de una enfermedad.
2olA. La tasa de riesgo instantaneo
Una definicion altemativa para una tasa instantanea de incidencia es la Ilamada rasa de riesgo insfanraneo (hazard) 0 incidencia condicional instantanea oJilerza de morbilidad (0 lIIorfalidad). En eI contexto de un estudio de cohorte, la tasa de riesgo instantaneo se define como la probabilidad instamanea de cada individuo de tener cierto evento precisamente en eI tiempo 1 (0 en un pequeno intervalo If, f + 8.1]), supuesto que (0 «condicionado» a que) eI individuo estaba en riesgo en el momenta I. La tasa de riesgo instantaneo se define para cada punto particular del tiempo durante el seguimiemo. En tenninos matematicos, se define para un intervalo de tiempo pequeno (8.1 cercano a 0) como sigue: h(l)
P (evento en el intervalo entre f Y II + 8.IJIvivo en el momenta t) = ---'-----------:---'--'--------''-----------'-M
La tasa de riesgo instantaneo es tambien una tasa medida en unidades de tiempo·l. Y es un concepto utH para cualquiera que Irate de entender algunas de las tecnicas
estadfsticas utilizadas en eI analisis de supervivencia, particularmenle la metodologfa conocida como milodos de regresi6n de rie.\'gos I'r0l'0rciollale.\" (vease Capitulo 7, Secc ion 7 AA). A pesar de su importancia {eorica, sin embargo, la rasa de riesgo instantaneo no puede obtenerse directamente en los est udios epidemiol6gicos. Esta fuera de los Ifmites de este libro discutir las propiedades matematicas de la tasa de riesgo instantaneo, que son complejas y que se abordan apropiadamente en libros de estadfstica(l6) . Es anaJoga, sin embargo, a la probabilidad condic ional del evento que se calcula en el momento de cada evento utilizando el enfoq ue de Kaplan-Meier (Tabla 2.3). Ademas, puede est imarse el riesgo instantaneo promedio para un cierto lapso en la tabla de vida ciasica . La Jimci6n de riesgo instantaneo puede est imarse utilizando tecnicas parametricas de analisis de supervivencia (el lector interesado debe consu ltar textos especializados, como el de ColletFI6) .
23. MEDIDAS DE I'REVALENCIA La prevalencia se define como la frecuencia de casos existentes, viejos y nuevos (de aparicion reciente). Existen dos tipos de prevalencia, la prevalencia puntual y la prevalencia de periodo (Tabla 2.1). La plevalendll punlllal es la freeuenc ia de una enfermedad 0 condicion en un punto del tiempo; es la medida est imada en las Ilamadas encuestas de prevalencia 0 transversales, tales como la Encuesta Nacional de Salud, Nutricion y Examen (National Health, Nutrition and Examination Surveys, NHANES) conducida porel Centro Nacional de Estadfsticas de Salud de los E.>;tados Unidos . La prevalen· cia de I'eriodo se emplea con menos asidu idad y se define como la frecuencia de una
EPIDEMIOLOGiA INTERMEDIA; CONC EPTOS Y APLlCAC[ONES
74
enfennedad 0 condic i6n existentes d urante un lapso definido, tal como un ana . Un tipo especial de prevalencia de penodo es la prevalencia {/culllulada a 10 largo de la vida , que brinda un estimado de la ocurrencia de lIna condic i6n en c ualquier momenta durante e l pasado de un individuo. En general, cuando se emplea el lennina prevalencia sin especificaci6n adicional, se da por sentado que se trata de prevalencia !'Unfllal. Aunque la prevalencia es un Indice eXlremadamente utH de la magnit ud de problemas actuales de saiud, en los es[udios etio16gicos eSla medida es menos expresiva que la incidencia, porque es simu ltaneamente una fund6n de la incidencia y de la duraci6n de la enfennedad despues de su comienzo. (La duraci6n esta. a su vez. detenninada por la supervivencia para las enfermedades fata les 0 la curaci6n para las no fata les). Aunque la dependencia entre la prevalencia puntual y la d uraci6n de la enfermedad compromete la ut ilidad de la prevalencia al efecto de evaluar asociaciones entre faclOres de riesgo y enfennedad, su relaci6n con la incidencia permite q ue sea ut ilizada como una aproximacion del «riesgo», y en ese sentido puede ser apropiada si se comprenden adecuadamente sus limitaciones. Las limitaciones de la prevalencia punt ual pueden apreciarse al detenernos en la f6nn ula que define su conexi6n con la incidencia y con la duracion de la enfennedad: "
IEcuacion 2.3J Prevalencia puntual ( I - Prevalencia pumual
) = Incidencia x duraci6n
N6tese que eI termino Prevalencia Puntual l ( I - Prevalencia Pumual) es el odd.~· de la prevalencia pumual (vease Secci6n 2 .4). En esta ecuaci6n y las q ue se derivan de ell a, la unidad de tiempo para la incidencia y la duracion deberfa ser la misma: esto es, si la incidencia se da como promedio anual, la duraci6n deberfa darse utilizando afios 0 fracciones de ano. Ademas, se supone que la incidencia y la duraci6n de la enfermedad se han mantenido relativamente estables a 10 largo de los anos . La Ecuaci6n 2.3 puede ser reescrita como: IEcuacion 2.4J Prevalencia Puntual = Incidencia x duracion x (I - Prevalencia Puntual)
* La derivaci6n de esta f6mmla es relativamcnte simple. La suposici6n principal es que la enfermedad esta en est ado est able. 10 que significa que la incidencia y el numero de casos existentes en cualquier punto dado (por ejemplo. X) son aproximadamente constantes. Para una enfemledad incurdble. esto implica que el numero de nuevas casas durdnte un pcriodo de tiempo dado cualquiera es aproximadamente igual al lIlimem de mllerles entre (os casas. Si N es el tamai'io de la poblaci6n.l es la incidencia. y F es la tasa de Ictalidad. el numero de casos nuevos puede estirnarse multiplicando la incidencia por cl numero de sujetos potencialmcnte «susceptiblcs» (N-X); a su ve"L. cl numero de muertes p!.lede estirnarse multiplicando la tasa de casos fatales por el nurnero de casos prevalentes. Por tanto. la suposici6n anterior puede formularsc wmo si~ue: I x (N-X) .. F x X. Si no hay inmigraci6n.la tasa de casos fatales es el inverso de la durdC i6n (D)' . Pm tanto. despuCs de una pcquei'ia m,mipulaci6n ari tmctica. y dividiendo el numerddor y cl denominador del termino de la derecha por N: X I x D .. -":-'-cc (N - X)
Prevalencia (t - Prevalencia)
Un rdzonarniento analogo puede aplicarse a las enfermedades no fatales para los cuales F es la proporci6n de curddos.
MEDICION DE LA OCURRENCIA DE LA ENFERMEDAD
75
Como se disc utira en los Capft ulos 3 y 4, la Ecuaci6n 2.4 involucra a los dos elememos de una enfermedad que son responsables de la diferencia entre la incidencia y la prevalencia puntual: su duraci6n y la magnitud de su prevalencia punt ual. Cuando la prevalenc ia puntual es baja - por ejemplo 0,05 0 menos - el termino ( I - prevalencia punt ual) es casi ig ual a 1,0. Siendo as!. se obt iene la sigu ieme bien conocida f6nnula que establece la relaci6n entre prevalencia e incidencia: Prevalencia Puntual ... Incidencia x duraci6n Por ejemplo, si la incidencia de una enfermedad que se ha mantenido estable a traves de los afios (por ejemplo, diabetes) es I % por ano, y su du raci6n aprox imada (supervivencia despues del diagn6stico) asciende a 15 anos, su prevalencia puntual sera aproximadamente IS %.
2.4.
ODDS
EI odds es la razon entre la probabilidad del evento de interes y la probabilidad del evento complememario (de que no se produzca el evento) . Puede defin irse tanto para la incidencia como para la prevalencia . Por ejemplo, cuando se trabaja con probabilidades de incidencia, el odds es: Odds = _ '_1 -
1- q (Altemat ivamente, a part ir del odds puede calcularse la probabilidad: q = odd.~" I I I + odds!) . EI odd.~" de prevalencia es como sigue (vease tam bien la Ecuacion 2.3): Prevalencia pumual I - Prevalencia pumual Tanto los odds como las proporciones pueden utilizarse para expresar la «frecuencia>, de la enfermedad. Un odds se aproxima a una proporci6n c uando esta ultima es pequena. por ejemplo , menos de 0, 1. As!, Proporci6n = 0.05 OddJ" = 0,05 1 (1-0,05) = 0,05 /0,95 = 0,0526
Es mas sencillo captar el significado imuitivo de una proporci6n que el de un qu izas porque en una descripci6n del odds la nat uraleza de este ultimo como raz6n no siempre se ex presa explfcitamente . Por ejemplo, si la proporci6n de fumadores en una poblacion es 0,20, el odds es odd.~",
Odds =
Proporci6n de fumadores -,.::.:;;""'=:::,:=-c::;:=:;.:::'-I - Proporci6n de fumadores
00,20 I (1 - 0,20) = 0,20 10,80 = 1:4 = 0.25 .
Proporcion de fumadores Proporci6n de no fumadores
76
EPIDEMIOLOGiA INTERMEDIA; CONC EPTOS Y APLlCAC[ONES
Existen dos maneras ailernativas de describir e l estimado de un odds: bien como un numcro aislado, 0,25, (10 que supone que el lector entiende que ello expresa intrfnsecamente una raz6n, 0,25: 1,0), bien como una raz6n - cn el ejemplo, 1:4 comunicando claramente el mensaje de que, en la poblaci6n de estudio , por cada fumador hay 4 no fumadores. EI odtis , como medida absoluta a i ~ lada de ocurrencia, no se utiliza virtualmente nunca por los epidem i61ogos. Sin embargo, la raz6n de dos odds (el odds ratio) es una med ida de asociaci6n extremadamente popular debido tanto a que el metoda de ajuste a traves de la regresi6n logfst ica es ampliamente ut ilizado. como a que por conducto del odds ratio se puede muchas veces estimar el riesgo relativo (med ida mas intuitiva y simple de comprender) en los estudios de casos y controles (veanse Capitulo I, Secci6n I .4.2; Capitulo 3, Secci6n 3.2. 1; Y Capitulo 7, Secci6n 7.4.3).
BlBLlOGRAFiA I. Websler's l1il1lh new wllegiale diclionary. Springfield. Miriam-Webster [nc. 1988. 2. Bromberger JT. Matthews KA. Kuller LH el al. Prospective study of the determinants of age at menopause. Am J Epidemioll997: 145: 124-133. 3. Mirza NM . Caufield LE. Black RE el a/. Risk factors for diarrheal duration. Am 1 Epide. mio11997: 46: 776-785. 4. Breteler MMB . de Groot RRM. vall Romunde LKJ. Hofman A. Risk of dementia in patients with Parkinson's disease, epilepsy. and severe head trauma: a register based follow.up study. Am J Epidemio/ 1995: 142: 1300-1305. 5. Gane E. Saliba F. Garcfa Valdecasas IC el al. Randomised trial of efficacy and safety of oral ganciclovir in the prevention of cytomegalovirus disease in liver.transplant recipients. Lancel 1997: 350: 1729-1733 . 6. Centers for Disease Control. Revisioll of the CDC surveillance case definition for acquired immunodeficiency syndrome. JAMA 1987: 258: 1143-1145. 7. Kaplan EL. Meier P. Nonparametric estimation from incomplete observations. J Am SIal Auoc 1958: 53: 457-481. 8. Reed LL Merrell M . A short method for constructing an abridged life table. Alii J Hyg 1939: 30: 33-62. 9. Pooling Project Research Group. Relationship of blood pressure. serum cholesterol. smoking habit. relative weight and ECG abnormalities to incidence of major coronary events: final report of the Pooling Project. J Chrol1 Dis 1978: 3 1: 201-306. 10. Gordis L. Epidemiology. Philadelphia, WB Saunders Co: 1996. II. Kahn HA , Sempos CT. Slalislicallllelhod.f in epidemiology. New York.Oxford University Press. 1989. 12. Checkoway H . Pearce NE. Crawford·Brown Dl . Research melhods in oculpilliol1a/ epi. demiology New York, Oxford University Press. 1989. 13. Monson RR. Analysis of relative survival and proportional mortality. Complil Biomed Res 1978: 7: 324-332. 14. Macaluso M. Exact stratification of person-years. Epidemiology 1992: 3: 441-448. 15. Pearce N, Checkoway H. A simple computer program for generating person-time data in cohort studies involving time-related factors. Am J Epidemiol 1987: 125: 10851091.
MEDICION DE LA OCURRENCIA DE LA ENFERMEDAD
77
16. Collett D. Modelling .rurl'ival d(J/a in medical research. London. Chapman & Hall. 1994. 17. Rothman KJ. Greenland S. Modem epidemiology. 2.' ed. Philadelphia, Lippincott~Raven Publishers. 1998.
CAPITULO 3
Medici6n de asociaciones entre exposiciones y desenlaces 3.1. INTRODUCCION Los epidemi61ogos se imeresan a menudo en evaluar la presencia de asociaciones expresadas mediante diferencias entre medidas de la frecuencia de las enfermedades . Las medidas de asoc iaci6n puedcn basarse, bien en diferellcias absolutas entre grupos que han de compararse (por ejemplo, expucstos frente a no expucstos), bien en dijerencias relariva,\" de razones (Tabla 3. 1). Usualmente se o pla por las medidas basadas en dife rencias absolmas clIando se Irata de act ividades preventivas 0 de salud publica, puesto que Sli principal objet ivo es con frecuencia conseguir lIna red ucci6n absoluta del riesgo de aiglin desenlace indeseado. Ademas, cuando e l desenlace de intcres es continuo, la est imaci6n de la diferencia media absoluta entre individuos expuestos y no expuestos puede ser un me{Qdo apropiado para la determinacion de una asociaci6n. Las diferencias relativas, que pueden ser estimadas para desenlaces discretos, se emplean generalmente por los epidemiologos para la valoraci6n de asociaciones causales (Tabla 3. 1).
3.2. MEDICION DE ASOCIACIONES EN UN ESTUDIO DE COHORTE En estudios prospecl ivos trad icionales 0 de cohorte, los participantes se eligen de una de las sig uientes dos maneras: I ) se elige una poblaci6n definida 0 una muestra de e ll a, cada uno de c uyos integrantes se clasifica con acuerdo al nivel de
Tabla 3.1 Tipos de medidas de asoeiaeion tmpleadas en estudios de epidemiologia analitica Tlpo Diferencia absoluta
EJemplos Riesgo alribuible en expueslos Riesgo alribuible iX'blacional Eficacia
Diferencia relativa
Diferencia de medias (desenlaces continuos) Riesgo relativo 0 raz6n de lasas Odds relalivo
Apiica clon usual Impacto de la prevenci6n primaria; busqueda de causas Impacto de la prevenci6n primaria Impacto de la inteNenci6n sobre las reca idas; letalidad. elc. Busqueda de delerminantes Busqueda de causas Busqueda de causas
80
EPIDEM IOLOGiA lNTERM EDIA ; CONCEPTOS Y APLICACIONES
exposici6n, 0 2) se idemifican de modo especffico tanto sujetos ex puestos como no expucstos y se incluyen en e l estudio. Estos ind ividuos son emonces seguidos de manera conc urrente 0 no(1. 2) para aquila tar los desenlaces, de suerte que se pueda est imar alguna medida de incidencia en cada gru po (veanse tambien los Capftulos 1 y 2) . Con el fin de simpli fi car los conceptos descritos en este capitulo , en la mayorfa de los ejemplos que subsiguen se consideran solo dos niveles de exposici6n: expucs{Os y no expucs{Qs. Por otra parte, se da por sentado que e l seguimiento se prolongara durante todo e llapso previsfO para IOOos los individuos de la cohorte (es decir. no se contempla la posibilidad de casas censllrados; sin embargo, la disc llsi6n que sigue tambien sirve por 10 general para la est imaci6n de riesgos y de tasas que contemplan seguimiento incompleto y censura, descritos en el capitulo prev io, Seccion 2.2.) . Por razones de simplicidad, este capitu lo se concentra casi exclusivamente en la raz6n de dos probabilidades 0 de dos olidJ" (es decir, e l riesgo relat ivo y el odds ratio) 0 en la diferencia absoluta entre dos probabilidades (es decir, el riesgo atribu ible). Sin embargo, los conceptos descritos en relacion con dichas medidas tambien valen para las otras medidas de asociaci6n, tales como la raz6n de tasas de riesgos instantaneos (hazard ratio). Por ult imo, con el fin de describir medidas de asociacion, por 10 general se parte del supuesto de que las est imaciones no estan afectadas por confusion 0 sesgo .
3.2.1. Riesgo relativo (Raz6n de Riesgos) y Odds Ratio La Tabla 3.2 muestra una tabu laci6n cruzada ciasica de dos fila s para la exposici6n y dos columnas para la cond ici6n morbosa. De un total de (a+b) ind ividuos expuestos y (c+d) no expuestos, a expuestos y c no ex puestos desarrollan la enfermedad de imeres a 10 largo del seg uimiento. Las estimaciones de los riesgos y los odds correspondientes se muestran en las ultimas dos columnas de la Tabla 3.2 . N6tese que los odds de la enfermedad (Ia razon de la probabilidad de enfennar entre la de
Tabla 3.2 Tabulacion cruzada de exposicion y e nfermedad ell un estudio de cohorte Exposlcion
Presente
Ausente
Enfermos
, ,
Sanos
Incidencla de la enfermedad (Rlesgo)
,
b
q+"' - -
d
, Q" - -
,.b
,. d
Odds probabllistlcos de enfermar
,
Q. 1 - q. "
,.b
1-(-,.b ' )
,
" -b
, ~
1
- Q
"
c.d
1-(-,.d ' )
,
"
-d
MEDICION DE ASOCIACIONES ENTRE EXPOSICIONES Y DESENLACE
81
no enfermar) se reduce aritmeticamente a la razon del nlimero de casos enfennos dividida por la de individuos q ue no desarrollan la enfermedad para cada categorfa de ex posic ion . EI riesgo relativo de desarrollar la enfermedad se ex presa como la razon del riesgo (incidencia) entre sujetos ex pues!Os (q+) entre la de los no expuestos (q_): 1Ecuacion 3. 1J Riesgo relativo (RR) = q+ = q-
c
c+d
Para informarse sobre metodos de eSlimacion de Ifmites de confianza y valoreJ· P para un riesgo relat ivo, vease Apendice A, Secci6n A.3 . EI odd.\· ratio de desarroll ar una enfermedad es la razon del odd.\· de enfermar; puesto q ue este ejemplo se basa en los riesgos de incidencia 0 probabilidades, este es ocasionalmente designado como odds relarivo.\· de riesgo 0 como odds I)robabilfsticos relativos . Notese q ue la razon de los odds de probabilidad de enfermar es equivalente a la raz6n de productos cruzado (a x d)/(b x c). Usando la no{aci6n de la Tabla 3.2 tenemos:
a a+b OddJ· probabilfsticos I _ q+ relativos (OR) = --=!f~ =
a a +b
1_(_a ) a +b ,
a +h
c+d
c +d
- qI - q_
1-
(-c +c) (/
h
,
:
()
=- -
(:)
d c+d
As!, 1Ecuacion 3.21 ax d O R= - bx c
Para examinar metodos de es{imacion de limites de confianza y va/oreJ· p para un odd.\· ratio. vease Apendice A, Secci6n A.4. En e l ejemplo hipotetico q ue se presenta en la Tabla 3.3, la hipenensi6n grave y e l infarto agudo de miocardio son, respec livamente, e l factor de exposicion y e l desenlace de interes. EI tamano muestral para cada nivel de ex posici6n se fij6 arbitrariamente en 10.000 con el fin de faci litar los d.lcul os . Para {ales datos. puesto q ue la probabilidad (riesgo) de infano de miocardio es baja tanto para expuestos como para no ex puestos, los O(Id.\· probabi lfsticos de desarrollar la enfermedad tanto entre hipertensos como en s ujetos norma les se aproximan a las probabilidades res pectivas (Tabla 3.3).
82
EPIDEMIOLOGiA lNTERMEDIA ; CONCEPTOS Y APLICACIONES
Tabla 3.3 Estudio de cohortc hipotCtica de UII ano para la estimaci{m de incidcncia de infarto agudo de miocardio en individuos COli hipertclIsioll sist61ica grave (> 180 mill Hg) y tension arterial sist6lica normal «120 mm Hg) Infarto de mlocardlo Situacion de la tensi on arterial
Odds probabllfstico de enfermar
Numero
Presente
Au sente
Probabilidad
10.000
180
9.620
180/10,000" 0,0160
Hipertensi6n
160/(10,000 - 180)
grave
~
180/9.820 '" 0,01833
Normal
10.000
30
30110.000", 0,0030
9.970
30/(10,000 - 30) '"
30/9.970", 0,00301
Como resultado, la razon de odd.\" probabilfsticos de enfermar (ex puesto frente a no expucsws) se aprox ima a1 riesgo relat ivo:
180 RR =
10 .000
0,0180 =6,00 0,0030
30 10.000
180 OR probabilfstico =
9.820 30
-;:0.:;:,0;0 18",3:;.-3 = 6,09 0,0030 1
9.970 Una situaci6n diferente emerge cuando las probabilidades de desarrollar la enfermedad son alias tanto entre expuestos como en no expuestos . Por ejemplo, Seitscr et al.(l) examinaron 1a incidencia de reacciones locales en individuos aleatoriamente asignados a un proceso de vacunaci6n inyectable para la influenza 0 a un gru po al que se administr6 un placebo. La Tabla 3.4, basada en este estud io, muestra que mientras 1a probabilidad (incidencia) de reacciones locales es alta, las estimaciones de el oddJ' probabilfsticos de tener rea::ciones locales no se aprox iman a las res pectivas probabilidades, y aSI que la odds ratio probabilfst ico de reacciones locales (vacuna frente a placebo) es bastantc diferente del riesgo relativo:
RR=
650 2.570 170 2.410
650
= 0,2529 = 3,59 0,0705
OR=
1.920
170 2 .240
=
0,3385 0,0759
=44 '
6
Cuando la condic i6n tiene una incidencia alta y cuando se tienen datos prospect iVQS, como fue el caso en este ensayo de vac linaci6n, entonces por 10 general es mejor o ptar por e l riesgo relat ivo por ser una medida de asociaci6n entre el factor de riesgo y el desenlace de mas [aci! comprensi6n.
83
MEDICION DE ASOCIACIONES ENTRE EXPOSICIONES Y DESENLACE
Tabla 3.4 Incidcncia dc rcaccioncs localcs en vacunados y en un grupo placcbo, ensayo de vacunacion contra la influcnza Reaccl6n local Grupo
Numero
Presente
Ausente
Probablildad
Odds probabltfstlco de enfermar
Vacuna
2.570
650
1.920
650/2.570", 0,2529
650/( 2.570 - 650} "
Placebo
2.410
170
2 .240
170/2.410::0 0,0705
170/( 2.410 - 170} "
G~O f1
.920 '"
0,338~
17012.240", 0,0759 Nota; 8asado en datos pa ra ind ividuos de 40 anos de edad 0 mayores en Seltser et al."I. Para evitar ambigileda· des de redondeo en los ejemplos subsiguientes basados en estos datos (Rgura 3.4 , Tab la 3.7 y 3.9). los tamanos de las muestras originales en el estudio (257 vacunados y 241 receptores de placebo) se mu ltiplicaron por 10. Fuente; Datos procedentes de R Seltser. PE Sartwell, and JA 8ell, AControlled Test 01 Asian Influenza Vaccine in Popu lation 01 fam ilies. American Journal of Hygiene, Vol. 75, 112·135 11:11962.
Aunque el oddJ' ratio es una medida valida de asociaci6n por sf misma, (vease mas adelante), frecuentemente se usa como una aproximaci6n del riego relativo. EI odds ratio como una eJ·timacion del riesgo relativo esta, sin embargo, sesgada en direcci6n opuesta a la hip6tesis nu la: esto es, tiende a exagerar la magnitud de la asociaci6n. Cuando la enfennedad es relativamente rara, este sesgo dnherente» (huilt in bias) es despreciable, como se aprecia en el ejemplo de la Tabla 3.3 . Sin embargo, c uando la incidencia es alta , como en el ejemplo del ensayo sobre la vacuo na (Tabla 3.4), tal sesgo puede sersustancial . Una expresi6n de la relaci6n matematica ex istente entre eI odds ratio , por una parte, y el riesgo relativo por otra. puede obtenerse del modo siguiente . Supongamos que q+ es la incidencia (probabilidad) entre expuestos (por ejemplo, vacunados) y q. es la incidencia entre sujetos no expues(Os. EI odds ratio es entonces:
1Ecuaci6n 3.31
OR=
e~.q.l e:-qJ
q. I - q+
x
1 - q.
q-
N6tese que el te rminG q) q. en la Ecuaci6n 3.3 es el riesgo relati vo. As!, el ter· mino:
84
EPIDEMIOLOGiA lNTERMEDIA; CONCEPTOS Y APLICACIONES
define el sesgo responsable de la d iscrepancia entre el riesgo relativo y el odds ratio estimado (sesgo inherente). Si la asoc iaci6n entre la exposic i6n y el desen lace es posit iva, q_< q+, entonces (1 - q_) > (1 - q+) . EI sesgo sera por tanto mayor q ue 1.D, de modo q ue el oddJ' ratio supone una sobreestimaci6n del riesgo relat ivo . Por analog la, si e l factor es protector, OC ll fre 10 contrario - csto es, ( I - q_) < (1 - q+) - yel odd.~· ratio sobrest imara nucvamente la intcnsidad de la asociaci6n . En general, e l odd,\" ratio tiende a prod ucir una estimad6n mas distante de 1.0 q ue el riesgo relativo en ambos lados de la escala (encima y debajo de 1.0). En e l ejemplo de hipertensi6n!infarto de miocardia y la (Tabla 3.3), e l sesgo es de pequeoa magnitud, y la estimacion del odds ratio, aunq ue un poco mas d istante de 1.0, sigue siendo proxima al riesgo relat ivo; usando la Ecuaci6n 3.3:
. 6 ,0 x 1 - 0,0030 = 6 ,0 x I ,0 15 = 6 ,09 O R = RR x «sesgo lnherente»= 1- 0,0 180
Sin embargo, en e l ejemplo de las reacciones locales a la vac una contra infl uenc ia (Tabla 3.4), existe un sesgo considerable cuando se usa el odds ratio para estimar e l riesgo relat ivo: OR = 359 x 1 - 0,0705 = 3,59 x 1.244 = 4,46 I - 0,2529
Independientemente de que el odlis ratio pueda prod ucir una est imaci6n adecuada del riesgo relativo 0 no, aquel es, como ya dij imos, una med ida de asociaci6n valida par sf misma. Y resulta especialmente valiosa porque puede ser obtenida a partir rle
l o~
resll ltarlos rle los est llrlios rle
caso~
y conlroles y por'1 11e se ohtiene
directamente a partir de los modelos de regresion logfstica (vease Capitulo 7, Seccion 7.4.3). Ademas, a diferencia del riesgo relativo, el olids ratio de un acontecimiento es el recfproco exac(Q del odds ratio del evento o pues(Q (de que no se prod uzca). Por ejemplo, en el estudio de las reacciones locales a la vac una contra infIuencia ya discut ido(3), el odds ratio de una reaccion local,
650 ) ( 1.920
OR",,,moo 1oc.1 (.) =
C(--"1~7=0'-') = 4,46 2.240
es e l recfproco exacto del odds ratio de no tener una reacci6n local,
1.920) ( 650
I =022= - :z.:Z4U ) , 4,46 ( 170
Este rasgo no 10 comparte e l riesgo relat ivo, como puede verse usando e l mismo ejemplo:
MEDICION DE ASOCIACIONES ENTRE EXPOSICIONES Y DESENLACE
650 2.570 RR " acco6nloc. 1(+)=
' 70 2.410
85
= 3,59
y
R R ",ocdoo locol 1_)
=
,
1.920) ( 2.570
= 0 8 ,. - , 3,59 2240 ) ( 2.410
Este hallazgo, aparentemente parad6jico, es una consecuencia de la sensibilidad del riesgo relativo a la magnit ud de un desenlace: esto es, e l riesgo relativo de un punto fi nal comtin se acerca a 1,0. Esto se aprecia nftidamente cuando se estudia e l complemento de un desenlace mu)' poco probable . Por ejemplo, si las tasas de letalidad en pacientes somet idos a cierta intervenci6n qu irtirgica usando una tecnica estandar y usando una n ueva tecnica fueran, respecrivamente, 0,02 y 0,0 1, entonces e l riesgo relativo para el suceso relat ivamente raro (el de «morin), en esre caso) serfa 0,02/0,0 1 = 2,0. Sin embargo, e l riesgo relativo de supervivencia serfa 0,9810,99, numero virt ual mente igual a 1,0, eI cual sug iere q ue la nueva tecnica qu inirgica no afecta la supervivencia. Por otra parte, e l odds ratio de morir serfa
OR morir =
0,02 1,0 - 0,02 0,0 1 1,0 - 0,0 1
= 2,02
en tanto que e l de sobrevivir serfa
0,98
_ ,,,,-98 ,, --- = 0,495 = -' ,0 OR""",-,;,'ir = """"0,;;-",0 0 99 , 2,02 ' ,0 - 0,99 3.2.2. Riesgo Atribuible EI riesgo atribuible (RA) es una medida de asociacion basada en la diferencia absoluta entre dos estimaciones de riesgo . Dicho de otro modo, el RA est ima e l exceso de riesgo absoluto debido a una ex posici6n dada. Puesto que el riesgo atribui ble se usa a menudo para detectar una relacion causa-efecto, debe ser interpretado como una verdaderafracci6n etiol6gica solo cuando ex isla una certeza razonable de q ue hay una conexi6n causal entre la exposici6n y e l desenlace(4 ~) . EI termino fracci6n lie exceso se ha sugerido como una altemativa al de riesgo atribuible 0 fraccion et io16gica cuando la causalidad no ha sido finnemente corroborada(4). Debe advert irse asimismo que, aunque las formu las y ejemplos en esta secci6n se refieren por 10 general a rieJ'gos atribu ibles, son {ambien aplicables a tasas 0 densidades atribuibles; es decir, si se usan datos que 10 que permiten es computar incidencia basada en per-
86
EPIDEMIOLOGiA lNTERMEDIA; CONCEPTOS Y APLICACIONES
sona-tiempo, entonces puede ca lc u la r~e lIna rasa atri buible entre los ex pucstos (vease mas adelante) por conducto de tasas por persona-tiempo . Como se discute extensamente por Gordis(2), eI RA asume diferentes fo rmatos, incluyendo los siguientes.
Riesgo Atribuible ellllldividuos Expuestos (RA ,~p) EI RA .... es meramente la diferencia entre el riesgo estimado para diferentes niveles de exposic i6n y un nivel de exposici6n de referenda; regularmeme, este ultimo no es mas q ue la categorfa de los no expuestos. Suponiendo una exposici6n binaria, y llamando q+ al riesgo entre los expuestos y q_al riesgo entre los no expucstos, RA."p simplemente es:
IEcuaci6n 3.4 J RA..p = q+- q-
El RA.xp mide el exceso de riesgo correspondiente a una categoria dada de exposid6n . Por ejemplo, con los datos del ejemplo de la Tabla 3.3, la inddencia ac umu lada de infarto de miocardio entre hipertensos (q+) es 0,0 18 (0 1,8 %), Y la correspondiente tasa entre nonnotensos (grupo de referenda 0 de no expuestos) (q_) es 0,003 (00,3 %); as!, eI exceso de riesgo asociado con la exposidon a la hipertensi6n es 0,0 18-0,003 = 0,0 15 (0 1~ %) . Esto es, suponiendo que existe una relad6n causal (es decir, que no se trata ni del efecto de un sesgo ni de un efecto de confusion, veanse Capft ulos 4 y 5), Y si el exceso de inddencia fuera completamente reversible, al cesar la exposicion (la hipertensi6n sist61ica grave) e l riesgo entre eI grupo de expuestos se red udria de 0,0 18 a 0,003 . En la Figura 3. 1, las dos barras representan la incidencia acumulada en expueslOS y no expueslos; asf, eI RAu p (Ecuaci6n 3.4) es la diferenda en altura de dichas barras . (L.1 analogfa grMica para eI riesgo relativo IEcuaci6n 3.4J es cuantas veces mayor es la barra de los expuestos que la de los no expuestos en la Figura 3. 1). N6tese q ue el RA.,p - la diferenda entre dos medidas de incidencia - es tambien una magniIUd de incidenda y por ende se mide usando las mismas unidades. EI RA",p estimado de I ~ % en el ejemplo anterior representa el exceso absoluto en la incidenda que se hubiera prevenido mediante la eliminaci6n de la hipertensi6n grave. Puesto q ue la mayorfa de los efectos de exposicion son acumul at ivos, con e l cese de la exposici6n (incluso si estuviera causalmente relacionada con la enfermedad) usualmente no baja el riesgo entre los su jetos expuestos hasta alcanzar el nivel hallado entre aquellos que nunca estuvieron expuestos. Asf, la maxima red ucci6n del riesgo es nonnalmente alcanzada solo a traves de la prevenci6n a la ex posici6n y no como resu ltado de que esta cese .
RA ....p porcetltual Un RA oxp porcent ual (% RA"p) es meramente el RAexp expresado como un porcentaje de los q+ - e l exceso asociado con la exposic ion como un porcentaje del total q+. Para una variable de exposicion binaria, eS(Q es: IEcuacion 3.5J
MEDICION DE ASOCIACIONES ENTRE EXPOSICIONES Y DESENLACE
\
-------- .
--------- ---------
No expuestos
87
RA_
I
Expuestos
Figura 3.1. Ricsgo atribuiblc entre tXpucstos
En el ejemplo anterior, e l %RA"p es %RA..p = 0 ,0 18 - 0,003 x 100 = 83,3 % 0,0 18 Si Ia cau salidad estuviera confirmada , el R~xp porcentual puede interpretarse como el porcemaje del riesgo total entre los expuestos que es atribu ible a la exposicion . Puede ser liti! expresar la Ecuacion 3.5 en tenninos de l riesgo relativo:
As!, en el ejemplo, al usar e l riesgo relativo (0,018/0,003=6,0) en esta f6rmula, se produce el mismo resultado que el que se obtiene aplicando la Ecuacion 3.5 : %RAox p =( 6,0 - 1,0) x 100=83 ,3% 6,0 La vemaja evidente de la f6nn ula lEcuacion 3.6] %RA oxr = (
RR - l ,O) RR x 100
consiste en que puede emplearse en los estudios de casas y controles, en los que los datos de incidencia (es decir, q~ 0 q_) no pueden obtenerse, pero donde puede usarse e l odds ratio como una estimacion del riesgo relati vo si la enfennedad es relat ivameme rara (vease Seccion 3.2 .1 ).
88
EPIDEMIOLOGiA lNTERMEDIA; CONCEPTOS Y APLICACIONES
Adviertase que el %RA." p es an:llogo al porcentaje de eficacia cuando se evalua una imervenci6n tal como lIna vacuna. La fannu la usual para la eficacia es equivalcote a la f6rmula para el %RA..p (Ecuaci6n 3.5) cuando q+ se reemplaza por qcont (riesgo en el gmpo control, ej, e l grupo que recibe placebo) y q_ se reemplaza por qin'"" (riesgo entre aquellos bajo intervcnci6n):
IEcuaci6n 3.7J Eficacia = (
q coot -
q mterv ) X
100
q•.",,, Por ejemplo. en un ensayo aiea{Qrizado para evaluar la eficacia de una vacuna, los riesgos en personas que reciben la vacuna y e l placebo son, respectivamente, 5% y 15 % . Usando la Ecuaci6n 3.7, la eficacia resulta seT 66,7 %:
. (15% -5%) x 100 = 66,7
Eficacla =
15 %
%
Altemativamente, puede emplearse la Ecuaci6n 3.6 para est imar la eficacia . En e l ejemplo que nos ocupa, el riesgo relat ivo (placebo/vac una) es, 15 %/5 % = 3,0. Asf, Eficacia = ( 3,0 - 1,0 ) x 100 = 66,7 % 3.0 N6tese que el empleo de la Ecuaci6n 3.6 para calcular la eficacia req uiere que cuando se calcule el riesgo relativo, el gmpo que no recibe la intervenci6n (por ejemplo, pla~ebo)
sea
~olls iuerduo
(;omo «exput:slo», y d g rupo que redbt: 1a
i lllera~dOIl
a(;liva (pur
ejemplo, el de la vacuna) sea el que se considera como de «no expuestos~), Un enfoque matematicamente equivalente consistiria en obtener primero el riesgo relat ivo, pero esta vez poniendo en el numerador el riesgo de aquellos que reciben la intervenci6n activa (por ejemplo, vacuna) y en el denominador aquellos que no la reciben (por ejemplo, placebo) . En este caso, la eficada se calc ula como el complemento del riesgo relativo, ej ., (1,0 - RR) x 100. En el ejemplo, usando este enfCKJue, la eficacia de la vacuna serfa, Eficacia =[ 1,0 - ( 155
o/~)] x 100 = 66,7 %
Como con el RA porcent uaL la correspondencia entre e l riesgo relat ivo y el odds en la mayor parte de las situaciones practicas permitirfa la estimaci6n de la eficacia en los est udios de casos y controles usando la Ecuaci6n 3.6.
Riesgo Atribuible Poblaciollal de Lel'ill EI riesgo atribui ble pobladonal de Levin (RApoo) estima la propord6n del riesgo de enfermar en la poblad6n total asociada con la exposid6n 1b), Por ejemplo, supongamos q ue la prevalenda de la exposid6n en la poblaci6n (p,) asdende a 0,40 (y, asf la prevalenda de 110 eXl'osici6n, ( I - Po) es 0,60), y que los riesgos enU"e los expuestos y los no expuestos son, respectivamente, q+= 0,20 y q_= 0, 15. El riesgo en la poblad6n total(qlti» es una
MEDICION DE ASOCIACIONES ENTRE EXPOSICIONES Y DESENLACE
89
suma ponderada de los riesgos entre los expuestos y los no expuestos en la poblaci6n: 1Ecuacion 3.81
En el ejemplo: ql'oo= (0,20 x 0,40) + (0, 15 x 0,60) = 0, 17 EI RAl'oo es la dife rencia entre el riesgo en la poblaci6n total y el de los sujetos no expuestos, 0 0, 17 - 0, 15 = 0,02, loque representa el exceso de riesgo en la poblaci6n asociado con la exposici6n. Esto es, si la relaci6n fuera cau sal, y si el efecto de la exposici6n fue ra completamente reversible, el cese de la exposici6n producirfa un decrecimiento en el riesgo de la poblacion total (ql'oo de 0,17 a 0, 15, es decir, eI nivel del riesgo en e l grupo no expuesto) . EI RAl'oo usualmente se expresa como e l riesgo atri bu ible poblacional porcentual, % RA I'ob' En e l ejemplo que nos oc upa, e l % RAl'oo es (0.02/0, 17) x 100 , 0 apro."(imadamente 12%. Matematicamente, el % RAl'o b puede expresarse como sigue: 1Ecuaci6n 3.91
% RA pob=L(ql'ob- q_)/q]>ooJ x 100 Como se vio en la Ecuad6n 3.8, la incidenda en eI tOlal poblacional es la suma de la inddencia entre expues(os y no expuestos, ponderada por las proporciones de expuestos y no expuestos en la pobladon. De modo que cuando la prevalencia de exposicion es baja, la incidenda pobladonal sera pr6xima a la incidencia presente entre los no expueslOS. (Figura 32A) . Analogamente, si la exposici6n es altamente prevalente (Figura 32 B), la inddenda poblacional sera cercana a la incidencia entre no expuestos. Como resullado, el RAPnII se aproxima al RA.x p cuando la prevalenda de la exposici6n es alta. Tras una simple manipulaci6n aritmetica' , la Ecuacion 3.9 puede expresarse como una fund6n de la prevalencia de exposic ion en la poblacion y el riesgo relativo en la siguiente formu la, q ue fuera introducida por Lev in: , Usando la Ecuaci6n 3.8, la Ecuac i6n 3.9 pucde ser reescrila como una funci6n de la prevaJenc ia de la expos ic i6n (p,) y la incidencia entre expues tos (q. ) . como sigue: % RA "", =
[q. x I', ] + [q_ x (I - 1',)] - q_ [q. xp, ] + [q _ x (J 1',)]
x JOO
[q. x 1', ] - [q_ xI',)]
-;-:=-,7'7""'-:-72-:' [q. x I', ] [q _ x I',)] + q_
J()()
Esla expres i6n puede ser aun mas simplificada dividiendo todos los term inos del numer..tdor y e l denominador por q_ -
q.
xp,_ p, q% RA "", = - - ' - - - - _q. xp,_ p, + I
qp, x (RR - I) p, x (RR 1) + 1
EPIDEMIOLOGiA lNTERMEDIA ; CONCEPTOS Y APLICACIONES
9()
IEcuaci6n 3 .1 OJ % RA J''''' =
p, x (RR - I )
-"-':::"=-c-'-'--,l', x(R R - I ) +!
x 100
Usando el mismo ejemplo de la poblacion con una prevalencia de exposici6n igual a 0,40 y un RR = 020/0, 15 = 1,33, la Ecuaci6n 3 .1 0 produce e l mismo % RA pobestimado ames: %
0,40 x (1 ,33 - I)
RA]'ob = 7"'0':::'''''7''''--,,-''-,0,40 x (1,33 - 1) + I
40 -,-O " ,,, :c:cx-,O,,,,3,,3'-,- = 12 % 0,40 x 0,33 + 1
A
r------r------ -------- ----- --------
No exp ueslos
Poblaci6n
Expuestos
B
M
R~1b ....
lP
...... .... -... ..... ........
NO expueslos
Poblaci6n
Expuestos
F igura 3.2. EI ricsgo atribuible poblacionai y su depcndcncia de 13 prevalcncia de 13 cxposici6n. Como la pobJaci6n se compone de individuos expuestos y no expuestos. la inci· deneia en la pobJaci6n es sim ilar a la de los no expuestos cuando la exposici6n es poco prevalente (A) y es pr6xima a la que tienen los expuestos cuando la exposici6n es comlin (8). Asf. para un riesgo relativo fijado (p. ej .. RR ... 2 en la figura). el riesgo atribuible poblacional depende fuertemente de la prevalencia de la exposici6n.
MEDICION DE ASOCIACIONES ENTRE EXPOSICIONES Y DESENLACE
91
Para consultar un me{odo de c6mputo de los Ifmites de confianza para RA pob , vease el Apendice A, Secci6n A.S. La f6nnula de Levin es aplicable a los estudios de casos y controles (mediante el reemplazo del riesgo relativo por eI valor del oddJ" ratio) cuando la prevalenda de la exposici6n en la poblad6n de referenda es conocida. Esto subraya la importanda de los dos elementos criticos que contribuyen a la magnitud del riesgo a{ribu ible pobladonal: el riesgo relativo y la prevalenda de la exposici6n. La dependenda que {iene el riesgo atribuible pobladonal de la exposidon se ilustra graficamente en la Figura 3.3; esta mues{ra que para {Odos los valores del riesgo relat ivo. el riesgo atribu ible pobladonal (RA) se incrementa marcadamente en la medida que la prevalenda de la exposid6n crece. Toda la discusi6n precedente es valida cuando la variable de exposici6n es binaria (es decir, expuestos frente a no expuestos). Cuando la exposici6n se define a (raVeS de mas de dos categorfas, una extension de la formu la de Levin fue propuesta por Walter(7) .
L• I'j X (RRi -
% RA pob
l)
=-'C"""c.------ x 100 = I+ L l'i x(RR j- l) i.O
EI subfndice i denota cada uno de los niveles de exposici6n; 1'. es la proporci6n en la poblaci6n que se estudia en eI nivel de exposic i6n i; y «RR j »es el riesgo relativo RR no ajustado para el nivel de ex posici6n i comparado con el nivel de los no expueslOs (referenda).
100 RR '=' 10 RR",S
80
,t 0
• ~
RR",3
60
Q
RR",2
40
~
20
0 0
20
40
60
80
100
Prevalencia de expuestos (%oj
Figura 3.3. EI riesgo a tribuible pobla cional: dependencia de la prevalencia de exposi. cion y de l riesgo rela ti vo
92
EPIDEMIOLOGiA lNTERMEDIA ; CONCEPTOS Y APLICACIONES
Es importante enfatizar que la fannula de Levin y la extensi6n de Walte r para exposiciones a varios niveles dan por sentado que no hay confusi6n (vease Capitulo 5) . S i la
confusi6n estuviera presente, entonces no es correcto calcular el riesgo relat ivo ajus(ado (usando clIalquiera de los enfoques que se describen en el Capit ulo 7) e inser(arlo en las fannulas de Lev in y de Walter con e l fin de obtener un RA poo aj ustado(8). El enfoque correc(Q para dic ho aj uste del RAp"" se ha descrito en alro sitio .
33. ESTUDIOS DE CORTE TRANSVERSAL, ESTIMACION P UNTUAL DE LA RAZON DE TASAS DE PREVALENCIA Cuando de 10 que se dispone es de datos procedentes de un es{udio transversaL las asociaciones se estiman a menudo mediante el empleo de lIna razon de tasas puntuales de prevalencia (RTP). La capacidad de las RTP para estimar el riesgo relativo depende de la relaci6n entre la incidencia y la prevalencia punt ual, como se discutio previamente en el Capftulo 2 (Secci6n 2.3, Ecuacion 2.4): Prevalencia punt ual = Incidencia x Duraci6n x ( I - Prevalencia puntual) Usando las notaciones «Prev» para la prevalencia, «q» para la incidencia y «Dun) para la duraci6n, y denotando la presencia 0 ausencia de una exposic ion dada mediante «+» y «-~), la relacion entre el RTP y la razon de incidencias es : RTP = Prev+ = q+ X Dur+ x LI ,0 - Prev+J Prev_ q- x DUL x [1,0 - Prev_J Como la razon de incidencias es el riesgo relat ivo, esta f6nn ula puede ser replan{eada como: IEcuacion 3.II J. RTP = RR x ( Dur+ ) x (....!....=!rev+ ) DUL 1 - Prev_ As!, los dos fac{Qres de sesgo que diferendan al RTP del riesgo relativo son la raz6n de las duraciones de la enfennedad, (Dur..fDuL), y la razon de los complemen{OS de las estimaciones puntuales de las prevalencias ( I-Prev ..f l -Prev _) en expuestos y no expuestos. En el Capitulo 4 (Secci6n 4.4.2) se discuten e ilustran tales sesgos .
3.4. MEDICION DE LA ASOCIACION EN ESTUDIOS DE CASOS Y CONTROLES 3.4.1. Odds Ratio Uno de los mas importantes aportes cn materia de estimacion de riesgos en epidemiologfa se produjo en 1951 cuando Cornfield(
MEDICION DE ASOCIACIONES ENTRE EXPOSICIONES Y DESENLACE
93
eq uivalentes . Esta simple pero crucial circunstancia pennite calcu lar e l odds ratio de enfermar en los est udios de casos y comroles, pues es algebraicamente idemico al odd.\" ratio de estar expuesto . Como ya se vio en la Ecuacion 3 .2, la raz6n de los odds de desarrollar una enfermedad entre expuestos y no expuestos se conv ierte en la raz6n de productos auza· (los, (a x d)/(b x c). Usando los datos plVsl'ectivos que aparecen en la Tabla 3.3, ahora reorganizados como se muestra en la Tabla 3.5, y asumiendo que las celdas en la tabla representan la distdbuci6n de los partic ipantes en la cohone durante el seguimiemo de un ano. es posible lIevar adelante un analisis de casos y controles comparando los 210 sujetos que desarrollaron un infarto de miocardio (casos) con los 19 .790 individuos que se mantuvieron libres de enfermedad coronada durante dicho seg uimiento . EI odds absoillfo de exposicion (Odd,\"oxp) entre los casos y e l odd.\" analogo de ex posici6n para los comroles se estima como la razon de la proporci6n de individuos expuestos respecto de la proporci6n de ind ividuos no expuestos: a
a
a +c
Odd.\"nplm"",=
- -
c
1-( -a- ) a +c
Odd'\"
b b+d
I_(_b ) b+d
b d
- -
La sigu ieme maniobra algebraica demuestra que e l odds ratio de los expuestos (OR.. p) es identico al odds ratio de enfennar (014nf; Ec uaci6n 3 .2):
IEcuacion 3. 12J a OR.. p = -
C
b
a
a xd
= --bxc
d
b c
= OR.,nf
d
Tabla 3.5 Estudio hipotctico de casos y controles sobre infarto del miocardio en relacion con hipertension sistolica, basada en un aiio completo de seguimiento de la poblacion tomada de la Tabla 3.3 Inlarto del mlocardlo
Situa clon de la lenslon arterial sltollca' Hipertensi6n g rave Normal
Tot31
Presente
180 (a) 30 (e) 210 (a-+<:)
AU!~e nte
9.820 (b) 9.970 (d) 19.790 (b+d)
• Hipertensi6n siSl6hca grave ., 180 mm Hg. y lensi6n arterial sisl6lica oorma l < 120 mm Hg.
94
EPIDEMIOLOGiA lNTERMEDIA ; CONCEPTOS Y APLICACIONES
Para el ejcmplo de la Tabla 3 .5, e l OR oxp es
180 30 0"",, = --;:-:=9.820
180 x 9.970 = 6,09 = ORe"f 9.820 x 30
9.970 En este ejemplo. basado en datos pros pectivos, {Odos los casa s y los no casas (controles) han sido lIsados para la estimaci6n del odds ratio (suponicndo un seg uimiento completo durante un ana de los 20 .000 individuos). Sin embargo, los estudios de c asas y controles se basan tfpicamente en muestras. 5 i el numero total de casas es pequeno, como en el ejemplo de la Tabla 3.5, el investigador p uede intentar incluir todos los casa s y una mue.stra de controles . Por ejemplo, si se trabajara con e l 100% de los casas pero con lIna muestra de aprox imadamente e l 10% de los no casa s fue ran estudiados (Tablas 3 .6), su poniendo que no hay variabilidad aleatoria, los resul tados sedan idemicos a los obten idos cuando se incluyen todos los no casos, como en la Tabla 3 .5:
180 30
ORoxp = """""982 =
180 x 997
982 x 30
= 6,09 = O~nf
997 Este ejemplo pone de manifiesto que la fracci6n muestral no tiene q ue ser la misrna en casos y en comroles . Sin embargo, para obtener estimaciones insesgadas de los odds absolutos de exposic ion para los casos y para los comroles, las fracciones de muestreo han de ser independientes de la ex posici6n: esto es, e lias deben ser aplicadas por igual a las celdas (a) y (c) para casos y en las celdas (b) y (d) para los controles . (Para conocer acerca de excep:io nes de esta regia, vease e l Capitulo 4, Seccion 4.2). Tabla 3.6 Estudio de easos y controles de la rclacion de inrarto del miocardio y presencia de hipertension sistolica grave incluyendo todos los casas y un 10 % de la muestra de los no casas tornado de la Tabla 3.5 Infarto del mlocardlo Sltuaclon de ta tension arterlat slstollca" Hipertensi6n grave Normal Total
Presente
Ausente
180 (a)
982 (b)
30 (c)
997 (d)
210 (a+c)
. Hipertensi6n sist6lica grave ~ 180 mm Hg. y tansi6n arterial sist61ica normal
1.979 (b+d) <:
120 mm Hg.
MEDICION DE ASOCIACIONES ENTRE EXPOSICIONES Y DESENLACE
EI investigador selecciona muestras de ::::~g~:~:
J
95
:~: ~~~:sas
J
Total de casos: 820 ~ 0,8 '" 656
Total de no casas: 4.160 ~ 0,5 " 2.080
____________________ t
_____________ J _____________ ...... _,
Composici6n esperada de estas muestras si la distribuciOn da vacunadosJplacebo es insesgada
--------------------,---------------r-------------------, , , ,-----------~ ' r'L-----------~ CAsas: Vacunados: 650 Placebo: 170
~ ~
NOCASQS: Vacunados: 1.920 ~ 0,5 '" 960 Placebo: 2.240~ 0,5 "".120
0,8 '" 520 0,8 '" 136
Figura 3.4. &Ieccion del 80 % del total de casas y 50% de no casas en UII cstudio de casos YcOlltroles procedente de la poblacioll que se estudia y que se muestra en la Tabla 3.4. La composicion esperada se supolle que 110 tiene variabilidad aleatoria. Fllellle: Datos tornados de R Sdtscr.?E SartwelL and JA Bell. A Controlled Test of Asian Influenza Vaccine in a Population of families. AmericwI iOllrllai of flygielle. Vol. 75. 1 t2 - 135.1!::1 1962.
En e l ejemplo de las reacciones locales a la vacunaci6n (Tablas 3.4), un esludio de casas y comroles podrfa haberse IIcvado adelante incluyendo, por ejemplo, el 80% de los casos que tuvieron tales reacciones y e150% de los controles . Partiendo de que no hay variabilidad aleatoria. los datos que se hubieran obtenido serfan los que se registran en la Figura 3.4 Y se muestran en la Tabla 3.7. N6tese q ue el investigador selecciona casos por una parte y no casas por o[ra, y espera que las fraccione s de mues[reo con que 10 hace afccten por igual tanto a expuestos (vacunados) como a no expueslos (no vacunados). Es de esperar que este patron se verifiq ue tamo para los casos como para los no casos. Los resultados son, de nuevo, idemicos a los que se vieron en la poblacion [o[al, en los cuales e l (vcrdadero) odds ratio es 4,46:
OR oxp=
( ~) 136
= 4,46 = OR,of
, 960 ) ( 1.1 20 EI hecho de q ue el ORe.. p sea identico al OR ool explica por que la interpretacion del odds ratio en los est udios de casos y comroles es «prospectiva» . As\, en e l ejemplo basado en la estrategia de casos y comroles, (y suponiendo que el est udio es insesgado y esla libre de confusion), la interpretaci6n de los resu ltados es que para individuos que recibieron la vacuna, e l odds de desarrollar reacciones locales es 4.46 veces mayor que e l de aq ue llos que recibieron placebo .
96
EPIDEMIOLOGiA lNTERMEDIA ; CONCEPTOS Y APLICACIONES
Tabla 3.7 Estudio de casos y controlcs sobre la rclacion entre ocurrcncia de rcacci{m local e inlllunizacion previa contra innuenza Vacunacl6n
Casos con reaccion local
Controles sin reaccl6n local
Sf
5:<0
960 1.120 4160 x 0,5 ,,2.080
No Total
136 820 x O,B ,,656
NortE 8ocodo <>n uM muM!,,, pcrf<>ei3monto reprMcnt
Eluso de 1a raz6n de Oddsoxp para los casas dividida par 1a de los controles,
se recomienda enfaticamente como el primer paso para el calcu lo de los OR oxp antes que acudir a la razon de producws cruzados, de suene que se evite la confusi6n sobre confi guraciones dife rentes de las tablas, como, par ejemplo, cuando se ubican los datos de los controles a la izqu ierda y los de los casas a la derecha:
E\posiciO/l
Commies
Sf
«a>, «c»
No
Casos
En este ejemplo. la aplicacion mednica de la raz6n de productos cruzados, (a x d)/(b x c), produce una est imacion de l odd.~· ratio que es la inversa del verdadero O l /dS ratio. Por otra pane, al dividir el odds de ex posicion para los casos por el que corresponde a los controles, produce el Ol/dS ratio correcto, (blt/)/(a lc).
Odds ratio en esllldios de casos Y colltroles emparejados En un estud io de casos y controles emparejados en el c ual la razon entre el numero de controles y casos sea I: I , un estimador insesgado del odds ratio se obtiene mediante la division del numero de pares en los que el caso, pero no el control con el que esta emparejado, esta expuesto (casoL+I, control 1- ]), entre el numero de pares en los que el control esta expuesto pero no aSI el casa, (casol - 1. control I+J). La 16g ica intuitiva que subyace as! como un ejemplo de tal enfoque se discu{en en el Capl{u lo 7, Seccion 7.3.3. Odds ratio como una estimadon del riesgo reiatil'o: eI s"p"esto de baja prevalenda En un eSllldio de casos y controles,el empleo del odds ratio para estimare! riesgo rei a!ivo se basa en el supuesto de que la enfermedad que se est udia tenga una incidencia
MEDICION DE ASOCIACIONES ENTRE EXPOSICIONES Y DESENLACE
97
baja, de manera q ue se produce un pequeno se.\·go inherente (Ecuad6n 3.3), como ya fue discmido oportunamente (Secd6n 3.2 .1 ). Cuando la incidenda de la enfennedad es alta, eSle sesgo puede ser sustancial, tal y como se puso de manifiesto en el ejemplo de la re1adon entre la vacunad6n contra la infl uenza y las reacciones locales. Al igual que en los estudios prmpectivos (vease Secci6n 3.2. 1), e l supuesto de q ue la enfennedad es rara (escasamente prevalente) solo procede en situadones en las que e l odds ratio se ell/plea para estimar el riesgo relativo . Cuando el OlJd.\· ratio se usa como medida de asociad6n sin mas, tal supuesto es obviamente innecesario . Ademas, tal supuesto tampoco procede en situaciones en las que el gmpo control es una muestra de la poblad6n tOlal(IO), estrategia regularmente empleada en los estudios de casos y controles dentro de una cohorte definida (Capitulo I , Secd6n 1.4.2) . La irrelevancia del supuesto de baja prevalenda cuando los controles confonnan una muestra de la pobladon de referenda puede ser demostrada mediante comparadon de los dlc ulos de los OlJdS ratios que se derivan al emplear diferentes tipos de gru pos control. En 10 que condeme a la tabu lacion cruzada que incl uye todos los casos y todos los no casos en una poblaci6n definida como la de la Tabla 3.8, c uando los no casos se emplean como gru pos control, como ya se vio (Ec uacion 3.2) e l OR..p se emplea para est imar el ORenf div idiendo los Odds"p entre los casos por dicho odd,\· en los controles:
a OR exp =
_=O cd=d='c'~""'~'_,,---
Oddsoxpcootroios
= - c = ORen! b
"
Otra posibilidad es emplear e l total de la poblaci6n estudiada al comienzo como grupo control en lugar de circ unscri birse a los no casos . Si tal estrategia se emplea en el contexto de un es(ud io de cohorte, e l est udio de casos y controles es entonces denom inado un estlldio de caso-co/wrte (Capitulo I , Secci6n 1.4.2), y la divisi6n del Oddsup para los casos entre el Odds" p para los controles (poblaci6n total) da lugar al riesgo relat ivo: IEcuaci6n 3. 13J
(~) ( G+b) c + (/
(-;;S;-)
RR
C:" )
Tabla 3.8 Tabulacioll c ruzada de una pohlacion dcfillida seg ull exposicioll y desarrollo de la e nfermcdad Exposlclon Presente Ausente
Totat po btaclo n (Ca sos + No ca so s)
Caso s
No casos
, ,
b
Hb
d
,.d
98
EPIDEMIOLOGiA lNTERMEDIA; CONCEPTOS Y APLICACIONES
Ut ilizando nucvamente el ejemplo de la investigacion sabre vacunaci6n contra la infl uenza y reacciones locales (Tabla 3.4) puede verse que un estudio de casoscohortc pud iera lIevarse adelante usando IOOos los casas y toda la poblaci6n en est udio, esta en calidad de grupo control. La raz6n del oddJ' de los expuestos para los casas (Odds oxp o• ..,.) entre los odds de los expuestos en la poblaci6n {Olal bajo est ud io (Oddsnpf>Ob) produce el riesgo relativo:
Odds expc.....
Ods "ppoob
(~) 170 2.570 ) ( 2 .410
650 ) ( 2.570
q = -+ =3,59=RR 170) q( 2.410
donde q+ es la incidencia entre expucslOs y q_ la incidencia entre no expucs(Os . En esta estimaci6n del riesgo relativo todos los casas y e l total de la poblaci6n han sido incluidos . Sin embargo, puesto que las est imaciones insesgadas de Odds eJIpc."" y de Odds nos proveen de un estimador insesgado del riesgo relat iYO, en un est ud io casos-cohorte p ueden ser comparadas una muestra de casos y una muestra de la poblaci6n total. Por ejemplo, suponiendo que no hay variabilidad aleatoria, muestras insesgadas del 40% de los casos y del 20% de la poblaci6n total prod ucirlan los res ul tados contenidos en la Tabla 3.9; puede demostrarse que el producto de la d ivisi6n del Odds..p caso< entre e l Odds" p po/> es identieo al riesgo relativo obtenido prospectivamente para la cohorte completa, tal y como se m uestra a cont inuaci6n:
260
6'
OR" p= - - = 3,59 = RR 5 14
4'2 Tabla 3.9 Estudios de casos coho rtes de la relacioll de yacunacioll previa y reaccion local Va cunaci6n previa
Ca sa s de reaccion local
Muestra de cohorte
sr
260
514
No
68
482
328
996
Total
Nota: 8asado en una mueSlra aleatoria del estldio de poblacoo de la Tabla 3,4. con fracciones de mues\reo del 40% para los casos y del 20% para la cohorte. Fuente: Datos \omados de R SeHser, PE Sartv,ell, ar.d JA Bell. A Controlled Tes\ of Asian Influenza Vaccine in a Population of families, American Journal of Hygiene, Vol. 75, 1I2· 135,itl 1962,
Nuevamente, en virtud del pequeno n umero de casos en relaci6n al tamano poblacional, 10 mas comun es que los estudios casos-cohorte procuren incl uir todos los casos y una muestra de la poblacion de referencia . Una de las ventajas del enfoctue casos-cohorte radiea en que este penn ite una estimaci6n d irecta del riesgo relativo, de manera q ue no hay q ue depender del
MEDICION DE ASOCIACIONES ENTRE EXPOSICIONES Y DESENLACE
99
supuesto de baja prevalencia . Otra ventaja estriba en que, puesto que el grupo con[rol es una mues[ra de la poblacion de referencia, puede ob[enerse una est imaci6n sin sesgo de la prevalencia de la ex posici6n (0 de la distribucion de esta), necesaria para la estimacion del RApob de Levin (Ecuaci6n 3.10). Un gmpo control formado por una muestra insesgada de la cohorte (ambien permite la evaluaci6n de relaciones entre diferentes niveles de exposici6n, e incl uso entre dichos niveles y o[ros desenlaces diferentes al que inic ialmente interesaba. Ademas, hay ocasiones en las que la excl usion de casos del grupo control es diffci l desde el punto de vista logfstieo y puede incrementar los costos . asf como e l agobio de los part icipantes . Por ejemplo, en enfennedades con una alta proporci6n de sujetos en fase subclfnica (por ejemplo, colecistitis cr6niea 0 cancer de pr6stata), la excl usi6n de casos de un conj unto de controles e leg ibles (por ejemplo. individuos aparentemente saludables) req uerirfa la apl icaci6n de examenes mas 0 menos invasivos (por ejemplo, rayos X contrastados, examen rectal) . As!, en estos ejemplos, un enfoque de casos-cohorte pudiera ser oportuno: seleccionar «controles» de la poblacion general independientemente de (es decir, ignorando) la posible presencia de la enfermedad (clfnica 0 subclfnica) . En tenninos generales, sin embargo, solo es apropiado lIevar adelante un estudio de casos-cohorte cuando puede identificarse una poblaci6n definida de la cual tomar casos, como cuando se opera con una cohone definida en e l contexto de un estudio prospectivo . Por o[ra parte, e l desarrollo de est udios de casos-cohorte cuando se opera con cohortes «abiertas» 0 poblaciones completas exige la suposici6n de que ellos representan las poblaciones fuente de las c uales los casos proceden (Capft ulo I , Seccion 1.4.2). Debe enfat izarse que, cuando la enfermedad tiene baja prevalencia, la estrategia de ignorar la situaci6n vigente en relaci6n con la enfennedad cuando se seleccionan controles producirfa con (oda probabilidad unos pocos casos, a 10 sumo, inclu idos en e l gmpo control: asf, en la practiea, la Ec uacion 3.1 3 sera casi identica a la 3.12 porque (a+b) ... b y (c+d) ... d. Por ejemplo, en el caso del infarto de miocardio y la hipertensi6n q ue se expuso en la Tabla 3.3, la estrateg ia de «caso-cohorte» (seleccionar una muestra del 50% de los casos y del 10% de los controles) darfa lugar al sigu iente est imado del odds ratio:
OR oxp =
Odds "pCOk» Odds "FOOC'''''
=
(*)
( 1.000) 1.000
= 6,00= RR
En este m ismo ejemplo, una estrategia «casos-no casos» producirfa la sig uiente estimaci6n:
"d"d=,:::"'""e'~'-"- OR "p = -,: ~O Odds
(*)
= 6,09 = OR 'nf
(:~ )
En otras palabras, esta situacion es analoga a la q ue se discmi6 en la Secci6n 3.2. 1 en relaci6n con la similitud de los odds ratio y el riesgo relativo cuando la enfermedad es poco prevalente .
]00
EPIDEMIOLOGiA lNTERMEDIA; CONCEPTOS Y APLICACIONES
Tambien resu lta uti! notar que, afortunadameme para nosotros (como epidemi6logos y como seres humanos en riesgo), la mayorfa de los desenlaces morbosos son relativamente poco frecuentes . Los desenlaces comunes (por ejemplo, con frec uencias del 10% 0 mayores) se producen en ensayos cl fnicos, tales como el de las reacciones a las vacunas antes descritQ, 0 en est udios clfnicos de pron6stico despues del diagn6stico de cancer. Generalmente, para la mayorfa de las enfermedades, la incidencia que arrojan los est udios basados en la poblaci6n no supera el 5%. En estos ejemplos, como ya se discut i6, e l olids ratio es a menudo una buena aproximaci6n del riesgo relat ivo . De e llo se deriva desde el punto de vista de la medici6n de la asociacion, que la estrategia de caso-cohorte es pr:kticamente equivalente a la de realizar estudios trad icionales de casos y controles en los que los controles son no casos.
Influ encia del marco muestral para la seleccioll de cOlltroles sabre la estilllacion de parallletros mediallte el odds ratio de fa exposicion : incidencia aClllllulada frente a densidad de illcidencia Ademas de considerar si los controles se seleccionan de entre los no casos 0 de la poblaci6n bajo estudio, es importante especifi car el marco muestral para la selecci6n de controles. Tal y como se discmi6 en el Capitulo I (Seccion 1.4.2), cuando se eslan seleccionando conlroles de una cohorte defi nida, los marcos de mueslreo pueden consisl ir en: (I) la cohorte de partida 0 (2) sujetos en riesgo cuando los casos ocurren d uranle e l periodo de seguimienlo (m uestreo por dens idad) . La primera alternativa (ejemplifi cada mediante e l analisis del estudio de la vacunacion contra la infl uenza y las reacciones locales) ha sido designada como disel10 cm'o-eohorte y la segunda como disefio de em'os y controleJ" unidado ll l ). Como se demueslra de inmediato. los disefios de caso-cohorte y anidado permiten la esrimaci6n del riesgo relal ivo y de la raz6n de lasas. respecl ivamenle. Una manera inl uitiva de conceplualizar cual de esos dos parametros esta siendo estimado por el OR.,'P (ej ., riesgo relalivo 0 raz6n de tasas) es concebir a los casos como e l «numeradon) y los controles como e l «denominadon, de la med ida absoluta de la frec uencia de la enfermedad con la cual los parametros se relacionan (vease e l Capitulo 2) . Selecci6n de contlVle.\" de una cO/lOrte al comienzo de .I'll observuci6n : EI disel10 de C(wH"Ohorte . Como ya se describio (Secci6n 1.4.2), c uando se emplea el disefio de caso-cohorte, el grupo de casos se compone de casos identificados duranle el periodo de seguimienlo, y los conlroles integran una mueslra de la cohorte en el momento inicial (Figura 1.20) . Los casos y el marco mucslral para los controlcs puedcn ser considcrados, respeclivamenle, como e l lipo de numerador y de denominadorque hubieran sido seieccionados para calcular una probabilidad basada en la poblac i6n inicial, q. Asf. cuando se eslan seieccionando eslos controles, el OR."p produce una rawn de la probabilidad para expues(Os (q+) entre la que rige para no expuestos (q_): eslo es, la raz6n de incidencias ac umuladas 0 el riesgo relativo. Pueslo que la distribuci6n de los liempos de segu imiento en la muestra de la cohorte inicial - que. por definicion. incluye aquellos que no se han perdido as! como los que habran de perderse mas adeiante durante ei segu imiemo sera diferenle de la distri bud6n de los casos (cuyo «conjunto de riesgo» ' por definicion • Definido como el subconjunlo de los miembros de la cohorte bajo observaci6n en el momento en que ocurre cada caso (vease secci6n 1.4.2, Figurd 1.21).
MEDICION DE ASOCIACIONES ENTRE EXPOSICIONES Y DESENLACE
101
no incluye perdidas antenores), es necesario corregir por perdidas q ue oc urren durante el seguimiento en un esmdio caso-cohorte usando tecnicas de analisis de supervivencia (vease Secci6n 2.2 .1 ) . Es tambien posible excluir casos del gmpo control cuando se tDma la muestra de la cohone en el momento inicial: esto es, e l marco muestral para los controles estarfa conformado por individ uos que se han mantenido libres de la enfennedad a 10 largo del segu imiento. Estas son las personas q ue hubieran sido elegidas como el denominador de los odds ba.wdos en la poblacion inicia/:
(~) As!, el c6mputo del OR np cuando se aplica esta estrategia produce una est imad6n del OR. nf , comparando e l odds de desarrollar la enfermedad d urante e l seguimiento entre los expuestos y los no expuestos al comienzo de la observaci6n . Muestreo de densidad : diseiio anidado de caJ·os y commies . EI d isefio anidado de casos y controles se basa en muestreo de densidad de inddencia y tambien se descri be en el Capitu lo I (Secd6n 1.4.2) . Consiste en seleccionar un gmpo control q ue represente la suma de las submuestras de la cohorte seleccionada du rante el seguimiento en los momentos aproximados en q ue los casos oc urren (conjunto de riesgo) (Figura 1.2 1) . Estos controles pueden tambien ser considerados como una muestra ••promedio» de la poblad6n sobre todos los instantes en que oc urren los eventos (vease el CapItu lo 2, Secd6n 2.2.2) . Por 10 tanto, el OR"p aSI obten ido estima la raz6n de tasas 0 la raz6n de densidad (0 tasa relat iva 0 densidad relativa) . Esta estralegia reconoce de manera ex plfcita que hay perdidas (observadones censuradas) durante e l segu imiento de la cohorte, en que los casos y los controles se eligen de las poblaciones de referenda excluyendo las perd idas prev ias, emparejando aSI casos y controles a 10 largo del seguimiento. Cuando los casos se excl uyen del marco muesIral de los controles, e l ORexp estima e l odds ratio de densidad. Un resumen de los efectos del marco muestral especffico para la selecci6n de controles sobre el parametro estimado por el OR" p se muestra en la Tabla 3.10 . Tabla 3.10 Resumcn dc la innuencia de la sclcccion dc controics sobre cI pa nimctro estimado por el odds ratio de la exposicion en estudios dc casos y contro les dentro de una cohorte definida Diseno
Marco pobiaclonai para ta seiecclon de controtes
Caso-cohorte
Cohorte total al comienzo
Raz6n de incidencias acumuladas (riesgo relalivo)
(Cohorte total al comienzo menos los suetos que se convierten en casos durante el seguimient()j
(Odds ralio probabilistico)
Poblaci6n en los momenlos en que aproximadamente acunen los casos durante el seguimiento
Raz6n de tasas (de densidad)
(Poblaci6n durante el seguimienlo menos los casos)
(Odds ralio de densidad)
Caso-controt anidado
Lo que estima et odds ratio de la exposlclon
EPIDEMIOLOGiA lNTERMEDIA ; CONCEPTOS Y APLICACIONES
102
Calculo del odds ratio wando hay mas de dos categorfas de exposici6n Aunque los ejemplos que se han dado hasta ahora en este capit ulo se circunscriben a solo dos categorfas de exposicion, con frecuencia hay mas de dos niveles de exposici6n que deben ser evaluados . Entre las vemajas de estudiar mu ltiples categorfas de exposic i6n se halla la posibilidad de contemplar diferemes d imensiones de exposici6n (<
3.4.2. Riesgo atribuible en estudios de casos y controles Como fue advertido previamente (Secd6n 3.2.2), puede obtenerse e l riesgo atribuible porcent ual para los ex puestos en los estudios de casos y controles (casos - no casos) siempre q ue e l odds ratio sea un estimador razonable del riesgo re lativo mediante el reem plazo de su correspondiente valor en la Ecuad6n 3 .6:
Tabla 3.11 Distribuci6n de CllSOS de cmneosinostosis y controles normllies con acuerdo a edad nmterml
Edad materna (ai'ios) (1 )
Casos (2)
Controles (3)
Oddsdeedad materna especilicada Irente a la de referencla entre casos (4)
Odds de edad materna especilicada frente a la de referencla entre controles (5)
Odds ratio (6) " (4Y( S)
<20'
12
89
12112
89/89
1,00'
20-24
47
242
47/12
242/89
1,44
25-29
'"58
255
56/12
255/89
1,63
173
58/12
173/89
2,49
>29
. Categoria de referencia. Fuente: Datos tomados de BW Aldeman ef a/.. An Epidemiologic SILJC1y of C raniosynostosis : Ris k Indicators lor the Occurrence 01 C raniosyoostosis in Colorado, American Journal of Epidemiology, Vol. 128, 431 -438, 1Cl 1988, The Johns Hopkins University Schoof 01 Hygiene & Public Hea lth.
MEDICION DE ASOCIACIONES ENTRE EXPOSICIONES Y DESENLACE
103
IEcuacion 3. 14J
%RA..p = (
OR - I,D) OR
x 100
En estudios q ue conciernen a intervenci6n prevemiva , la medida anaJoga al % R A.,xp es la eficacia (vease Secd6n 3.2.2, Ecuacion 3.7) . EI hecho de que e l odds ratio sea usualmente una buena estimacion del riesgo relativo hace posible e l empleo de la Ecuaci6n 3.14 en los est udios de casos y controles de la eficacia de una intervencion tal como un cribadd ll). EI mismo razonam iento vale para e l uso de los est udios de los casos y controles con la fina lidad de estimar e l riesgo atribu ible poblacional empleando una variaci6n de la formu la de Levin:
IEcuacion 3. 15J b x (OR - I ,O) % RAI'ub = -,---"-',:..c:=--"=.,-,h x (OR - 1,0) + 1,0 En la Ecuaci6n 3 .1 5 la proporci6n de sujetos expuestos en la pobladon de referenda, h, puede ser est imada med iante la prevalenda de exposic ion entre controles en la medida que la enfermedad sea poco frec uente y e l gmpo de control sea razonablemente re presentativo de todos los no casos en la poblad6n( Il). Obviamente, si se tratara de un estudio de casa-cohorte, e l supuesto de baja prevalenda no es necesario (Secd6n 3 .4 .1 ), puesto que tanto el riesgo relat ivo como la prevalenc ia de exposid6n pueden ser estimados de manera directa. Tal y como mostraron Levin y Bertell(l4). si el odds ratio se emplea como una estimaci6n del riesgo relat ivo, la Ecuacion 3. 15 se reduce a otra mas simple: m R" ·'v
...... pob
_ b o.",- b eoo' I ,D - h e,,",
-
Donde boo<., re presenta la prevalencia de la exposic ion entre los casos - que es a/(a + c) en la Tabla 3.8- y beon , representa la prevalenda de exposicion entre los controles, que es b/(b + d) en la propia Tabla 3.8.
35, EVAL VACION DE LA FVERZA DE LAS ASOCIACIONES Los valores de las medidas de asodacion discutidas en este capitu lo son con frecuencia empleados para establecer jerarqufas en la importancia relativa de los factores de riesgo. Sin embargo, puesto q ue los factores de riesgo varian en fundon de su modus operandi fisio l6g ico, asf como en c uanto a sus niveles de exposici6n y unidades, tales comparaciones no son procedentes . Re parese, por ejemplo, en 10 absurdo que seria dedr que la tension arterial sistolica es un facto r de riesgo mas importante a los efectos del infarta de miocard io que cI colesterol total , basado en la comparacion del odds ratio asociado con un incremento de 50 mm Hg en la tension arterial sist61ica con aque! correspondiente a un mg/dl de incremento en e l
104
EPIDEMIOLOGiA lNTERMEDIA ; CONCEPTOS Y APLICACIONES
colesterol serico total. Ademas, al margen del (amana de las un idades empleadas, es difki l comparar las fuerzas de asociaci6n, dada la natu raleza unica de los difefentes factores de riesgo . Una manera alternativa de evaluar la fucrza de la asociaci6n de un factor de ricsgo dado con un desenlace consiste en estimar la intcnsidad de la exposici6n necesaria para que e l factor produzca lIna asociaci6n de la misma magnitud a la de cicrtos factores de riesgo bien establecidos 0 viceversa . Por ejemplo, en un estudio reciente Tverdal et U/.(IS) evaluaron e l nivel de exposicion de cuatro factores de riesgo bien conocidos para la mortalidad por enfennedad coronaria necesarios para re plicar e l riesgo relat ivo de 2,2 asoc iado con un consumo de cafe de nueve 0 mas tazas diarias. Como se ve en e l Esq uema 3. 1, un riesgo relativo de 2,2 corresponde a un consumo de tabaco de 4,3 cigarrillos diarios 0 a tener un incremento de la tension arterial sis161ica de alrededor de 6,9 mm Hg, y asf sucesivamente. E~quema
3.1
Una posiblc mancra de describir la fuerza de uua asociacion entre un factor de ricsgo y un dcscnlacc Un riesgo relativo de 2,2 para mortalidad pot concepto de enlermedad coronaria comparando hom bres que beben 9 0 mas tazas de cafe diarias Irente a menos de una taza diaria corresponde a: Consumo de tabaco Tensi6n arterial sist61ica Colesterol serico total Lipoproteina de alta densidad sarica
4,3 cigarrillos diarios 6,9 mm Hg 0,47 mmoVL - 0,24 mmollL
Fuente: Datos provenientes de A Tverdal et al. , Coffee Consum ption and Death from Coronary Heart Disease in MtCld le·Aged Norwegtan Men and women, Brlfj5f1MediCal Journal, vo!. 300, 566-569 , 1990.
GIro eje mplo procede de un estudio realizado por Howard ef at Jlb) , quienes evaluaron la asociaci6n transversal entre habito pasivo de fumar y arteroesderosis subcifnica detenninada por el grosor de las arterias coronarias (capas fnt ima y media) med idas por ultrasonido modo- B. Puesto que el habiw pasivo de fumar aun no habfa sido estudiado previamente en conexion con aleroscierosis directamente visualizada, su importancia como un factor de riesgo fue contrastada con la edad como un detenninante conocido de la aterosderosis. (Esquema 3.2). Tal y como se ve en e l esquema, la asociacion transversal entre el habito pasivo de hlmar y la aterosd erosis es equivalente a una diferencia de edad de un ano. Esto es. suponiendo que la asociaci6n transversal re presenta adec uada mente a la re lacion prospect iva entre la edad y la ateroscierosis, y que los datos son validos, precisos, y libres de confusi6n, e l grosor medio de la arteria carotida de los fumadores pasivos parece coincidir con e l q ue exhiben los q ue nunca fueron fumadores pero q ue son un ano mas viejos . Esla inferencia fue extendida por Kawachi y Colditz(l7) quienes, sobre la base de los datos del estudio de Howard et ut., estimaron que el cambio en el grosor de la pared relacionado con consumo pasivo de tabaco resu lt arfa en un aumento en e l riesgo de eventos cifnicos cardiovasc ulares equ iva lente a un incremento de 7 mm Hg de tension arteria l sist6 lica, 0 0,7 mmollL de colesterol tota l - ci fras nada des prec iables.
MEDICION DE ASOCIACIONES ENTRE EXPOSICIONES Y DESENLACE
105
Esquema 3.2 Valor medio (en mm) del grosor determinado por cortes transversales de la pared (media mas intima) de las arterias car6tidas en individuos fumadores pasivos que nunca fueron fumadores activos, estudio ARIe, 1987 a 1989 $ituaci6n como lumadores pasivos de sujetos que nunca lueron lumadores aclivos
ITM Media (mm) -
Ausente (n; t ,774)
(n;3,358)
Incremento eSlimado por cada ana de edad
0.70)
0,711
0.011
Presente
Equivalente de edad en exceso que puede alribuirse a sar un fumador pasivo : (0.7" - 0,700)/0,0";' ana. Fuente; Datos tomados de G Howard et al., Active and Passive Smoking Ate Associated with Increased Carotid Wall Thickness . The Atherosclerosis Risk il Corrvnun~ies Study, Archives of International Medicine, Vol. 154. 1277'1282, ClI994, American Med ical Association.
BIBLIOGRAFIA I. Lilienfeld DE. Stolley PD. FOllndmions of epidemiology. 3rd ed. New York. NY: Oxford University Press: 1994. 2. Gordis L. Epidemiology. Philadelphia, WB Saunders: 1996. 3. Seltser R. Sartwell PE. Bell JA. A controlled test of Asian influenza vaccine in a population of families. Am J Hyg 1962: 75: 112-135. 4. Greenland S. Robins 1M. Conceptual problems in the definition and interpretation of attributable fractions. Am J Epidemiol 1988: 128: 1185-119 7. 5. Rothman K1 . Greenland S. Modem epidemiology. 2: ed. Philadelphia. Lippincott-Raven Publishers: 1998. 6. Levin ML. The occurrence of lung cancer in man. ACf{/ Un In tem Cancer 1953: 9: 531-541. 7. Walter SD. The estimation and interpretation of attributable fraction in health research. Biometrics 1976:32: 829-849. 8. Rockhill B. Newman B. Weinberg C. Use and misuse of popUlation attributable fractions.Am J PI/blic Health 1998: 88: 15-19. 9. Cornfield J . A method of estimating comparable rates from clinical data: applications to cancer of the lung, breast. and cervix. J Natl Cancer Inst 1951: II: 1269-1275. 10. Prentice RL. A case-cohort design for epidemiologic cohort studies and disease prevention trials. Biometrika 1986: 73: I-II. 11. Langholz B. Thomas DC. Nested case-control and case-cohort methods of sampling from a cohort: a critical comparison. Am J Epidemiol 1990: 131: 169-176. 12. Alderman BW. Lammer EI . Joshua SC et al. An epidemiologic study of craniosynostosis: risk indicators for the occurrence of craniosynostosis in Colorado. Alii J Epidellliol 1988: 128: 431-438. 13. Coughlin SS. Benichou J . Weed DL . Attributable risk estimation in case-control studies. Epidellliol Rev 1994: 16:51- 64. 14. Levin ML. Bertell SR. Re: Simple estimation of population attributable risk from case-control studies. Alii J Epidellliol 1978: 108: 78-79. 15. Tverdal A. Stensvold 1. Solvoll K et al. Coffee consumption and death from coronary heart disease in middle aged Norwegian men and women. BrMed J. 1990: 300: 566-569.
106
EPIDEMIOLOGiA INTERMEDIA; CONCEPTOS Y APLICACIONES
16. Howard G. Burke GL . Szklo M el al. Active and passive smoking are associated with increased carotid wall thickness: the Atherosclerosis Risk in Communities study. Arch In/ern Med 1994: 154: 1277- 1282. 17. Kaw achi I. Colditz GA. Confounding. measurement error. and publication bias in studies of passive smoking. Alii J Epidemiol1996: 144: 909-915.
PARTE
III
AMENAZAS A LA VALIDEZ Y PROBLEMAS DE INTERPRETACION
CAPITULO 4 Fa/ta de validez: Sesgo
4.1. GENERALlDADES El .\'C.\'g0 p ucde definirse como e l resuitado de un error .\"istelluirico en e l disefio 0 la conducci6n de un estudio . Este error sistematico se deriva de deficiendas en el metodo de selecci6n de los participantes del estudio 0 en los procedimientos de recogida de la infonnaci6n relevante sobre la exposicion 0 la enfermedad; como consecuencia, los res ultados observados del estudio tiel/den a ser d ife rentes de los resultados verdaderos. Es a tal tendellcia hacia resultados erroneos a 10 q ue se llama genericamente sesgo. Como se disclitira en eslc capitulo, muchos tipos de sesgos pueden afectar a los resultados del estudio. EI sesgo, junto con la confusi6n (vease Capitulo 5) merece consideraci6n detenida y suele constituir un problema de gran entidad en los eSUldios epidemiologicos observacionales. EI error sistematico (sesgo) debe d istingu irse del error debido a variabilidad aleatoria (error de muestreo), el cual es inherente al hecho de que se hace una extrapolaci6n: por conducto de una muestra se estiman parametros de la poblacion de referencia . Tales estimaciones procedentes de la muestra pueden diferi r sustancialmente de los parametros verdaderos debido al error aleatorio, especialmente c uando la muestra con que se opera es pequefia. N6tese que la definic i6n de sesgo se relaciona con e l proceso - es decir, con e l disefio y los procedimientos - del estudio. y no con los res ultados de estudio part icu lar alguno. Si e l disefio y los procedimientos de un estudio son insesgados, el estudio se considera valida porque sus resultados seran (en promedio) correctos . Un disefio deficiente se cons idera sesgado (0 no valido) porque producira un resu ltado err6neo en I'romedio; sin embargo, debido a la variabilidad muestral, un estudio q ue uti lice metodos «sesgados» podrfa producir no obslante un res ultado cercano a la verdad (Figura 4.1) . Se dice que existe sesgo cuando, en promufio, los resultados de un numero infinito de estudios (relacionados con una asociacion espedfica y una poblaci6n de referencia) difieren del verdadero resu ltado . Ese serfa el caso, por ejemplo, c uando e l promedio de los odds ratio procedentes de un numero grande (te6ricamente infinito) de estudios de casos y controles fuera 2,0 a pesar de q ue en verdad no exista asociaci6n (Figura 4 .1 ). Esta definicion de sesgo, sin embargo, tiene escasa utilidad para eI epidem iologo. quien debe inferir a partir de los resu ltados de un linico estudio . Aun cuando el epidemio logo lIeve a cabo una revision 0 un meta-analisis, los estudios publicados dispon ibles son solo una fracci6n de 10 q ue, bajo cualqu ier definici6n, p uede considerarse «un nlimero infinito de estudios» . (Un problema relacionado es el sesgo de publicacion, - esto es, la tendencia a que sean publicados aq ue1I0s estudios cuyos res ultados han sido «positivos»; - puede verse en la Secci6n 4 .5) .
110
EPIDEMIOLOGiA lNTERMEDIA; CONCEPTOS Y APLICACIONES
Estudios con resultados que se acercan a la verdad
-
Sesgo
Resultados de los estudios
VERDAD
Promedio de los resultados
Figura 4.1. Distribucion hipotCtica de resulta dos procedcntcs de un discno sesgado
El sesgo, por 10 tanto, debe serevaluado en e l contexto de una considerac i6n cu idadosa del disefio espedfico del est ud io. los metodos y los pmcedimiemos . La prevenci6n y el control del sesgo se alcanzan en dos niveles: 1) asegurando que el disefio del est ud io sea apropiado para encarar las hip6tesis; y 2) estableciendo y vigilando cu idadosamente que los procedimientos de recolecci6n de los datos sean validos y confiables. E.>;te ultimo lema se (rata en el Capitulo 8, destinado a discutir procedimientos
de control y aseguramiento de la calidad en estud ios epidemiologicos . Muchos tipos de sesgos han sido descritos en la literatura epidem iol6gica (vease, por ejemplo, SackeW I)). Sin embargo, la mayorfa de los sesgos relacionados con el disefio y los procedimiemos de estudio pueden clasifica rse en dos categorfas basicas: de selecci6n y de informaci6n. El sesgo de selecci6n se produce cuando los individuos tienen dife rentes probabilidades de ser incl uidos en la muestra en dependencia de cuaJes sean s us caracterfsticas relevames: es decir, la ex posici6n y el desenlace de imeres . La Figura 4 .2 ilustra una sit uaci6n genera l donde los casos expuestos tienen mayor probabilidad de ser seleccionados para el est udio que otras categorfas de ind ividuos . Un ejemplo de este ti po de sesgos es el seJ'go de vigilancia medica, que podrfa hallarse, por ejemplo, cuando se conduce un estudio de casos y controles para examinar la re laci6n del uso de anticonceptivos orales con cualqu ier enfermedad que tenga un componente subclfnico imponante - tal como la diabetes . Debido a que el uso de contraceptivos orales esta probablemente relacionado con una mayor frecuencia de consultas mooicas, cualqu ier enfermedad subc lfnica se diagnostica con mayor probabilidad en estas mujeres que en otras. Consecuentemente, en un esru ciio en '1ue se comparen casos cic ci iahefes y confroles s in ci iahetes - , puci iera
observarse una asociaci6n espuria entre esta condic ion y el uso de contraceptivos orales. El efecto del sesgo de selecci6n sobre la direccion de la medida de asociaci6n es, por supuesto, una funcion cuyas celdas en una tabla n x k (ej., una tabla 2 x 2 tal como la mostrada en la Figura 4 .2) estan sujetas a una probabilidad espuriamente mayor 0 menor, de selecci6n .
I II
FALT.... DE VALIDEZ: SESGO
Poblacl6n de referencla
,- ------------,- -- -----------,
: Enfermos : expues tos
: SanDs : expueslos
muestra del estudlo
Figura 4.2. Sesgo de scleccion: un grupo relevanle en la poblacion (casos expuestos en el ejemplo) tiene una probabiJidad mas alia de eslar incluido en la muestra
EI sesgo de informacion resulta de una tendencia sistematica de los individuos seleccionados para su inclusi6n en el esntdio de ser colocados erroneameme en Cafegorfas diferentes de exposicion/desenlace, 10 que conduce a un error de clasijicacion. EI ejemplo clasico de sesgo de in formaci6n que engendra este tipo de errores es el sesgo lie reel/erdo que acaece cuando la capacidad para recordar exposic iones pasadas difiere en dependencia de que se trate de un caso 0 de un control. En el ejemplo hipoletico i1ustrado en la Figura 4.3 los casos lienen una probabilidad mas alta que los controles de consignar una exposic ion pasada .
Poblacl6n de referencla
:E~ie~~~~ ----:- S~-~~~ -------: : expuestos
:, expuestos
:,
, , ~~, ,,, : Enfermos : Sanos , : no expueslos : no expueslos : , : '
----------- -- ----------
--------------'- -- -----------' Casos
.
E
--
NE
I j
, ConlO! tI I
j
muestra del estudio
Figura 4.3. Sesgo de mala clasilicacion (informacion): se produce cieno grado de mala clasificaci6n en la infomlaci6n sobre la exposici6n tanto en casos como en comroles. pero los casos no expuestos en este ejemplo tienden a comunicar un grado de exposici6n pasada en mayor medida que los comroles. E. expuestos: NE . no expuestos.
EPIDEMIOLOGiA lNTERMEDIA; CONCEPTOS Y APLICACIONES
112
La q ue sigue es una discusi6n de los sesgos de infonnaci6n y de selecci6n mas comunes q ue dis(Qrsionan las asociaciones entre exposici6n y desenlace en estud ios epidemiol6gicos observacionales. Inev itablemente, debido a q ue los diferentes tipos de sesgos se solapan, cualq uier intento de clasifi carlos entrana alguna d uplicacion; como puede advert irse f:k ilmente, algunos ti pos de sesgos puedcn ser categorizados como de J"e/eccion 0 lie informacion (0 de ambas maneras) . La clasifi caci6n de los distintos tipos de sesgos que se examina en las secciones sig uientes esla hccha, por 10 tanto, con propOs itos basicamente didacticos y bajo ningun concepto puede entenderse como una taxonom fa rfgida y mut uamente excluyente .
4.2. SESGO DE SELECCION EI sesgo de selecci6n ocurre cuando un error sistematico en la asignaci6n de los sujetos - a la condicion de casos 0 de comrol e~ en los estudios de casos y controles,o a la condic i6n de expuestos 0 no expuestos en los esmdios de cohorte - contribuye a distorsionar nuestra apreciaci6n de la verdadera asoc iaci6n entre la exposici6n y el desenlace. EI sesgo de selecci6n es a menudo denominado se.\-g0 Berhoniano, particulannente cuando ocurre en los est udios de casos y comroles con paciemes hospitalizados(2J). Una representacion hipotetica del sesgo de seleccion en e l contexto de un est udio de casos y controles se observa en las Tablas de la 4 .1 a la 4.4. Para faci litar la comprensi6n, en elias se supone que la confusion esta auseme y q ue no hay ni variabilidad aleatoria ni sesgo de informacion (es decir, que no existe error de clasifi caci6n ni en materia de exposicion ni en la condic ion de caso 0 control, vease Seccion 4.3). En la Tabla 4. 1 aparecen todos los casas verdaderos y los no casos verdaderos en una poblacion de referencia de 10.000 sujetos incluidos en un esmdio de casas y con{roles que evalua la relaci6n entre eI factor de riesgoA y la enfennedad Y. La Tabla 4. 1, par tanto, muestra los «verdaderos» resultados que pueden ser ut ilizados como «estandar de oro» para evaluar los resultados mostrados en las Tablas 4.2, 4.3 Y4.4. Tabla4.1 Esludio hipole tico de casas y conlroles que ineluye lodos los casos Y lodos los no casos de una poblacio n definidaj se supone que no hay efcclo de confusion ni sesgo de informacion Poblac l6n total Facto r de rles go A
Caso s
No c asos (c o ntro les )
Presente Ausenle Total Odds de exposici6n
soo
1.600 7 .200 9 .000 1.600:7.200 e: 1,0:4.0
SOO 1.000 500:500 '" 1 ,0:1 ,0
(~) ::4.0
Odds ratio
1.800 ) ( 7.200 Nota: los resultaoos en esta tabla representan el .estiindar de oro~ contra el cual oompara r el resuHado de las Tab las 4.2, 4.3. Y 4.4
113
FALT.... DE VALIDEZ: SESGO
Tabla 4.2 Estudio hipotetico de casos y controles conrormado por una muestra insesgada del 50 % de los casos y una muestra insesgada del 10 % de los no casos procedentes de la poblacion de rderencia que se muestra en la Tabla 4.1 Muestra de la poblaclon Factor de rlesgo A
50% de los casos
10% de los no casos (controles)
Presente Ausenle Tolal Odds de exposicion
250 250 1.000 x O.SO '" SOO 250:250" 1,0:1,0
18() 7211 9.000 >< 0,10 ,,900 180:720:: 1,0:4,0
( :~ ) (;: )
Odds ratio
Consecuencias
- : = - :::4.0
Odds de exposicion insesgado en casas y controles Odds ralio insesgado
Tabla 4.3 Ejemplo de sesgo de selecciun al escuger los casus en un estudiu hipoteticu de casus y contrules que incluye en III muestnl 1I1 50 % de los casus y al 10 % de los no CliSUS de III pobiaciull de referencill que se muestra en III Tlibia 4.1 Poblaclon total Factor de rlesgo A
Casos
No casos (controles)
Presente Ausenle Total Odds de exposicion
500 x 0.60" ,,300 500 x 0.40" ,,200 1.000 x 0.50 '" 500 300:200 " 1 ,5:1,0
180 720 9.000 x 0, 10 ,,900 180:720:: 1,0:4 ,0
(~) Odds ratio
:::6.0
) (~ 720 Consecuencias
Odds de exposici6n sesgado en los casas Odds de exposici6n insesgado en los controles Odds ratio sesgado
Fracciones de muestreo diiereociales ajenas a la inleoci6n del invesligador y desconocidas para ill.
EPIDEMIOLOGiA lNTERMEDIA ; CONCEPTOS Y APLICACIONES
114
Tabla 4.4 Ejcmplo del mismo nive! de sesgo de sclcccion ell 13 clcccioll de casos y controles en un cstudio hipotCtico de casos y controles que illcluye ulla mucslra de 50 % de los casos y 10 % de los 110 casos de la poblacioll que se mueslra en la Tlibia 4.1 Poblacl6n total Factor de rlesgo A
Casos
No casos (controles)
Presente Ausenle Total Odds de exposici6n
500 x 0,60' :0 300 500 x 0, 40' :0 200 1,000 x 0,50:0 500 300:200" 1 ,5:1,0
1.800 x 0,136' '" 245 7.200 x 0,09 1' ,,655 9.000 >< 0, 10 ,,900 245:655" 1,0:2,67
( :~ )
--==- :::4.0 ( ~) 655
Odds ratio
Odds de exposici6n sesgado en igual grado en casas y controles Odds ratio insesgado
Consecuencias
• Las f,,,,,,,ion«
dif~rc""i.",s
de rn"", I..c" 'on dcsconocida< para d in,''''l igador
En la Tabla 4 .2 LI lia muestra del 50% de los casos y del 10% de los comroles se selecciona de la poblac i6n {otal mostrada en la Tabla 4.1 . Una muestra insesgada tal como eSla prod uce oddJ' de ex posici6n insesgados en los casos y controles y, por ende, tambien un odd.\· ratio insesgado. (EI uso de una fracci6n mayor de muestreo para los casos que para los comroles en la Tabla 4.2 es IlpieO de m uchos estudios de casos y controles para los cuales se dispone de una fuente limitada de casos (vease el Capitulo 3, Seccion 3.4 .1 ). Sin embargo, a medida que la fracci6n de muestreo delltro del grupo de casos y dentro del grupo de controles no eSla afeclada por la exposicion, no se presenta sesgo de selecci6n. En contraste con los enfoq ues que producen estimadores insesgados como los de las Tablas 4.1 y 4.2, la Tabla 4.3 recoge un ejemplo de sesgo de seleccion: sin que eI inve.\·tigador esre avizorado de ella, la selecci6n de casos, pero no la de controles, esta sesgada porque varia de ac uerdo al grado de exposie i6n. En el ejemplo hipotet ico incl uido en la Tabla 4.3, el investigador decide seleccionar el 50 % de los casos y el 10 % de los controles, como en la Tabla 4 .2. Sin embargo, la selecci6n de casos no es independiente del grado de exposici6n . Como consecuencia, aun cuando la fraccion de muestreo total para los casos es 50%, a los casos expuestos se aplica una fracci6n de muestreo mayor que a los casos no expuestos, 10 que sesga el odd.\· de ex po~ i citin
en
l o~
casos pem no en
lo~
contmles, 10 clla l proo llce lin nrirh I'fII;n
~e~
gado . Es importame enfatizar que la diferencia en la fracci6n de muestreo de acuerdo al nivel de exposie i6n en los casos no es una decisi6n deliberada del invest igador, quien tiene la impresi6n de que tanto los casos ex puestos como los no expuestos estan sujetos a la misma fraccion de mueslreo preeslablecida de 50% aplicada a la fuente total de casos . Los ejemplos mostrados en las Tablas 4.1 ala 4.3 se apliean en
FALT.... DE VALIDEZ: SESGO
115
una situad6n hipotetica en la cual existe una Usta de la pobladon de referenda definida de la que seleccionara los casos y los no casos. A menudo tales listas no estan disponibles y por tanto los epidemi61ogos utilizan muestras convenientes de casos y controles, 10 que da lugar a que la ocurrencia de sesgo de seleccion sea aun mas probable. Un ejemplo hipotetico de sesgo de selecci6n es un est udio de anemia aplastica en el cual los casos proceden de un hospital de referencia y los controles son padentes con des6rdenes no malignos, ni hcmatol6gicos, identificados en el mismo hospital. Puesto que los pacientes con anemia aplastica pueden ser remitidos a menudo a este hospital para un trasplante de medu la 6sea. algunas de sus caracterfsticas dife riran de las de los otros pacientes: por cjemplo, pueden ser mas propensos a provenir de familias numerosas (ya que con frccuencia tienen un fam iliar donante geneticamente pareado) y a poseer seg uro de salud 0 una mejor situaci6n econ6mica que les permite sufragar los considerables costos involucrados en este procedimiento. Como resu ltado, las exposiciones relacionadas con el hecho de tener una familia grande y/o un nivel socioecon6mico alto pueden estar diferencialmente distdbu idos entre casos y controles, 10 que conduce a una distorsion de las asociaciones ex posici6n-enfermedad. Debido a que el sesgo diferencia l como el que se ilustra en la Tabla 4.3 distorsiona la magnitud de una asociacion, los invest igadores a menudo intentan <
(;(ISOJ",
ba.wuJa en la clfllica, 0
.~"elecci6n
de confrole.\" ba.wuJa ell elllO.\"·
La selecci6n de los controles, ignorando el proceso de selecci6n que hizo que los casos en est udio se dirigieran a los hospitales HI Y H2 (por ejemplo, seleccionando los controles de la poblad6n total A), bien puede prod ucir sesgo de seleccion si, por ejemplo. los dos hospitales donde los casos se identifican suministran preferentemente a los pacientes que tienen caracterfsticas relacionadas a la ex posicion objeto de evaluacion. Posiblemente, el mejor ejemplo de ig ualamiento exitoso de los procesos de se lecci6n esta dado por los esw dios de casos y controles en los que tanto los casos como los controles se identifican entre mujeres que aceptan participar en un programa de tam izaje(6). Las mujeres que participan en un programa de tamizaje de cancer de mama tienen mayor probabilidad de estar bajo el efecto de factores de riesgo conocidos de cancer de mama, tales como antecedentes fam ili ares de esa entidad. Por tanto, si los casos diagnosticados por tam izaje se compararan con una muestra de no casos seleccionada de la poblaci6n general, podrfa prod ucirse una sobreestimaci6n en la magn itud de la asociacion con algunos factores de riesgo. AI se leccionar tanto los casas como los controles entre las mujeres pesq uisadas. sin embargo, se consigue que ambos gru pos tengan una mayor probabilidad de exposici6n a facto res de riesgo conocidos. Este proceso se il ustra esquematicamente en el ejemplo hi potetico mostrado en la Tabla 4 .4. En esta tabla un sesgo de igual magnit ud result6 en la inclusion de proporciones mayores de sujetos expuestos en el grupo de casos y en el gru po de controles . Como consec uencia,
EPIDEMIOLOGiA lNTERMEDIA; CONCEPTOS Y APLICACIONES
116
aunquc e l odds de exposic i6n esta sesgado tanto en casas como en controles, como se aprecia al compararlos con los verdaderos odds de exposic i6n inclu idos en las Tablas 4 .1 y 4 .2,eI odds ratio es insesgado . N6tese que la magnitud del sesga en la selecci6n de casas es la misma q ue la de los comroles en la Tabla 4.4, 10 q ue conduce a 10 que Schlesselman(4 pag 128) ha ll amado sesgo cOlllpellsarorio: 1,0
1,5 Se.\"go
=
Odds observadoc..... 10 -"':,,-="'-=="'= _ '_
Odds verdaderomos
1,0
_
Odds observadocontrole.
2,67
Otlds verdaderorontroloo
1,0
= 1~
4,0
1,0
Para q ue OC LIrra el sesga compensatorio, el mismo factor de sesgo (en este ejemplo, «x 1,5») necesita estar presente tanto en e l numerador (odds de exposici6n de los casas, Odds oxpk.,.,.) como en el denominador (oddJ' de exposici6n de los controles, Oddso_,pkootrol•• ) del odds ratio, de manera que se puede hacer una cancelaci6n: Odd.~·~,pk~>O!i x LsesgoJ
Odds<>p/<~,O!i
Oddsnplro",roi« x [J'esgoJ
Odd.~·'~pI""",rol..
= Odd.~· rat io verdadero (OR)
En el ejemplo, 1,0) ( - - x 1,5 OR = ...:....:.1"', 0-'---_ -1,0) - x 1,5 ( 4,0
H%)
=4,0
1,0 ) ( 2,67
En la practica es diffc il asegurar que e l sesgo afecte por igual al oddJ' de exposici6n de los casos y al de los controles, y los intentos de introducir un sesgo compensatorio p uede incl uso llegar a ser comraproducente, como oc urrfa en e l ejemplo de anem ia aphistica discut ido prev iamente. Otro ejemplo es un est ud io que examina la asociaci6n de consumo de cafe y cancer pancreatico debido a MacMahon et al.m, en e l cuallos comroles se seleccionaron de un grupo de pacientes vistos por los mismos medicos que habfan d iagnosticado la enfermedad en los casos. EI objet ivo de este d isefio probablemente fue conseguir que e l proceso de selecci6n (incluyendo los sesgos de part ici paci6n) de los casos y los comroles fuera similar. S in embargo, como la exposici6n de interes era e l consumo de cafe, y debido a que los pacientes vistos por los medic.os que d iagnostican e l cancer de pancreas, a menudo tienen desordenes gastrointest inales conducentes a la recomendaci6n de no tomar cafe, e l intento del investigador de introducir un sesgo de compensacion condujo a la selecci6n de controles con un oddJ' de exposic i6n inusualmente bajo . Esto dio lugar a una asoc iaci6n posit iva (espuria) entre el consumo de cafe y el cancer de pancreas, que no pudo ser a la postre confirmada(8).
FALT.... DE VALIDEZ: SESGO
117
Siempre que sea posible, los sujetos de esmdio deberfan ser seleccionados de poblaciones de referencia definidas. En los estudios de casos y comroles una muestra de la poblacion definida de la cual se originaron los casos (igual que cuando se realiza un estudio de cohorte) constit uye el mejor tipo de gmpo control. Los esfuerLos orientados a introducir sesgo compensatorio cuando la seleccion del gmpo control se basa en las caracterfsticas de los casos, pueden 0 no ser exitosos, aunque se subraya la posibilidad de obtener medidas validas de asociaci6n aun cuando no sea posible obtener estimaciones absolutas validas de la frecuencia de la enfennedad (odd.\"). Todos los ejemplos precedentes provienen de est udios de casos y comroles. porque estos estud ios (jumo con los transversales) constituyen el ambito mas probable en el cual las probabilidades de muestreo de los diferemes grupos de enfennedadl exposici6n pueden resu ltar diferenciales (Figura 4.2). En un estudio de cohorte, debido a que los participantes del estud io (ex puestos y no expuestos) son seleccionados (por 10 menos te6ricamente) antes de que la enfermedad realmente ocurra, es menos probable que se produzca una selecci6n diferencial de acuerdo al estado morboso. Para enfermedades con una larga fase preclfnica (por ejemplo, algunos canceres, enfermedad ateroescler6tica), los sesgos que resultan de cambios relacionados con manifestaciones prodr6micas de la enfennedad (anteriores a la manifestaci6n clfnica de la dolencia propiamente dicha) a menudo afectaran tanto a los individuos expuestos como a los no ex puestos, 10 que da lugar a una situacion similar a la de la Tabla 4.4 (sesgo compensatorio). EI fenomeno analogo mas importante del sesgo de selecci6n en el contexto de los estudios de cohone se reladona al problema de pirdida diferencial del seguillliento; esto es, si los individuos que se pierden del segu imiento a 10 largo del est udio son diferentes de aquellos que se mantienen bajo observaci6n hasta que se produce ei evento 0 hasta la tenninacion del esmdio. Esta analogfa se discuti6 en la Seccion 1.4.2. y las Figuras 1.1 3 y 1.18 subrayan la equivalencia te6rica entre los aspectos de la selecdon de los casos y los controles (de una cohorte definida 0 hipotetica) y los relacionados con perdidas diferendales en un estudio de cohorte. Los sesgos en los est imados de inddencia que pueden surgir como consecuenda de las perdidas se discutieron en la Secdon 2.2 . Los individuos que se pierden del segu imiento (particularmeme cuando las perdidas son debidas a mortalidad por causas ajenas al desenlace de interes, a la migraci6n 0 a que rehusan continuar; vease la Tabla 2.4) tienden a tener diferentes probabilidades del desenlace respecto de aquellos que se mantienen en la cohone todo el tiempo del estudio. Por 10 tanto, los estimados de incidencia tienden a ser sesgados. Sin embargo, como en eI estudio de casos y controles (Tabla 4.4), las medidas de asociaci6n relativas (riesgo reiativo, rawn de riesgo) seran insesgadas si el sesgo de los estimados de inddenda es de magnimd similar en los individuos expuestos que en los no expuestos (sesgo compensatorio). En otras palabras, en un riesgo relativo sesgado 0 un est imado de fawn de tasas, solameme apareceran sesgos si las perdidas del seguimiento son sesgadas de acuerdo a alllbo.\·: exposici6n y desenlace.
43. SESGO DE INFORMACION EI sesgo de informacion en los estudios aparece como resultado de definiciones imperfectas de las variables de estudio 0 como consecuencia del empleo de pro-
118
EPIDEMIOLOGiA lNTERMEDIA ; CONCEPTOS Y APLICACIONES
cedimientos inapropiados para coleccionar los datos. Estos problemas puedcn generar crrores de clasificaci6n de la ex posici6n y/o de l desen lace para una proporcion significativa de partici pames en el eSlUdio . A 10 largo de esta secci6n, los term inos validez ..\"ensibilidad, especiJicidad y Jiabilidad se utilizan reiteradamente; tanto aquf como en el Capitulo 8 (estrechamente relacionado con el actual) emplearemos las definiciones usuales de los textos basicos de epidem iologfa (Esquema 4. 1). Esquema 4.1 Dcfinicioncs de terminos relacionados con la c1asificacion de los individuos en cstudios cpidcmiologicos Valldez: capacidad de una prueba de distinguir entre aquellos individuos que lienen la enter· medad (u olra caraclerislica) y aquellos que no la lienen. Senslbilidad : capacidad de una prueba de idenlilicar correctamenle a aquellos individuos que lienen la enfermedad (0 caracterfstica) de interes. Especlllcidad: capacidad de una prueba de idenlificar correclamente a aquellos individuos que no lienen la enlermedad (0 caracteristica) de inleres. Fiabllidad (repUcabilidad): grado en que los resu ltados oblenidos por una prueba son ralilicados cuando la prueba se repile. Fuente: L Gordis. Epidemiology. pp. 59 Y 70. 1Cl19W WB Saunders Company.
Un eS/lIliio I'li/ido es equ ivalenle a un «esludio insesgado» - un eslud io que, basado en su diseno, mCiodo y procedimiento, producira (en promedio) resultados globales cercanos a la verdad . Ul sellsibifidad y fa especiJicidad se definen como los dos componentes princi pales de la validez. Notese que en los libros de textos basicos 0 los capitu los que discmen aspectos relacionados con el diagn6stico y el tamizaje (por ejemplo, Gordis(
4.3.1. Sesgo en la identificaci6n de la exposici6n Problemas en la recoleccion de los datos de exposic ion 0 una definic ion imperfecla del nivel de exposici6n pueden conducir a sesgo. La identificaci6n del sesgo de ex posici6n es motivo de preocupaci6n principalmente en los est udios de casos y controles, aunque no solo en ellos . Consecuentemente, la mayoria de los ejemplos relacionados con este ti po de sesgo de informacion provienen de es{udios de casos y controles . Dos de las subcategorfas principales de sesgo de identificacion de la exposicion son el sesgo de recuerdo y eI sesgo del entrevislador.
FALT.... DE VALIDEZ: SESGO
119
Sesgo de recuerdo EI sesgo de recuerdo dimana de un rec uerdo inexacto de la exposicion pasada y qu izas sea el tipo de sesgo de identificacion de la exposic ion mas c hado . Es fuente de preocupaci6n especialmente en el contexto de los est udios de casos y controles, cuando a los casos y a los controles se les pregunta sobre exposiciones en el pasado . La dific ultad para recordar adecuadamente tales exposiciones preteritas introduce un error de clasificacion del estado de exposicion. con el consec uente sesgo de los resultados del est udio . Si el error de recuerdo difiere entre casos y controles. el error de clasificacion se dice que es diferencial; cuando el error de recuerdo es de magnitud similar, se dice que eI errores 110 diferencial, como se discute en la Secci6n 4.3.3 . Un ejemplo empfrico de sesgo de recuerdo fue documentado por Weinstock et aIJ IO) , quienes, mediante un c uest ionario, recolectaron infonnaci6n sobre el color del cabello y la propensi6n al bronceado de la piel en el momenta inic ial y despues de la ocurrencia del melanoma en las participantes de una cohorte para el estudio de salud de las enfermeras (Nu rses' Health Study). En este estudio, los casos de melanoma tendfan a comunicar •• baja propension al bronceado de la piel» con mayor frecuencia c uando la entrevista se veri ficaba despues del diagn6stico de melanoma, que cuando esta se llevaba a cabo antes de la ocurrencia de la enfermedad, diferencia que no se observ6 entre los controles (los resul tados de este est udio se disclllen en detalle en la Secci6n 4.3.3). Entre los mNodos uti lizados para prevenir el sesgo de recuerdo se hallan la verificaci6n de la res puesta que dan lo~ individuos est udiados, eluso de controles enfermos en los est udios de casos y controles, el empleo de marcadores objetivos de la exposici6n, y la realizaci6n de est lldios de cohone, los cuales abarcan a los estudios de casos y controles dentro de una cohone. Ln verificacion de la informacion ohtenida de los participames se hace ocasionalmente mediante rev isi6n de las historias cl fnicas de fannacias, hospitales u otras fuentes, para los estudios de caso~ y cont roles. Entre los ejemplos se incl uyen los est udios que examinan las relaciones entre el uso pasado de estr6genos y el cancer de mama(l l) , en los que las respuestas dadas por casos y controles eran corroboradas por los medicos. Una estrategia simil ar puede ser utilizada en los estudios de cohorte, para confirmar la informaci6n de los partic ipantes concerniente a los desen laces (por ejemplo, infano de miocardio) 0 para ident ificar y excl uir casos prevalentes de la cohorte de base con vistas a est imar incidencia en el seguimiento. En el est udio sobre riesgo de anerioesclerosis en las comunidades (AR IC), por ejemplo, la informaci6n suministrada por los miembros de la cohone durante las entrevistas peri6dicas en los ingresos para los desenlaces principales (tales como, infano de miocard io) se veri fica sistematicamente mediante rev isi6n de las historias cl fnicas reievantes(12). Debido a que en los estudios de casos y controles el sesgo de recuerdo puede ser el resultado de que los casos han estado «mmiando» en torno a las causa.~ de su enfermedad, en alguna ocasion se selecciona lin grupo cO/llral fi)rmado par sujeto.\· enfermoJ' en un intento por introducir un sesgo similar en el odds de exposicion de los controles. Un ejemplo 10 brinda un estudio debido a Mele et al.(l l) en el cuallos casos de leucemia se compararon con un grupo control fonnado por pacientes sintomaticos que, despues de la evaluaci6n en las mism.... cl fnicas hematol6gicas que los casos, se encontr6 que no tenlan des6rdenes hematol6gicos . EI problema con eluso de un gmpo de control fonnado por enfermos, sin embargo, radica en que a menudo no resuita claro si el
120
EPIDEMIOLOGiA lNTERMEDIA; CONCEPTOS Y APLICACIONES
mencionado proceso de «rumiaci6n» relacionado con las enfermedades de los controles es equivalente al de los casas con respecto a la magnitud del sesgo de rec lIcrdo. Los marcudores objetivos de fa exposici6n 0 fa slIscepfihilidad son menos propensos al sesgo de recuerdo que las res pucstas directas de los sujetos de est udio . Un ejemplo puede encontrarse en e l estudio de factores de riesgo de melanoma anteriormente citado(IO) . En contraste con el sesgo prescnte al comunicar «propensi6n al bronceado de la piel» despues del diagn6stico de la enfermedad, las res puestas de los casas y los controles en ClIanto a color del cabello no mostraban ningun cambia significativo al compararse con las que se daban a los cuest ionarios apl ieados ames y despues del d iagn6stieo de la enfermedad (vease Secci6n 4.3.3). Una raz6n probable para expliearlo es que e l color del cabello es evaluado mas objetivameme que la propensi6n al bronceado de la piel. Cienos marcadores genetieos, por ejemplo, const ituyen «exposiciones» no dependientes del tiempo y pueden ser medidas incl uso despues de que la enfermedad haya ocurrido; por 10 tanto, posiblememe son menos propensas al sesgo (suponiendo q ue el marcador genetico en c uesti6n no esta relacionado con la supervivencia, vease Secci6n 4 .4.2). Un ejemplo es la evaluacion de la capacidad de re paraci6n del ADN como un marcador genetieo de la susceptibilidad al cancer de piel no melanoma inducido por luz ultrav ioleta en casos y controles j6venes(14) . Desafonunadameme, sin embargo, la mayorfa de las exposiciones ambiemales q ue pueden ser evaluadas por medio de marcadores biol6gieos objetivos representan ex posiciones act uales mas que pasadas, tal como ocurre con los niveles de nieot ina como indicio del habilO de fumar, de manera q ue son de ut ilidad limitada(lS). Los eSllldios de casos y controles anidados, 0 est udios de casos cohorte cuando los datos prospect ivos estan disponibles (vease Secci6n 1.4 .2), permiten la evaluaci6n de ciertas hipotesis libres de sesgo de recuerdo (0 sesgo temporal: vease Seccion 4 .4.2). Tfpieamente, en eslOs eSllIdios de casos y comroles, la informaci6n sobre la ex posici6n y los confusores se recolecta en el momento inie ial, antes de q ue ocu rran los casos, 10 q ue reduce la probabi lidad de diferencias sistematieas en eI recuerdo emre casos y controles. EI est udio ya considerado donde se examina la relaci6n de la propensi6n al bronceado de la piel y el melanoma(lO) (vease en la Seccion 4.3.3) es un ejemplo de un estud io de casos y controles dentro de una cohone (la cohone del est udio de salud de las enfermeras); la aplicaci6n del cuestionario de d iagn6stieo pre-melanoma ev ita el sesgo de recuerdo q ue se observa c uando el analisis se basa en informaci6n obtenida del interrogalOrio post-melanoma(lOJ. Aunque el sesgo de recuerdo de la exposiei6n es un problema tfpieo de los estudios de casos y controles, tambien puede ocurrir en estudios de cohorte . En este ultimo tipo de estud io tal sesgo podrfa estar preseme al comienzo de la investigaci6n, cuando la categorizacion de los individuos segun nivel de exposici6n se basa en la informaci6n sobre un pasado d istame 0 reciente, as! como cuando se trata de clasificar a los participantes de una cohorte en el momento inicial segun la duraci6n de la exposici6n.
Sesgo del entrev;stador Cuando la recolecci6n de los datos en un estudio de casos y comroles no esta enmascarada con respecto al estado de la enfermedad de los panie ipantes en el eSlUd io, puede producirse tanto el sesgo del observador al evaluar la exposici6n, como e l del
FALT.... DE VALIDEZ: SESGO
121
entrevistador. EI sesgo del entrevistador puede producirse como consec uencia del afan por «aclaran) las preguntas cuando tales aclaraciones no son pane del protocolo de eSUldio, cuando se violan las reglas de la pmeba, 0 se pasan por alto las especificaciones del cuestionario . Desviaciones mas sutiles del protocolo, que pueden incluir el enfasis que se ponga en algunas palabras cuando se trate de los casos pero no de los controles (0 viceversa), no son faci les de ident ificar. Aunque es diffc il de reconocer el sesgo del entrevistador. es importante estar advertidos de su posible aparic ion e implementar procedimientos para minimizar la probabilidad de su ocurrencia . Los esfuerzos por prevenir el sesgo del entrev istador incluyen un disefio c uidadoso y la conduccion de activ idades de aseguramiento de la calidad y de control (vease Capitulo 8), el desarrollo de un manual detallado de operaciones, entrenam iento del gru po de entrevistadores, la estandarizaci6n de los procesos de recolecci6n de datos, y el monitoreo de las actividades de recolecci6n de datos. Medidas adic ionales para prevenir este sesgo son la realizaci6n de subesUldios de confiabilidad y validez, y el enmascaramiento ante los entrevistadores de la condici6n (caso 0 control) que tenga el sujeto entrevistado. Los sub-estudios de cOllfiabilidad y validez ell muestras se desc riben detalladamente en el Capitu lo 8, Seccion 8.3. Ellos constituyen una estrategia importante que neces ita ser lIevada a cabo sistematicamente, con una retroalimentacion rapida a los entrevistadores que no siguen el protocolo 0 que han encontrado problemas . Debe notarse, sin embargo, que, en contraste con los estud ios de fiab il idad de las med idas de laboratorio, los sub-est udios de fiabi lidad de las entrev istas no son faci les de conducir. Evaluar la fiabilidad de los datos de la entrev ista es diffcil porque hay una variabilidad intraparticipante c uando las entrevistas se hacen en momentos distantes; por otra parte, el recuerdo de las respuestas previas por parte del entrevistado puede inlluir en que este provea la misma respuesta. incluso siendo err6nea. Al igual que para el sesgo de recuerdo. los est udios de validez que utilizan fuentes independientes (por ejemplo, historias clfnicas) pueden ser conducidos para evaluar la exact itud de la recoleccion de los datos por parte de los entrevistadores. Enmascarar ante los entrevistadoreJ' fa condici611 de que el intermgado sea un cuso a un control es diffc il ; pero, si es posible, puede eliminar una importante fuente de sesgo, particulannente c uando el entrev istador esta familiarizado con las hipotesis del estudio. En ocasiones, incluir una pregunta de salud para la que cabe esperar una respuesta afirmativa frec uente tanto en casos como en controles permite enmascarar a los entrev istadores con res pecto a la hip6tes is principal del eSUldio y hacerles creer que la hipotesis concierne a la pregunta ••erronea» . Tal estrategia fue empleada en un estudio de casos y controles de factores psicosociales e infarto del miocardio en la m ujer, en el que preg untas sobre la histerectomfa, que a menudo se respond fan posit ivamente debido a la alta frec uencia de esta intervencion en Estados Unidos, condujo a los entrevistadores a creer que el est udio estaba evaluando una hip6tesis honnonal(lb) . Un error cometido en un estudio temprano de cancer de pu lmon y habito de fumar conducido por Doll y HiW I7 . en eI cual algunos controles estaban erroneamente clasificados como casos. sugiere una estrategia adicional para evaluar la posibilidad de sesgo del entrevistador. En este est udio el odds de exposici6n al habito de fumar entre los controles clasificados err6neamente fue muy similar al de los controles no clasificados err6neamente, y mucho mas bajo que el de los casos, 10 que con-
122
EPIDEMIOLOGiA lNTERMEDIA ; CONCEPTOS Y APLICACIONES
finna la allsencia de sesgo del entrevistador. Este ejemplo sug iere la posibilidad de ut ilizar casas y comroles «fantasmas» y/o deliberadamente hacer creer a los entrevistadores err6neamente que algunos casas son controles y viceversa con el fin de evaluar e l sesga del entrevistador.
4.3.2. Sesgo de identificaci6n del desenlace El sesgo de identificaci6n del desenlace (por ejemplo. la enfennedad) puede oc urrir por igual en los estudios de cahone y en los de casas y controles . La clasificaci6n erronea de la enfermedad resu ltante puede deberse a lIna definicion imperfecta de l desenlace 0 a errores en la clapa de recolecci6n de los datos.
Sesgo del observador En un estudio de cohortc la decisi6n acerca de si eI desenlace esta presente puede estar afectada por el conoc imiento del estado de exposici6n de los panicipantes en el esUldio, partic ularmente cuando e l desenlax no es inequi vocamente constatable , tal como episodios de migrafia 0 sfntomas psiq uiatricos . EI sesgo del observador puede presentarse en diferentes etapas de la evaluacion del desenlace, ocasionalmente como resu ltado de la aplicaci6n de criterios clfnicos 0 patol6gicos . Un ejemplo bastante cmdo de sesgo del observador se produce cuando se valora un especimen histol6gico para diagnosticar «cirrosis alcoh6lica» si el patologo conoce que eI paciente es alcoholico. Un ejemplo documentado de sesgo del observador se aprec ia a partir del efecto de la raza del paciente sobre e l diagn6stico de enfermedad renal hipertensiva en fase terminal (ERHFf). En un estudio de simulac i6n cond ucido por Perneger ef al '<'~I, a una muestra de nefr610gos se Ie enviaron historias dfnicas de 7 pacientes con ERHFf. Para cada historia , la raza atri bu ida a cada paciente fue escogida aleatoriamente como «blanca» 0 «negra». Las historias que identificaban la raza del paciente como «negra» tuvieron probabilidad dos veces mayor de dar lugar a un diagn6stico de ERHFf que las historias en las cuales la raza del paciente se consignaba como «blanca». Como ya se mencion6, el sesgo del observador oc urre cuando la evaluaci6n del desenlace no es independ iente del conocimiento que se tenga acerca de la exposici6n . Por tanto, med idas concebidas para elllllascamr la Sifll(lcion en fermi/lo.\" de exposici6/1 anfe los observadore.~· a cargo de decidir .~·i el dncnlace esr6 presellfe 0 no, podrfa/l te6ricamente prevenir el sesgo del observador. Cuando tal enmascara-
miento no sea practico, el sesgo del observador puede evaluarse estratificando segun certeza de diagn6stico. Po r ejcmplo, los nive les de exposici6n pueden evaluarse en relaci6 n a la incidencia de [a enfermedad como «pos i bles~), «probables» y «defin itivos». EI sesgo de l observador deberfa sospecharse si se observa una asociacion sola mente para [as categorfas «mas suaves» (po r ejemplo , enfermedad «posible») . Olra estrateg ia para prevenir el sesgo de l observador es realizar ]a clasi ficaci6n diagn6stica con ohserwuiores /llIilriples . Por ejemplo, dos observadores podrfan dasificar independientemente un evento , y si oc urre discordancia, un tercer informador decid irfa ; es decir, la decision sobre la presencia 0 ausencia del desenlace tendrfa que contar con la conformidad de , par 10 menos, dos observadores . Esta estrategia , sin embargo, aumenta los costos del estudio y puede llegar a ser prohibit iva .
FALT.... DE VALIDEZ: SESGO
123
Sesgo del que responde Los sesgos de recuerdo (entre otros) atribuibles al informante estan usualmente asociados con la identificacion de la e:
433. EI resultado del sesgo de informacion: el error de clasificacion EI sesgo de informacion cond uce a errores de clasificaci6n de la ex posic ion y/o del desen lace. Por ejemplo, cuando hay sesgo de l recuerdo en un eSllldio de casos y controles algunos indiv iduos expueslOs se clasifican como no ex puestos, y viceversa. En un est udio de cohorte, un desenlace positivo podrfa om iti rse . Paralelamente, un pse udoevento pudiera ser err6neamente clasificado como desenlace posit ivo. Los ejemplos de errores de clas ificaci6n diferenciales y no diferenciales en esta secci6n conciernen a los niveles de ex pos icion en los estudios de casos y controles . EI error de clasificaci6n en cuanto a ser un caso 0 un control en los est udios de casos y controles, y de la exposici6n y el desenlace de los de cohorte pueden inferirse faci lmente, aunq ue no han sido disc utidos especfficamente para ev itar repetic iones. Existen dos tipos de sesgos de clasificacion: el no diferencial y el diferencia l.
Error de clasificaci6n
110
diferencial
EI error de clasificaci6n no diferencia l oc urre c uando el grado de error de clasi fi cacion de la exposicion es independiente de que se trate de un caso 0 de un control.
EPIDEMIOLOGiA lNTERMEDIA ; CONCEPTOS Y APLICACIONES
124
Error de clasiJicacion 110 dijerencial cUll/uio hay dos categorfas . EI Esquema 4.2 muestra un ejemplo hipotetico y mlly simplificado de error de clasificaci6n no diferencial de exposid6n (dicot6mica) en un estudio de casa s y commies . En este ejemplo. se
produce un error de clasificaci6n consisleme en declarar no expuestos al 30% de los casas expucs!Os y al 30% de los controles expuestos. EI error de das ificaci6n no d iferendal tiende a sesgar la asociaci6n hacia la hip6tesis nllia cuanda hay do.'> categorfas de exposici6n (por ejemplo, «sf» y «no»). (Vease en la proxima secci6n una discusi6n del error de clasificaci6n de variables de exposici6n con mas de dos categorfas) .
En el ejemplo hipotetico mostrado en el Esq uema 4 .2. el error de dasificaci6n oc urre solamente en una direcci6n: los indi viduos expuestos se clasifican err6neamente como no expues{Os . Sin embargo, a menudo el error de clasifi caci6n ocu rre en ambas direcciones: esto es, parte de los sujetos expuestos se clasifican como no expues{Os 0 «falsos negativos» (es decir, la clasificaci6n correcta de los verdaderamente ex puestos, 0 sensibilidad, es menor que el 100%) y parte de los sujetos no expues{Os se clasifican como expuestos 0 <
E~quema
4.2
Ejemplo hipotCtico del efccto del error de elasificacion no diferencial de dos categorias de exposicion, con el 30 % de casos expuestos y e130% de controlcs expucstos elasificados erroneamente como 110 expucstos Sin error de ciasil icacion Exposici6n
Sf No
Casos 50 50
Controles 20 80
(:: ) (:: )
OR :0 - - :0 4,0
30 % de error de ctaslficacion de la exposlcion en cada grupo Controles Exposici6n Casos 20 -6 :014 50 -15 :0 35 Sf No 50 + 15 :065 80+ 6 :086
(:: ) (:: )
OR :0 - - :0 3,3
Electo del error de clasificaci6n no diferenciaJ con dos categor ias de exposiciOn: sesgar el OR hacia el valor nulo de 1,0 (con 10 cual sa "diluye" la asociaci6n). Nota: Los numeros en negritas represenlan irnliviGlJOS ma l clasificados.
125
FALT.... DE VALIDEZ: SESGO
de individuos clasifi cados como «expues(Qs» 0 «no expuestos» utilizando los procedimientos de recolecci6n de datos del est udio y las defi niciones del nivel de exposici6n es similar a la est imaci6n de los individuos «positivos» y «negativos» segtin la prueba cuando se aplica un examen de tamizaje. Por tanto, las nociones de sensibilidad y especifi cidad, esquematicamente representadas en la Figura 4.4, pueden ut ilizarse para explorar el tema del error de clasificaci6n con mas profundidad . Casos Exp No exp (Pos) (Neg) Resultados verdaderos: A Resultados del estudio
Controlas Exp No exp (Pos) (Neg)
OR verdadero
[AIC + BID]
B
C
!!
E,p VP FN
No exp
0
!!
Total de casas
FP VP+FP",a VN FN +VN "'c
VP
FN
FP VN
OR mal c/asificado
Tolal de conlroles
VP+FP",b [alc + bId]
FN+VN",d
Figura 4.4. Aplicacion de los conceptos de sensibilidad/espccificidad en cI error de c1asificacio n de la exposici{m: representaci6n esquemlitica de los odds ralio verdadero y del correspondiente a mala clasificaci6n. La sensibilidad de la evaluaci6n de la exposici6n = VP I (VP + FN): especificidad de la evaluaci6n de la exposici6n = VN/(VN + FP).
Un ejemplo hipotetico que ilustra el error de clasificaci6n no diferencial de la exposici6n en un eswd io de casos y controles en ambas direcciones - es decir, algunos suje(Qs expuestos se clasifi can err6neamente como no expuestos, y algunos no expuestos como ex puestos - se presenta en el Esquema 4.3. Este recoge los efectos
Esquema 4.3 Efectos del error de c1asificacion no difercncial sobre los odds ratio (sensibilidad = 0,90 ; es pccificidad = 0,80)
Dislribucci6n verdade ra _ (eslandar de oro)
Casos
Conlroles
Exp No exp
Exp No exp
50
50
No axpueslo
$ansibilidad (exp) 0 especificidad (no exp):
80
Tolal de casas
Dislribuci6n an al asludio: Expueslo
20
rB
~ r-- ' 10 ~ 40
1 45 1 1- __ I
{I}
(II)
(III)
0.90
0.80
OR Verdadero 50/50 + 20/80 =: 4.0 Control en el esludio r - - 1 OR mal clasificado , 34
~~,
, , ,
~
' 66
(IV)
{V}
0.90
0.8{)
(VI)
55/45
+
34/66 '" 2.4
126
EPIDEMIOLOGiA lNTERMEDIA ; CONCEPTOS Y APLICACIONES
del error de clasificaci6n no dife rencial resu]tante de la evaluaci6n de una exposici6n con una sensibilidad del 90% Y una especific idad del 80%. El hecho de que estos valores de sensibilidad y espedficidad sean los mismos para los casas y los controles haec que eSle tipo de error de clasificaci6n sea no diferencial. El efecto new de clasificar crroneamente a los caso.\" con una sensibilidad del W% y una especificidad del 80% se muestra en la columna (III) del Esquema 4.3 . Los totales en dicha columna (III) indican eI numero de casas clasificados como «expuestos» y «no ex pucstoS» en el est udio y reflejan el error de clasi ficaci6n debido a que la sensibilidad y la especificidad no son perfec las. Por 10 tanto. los casas clasificados como «ex puestos» incluyen tanto a las 45 personas verdaderamente expuestas (<
127
FALT.... DE VALIDEZ: SESGO
Esquema 4.4
Efcctos del error de c1asificacion no diferencial sobre el odds ratio cuando la prevalencia de la exposicion en los controles es baja y el tamano mucstral es mucho mayor en controles que en casos Casas
E,p
Controles
Noexp
Dislribucci6n 30 verdadera (eslandar de oro)
70
No expuesto
Sensibilidad (exp) 0 especificidad (no exp):
50
OR Verdadero 30nO .. SO/950,=, 8,1
950
Total de casos
Dislribuci6n en el estudio: Expuesto
Exp No exp
Control en el estudio
r - -
t
1 235
t
~ ~~ ~ § ,
---'
56
(I)
(II)
0,90
0 ,80
1 59 t 1- __ I (III)
760
1 765
(IV)
(V)
(VI)
0 ,90
0.80
, t
OR mal clasificado
41/49 .. 235n65 "2,3
Tabla 4.5
Error de dasificacion no direrencial: Ejemplos hipotcticos de los efcctos de la sensibilidad y la cspccificidad de la identificacion de la exposicion y de la prevaiencia de la exposicion en controies sobre cI odds ratio cstimado cuando cI odds ratio verdadero es 4,0 Senslbilidad' 0,90
0,60 0,90 0,90 0,90 0,90 0,90
Especlflcida dt
Prevalencia de la exposiclon en los controles
Odds Ratio observado
0,200 0,200 0,200 0,200 0 ,368 0,200
2,6 1,9 3,2 1,9 3,0 2,8 2,2
0,85 0,85 0,95 0,60 0,90 0,90 0,90
o,on
NOla: Los numeros en negrilas represenlan el factor (sensibilidad especifiddad 0 prevalencia de la expos'd6n) que varia, para valores fijaoos de los otros dos factores . • La sensibilidad de la identiiicaci6n de la expos'd6n se define como la proporci6n de lodes los verdade ramenIe expueslos que son clas~icados como tales en el eSludio. t La especiiicidad de la idenlificaci6!l de la exposici6n se define como la proporci6n de todes los verdaderamente 00 expuestos que son correctamente clas ificados en el eSludio,
F.I error fie
cla~ i fi cacion
para
calegorfa~
no
afiyace nte~
fi e ex pos icitin en e l ejem-
plo - esto es, entre «alta>, y «ninguna>, - produ jo la desaparici6n de la relaci6n verdaderamente gradual y, habiendose supuesto que no habfa error aleatorio, dio lu gar a la aparici6n de un patron tipo J . Adicionalmente, como demuestran Dosemeci et al .. el error de clasificacion de categorfa s de exposicion no adyacentes puede invenir la direcci6n de la tendencia en la relaci6n .
~
00
Tabla 4.6 Ejemplos de los efectos de errores de clasificaci6n no diferencial que conciernen a tres categorfas de exposici6n; errores de clasificaci6n del 40% entre «alta» y «baja» ( A) y entre «alta» y «ninguna» (8 ) Estado de exposiciOn Estado de caso 0 control Distribuci6n verdadera Casas Controles Odds ratio A. Categorias adyacentes: 40% de los casas y los controles en ~aHa" clasWicados err6neamente COJIIU
Ninguno
100 100 1.00
"jo 200
100 2.00
m
Alto
600 100 6.00
a~ 5r
8;;Z
" "< m
~baja~.
"'00'
100
Controles
100
Odds ratio 1.00 6 . Categorfas no adyacentes: 40 % de los casas y los controles en "aHa" clasWicados err6neamente como ~nfnguna" . 100 CC + 240 MC Casas =340 Controles l 00CC+40 MC = 140 Odds ratio 1.00
200 CC + 240 MC =440 l 00CC+40 MC =140 3. 14
~
600 CC - 240 MC =360 looCC - 40 MC
n
.6(j
n
6.00
a
z
~
~ < ,>
C
200
100
600 CC - 240 MC =360 looCC - 40 MC .6(j
0.82
2.47
Nota: ce , colTeclamenle clasilicado: Me, ma l clasilicados. Fuente: M Docemeci. S wacholde r. at1d JH Lltl in, Does Nond iHerentiai Misci PUb lic Healtl.
n
~ is Z
rn
129
FALT.... DE VALID EZ: SESGO
Error de clasificaci6n diferencial EI error de clasificaci6n diferencial ocurre cuando el grado de error de clasificaci6n difiere entre los grupos que se comparan . Mientras que la tendenc ia general del error de clasificaci6n no diferencial de un factor de exposici6n dicot6mico es a debilitar una asociaci6n verdadera, el error de clasificaci6n diferencial puede sesgar la asociaci6n bien acercandose, bien alejandose de la hip6tesis nula . Aun mas, es diffc il predecir la direcci6n del sesgo c uando se incurre en eI error de clasificaci6n dife rencia!. como resu ltado de un complejo entramado que involucra dife rencias de sensibilidad , especificidad y prevalencia de exposici6n entre casos y controles . Un ejemplo hipotetico de error de clasificaci6n diferencial se expone en el Esquema 4 .5, en eI que la sensibilidad de identificar la exposici6n en los casos es del 96% y en los controles es solamente del 70% . La especificidad en el ejemplo es 100% en ambos: casos y controles. La mayor sensibilidad entre los casos da lugar a una mayor proporci6n de sujetos verdaderamente expuestos que son identificados como casos y no como controles, 10 que produce un odds ratio sesgado que se aleja de uno mas que del verdadero odds ratio (verdadero OR = 4,0, sesgado OR = 5,7) para subrayar las dificultades en la predicci6n de los resultados cuando hay error de clasificaci6n diferencial; si se hacen los mismos calculos utilizando una especificidad mas alta en los casos (100%) que en los controles (80%), el odd,\' ratio se sesga hacia la hip6tesis nula (Esquema 4 .6), ya que una especificidad mas pobre en los controles compensa la sensibilidad mayor en los casos. La Tabla 4.7 muestra ejemplos de efectos aislados de sensibilidad (para una especificidad del 100%) 0 especi ficidad (para una sensibilidad del 100%) sobre el olfd,\· ratio en un estudio de casos y controles hipotetico con error de clasificaci6n difere ncial de exposic i6n y una prevalencia de ex posici6n en los controles del 10%. Un ejemplo de error de clasificaci6n dife rencial de la exposic i6n fue brindado por Weinstock et al .\lOl . Este ejemplo ya fue utilizado para ilu strar el concepto de
Esquema 4.5 Ejemplo hipotCtieo del erct:l0 del error de c1asificacion direrencial sobre eI odds ratio en eI eual, para la sensibilidad, casos > eontroles, y para la espccifieidad, easos = eontroles Casos Oislribucci6n verdadera __ (eslandar de oro)
E, p
Noexp
5(J
5(J
No expueslo
Sensibilidad (exp) 0 especificidad (no exp):
20
rB
~ o 1r--' 48 1 50
(I)
(II)
0 .96
1.00
~
1-
__ I
(III)
OR Verdadero SO/50 .. 20/80 '=' 4,0
80
Tolal de casas
Oislribuci6n en el esludio: Expueslo
Conlroles Exp No exp
Control en el esludio
~~ (IV)
(V)
0 .70
1.00
- , ,r 14 , ,' 86 , 1
~
(VI)
OR mal clasificado
4H152 .. 141t10 '" 5'"{
EPIDEMIOLOGiA lNTERMEDIA ; CONCEPTOS Y APLICACIONES
130
E~quema4.6
Ejcmplo hipotCtico del credo del error de c1asificacion difcrcncial sobre los odds ratio, en eI cual tanto para la scnsibilidad como para la espccilicidad, casos> controlcs Casas
Cantroles
Exp No exp
Exp No exp
50
20
Distribucci6n verdadera _ (eslandar de oro)
50 C;)::;o~
Expuesto No expuesto
$ensibilidad (exp) 0 especificidad (no exp):
en
Contrale::; en el eSludio
el estudio
Oistribuciones en el estudio:
~
~ o Ir-48 I'
~
50
1- __ I
(I)
(II)
(III)
0,96
1,DO
OR Verdadero SOl50 + 20/80 :0 4 ,0
80
~~ (IV)
(V)
0,70
0,80
r - , 30
, 70 ,
, , , I
~
OR mal clasificado
48/52 + 30170 '" 2.1
(VI)
Nora: La espec~icidad menor en los contmles aumenta el numero de exposiciones lalsas pos ilivas, 10 que compensa por tanto la mayor sensibilidad en los caoos y d iluye la iuerza de la asociad6n.
sesgo de reclIcrdo (vease Secci6n 4.3 .1 ). En este esi udio , se comparaban los casos de melanoma y los comroles seleccionados de los partic ipantes de la cohortc del estudio de salud de enfermeras en relad6n con e l registro del «color del pelo» y da propensi6n al bronceado de la pieh>, ambos en e l momento inidal del estudio y despues de que el caw fuera diagnosticado . En este ejemplo, el error de clasificaci6n diferencial probablemente se verifieD debido a que e l estado morboso era conocido por el panic ipante, 10 ellal afcctaba pmcncialmcmc su rec lIcrdo de 1a exposici6n . Por
Tabla 4.7 Ejcmplo de los efectos de 13 sCIlsibilidad y especificidad diferenciales de III evaluaci6n de III exposici6n sobre el odds ratio (OR) para un OR vcrdadero de 3,86 y una prevalcncia de la exposicion en los controles de 0 ,10 Evaluaclon de la exposlclon Senslbilidad'
Especl flcldadt
e._
Coot_
0,90 0,60 1,00 1,00
0,60 0,90 1,00 1,00
e._ 1,00 1,00 0,90 0,70
Cootro" 1 ,DO 1,00 0,70 0,90
Odd,...., 5,79 2,22 1,00 4,43
, La sens ibil idad de la idenlii;caci6n de la exposici6n se define como la propord6n de lodos kls verdaderamenIe expueslos que son correctamenle clas~icaoos. t La espec~icidad de la idenlificaci6n de la ex,cosici6n se define como la proporci6n de los verdaderamenle no expueslos correctamenle clas ificados.
131
FALT.... DE VALIDEZ: SESGO
10 tanto, la entrevista de diagn6stico de premelanoma se supone que refleje exactamente la verdadera asociaci6n . Los resultados principales del est udio se resumen en la Tabla 4.8. Para la discusi6n que sigue las categorfas asociadas con un aumento del odd.\· utilizando los datos de casos y controles obtenidos despues de la ocurrencia del melanoma se consideraron como correspond ientes a los ••expuestos» (<
Color del pelo reportado y propemion al bronceado dc la piei cntre casos incidentes y controles en un estudio de casos y contro les de melanoma de ntro de la coho rte del estudio de salud de las enrermeras Informacion dlagn 6stlca premelanoma ("Estimdar de oro») Ca sos Color del palo Raja a rubio (expueslos) Casiano a negro (no expueslos) Odds ralio Propensi6n al bronceado Ninguna, praclicamenle ninguna, a ligera propensi6n (expueslos) Media, promedio, profunda a mucha pmpesi6n (no expuestos) Odds ralio
Controles
Informacion dlagnostlca po st melano ma Casos
Controles
11
37
11
41
23
197
23
193
2,5
9
25 0,7
2,3
79
15
155
19
77
157 1,6
Fuente. MA Weinstock et ai, Recall (Report) Bias and Reliability in the Retrospective Assessment of Mefanoma Risk. American Journal of Epidemiology, Vof 133, 240-245, <1:>1991 , The Johns Hopkins Univers ity Schoof 01 Hygiene &Pubfic HeaHh.
Comparado con los datos anteriores al desarrollo de la enfermedad, el odds para el color del pelo aument6 ligeramente solo para los comroles c uando se usaron los datos de la entrevista post melanoma (de 37: 197 a 4 1: 193); como resultado, el odds ratio cambi6 re lativamente poco (prediagn6stico OR = 2,5, postd iagn6stico OR = 2,3) . EI efecto del error de dasificaci6n diferencia l en la propensi6n al bronceado, sin embargo, fue notable, ya que cond ujo a una invers ion en la direcci6n de la asociacion: su pon iendo que no hay variabilidad aleatoria, la verdadera asociaci6n (ej ., la detectada utilizando la informaci6n del diagn6stico premelanoma) harfan pensar en un efecto protector (OR = 0,7), en tanto que la asociaci6n observada postdiagn6stico (OR = 1,6) sug iere un odds de melanoma mayor, asociado con una baja propens ion al bronceado de Ia piel. Resulta de interes advertir que ei error de clasificaci6n de la exposicion, lal como se mide por la propension al bronceado de la piel, parece haber sido ligeroen los controles (el odds de exposici6n cambi6 de 79/155 a 77/ 157) . En los casos, sin embargo, el efecto del error de clasificaci6n fue sustancial, con un incremento de 9 a 15 en el nlimero de indiv iduos clasificados como «expuestos» entre la primera y la seg unda entrevista .
132
EPIDEMIOLOGiA lNTERMEDIA ; CONCEPTOS Y APLICACIONES
La tabla cruzada de los datos del diagn6stico pre y postmelanoma permite e l d lcu10 de la sensibilidad y la especificidad de la evaluad6n de la pmpensi6n al bronceado de la piel en los casas. Como se mucstra en la Tabla 4 .9, la sensibilidad de 89% de las entrevistas para e l diagn6stico post melanoma pennit i6 lIna correcta clasificaci6n en 8 de los 9 casos verdaderamente expucstos. Sin embargo, una especificidad de solamenIe eI 72% condujo a un numero reiativameme grande de personas no expuestas colocados en la celda de los «falsos positivos», y produjo por tanto un incremento marcado en el odds de exposici6n post diagn6stico (odds de exposid6n verdadero en los casas . 9:25 0 0.36: 1.0: odds de exposid6n sesgado. 15: 19 0 0.79: I tal que el odds ratio en el estudio postdiagn6stico esta en direcci6n opuesta al del verdadero valor. Como se mencion6 previamente (Secci6n 4.3. 1), e l error de clasificaci6n diferencial en el estudio de We instock et (11 .(10) probablemente se debi6 al sesgo de rec uerdo. Un error de clasificaci6n adicional puede haber ocurrido a resu ltas de q ue las preguntas sobre el colo r del pelo y la propensi6n al bronceado de la piel no eran exactamente las mismas en las entrevistas que se realizaron antes y despues del d iagn6stico.
m
Tabla 4.9 Dislribucion de casas incidenles en la cohorle del esludio de salud de las enfermcras, de 1976 a 1984 acorde con las respucslas dadas sabre la propcnsion al bronceado de la picl anlerior a l desarrollo de melanoma y despucs de que se hiciera el diagnoslico Informacion dlagnostlca premelanoma (" Estandar de oro»)
Informacion dlagnostlca post· melanoma
Nlnguna, pnictlcamente nlnguna, 0 IIgera propenslon al bronceado (<
Media, promedlo, profunda 0 mucha propenslon al bronceado ("no expuestos»)
Total (Claslflcaclon de casos y controles)
Ninguna, practicamente ninguna, 0 ligera propensi6n al bronceado (<
8 (V?)
7 (F?)
15
Media, promedio, profunda 0 mucha propensi6n al bronceado (<
1 (FN)
18 (VNJ
19
9 $ensibilidad 8/9:0 89 %
25 Especilicidad 16/25", 72 %
34
Tolal (clasificaci6n «verdadera»)
NOla; VP. verdaderos pos~ivos; FP, falsos posiwos; FN, falso oogativo; VN. ve rdaderos negativos.
Fuente; MA Weinstock et al., Recall (Report) BilS and Reliabili ty in the Retrospective Assessment of Melanoma Ris k, American Journal of Epidemiology, Vol 133. 2~O·245. (1)1991 , The Johns Hopkins Univers ity Schoof of Hyg iene & Pubfic Health.
J<..lecto del error de clasificacioll de ulla variable cOllfusora El error de clasificaci6n tambien afecta a la eficiencia del aj uste para los efectos confusores . Mientras que un error de clasificaci6n no diferencial de un facto r de riesgo potencial tiende a sesgar la medida de la asoc iaci6n hacia la hip6tesis nula, el error de clasificaci6n no d iferencia l de una variable confusora genera un aj uste imperfeclo debido a confusi6n residual (vease Secc i6n 7.5)<25).
FALT.... DE VALIDEZ: SESGO
133
Prel'encion del error de clasificacioll EI error de clasificacion ha sido extensamente discut ido en la literatura e pidem iologicp6.29) , 10 que da cuenta de su importancia en los estudios epidemiol6gicos. Como se vio en los ejemplos descritos en esta seccion, e l error de clasificaci6n puede distorsionar seriamente la magn itud de una asociacion entre un facto r de riesgo y una enfermedad . Si el riesgo relativo 0 el odd.\" ratio verdaderos son prox imos a I, un error de clas ificaci6n no diferencia l pudiera enmascarar completamente la asociaci6n: por ejemplo, para una ex posicion con una preva lencia tan alta como 16% (no muy diferente a la de muchos factores de riesgo), si e l verdadero olids ratio es aproximadamente 1.3, el odds ratio observado puede ser virtualmente igual a 1 si un error de clasificaci6n no diferencial resulta de un procedimiento de medici6n cuyas sensibilidad y especificidad esten ambas a lrededor del 70%. EI error de clasificacion diferencia l, por otro lado, puede tanto difuminar como reforzar una asociaci6n, e incluso producir una asociaci6n espuria. Cuando la exposici6n es comun, no poder demostrar una relaci6n real, 0 conclu ir que una asociacion es real cuando realmente es espuria puede traer consecuencias serias para la salud publica . Usualmente no hay datos disponibles q ue permitan una comparacion entre ind ividuos correctamente y err6neamente clasificados en tenninos de sus caracterls{icas (por ejemplo, nivel educacional): pero c uando existen, pueden ser informat ivas . Como se vio en la Tabla 4 .9, de los 34 casos incidentes incluidos en e l estudio de casos y controles anidado de la cohorte del estudio de sal ud de enfermeras, 26 estaban correctamente clasificadas (S verdaderas positivas y IS verdaderas negat ivas)(IO) , y S fueron erroneamente dasificadas (7 falsas posit ivas y 1 falsa negat iva). Podrla hacerse una comparacion, por ejemplo . entre los falsos positivos y los verdaderos negativos por un lado (abordando eI aspecto de la especificidad) y entre los fa lsos negativos y los verdaderos positivos por otro (abordando e l aspecto de la sensibilidad), En el estud io de salud de las enfermeras, los autores no comunicaron diferencias importantes entre los casas clasificados correctamente y los clasificados incorreclamente . (Cuando se est udia la propension a l bronceado, no serla absurdo poslular que e l rec uerdo de la propensi6n al bronceado de la piel podfa estar influi do por factores tales como la historia fam iliar de enfennedades de la piel 0 desarroliar act ividades laborales al aire libre) . La similitud en las caracterfsticas pertinen{es de las personas correctamente clasificadas y las clasificadas err6neamente puede q uizas indicar que el sesgo de recuerdo no es una explicaci6n probable para e l error de clasificacion, y surge la posibilidad de que el sesgo de informaci6n se o rigine en problemas relacionados con el instrumento 0 el observador. Por tanto, la comparaci6n entre sujetos err6neamente clasificados y no err6neamente clasificados no necesita cefiirse a las caracterfsticas de los entrev istados, y podrla incl uir problemas potencia les en los procedimientos de recolecci6n de datos. Cuando las entrevislas se graban, la adherencia al protocolo por parte de los entrevisladores puede ser comparada, Adicionalmente. deberfa oblenerse infonnacion sobre la confiabi lidad y la validez del instrumento (por ejemplo, un cuestionario), como se discute en el Capit ulo S. La prevenci6n del error de cla~ificaci6n en la exposic ion y e l desenlace es una funci6n del «estado del arte~) de las tecnicas de medic ion que pueden apl icarse con seguridad a un gran numero de sujetos q ue part icipan en estudios epidemiologicos.
134
EPIDEMIOLOGiA lNTERMEDIA ; CONCEPTOS Y APLICACIONES
Eiuso de marcadores de exposic i6n objet ivos (por ejemplo, bio16gicos), y las teen icas d iagn6sticas mas seguras para evaluar los deseniaces, tales como el uso de ultrasonido para diagnosticar arterioescleros is asimomatica('2), constituye la alternativa mas eficiente para mitigar los cfcctos del sesga debido al error de clasificaci6n . Por e l momenta, si se conocen la sensibilidad y la especificidad de la medida del desenlace 0 de la exposici6n, entonces es posible corregir el impacto del error de clasificacion utilizando fannu las q ue estiman un «riesgo relativo correg ido» . Tal correcci6n puede ser, por ejemplo, lIna fund6n del «riesgo relativo observado» y la sensibilidad y especificidad estimadas de la clasificaci6n de ex posici6n en el estudio(27·.lOl. Cabe adicionar que se han propuesto metodos de correcci6n que pueden ser aplicados a situaciones en las cuales los errores de medic i6n afectan tanto a las variables de ex posici6n como a las covariables (sean estas categ6ricas 0 continuas)OIl .
4.4. SESGO DE INFORMACIONISELECCION COMBINADOS En esta secci6n se d iscuten sesgos que tienen componentes de infonnaci6n y de selecci6n . Se inclu yen aquellos re lacionados con la vig ilancia medica , con los estudios transversales, y con la evaluaci6n por tamizaje . Las secciones sobre los sesgos de evaluaci6n de estudios transversales y de tamizaje pueden parecer algo repet itivas, habida cuenta de las discusiones previas sobre los sesgos de informaci6n y de selecci6n en este capitulo. Han sido incluidas aqul. sin embargo. porque contienen ejemplos especfficos de estas areas en virtud de 10 cual pueden tener un valor afiad ido para aquellos lectores especial mente interesados en estudios de intervenci6n transversales y de tamizaje .
4.4.1. Sesgo de vigilancia medica (0 de detecci6n) En este tipo de sesgo la ocurrencia de una ex posici6n medica presumiblemente relevante conduce a una vigilancia mas estrecha de los desenlaces que se estudian, los cuales, partic ularmente si son subc lfnicos, pueden incrementar la probabilidad de detecci6n en los individuos expuestos. Por tanto, e l sesgo de vig ilancia med ica oc urre c uando la identificaci6n del desenlace no es independiente del conoc imiento de la ex posici6n . Por ejemplo, ciertas exposic iones pueden conducir a una vig ilancia medica mas acusada , expresada a traves de contactos medicos mas frec uentes, 0 de preg untas y examenes mas profundos a los pacientes durante un contacto. EI sesgo de vigilancia medica es particu larmente probable cuando la exposici6n es una condic i6n medica 0 un tratamiento que conduce a examenes frec uentes y detallados - tales como la diabetes 0 e l uso de antico nceptivos orales - y el desenlace es una enfermedad caracterizada por una alta proporci6n de casas subcl fnicos, y por tanto . mas probablemente d iagnosticados d urante los contactos medicos frecuentes resultantes de la necesidad de monitorizar «la ex posici6n». Por ejemplo, aunque puede no haber fundamentos para creer que el uso de contraceptivos orales favo rezca los fa llos renales, una asociaci6n espuria se observarfa si las mujeres que taman contraceptivos orales fueran mas propensas a pasar examenes medicos, que supongan medidas repet idas de la concentraci6n serica de creatinina .
FALT.... DE VALIDEZ: SESGO
135
EI sesgo de vigilancia medica puede apreciarse como un tipo de sesgo de seleccion. porque la ident ificacion del desenlace esta influ ida por la presencia de la exposici6n. 0 como un sesgo de informacion. porque los sujetos ex puestos son objeto de examenes mas profundos que los no expuestos . EI sesgo de vigilancia medica se produce con mas frecuencia cuando el desenlace se evalua a traves de canales medicos regu lares. Alternat ivamente, cuando eI desenface se evaltia sistelluiticamellfe, il1del'elldiellfemellfe de la eXl'osici6n, utili· zando WI diseno proJpectivo COIICurrenfe, la aparici6n del sesgo de vigilancia med ica es menos probable(l). Por tanto, en la mayorfa de los grandes est udios de cohorte. tales como el est udio clasico de Framingham(32) 0 el estudio AR IC ( 12) se usan mt inariamente mdodos meticulosos estandarizados de evaluaci6n de los desenlaces . Otra estrategia para prevenir el sesgo de vigilancia medica en los estudios de cohorte consiste en enmascarar eI e,\·tado de exposici6n ("!lalldo se evahia fa presen· cia del liesenlace . Si estas estrategias no son posibles. como acaece cuando se lIeva a cabo un estudio de casos y controles en el que el diagn6stico de la enfennedad puede haber estado ya afectado por la presencia de la exposici6n. deberfa obtenel"se infimllaci611 sobre fa Fe· cuencia, fa illlem'idad y fa cafidad del c!lidado medico recibitio porlos participallle,\' liel estlldio COli prop6sitos mw{[ticos . Por ejemplo, para evaluar la relaci6n entre eI uso de la terapia de sustituci6n hormonal y una enfermedad dada con un componeme subclfnico (por ejemplo, diabetes no insu linodependieme) utilizando un disefio tradicional de casos y controles, es medu lar contemplar los indicadores de cuidados medicos, tales como la frec uencia de visitas medicas en el pasado y si el individuo tiene 0 no seguro medico . Debido a que la educacion y el nivel socioecon6mico estan usualmente relacionados con la disponibilidad y el uso de la atenci6n medica. ellos tambien deberfan ser tornados en consideraci6n cuando se trata de prevenir el sesgo de vigilancia medica . Tambien es posible obtener informaci6n sobre variables que indicall Wlloci· miento de 10,\' problema,\' de sailld, tales como el cumplimiento de los examenes de tamizaje y el conocimiento de enfermedad subc lfnica 0 de los resultados de los ana!isis de sangre. Por ejemplo, en un est udio prospectivo de la relaci6n entre la vasectom fa y el riesgo de cancer de pr6stata, la posibilidad de sesgo de vig ilancia se evalu6 examinando variables que podfan reflejar una atencion medica mas intensa(H). No se encontraron diferencias entre los sujetos que ten fan y que no tenfan realizada una vasectomfa con respecto al grado de conoc imiento sobre su presi6n anerial 0 su nivel de colesterol serico . Tambien fueron simi lares los porcentajes de los que habfan sido somet idos a una sigmoidoscopia en el contexto de un tam izaje, 10 que condujo a los autores a concl uir que los hombres con vasectomfa no estaban somet idos a un mayor grado de vigilancia medica. Ademas, la frec uencia de los examenes rectales digitales fue similar entre los individuos vasectom izados (expuestos) y los no vaseclOm izados (no expuestos). 10 que implica similar acceso a un procedimiento que puede cond ucir al diagn6stico del desenlace del est udio . Finalmente, cuando ocurre el sesgo de vigilancia medica. la enfennedad tiende a ser diagnosticada mas precozmente en los expuestos que en los no expuestos: consecuentemente, la proporci6n de sujetos con la enfermedad menos avanzada en un estudio de cohorte es mayor en el gru po expuesto. En un estudio de casos y controles, el sesgo se concreta en el hecho de que se encuentra una asociaci6n mas fuerte 0 solo presente en los casos menos avanzados . En el estudio de cohorte ya discutido, G iovannucci et al Pl) encontraron que el estadio de gravedad histol6gica del cancer
136
EPIDEMIOLOGiA lNTERMEDIA; CONCEPTOS Y APLICACIONES
de pr6stata rue similar para los vasectomizados y para los no vasectomizados, hallazgo inconsistente con 10 que se hubiera esperado si la vigilancia medica hubiefa sido mas intensa en eI grupo de vasectomizados. La eJ'lrarijicacion pOl' gravedad de la enfermedad ell ellllolllento del diagnosticv es, por tanto, lIna estrategia adic ional para examinar y tomar en consideraci6n la posibilidad de sesgo de vig ilancia .
4.4.2. Sesgos transversales Los sesgos transversales puedcn ser clasificados como sesgos incidencia-prevalencia y sesgos temporales. EI pri mero es un tipo de sesgo de selecci6n, mientras que el segundo puede ser considerado como un sesgo de informacion.
Sesgo de illcidellcia-prevalencia
El sesgo de incidencia-prevalencia procede de la incl usion de casos prevalentes en el estudio. Como se discute en el Capitulo 3 (Seccion 3.3), la fuerza de una asociaci6n a veces se estima milizando la razon de tasas de prevalencia y no mediante el riesgo relativo, como cuando se analizan los datos de una encuesta transversal 0 c uando se evallian asociaciones transversales con la informacion inic ial de un estudio de cohorte. Si el invest igador esta interesado en evaluar asociaciones potencialmente causales, el uso de la raz6n de tasas de prevalencia como un estimado de la razon de tasas de incidencia esta sujeto a sesgo . La ec uaci6n 2.3, descrita en el Capitu lo 2 (Seccion 2.3), muestra la dependencia del mids de prevalencia punt ual LPrev/( 1 Prey)! sobre la incidencia (Inc) y la duraci6n de la enfennedad (Dur), suponiendo que la incidencia y la duracion son aproximadamente constantes: Prev -,-c'-:'::: __ = Inc x
Dllr
1,0 - Prev
La Ecuacion 2.3 puede ser refonnu lada como la Ecuacion 2.4: Prev = Inc)( Dur x ( I ,0 - Prev) Esta pennite apreciar que ademas de la incidencia y de la duraci6n, en la prevalenc ia influye el tennino ( I ,0 - Prey) (que, a su vez, depende obviamente de la magnitud de la tasa de prevalencia punt ual). La ecuaci6n 2.4 muestra que la raz6n de las tasas de prevalencia punt ual (RTP) que pennite comparar los individuos expuestos (denotados por el subfndice «+») con los individuos no expuestos (denotados por el subindice «- ») , obtenidos en est udios transversales es una funci6n de I) la razon de las tasas de inc idenc ia (RTI); 2) la ra70n cle ]a cllJracion cle la enfermeclarl en 1m; incl ivicl llos ex plIestm; y la cluracion cle la enfennedad en los no expuestos; y 3) la raz6n del termino ( 1,0 - Prev) en los ind ividuos expuestos y en los individuos no expuestos . Las razones 2 y 3 representan dos tipos de sesgo de incidencia-prevalencia, es decir, e! .\"C.\"gO de fa razon de (iura, cion y e!J·e.\·go de fa razon de! complemento de fa I'revafencia I'untllal, respectivamente, c uando la RTP se utiliza para eslimar la RTi (vease Secci6n 3.3):
FALT.... DE VALIDEZ: SESGO
137
_([nc.) (DM.) (',0 - P«V. )
RTP_ - - x - 11Ic.. Dllr_
X
1,0 - Prev_
Sesgo de raz6n de dllraci6n. Este tipo de sesgo (que podia interpretarse como un tipo de sesgo de selecci6n) aparece cuando se esta milizando la RTP como una medida de asociaci6n y la duraci6n de la enfermedad despues de su comienzo sea diferente entre las personas expuestas y las no ex puestas . (Debido a que la duraci6n de una enfermedad cronica esta a menudo relacionada con la supervivencia. este tipo de sesgo puede tambien ser designado como sesgo de supervivellcia). Para las enfermedades de baja prevalencia, cuando la duraci6n (0 e l pron6stico) de la enfennedad es independiente de la exposici6n (es decir, cuando la duraci6n es la misma en los expuestos que en los no expuestos), la RTP es un est imador vinualmente insesgado de la RTi. Por otro lado, cuando la exposic ion no solamente aumenta e l riesgo de enfermedad sino que tambien afecta el pron6stico de la dolencia, e l sesgo estara presente, como se muestra en los ejemplos sigu ientes . Se.\"go de la raz611 del cOlllplemellfo de la prevalellcia punfllal. Si la duracion es independiente de la exposicion, independientemente de la direcci6n del efecfO de l factor sobre e l desenlace, la RTP tiende a subest imar la jilerza de la asociaci6n entre la exposic i6n y dicho desenlace (es decir, la RTI resulta sesgada hacia 1,0) . La magnitud de este sesgo depende de la RTP y de la magnitud absoluta de las tasas de preva lencia puntual. Cuando la tasa de preva lencia puntual es mayor en los ex puestos que en los no expucstos (RTP > 1,0), la raz6n de los complementos de las prevalencias puntuales, ( 1,0 - Prev+) / ( 1,0 - Prev-) es menor que 1,0. Esta cercana a 1,0 cuando las tasas de prevalencia puntuales son bajas tanto en los expuestos como en los no expuestos. aunque la RTP sea re lativamente alta. Por ejemplo, si la prevalencia de la enfennedad en los sujetos expuestos es 0,04 y en los sujetos no ex puesfOs es 0,0 I, la RTP es alta (0,04/0,0 I = 4,0). pero e l sesgo que resul ta de la razon de los complementos de las prevalencias puntuales es solamente 0,96/0.99 = 0,97 ... 1,0 . Por otro lado, cuando la preva lencia es relativamente alta en los individuos expuestos, la raz6n de los complementos de las prevalencias puntuales puede ser marcadamente menor que 1,0, 10 que da lu gar a un sesgo imponante. Por ejemplo, si la prevalencia de la enfermedad en los sujetos expuestos es 0,40 y la prevalencia en los sujetos no expuestos esO,IO, la RTP es la misma que en e l ejemplo previo (4,0): sin embargo, la raz6n de los complementos de las prevalencias puntuales es 0,6/0,90 = 0,67: esto es, la RTP subestima a la RTI en un 33 % . La infIuencia de la magnitud de la prevalencia es a veces apreciable incluso para un RTP bajo. Por ejemplo, si las tasas de prevalencias puntuales son 0,40 en los ex puesfOs y 0,25 en los no ex puestos, la RTPes baslante baja (I ,6), pero e l facfOr de sesgo es 0,80: esto es, la RTP subestima a la RTi en un 20% . Obviamente, e l sesgo sera mayor c uanto mayores sean tanto la tasa de prevalencia como la RTP en uno de los gru pos (expuesfOs 0 no expuestos) . Para los eswdios de facfOres que disminuyen la prevalencia de la enfermedad (es decir. RTP < 1.0). se apJica el razonamiento recfproco: esto es, ( 1,0 - Prev+)/(l ,0 - Prev-) sera mayor que 1,0 Y la magnitud del sesgo tambien eslara afectada por las tasas absolutas. Ejelllplos de sesgos de illcidencia·prevalencia. En los ejemplos que siguen se supone que la incidencia y la duracion de acuerdo a la exposici6n se han mantenido eslables en el tiempo.
EPIDEMIOLOGiA lNTERMEDIA; CONCEPTOS Y APLICACIONES
138
Sexo e inJarto agudo de/miocardia en blanco.~· norfeamericallos: Los hombres blancos noneamericanos tienen un riesgo mllcho mayor de infarto de miocardia que las mujeres . Sin embargo, algunos estud ios han demostrado que aun despues de realizado un ajuste cuidadoso por la edad, las mujeres tiencn una supervivencia promedio mas cana que los hombres(34) . Por tanto, la razon (DUfoombr.JDurmuj.,.,) tiende a ser mayor que 1,0. como consecuencia de 10 cual la RTP que expresa la relaci6n entre el sexo y el infarto de miocardia sobreslima la RTI. Hdbiro de fimw r actual y ellft.lema: EI habito de fumar produce un aumento sustancial del riesgo de cnfiserna . Ademas, la supervivencia (y por cnde la duraci6n de la enfennedad) en los pacientes con enfisema que continlian fumando despues del diagnostico es menor que la de aquellos que dejan de hacerlo. Como resu liado, las RTP estimadas en estudios transversales que evalUan la asoc iacion entre el ha.bito de fumar en el momenta del estudio y el enfisema tienden a subestimar la RTI. TuberCIIlosis clfnica y reaccion PPD: En el contexto de las evaluaciones de la relaci6n entre el tamano de la reacci6n al test de PPO en la piel y la tubercu losis clfnica, un estudio basado en la poblacion Ilevado a cabo por George Comstock y sus colegas (observaciones no publicadas) hace algunas decadas mostro que las RTP subest iman las RTI (Figura 4.5) . Esta sub-estimaci6n fue probablemente debida a la prevalencia relativamente alta de tubercu losis clfnica en esta poblaci6n en eI momento en que se Ilevo a cabo eI estudio y condujo por tanto a la oculTencia del sesgo de la raz6n de los complementos de las prevalencias. Raz6n de lasas
Raz6n de tasas de incidencia
~ Raz6n de tasas de prevatencia
1,0
Tamano de ta reaccion a ta tuberculina
Figura 4.5. Representacio n esque matica de los resultados del estudio de Comstock et af. (no puhlicado) en que se evalua la relacioll entre eI tamano de la re accio n PPD y la tuberculosis clillica. Despues de una encuesta transversal inicial conducida en 1946.la cohorte rue objeto de seguimiento en el tiempo para detenninar las tasas de incidencia. Fuell/e: GW Comstock l'I at .. comunicaci6n personal.
FALT.... DE VALIDEZ: SESGO
139
Prevenci6n del sesgo de incidencia-I'revalencia . Si el objetivo es eval uar determinantes poteneiales de enfermedad, siempre que sea pos ible, deberfan utilizarse casos inc identes con el fin de ev itar el sesgo de ineidenc ia-prevalenc ia . EI sesgo de incideneia-prevaleneia, a unque es mas faei l de conceptuali zar comparando tasas de ineideneia y prevaleneia (transversal), puede tambien veri ficarse en estudios de casos y controles que utilicen casos prevalentes en lugar de solamente casos nuevos (ineidentes). Por ejemplo, el habito de fumar, al disminuir la superviveneia despues del diagn6stico, hace que dism inuya la duraeion de la enfennedad (como el infarto de miocardio): consec uentemente. un esrudio de casos y controles basado en casos prevalentes puede registrar una proporeion mas alta de casos no fumadores (ya que muchos fumadores habrfan sido e1 iminados del est udio por fa lleeimiento) que la que corresponderfa a un estudio basado en casos ineidentes, con el consecuente debilitamiento de la asociaei6n (vease Capftu lo I , Figura I .19) . Dtro problema en los estudios de casos y controles consiste en que los nuevos casos (fiagIlOJ"ticadoJ' son ut ilizados como aproximaeiones de nuevos casos de.w rrollados . Por tanto, para enfennedades que pueden evolueionar subc lfnicamente a 10 largo de muchos afios antes del diagn6stico (tales como la le ucemia linfocftica cronica, la diabetes 0 la insufieieneia renal) eiertos casos que se presumen como ineidentes son de hecho una mezcla de casos prevalentes e ineidentes, y el sesgo de ineideneia-prevaleneia puede emerger sin que se percate el invest igador. Un estud io de cohorte previene efieientemente el sesgo de ineideneia-prevaleneia siempre que sus procedimientos incluyan una evaluaeion cuidadosa y se apl ique una exclusi6n de casos prevalentes en el momento inieial, asf como una blisqueda sistematica y periodica de nuevos casos y desenlaces subclfnicos.
Sesgo temporal EI sesgo temporal ocurre cuando la secueneia temporal apropiada necesaria para demostrar la causalidad, Jactor de riesgo - enJermedad, no puede ser finnemente establecida . En otras palabras, puede aparecer cuando sea dinc H 0 imposible conocer que se produjo primero, la exposici6n 0 factor de riesgo potencial, 0 la enfennedad . EI sesgo temporal oc urre tfpicamente en encuestas transversales c uando fa lta infonnaci6n sobre la secuencia temporal del supuesto facto r de riesgo y el desenlaceo Por ejemplo, debido a que los datos de exposic ion y del desen lace se recolectan en el mismo instante, los resul tados de un estud io de prevalencia pueden establecer una asociacion estadfstica entre niveles de creat inina serica elevados y la ocurreneia de tension arterial alta . Debido a que la secueneia de tiempo no puede ser establecida, una asociaei6n transversal entre estas variables puede significar 0 bien que la creat inina serica alta (un marcador de fa llo renal) cond uce a la hipertensi6n, 0 viceversa. En un est udio prospectivo en eI que los niveles de presion arterial se midan en personas con niveles normales de creatinina serica que son entonces segu idos en el tiempo para evaluar la apariei6n de hipercreatinemia, obv iamente se puede identificar la secueneia temporal apropiada, y por tanto, apoyar la concl usion de que la hipertension arterial predice la insufieiencia renal incipienteOS ). EI sesgo temporal tambien puede oc urrir en los est udios de casos y controles - aun en los que solamente se incluyan nuevos casos (ineidentes) - c uando la exposiei6n se mide des pucs de haberse producido el diagn6stico de la enfermedad en los casos . Por ejemplo, debido a que la hepatitis viral detectada clfnicamente es mielot6-
140
EPIDEMIOLOGiA lNTERMEDIA; CONCEPTOS Y APLICACIONES
xica, se ha sugerido que la exposici6n al virus de la hepatitis 8 (HBY) puede ser un factor ctiologico de la Hamada anemia aplastica idiopatica (AA)(J6). Sin embargo, e l sesga temporal podrfa explicar la relaci6n cnte e l HBY y la AA en un est udio de casas y controles si las muestras de sucro para la determinaci6n de los antic ucrpos a la HBY y los niveles de antfgeno hubieran sida coleccionadas ames del inicio de la AA, pucs(Q q ue los individuos con anemia aphistica pueden recibir transfusiones de sangre contaminadas con HB Y alln ames de q ue se les haga e l diagn6stico. Por 10 tanto, la sec lIcncia inferida es HBV --+ AA, pero la verdadera secuencia es AA no (Jj(/gno.~·ticada - rrall.'ifllsi6n de sangre - AA diagllosticada. Un ejemplo del razonamiento q ue subyace bajo la posibilidad de sesgo temporal viene dado por la asociaci6n entre tratamiento hormonal de reemplazo con estr6genos (TH RE) en mujeres postmenopausicas y cancer de endometrid 1i ) . Aunque la naturaleza causal de esta asociaci6n esta bien establecida, fue inicialmente motivo de controversia sobre la base de que una mayor probabilidad de ut ilizar TH RE resultaba de sfntomas q ue oc urrfan como consecuencia de cancer de endometrio incipiente, aun no diagnosticado(3 ~) . Por tanto, en lugar de la sec uencia: THRE - cancer de endometrio, la verdadera secuencia serfa: cancer de endometrio /10 diagnosficado sfllfomas - THRE - ct//lcer de endometrio (JiagnoJ·ticado. Otro ejemplo de sesgo temporal 10 aporta un estudio transversal en ninos holandeses donde se encontraron asociaciones negativas entre la posesi6n de un animal domestico y la alergia, sfntomas respiratorios y asma(39) . Como fue acertadamente advertido por los investigadores de este estudio, estos resultados bien podfan haberse derivado del hecho de que las fam ilias son propensas a eliminar de sus casas (0 a no adquirir) animales domcsticos despues de q ue ocu rren tales manifestaciones. Este estudio tambicn subraya por q ue el termino causalidad inversa se miliza ocasionalmente en relaci6n con el sesgo temporal de este tipo. Otro ejemplo de este tipo de sesgo fue sugerido por Nieto et aUlOl , qu ienes hallaron que la relacion entre el habito de fumar en el momento del estudio y e l testimonio de arterioesclerosis clfnica dado por e l paciente (defin ida por ataque al corazon 0 cimgfa cardiaca diagnosticada por un medico) apareda con mas fuerza cuando se ut ilizaban datos long itudinales q ue cuando se trataba de datos transversales (en contraste con la asociacion entre e l habito de fumar y la arterioesc lerosis subc lfnica, q ue era igualmente fuerte para los datos long itudinales y transversales). Entre las posibles explicaciones ofrecidas por estos autores para tales hallazgos estaba q ue la oc urrencia de un ataque al corazon (pero no asf la presencia de aflerioesc lerosis subcl fnica) puede lIevar a abandonar el habito de fumar, y por tanto, a una dilucion de la asociaci6n cuando se utilizan casos prevalentes (transversalmente) Este tipo de sesgo puede aparecer incl uso en los analisis prospectivos cuando e l desenlace de interes es la mortalidad. Por ejemplo, la mortalidad a corto plazo de cancer de pulm6n puede ser mayor en ex-fumadores que en los fumadores actuales debido a la tendencia a abandonar el habito por parte de los individuos sintomaticos 0 q ue ya han recibido un diagn6stico. Los epidemi610gos usualmente manejan este sesgo excl uyendo del analisis las muefles que ocurren dentro de un periodo especificado despues del comienzo del est udio . Para preven ir el sesgo temporal en una enc uesta transversal. ocasionalmente es posible mejorar la informacion sobre temporalidad cuando se obtienen los datos a traves de c uestionarios. La temporalidad de los posibles factores de riesgo tales como e l habito de fumar, la act ividad ffsica y las exposiciones ocupacionales, puede
FALT.... DE VALIDEZ: SESGO
141
ser evaluada en muestras transversales por medio de preguntas tales como: «(.Cuando est uvo usted por primera vez e:
Como en c ualquier Olro estudio epidemiol6gico. los est udios para la evaluaci6n de intervenciones de tamizaje tambien son propensos a sesgos, de los c uales c uatro tipos son particu larmente relevantcs: sesgo de seleccion, sesgo de incidencia-prevalencia, sesgo de longitud y sesgo de tiempo. (Para una cabal comprensi6n de estos ti pos de sesgos, ellector debe revisar los conceptos que subyacen en la historia nat ural de la enfermedad; para ello vea'ie, por ejemplo, Gordis(9).)
Sesgo de seleccioll EI sesgo de selecci6n proviene del hecho de que cuando la evaluaci6n del tamizaje recae sobre un disefio observacionaL entonces los grupos bajo comparaci6n pueden diferir sustancialmente con respecto a las razones para el tamizaje. Por tanto, por ejemplo, las personas que estan incl uidas en un programa de tamizaje pueden tener un nivel socioecon6mico superior que las que no part ici pan, con 10 que pueden tener un mejor pron6stico, independientemente de la efect ividad del programa en cuestion . La prevenci6n de este tipo de sesgo de seleccion se lIeva a cabo mejor utilizando un disefio experimental. Mientras que este tipo de sesgo afecta la validez interna del estudio, un sesgo que afecta su validez externa ocurre c uando la efectiv idad del tamizaje (0 de c ualquier otra intervencion) varia de acuerdo a las caracterfsticas de la poblaci6n en estudio, comprometiendose asi la generalizacion de sus resul tados a otras poblaciones.
EPIDEMIOLOGiA lNTERMEDIA ; CONCEPTOS Y APLICACIONES
142
Sesgo de illcidencia-prevalencia EI sesgo de supervivencia OCllrre al comparar el pron6stico en casas prevalentes detectados en el primer tamizaje (el ellal es similar a una encucsta transversal) con el pron6stico en casas incidentes dctectados en tamizajes subsigu ientes. Este sesgo se prod uce porquc los casas prevalentes incluyen sobrevivientes de largo alcance, que tienen una mayor supervivencia promedio que la de los casas incidentes, en los que esta representado todo el especlro de niveles de gravedad . E.<;te tipo de sesgo puede ocurrir en estudios «prepost~). como cuanda se campara una estratcgia de tamizaje utilizado en el primer examen del tamizaje (<
Aparici6n biol6gica de la enfermedad
Punto mas temprano en el que el diagn6stico es pasible
A
B
Punto en el que se realiza el ciagoostico temprano
C
01
02
Diagn6stico usual basado en enfermedad sintomlttica
03
E
Desenlace (par ejemplo, muerte, recurrencia, etc,) F
•
I Fase preclinica detectable
, ," , Tlempo de anticlpaclon Supervlvencla despues ~
Supervivencla despues del diagnostico temprano ~
del diagnOstlco usual • Puntos cr iticos
Figura 4.6. Historia natural dc una cnfermcdad Fuente: L Gordis, Epidemiology, 23 1 , © 1996, WB Saunders Company.
143
FALT.... DE VALIDEZ: SESGO
Tabla 4.10 Historia natural de una enfermedad: definicion de los componentes representados en la Figura 4.6 Componente
Aepresentado en la Figura 4.6 como ..
Deflnlci6n
Fasa preciinicamente detectable
EI intervalo entre los puntos ByE
Fase que comienza cuando es posible un diagn6stico temprano y termina con el punto en el tiempo en el cual sa hubiera hecho el diagn6slico usual basado 1m los sfntomas dQ la entermedad.
Puntos criticos
01.02y03
Puntos luego de los cuales la detecci6n y tratamiento tempranos son poco etectivos trente al tratamiento que sigue al diagn6stico usual. EI tratamiento es completamente ine· tectivo despues del ultimo punto critico (punto 03 en la tigura).
Tiempo de anticipaci6n
EI intervalo entre los puntos eyE
PeriodO entre el instante en que se produjo el diagn6stico temprano y el momenta en el cual se hubiera hecho el diagoostico usual (basado en los sintomaSj.
Fuente: L Go rdis. Epidemiology. 11:1 1996. WB Saurnlers Company.
Incluso con la misma enfermedad, independientememe del tam izaje, puede rlemostrarse fllle los pacienles c lt ya enfermerlarl tiene Itna FPO mayor tienen mejor
pron6stico que aq uellos en los que la enfermedad tiene una FPO mas corta (por ejemplo, cancer de mama postmenopausico freme a premenopausico, respect ivameme) . Por ejemplo, en el estudio del plan de seguros para la salud sobre la eficacia del tam izaje para el cancer de mama, los Ilamados casos de .
grama de tamizaje es efectivo, cuando en realidad puede ser debido a que la FPO era mas larga en estos casos, rellejo de una enfennedad que progresa mas lemamente que la de los casos intervalo, UI prevcnci611 de sesgos de longitud puede consegu irse apelando a un experimemo y comparando el pron6stico de rodo.\· los casos (tanto los que tienen FPO lar-
144
EPIDEM IOLOGiA lNTERMEDIA ; CONCEPTOS Y APLICACIONES
2- - - - - -3 --------------------------~--4---5 •••• • ••••••••••••••• - - - - - - -
6------7 ---8 y primer cribado
T segundo cribado
Tiempo .........
Figura 4.7. Represcntacio n esqucllul.tica de la longitud de ulla rase detectable prcclinica (FPD) ell casos que ocurren dura nte un programa de ta mizaje. Casos con una FPD mas larga (casas N. o I, 3 Y 8) tienen una probabilidad mas alta de identificaci6n en cada examen de tamizaje. Los casos con una FPO mas corta que ocurren entre los examenes de tamizaje so n los «casos intervalo» (casos N.o 2. 4.6 Y 7). El caso N.o 5 es un falso negativo (no detectado por el primer examen).
gas como cortas) que ocurren en individuos asignados aleatoriameme a un programa de tam izaje con los de (odos los casas que ocurren en los controles asignados aleatoriamente a un gmpo que no sera. objeto de examenes de tamizaje .
Sesgo de anticipacion en eI diagllostico Ellapso que nos ocupa es aquel durante el c ual el diagnostico puede antidparse debido al tamizaje . Es eI tiempo que media entre el diagn6stico temprano (Figura 4.6, punto C) y el momento en que el diagn6stico se hubiera producido si no se hubieran aplicado pmebas para el diagn6stico temprano (Figu ra 4 .6, punto E; vease tambien Tabla 4- 10) . Este lapso, por tanto, esta contenido dentro de la FPO. Cuando se evalUa la efectividad del tamizaje, el sesgo de antic ipad6n en el diagnostico ocurre c uando la supervivenda (0 tiempo libre de recurrenda) se c uenta desde el instante en que se hizo el diagn6stico temprano. Por tanto , aun cuando el tamizaje sea inefectivo. el diagnostico temprano afiade tiempo a la supervivenda contada desde el momento del diagn6stico usual. La supervivenda puede entonces aumentarse desde el momento del diagnostico temprano , pero no desde la aparid6n biologica de la enfermedad (Figu ra 4 .8)(42). El sesgo de antic ipadon en el diagn6stico ocu rre solamente al estimar la superv ivenda (0 tiempo transcurrido hasta eI desenlace de interes) desde el momento del
145
FALT.... DE VALIDEZ: SESGO
Comienzo biol6gico
Diagn6stico precoz :
Paclente A
Muerte
{l }Tiempo de anticipaci6n
--"t.'_____.iic·=====~·i:
Diagn6stico basado en sfntomas
Comienzo btol6gtco
:
Paclente 8
______.i _____ .. {2}
Muerte
,
--'t'-___________1L'_ _ _ _ _ _ _1L'_ _ __ Tiempo
Figura 4.8. Representacion csquematica del scsgo de anticipacion en eI diag nostico: a pcsar del diagnos tico temprano mediante tamizajc , la supervivcncia del paciente A es la misma que la del paciente 8 , cllya enfermedad fue diagnosticada debido a los sfntomas clfnicos. en virtlld de que la supervivencia (A) = (I) tiempo debido a la anticipaci6n + (2) Supervivencia (8). Fuente: L Gordis, Epidemiology, 235
~ 1996.
we Saunders Company.
diagnostico . Por 10 tamo, e l sesgo de anticipacion en e l diagn6stico puede ev itarse calculando el riesgo de mortalidad 0 la tasa entre todos los sujetos objeto del tamizaje y los controles en lugar de la probabilidad acumulada de supervivencia (0 su complemento, la probabilidad acumulada de letalidad) desde el diagnostico entre los casos(9) . Si se opta por la supervivencia desde el diagn6stico como estrategia para describir los resultados de la evaluacion de un proceso de tamizaje, debe esrimarse la duracion promedio del tiempo afiadido por la anticipaci6n mencionada y tenerla en cuenta al comparar la superv ivencia des pues del diagn6stico entre los g rupos inclu idos y no incl uidos en e l tamizaje . Para que la supervivencia se considere aumentada desde la aparici6n biologica, tiene que ser correg ida por este concepto: esto es, deberIa ser mayor que la superv ivencia despues del diagn6stico usual mas dicho lapso (Figura 4.9). S i la enfermedad para un individuo dado se identifica a traves del tamizaje, es impos ible conocer cuando el diagnostico «usual» se hubiera hecho si no se hubiera llevado a cabo el tam izaje . Por tanto, no es posible estimar el tiempo de antic ipaci6n para paciemes individ uales, sino solamente un tiempo de ant ici pacion pmll/uJio . A cominuaci6n se da una descripcion simplificada del enfoque basico utilizado para estimar eI tiempo de anticipacion promedio . Una manera mas detallada de realizar tal estimaci6n escapa a los Ifmites de este libro de texto de metodos intermedios, por 10 que habrfa q ue acudir a otra fuente(42). EI primer paso en la estimacion del tiempo de antic ipaci6n promedio es la estimacion de la du raci6n promed io de la FPO. Como se menciono prev iamente. e l tiempo de ant icipacion es un componente de la FPO. Po r tanto, para estimar el tiempo de ant ici pacion promedio es necesario primero estimar la d uracion promed io de la FPO (OurFlV), utilizando la conoc ida relacion entre la prevalencia (PreVFl'D), y la incidencia (InCFI'D) de los casos precl fnicos: esto es casos en la FPO (vease tambien Capitulo 2, Secci6n 2.3, Ec uaci6n 2.4):
146
EPIDEMIOLOGiA lNTERMEDIA; CONCEPTOS Y APLICACIONES
PreVFI'D
= i nCFI'D )(
DU f FPD
X ( 1,0 - PrevFI'lJ)
La duraci6n de la FPO puede entonces ser facilmente de rivada: PreVFI'lJ
DUfFl'D
= -;------'~";'''';:---~ incFI'u x ( I ,0 - PrevF\'l))
Si la prevalencia de la enfermedad no es mlly alta (por ejemplo, no mayor de aproximada mente 5%), 1,0 - PreVFI'lJ estara cercana a 1,0, Y por tanto, la ecuacion
anterior puede simpli ficarse:
Para aplicar esta fannu la, la PrevA'U se estima utilizando datos del primer examen de tamizaje de la poblacion objeto, que es equivaleme a una encuesta transversal. La InCA'll puede estimarse en examenes sucesivos del tamizaje entre los sujetos objeto de tamizaje q ue se enC lIcntran libres de enfennedad en el momentQ del primer examen. Una manera alternat iva de est imar InCA'll, que no req uiere del seguimiento de los sujelOS objetos de tamizaje, es utilizar la incidencia de enfennedad cifnica en la poblaci6n de referencia, si esta disponible. El razonamiento en q ue se fundamenta eSle procedimiento, y una suposicion importante que j ustifica el lamizaje, es q ue, si se dejan sin tralar, los casos precifnicos necesariamente se conveniran en casos cifnicos; por tanto, no deberfa haber una d iferencia entre la incidencia de la enfennedad cifnica y la de la enfennedad precifnica. S in embargo. cuando dispone de informacion sobre incidencia de enfermedad cifnica (por ejelllplo, basada en datos de registro de cancer), es illllXlr-
Ganancia de supervivencia para el paciente A Comienzo biol6gico
Diagn6sticc precoz
(
: (l)Tiempode , anticipaci6n
M",,"
(3)
_ _____i·':::~==::·it' _ Pacienle A l y ______j't·':::===~·i t Comienzo biol6gico
Diagn slico basado en sintomas
:
Pacienle 8
..
{2}
Muerle
.
:
_.L___________--'y'---____--'YL______ Tiempo
Figura 4.9. Representacion esquematica del sesgo de anticipacion en el diagnostieo: su»Cni vencia del paciente A procedente del diagnOstiro temprano es mejor que la del paciente 8 , puesto que la super vivencia (A) > (1) tiempo debido a la anticipaci{m + (2) Supervivencia (8 ). Fuente: L Gordis, Epidemiology, 235 ©1996, WB Saunders Company.
147
FALT.... DE VALIDEZ: SESGO
tante ajustar por las diferencias en la prevalencia de los factores de riesgo, de la que se espera que sea mayor en los sujetos objetos de tamizaje que en la poblaci6n de referencia de la cual se obtiene aquella informaci6n de incidencia clfnica. Por tanto, por ejemplo, una historia familiar de cancer de mama es mas prevalente en mujeres que son objeto de tamizaje para cancer de mama q ue en e l total de la poblaci6n femen ina. Despues de esto, utilizando el estimado de la duraci6n de la FPO, la estimaci6n del tiempo de antic ipaci6n promedio necesita tener en cuenta si eI diagn6stico temprano mediante tamizaje se hace en el primero 0 en los examenes de tamizaje subsigu ientes. La estimaci6n del tiempo de antici pacion de casos prec lfnicos prevalentes puntuales detectados en e l primer examen de tamizaje recae sobre la suposic i6n relacionada con la distribuci6n de tiempos de diagn6stico temprano durante la FPO. Por ejemplo, si la distribuci6n de diagnostico temprano mediante tamizaje puede suponerse homogenea a traves de la FPO - esto es, si la sensibilidad de la prueba empleada para e l tamizaje es independiente del momenta en que se aplica dentro de la FPO (Figura 4 .IOA) - eI tiempo de anticipaci6n de la prevalencia puntual de casos preclfnicos puede simplemente estimarse como: . ..., FPO Tlempo de ant lclpac lon = - -
2
La ultima suposici6n, sin embargo, puede no estar justificada en muchas situaciones . Para la mayorfa de las enfermedades susceptibles de tamizaje (por ejemplo, cancer de mama), la sensibilidad de Ia pmeba de tamizaje, y por tanto, la probabilidad del diagn6stico temprano, probablemente aumenta durante la FPO (Figura 4 .108)
A. Ln (lennibilidnd del exnmen de eribndn
es la misma a 10 largo de la lase preclinica detectable (FPO): Tiempo promedio de anticipaci6n _ 112 FPO
111111 I· . 1--------· FPD
Fase clfnica
B. Sensibilidad del examen de cribado durante la lase preclinica detectable (FPO) como un resul t~do del progreso de la enlermedad: Tiempo promedio de anticipaci6n < 112 FPO
11
1-.--~. 1--------· FPD
Fase clfnica
Figura 4.10. Estimaci{m del ticmpo de anticipacion como una fundon de la variabilidad de la scnsibilidad del examcn de tamizaje durante la fase preclfnica detectable
148
EPIDEMIOLOGiA lNTERMEDIA; CONCEPTOS Y APLICACIONES
como un res ultado de la progresi6n de la enfermedad a medida que se acerca hacia su fase sintomatica (clfnica) . Si este fuera e l caso, una suposic i6n mas razonable consist irfa en q ue e l tiempo de antic ipaci6n promedio fuera mcnor q ue la mitad de la FPO. Obviamente, mientras mas larga sea la FPO, mas largo el tiempo de antic ipadon bajo cualqu ier suposici6n distribucional. Ademas, debido a q ue el tiempo de antic ipaci6n promedio es una fllnd6n de la validez del examen de tamizaje, este se {Qrna mayor a medida que se desarrollan pmcbas de tamizaje de mayor sensibi lidad. La duraci6n del tiempo de amicipad6n para casos preclfnicos incitiellfes ident ificada en un programa donde se lIevan a cabo examenes de tamizaje repetidos es una funcion de cuan a menudo se hagan los tamizajes - esto es, la duracion del intervalo entre tamizajes sucesivos. Mientras mas cercanos en el tiempo esten los examenes de tamizaje, mayor sera la probabilidad de que ocurra un diagnostico temprano mas cerca del comienzo de la FPO- , Y por tanto, mas se acercara el tiempo de anticipacion a la FPO. La Figura 4.1 1 ilustra esquematicamente intervalos cortos y largos entre tamizajes y su efeclO sobre e l tiempo de antic ipacion . Suponiendo dos personas con FPO similares c uya enfermedad comienza poco des pues del tam izaje previo, aquell a con e l menor intervalo entre tamizajes (a hasta b, paciente A) tiene su enfennedad precl fnica recientemente desarrollada diagnosticada mas cerca del comienzo de la FPO
Tiempo de anlicipaci6n Pacienle A
1 2,° examen de cribado Tiempo de anlicipaci6n Pacienle B
2.° examen de cribado Tiempo __
b
1 Primer examen de cribado
Figura 4.11. Relacio n cntre rrecncllcia del tamizajc y duracion del tiempo de a nticipacio n. Las lfneas horizontales representan la duraci6n de la fase preclfnica detectable (FPD). En el paciente A. el segundo examen de tamizaje se lIeva adelante muy poco despues del primer examen de tamizaje: tiempo de anticipaci6n ... FPD . En el paciente B. el intervalo entre tamizajes es mas largo: tiempo de anticipaci6n ... (.05) x FPO.
FALT.... DE VALIDEZ: SESGO
149
que la persona a la que corresponden intervalos de tamizaje mas largos (a hasta c, pacieme B). Por tamo, la duracion del tiempo de amic ipacion sera mas cercana a la duracion de la FPO para el paciente A que para el paciente B. EI tiempo de antic ipacion maximo, obviamente, no puede ser mayor que la FPO(43).
45. SESGOS AL COMUNICAR LOS RESULTADOS DEL ESTUDlO, SESGO DE I'UBLI CACION Algunos problemas comunes que pueden inlluir sobre la calidad del informe de los estudios epidemiol6gicos y que pOOrfan potencialmeme crear sesgos se discuten en detalle en e l Capitulo 9. En esta seccion, nos centramos en un tipo especial de sesgo de comunicacion: el sesgo de publicaci6n. La aceptacion de la validez de los hallazgos publicados que .\·e uplican a una poblacion de referencia dada es(a condic ionada por dos suposic iones importantes: I) que cada est udio publicado sea insesgado y 2) que los estudios publicados constilllyan una muestra insesgada de una «poblacion» teorica de estud ios insesgados (Figuras 4.12 y 4.13). Cuando estas suposic iones no se cumplen, una revis ion de la litera(ura basada en enfoques me(a-anaifticos 0 en {(!cnicas convencionales dara una vision distorsionada de la asoc iaci6n de interes entre exposic ion y desenlace . Que la suposicion 1 se cumpla depende de varios factores, incluyendo la solidez de los disefios empleados y de la caUdad del peer review. EI sesgo de publicacion, como se define convencionalmente, ocurre c uando la suposic ion 2 no puede cumplirse por-
I/
'"
.~~
~ :
,
"'-
-
L" "I,d;" p,bI;"d" roo";,",,, una muestra de tados los estudios insesgados
«Poblaci6n» de estudios insesgados
~
~
~
Resultados de los estudios OR Verdadero
Figura 4.12. Los estudios puhlicados constituyen una muestra represcntati va de una «poblacion,. de referencia teorica de estudios no sesgados (no ha y sesgo de puhlicacio n)
ISO
EPIDEMIOLOGiA lNTERMEDIA; CONCEPTOS Y APLICACIONES
A It{ I
Estudios publicados, que no son una muestra
represenlativa de tados los estudios insesgados
«Poblaci6n» de estudios insesgados
I
Sesgo Resultados de los esludios
1 OR en estudios
public ados OR Verdadero
Figura 4.13 Sesgo de publica cion : los csludios publicados COII StitUYCII una muestra sesgada de una «pobJacioll» de referenda te6rica de estudios inscsgados (sesgo de publicacion)
que, ademas de la calidad del (rabaja reporte, son Qlros los factores que deciden su aceptahilidad para 1a publicaci6n. La direcci6n de los hallazgos es uno de es(Os fae(Ores . Por ejemplo, en un est udio lIevado a cabo haec algunas decadas, Sterling+t l demostr6 que el 97% de los trabajos publicados en cuatro rev istas de psicologfa mostraban resultados significativos al nivel alfa del 5%; por tanto, sugerlan fuertememe que los resultados ten Ian mas probabilidad de ser publicados si habfan llegado a ese nivel de significaci6n convencional. Invest igaciones subsigu iemes(4S.4
«Melooos~)
ne (onas las ve rs iones e ran
identicas, mientras que las secciones de «Resultados» y «Discusi6n» eran diferentes: iban desde resu ltados «positivos» a «ambiguos>, a «negativos». A los revisores se les pidi6 que evaluaran los metodos, la presentaci6n de los datos, la contribuci6n cieniffica, y el merilO de la publicaci6n. Comparando con los est udios negativos 0 ambiguos, los manuscrilOs con resultados «positivos» sistematicamente reciblan
FALT.... DE VALID EZ: SESGO
151
puntuaciones medias superiores para todas las categorfas, incl uyendo la categorfa de evaluacion de los metodos, aunq ue la seccion «metodos» era identica en todos los conjuntos. Curiosamente , sin embargo, los editores y los rev isores pueden no ser la unica fuente de sesgo de publicaci6n . Por ejemplo, en e l estud io de Dickersin et al .(47) se detect6 q ue solo para el 12% de los estudios completos pero todavfa no publicados, sus autores pretend fan publicarla. Entre las razones dadas por los autores para ex plicar por que renunciaba e l 88% restante inc lufan «resultados negativos» (28%), «falta de interes» ( 12%) y «problemas del tamano de la mue stra ~) ( I 1%) . Incl uso la fuente de financiaci6n parece interferir con la probabilidad de publicacion. Davidson(S'), por ejemplo, encontr6 q ue los ensayos clfnicos que favoredan una terapeutica nueva sobre una trad icional que estaban financiado s por la industria fannace utica tenfan un odd.\· de publicaci6n 5,2 veces mayor que la de ensayos financiado s por otras fuentes, tales como los Instit utos Nacionales de Salud . Algunas fonnas de sesgo de publicaci6n son bastante sutiles, tales como el «sesgo de idioma>, (es decir, la publicaci6n en una revista de habla inglesa frente a la publicaci6n en una revista en otra lengua) . Por ejemplo, Egger et al.(S2) compararon ensayos clfnicos aleatorizados publicados por investigadores alemanes en revistas alemanas 0 en revistas inglesas entre 1985 y 1994 . Cuando dos artkulos del mismo primer autor eran comparados, no se encontraron diferencias en calidad entre los trabajos escritos en aleman 0 en ingles. En contraste, se constato una diferencia fuerte, estadfsticamente significat iva, con relacion a la significaci6n de los hallazgos: eI 73% de los artfc ulos publicados en ingles comunicaban un resultado estadfsticamente significati yo, rasgo presente en solamente e l 35% de los artkulos publicados en aleman (OR = 3,8; ifmites de confianza del 95 % 1,3 - 11 ,3) . Estos resultados sugieren claramente q ue ut ilizar eI idioma como uno de los criterios para seleccionar estud ios para incluir en un meta-analisis (un criterio q ue se adopta frec uentemente debido a razones practicas 0 relacionadas con e l acceso) puede socavar seriamente la representatividad de las revisiones publicadas . Los dos enfoques sistem:'iticos mas a menudo ci tados para ev itar el sesgo de publicacion son la creacion de reg istros de estud i os(~9) y la publicacion previa de disenos de investigacion(B), La prevencion del sesgo de publicacion, obviamente , req uiere esfuerzos por parte de la com unidad cientffica como un todo, incl uyendo los investigadores, los revisores y los editores de revistas , Estos ultimos han de advertir que la direccion de los hallazgos y la ausencia de resultados «significativos» no deberfan contemplarse como criterio para rechazar 0 aceptar un trabajo.
BlBLiOGRAFIA 1. Sackett DL. Bias in analytical research. J Chron Dis 1979: 32: 51-63. 2. Last 1M . A Dklionary of epidemiology. 3: ed. New York. Oxford Unive rsi ty Press . 1995:15 . 3. Lilienfeld DE, Stolley PD . FOllndations of epidemiology. New York. Oxford Uni versi ty Press. 1994. 4. Schlesselman JJ . Case-conlrol sllidies: Design, condlld, analysis. New York. NY: Oxford Universi ty Press . 1982. 5. Rothman K1. Greenland S . Modem epidemiology. 2.' ed. Philadelphia. Lippincott-Raven Publishers: 1998 .
152
EPIDEMIOLOGiA lNTERMEDIA ; CONCEPTOS Y APLICACIONES
6. Byrne C, Brinton LA. Haile RW el al. Heterogeneity of the effect of family history on breast cancer risk. Epidemiology 1991: 2: 276-284. 7. MacMahon B. Yen S, Trichopoulus D el al. Coffee and cancer of the pancreas. N Eng/ J Aled 1981: 304: 630-633. 8. Hsieh ce. MacMahon B. Yen S el al . Coffee and pancreatic cancer. N Eng/ J Med 1986: 315: 587-588. Letter. 9. Gordis L. Epidemiology. Philadelphia, WB Saunders, 1996. 10. Weinstock MA. Colditz GA. Willett we el al. Recall (report) bias and reliability in the retrospective assessment of melanoma risk. Alii J Epic/ell/;ot 1991: 133: 240-245. 11 . Brinton LA . Hoover RN. Szklo M elili. Menopausal estrogen use and risk of breast cancer. Cancer 198]: 47: 2517-2522. 12 . Chambless LE, Heiss G, Folsom AR fI al. Association of coronary heart disease incidence with carotid arterial wall thickness and major risk factors: the Atherosclerosis Risk in Communities (ARIC) study, 1987-1993. Alii} Epidemio/l997: 146: 483-494. 13 . Mele A. Szklo M. Visani G el al. Hair dye use and other risk factors for leukemia and pre-leukemia: a case-comrol study. Italian Leukemia Study Group. Am } Epidemiol 1994: 139: 609-619. 14. Wei Q. Matanoski GM, Farmer ER el al. DNA repair and susceptibility to basal cell carcinoma: a case-control study. Alii} Epidell/iol 1994: 140: 598-607. 15 . Commonwealth of Australia, National Health and Medical Research Council. 77Ee heallh ejJeclJ of passive smokillg. November 1997. Canberra: Australian Government Publishing Service. 16 . Szklo M. Tonascia L Gordis L. Psycho social factors and the risk of myocardial infarctions in white women. Alii} Epidell/iol 1976: 103: 3 12-320. 17. Doll R'H ill AB. Smoking and carcinoma of the lung: preliminary report. B Med} 1950: 2: 739-748. 18 . Pemeger TV. Whelton PK , Klag Ml . Rossiter KA . D iagnosis of hypertensive endstage renal disease: effect of patient's race. Alii} Epidemiol 1995: 141: 10-15. 19. Stewart WF. Linet MS, Celentano DD c/ al. Age and sex specific incidence rotes of migraine with and without visual aura. Am} Epic/ell/iol 1991: 134: 1111-1120. 20. Rose GA. Chest pain questionnaire. Milbank M elli Fund Q 1965: 43: 32-39. 21. Bass EB, Follansbee WP, Orchard TJ . Comparison of a supplemented Rose questionnaire to exercise thalium testing in men and women.} Clin Epidemio/1989: 42: 385-393. 22. Garber CE, Carleton RA, Heller GV. Comparison of «Rose questionnaire angina» to exercise thalium scintigraphy: different findings in males and females.} Clin Epidellliol 1992:45: 715-720. 23. Sorlie PD. Cooper L. Schreiner PJ el al. Repeatabilit y and validity of the Rose questionnaire for angina pectoris in the Atherosclerosis Risk in Communities study.} Clill EpidelIIio11996: 49: 719-725. 24. Dosemeci M, Wacholder S. Lubin lH. Does nondifferential misclassification of exposure always bias a true effect toward the null value? Alii} EpidemioI1990: 132: 746-748. 25. Greenland S. The effect of misclassification in the presence of covariates. Alii} Epidemio11980: 112: 564-569. 26. Wacholder S. When measurement errors correlate with truth: surprising effects of nondifferential misclassification. Epidemiology 1995: 6: 157-161. 27. Flegal KM. Brownie C, Haas JD . The effects of misclassification on estimates of relative risk. Anli Epidemiol 1986: 123: 736-751. 28. Flegal KM, Keyl PM . Nieto FJ . Differentia l misclassification arising from nondifferential errors in exposure measurement. A.III} Epidellliol 1991: 134: 1233- 1244. 29. Willet W. An overview of issues related to the correction of non-differential exposure measurement error in epidemiologic studies. Sial Med 1989: 8: 1031-1040. 30. Thomas D, Stram D, Dwyer J . Exposure measurement error: influence on exposure disease. Re lationships and methods of correction . Allnll Rev Pllblic Heallh 1993: 14: 69-93.
FALT.... DE VALIDEZ: SESGO
153
31. Amlstrong BG . TIle effects of measurement errors on relative risk regressions. Alii J Epidell1ioI1990: 132: 1176-1184. 32. Kannel WB. C HD risk factors: a Framingham study update. Hosp Prat-o 1990: 25: 93-104. 33. Giovannucci E . Ascherio A. Rinun EB et al. A prospective cohort study of vasectomy and prostate cancer in US men. JAMA 1993: 269: 873-877. 34. Goldberg Rl, Gorak El, Yarzebski J . A communitywide perspective of sex differences and temporal trends in the incidence and survival rates after acute myocardial infarction and out-of-hospital deaths caused by coronary heart disease. Cirwlalion 1993: 87: 1947_1953 . 35. Pemeger TV. Nieto Fl, Whelton PK. A prospective study of blood pressure and serum creatinine: results from the «CLUE» study and the AR IC study. JAMA 1993: 269: 488-493. 36. Szklo M. Aplastic anemia. En: Lilienfeld AM. (ed.). Reviews in cancer epidemiology. vol l. New York. Elsevier North-Holland. 1980: 115-119. 37. Antunes CM . Stolley PD . Rosenshein NB. Endometrial cancer and estrogen use: report of a large case-control study. N Engl J Med 1979: 300: 9-13. 38. Horwitz RI , Feinstein AR. Estrogens and endometrial cancer: responses to arguments and current status of an epidemiologic controversy. Am J Med 1986: 81: 503-507. 39. Brunekreef B. Groot B. Hoek G. Pets. allergy and respiratory symptoms in children. lnl J Epidell1iol1992: 21: 338-342. 40. Nieto FJ . Diez-Roux A. Szklo M. Comstock GW. Sharret AR. Short and long teml prediction of clinical and subclinical atherosclerosis by traditional risk factors. Inl J EpidelI1ioI1999: 52: 559-567. 41. Shapiro S, Venet W. Strax P. Selection, follow-up. and analysis in the Health Insurance Plan study: a randomized trial with breast cancer screening. Na Il Canar hw Monogr 1985: 67: 65-74. 42. Hutchison GB. Shapiro S. Lead time gained by diagnostic time screening for breast cancer. J Nail Canar Insl 1Y6l:1: 41: 665. 43. Morrison AS. Saeening in chronic disease. Monographs in Epidemiology and Biostatistics. vol. 7. New York. Oxford University Press. 1985. 44. Sterling TO. Publication decisions and their possible effects on inferences drawn from tests of significance or viceversa. J Alii SIal A.uoc 1959: 54: 30-34. 45. Dickersin K. Hewitt P. Mutch L eI al. Perusing the literature: comparison of MEDLI NE searching with a Perinatal Trials database. Control Clin Trials 1985: 6: 306-317. 46. Dickersin K . Chan S. Chalmers TC et al. Publication bias and clinical trials. COII/roi Clin Trials 1987: 8: 343-353. 47. Dickersin K. Min Y- 1. Meinert CL. Factors influencing publication of research results. JAMA 1992: 267: 374-378. 48. Easterbrook PL Berlin JA. Gopalan R el al. Publication bias in clinical research. umat 1991: 337: 867-872. 49. Dickersin K. Report from the Panel on the Case for Registers of Clinical Trials at the eighth annual meeting of the Society for Clinical Trials. Conlrol Clin Trials 1988: 9: 76-81. 50. Mahoney M l. Publication prejudices: an experimental study of confirmatory bias in the peer review system. Cog Ther Res 1977: I: 161-175. RA. Source of fllnrline ~nrl Olllcome o f clinic~1 Tri~I~ . .1 (;",1 In/pm MPff 191<11: I: 155-158. 52. Egger M . Zellweger-Zahner T. Schneider M el al. Language bias in randomised controlled trials published in English and Gennan. UJncetl997: 350: 326-329. 53. Piantadosi S. Byar DP. A proposal for registering clinical trials. Control Clin Trials 1988: 9: 82-84. 'i I .
n~virl~on
CAPITULO 5
La identificacion de asociaciones no causales: confusion 5.1. INTRODUCCION EI vocablo COllfllsi6n alude a una siwaci6n en la que se observa una asociaci6n no causal entre una expos ici6n dada y un desen lace, que ocurre como conscc uencia de la influencia de una tercera variab le (0 de grupo de variab les), a la que usualmente se design a como variable conlusora, 0 simplemente como COII/llsor . Con fo rme fue discutido anteriormenle, la variable confusora tiene que eslar relacionada tanto con un su puesto facto r de riesgo como con el desen lace bajo estud io. En un eswd io observacional de cohone, por ejem plo, una variable confusora diferirfa entre sujetos ex puestos y no ex pueslos, y ademas estarfa asodada con el desenlace de imen!s. Como se mostrara en los ejemplos que siguen. eslo puede dar como resu l{ado la aparid6n 0 inlensificad6n de una asodaci6n que no es debida a un efeclo causal direclo, 0 bien puede producir la ausencia aparenle (0 el debililamienlo) de una asociaci6n causal que es, en rigor, verdadera. Desde un punlo de visla eminememenle epidemiol6gico, es lilH concepUlalizar la confusi6n como algo dife renle a un sesgo en el senlido de que, atmque la relaci6n no sea causal, sf es real (vease la Secci6n 5.4.7 para una discusi6n mas profunda de esle conceplo). ESla disl inci6n liene obvias implicaciones praclicas con respecfO a la relevancia de los faclores de exposici6n como marcadoreJ" de la presencia 0 rie.\-go de enfermedad con prop6silos de pesqu isaje (prevencion secundaria) . Si, por olra parle, el prop6sito del invesligador es ejecutar acciones de prevenci6n primaria, enlonces la disl incion entre relaci6n causal y no causal se lorna crucial, ya que esla ult ima se debera a los sesgos 0 al efecfO de uno 0 mas confusores. Como se describe en delalle en el Capitu lo 7, se dispone de diversas lecnicas eslad fslicas para conlrolar el efeclo de la confusi6n; la idea basica subyacente consisle en usar algun modelo eSfadi\"fico para estimar cual serfa la asociaci6n enlre la exposic i6n y el desenlace, dado un valor 0 nivel constante de la posible variable confusora (0 variables confusoras). Es mas verosfmH que la confusi6n lenga lugar en un estudio epidemiol6gico observacional que en uno experimental, porque la posibil idad de que los grupos bajo comparacion (por ejemplo. expueslos y no ex puestos) difieran con respeclo a variables confusoras se minimiza en esl udios ex perimenlales gracias a la asignad6n aleatoria. En esfOs liltimos, se selecdonan submuestras aleafOrias de la poblad6n de referenda que se espera sean comparables en cuanlo a la dislribuci6n de las variables confusoras conoddas y desconocidas, espedalmente cuando los {amanos de mueslra son grandes. Sin embargo, aun c uando la variante de asigna-
156
EPIDEMIOLOGiA lNTERMEDIA; CONCEPTOS Y APLICACIONES
ci6n aleatoria sea insesgada y las muestras sean grandes, puede haber diferencias aleatorias entre el grupo ex perimental (por ejemplo, vacunados) y el control (por ejemplo, aq uellos que red ben placebo), las cuales podrfan generar un efec(O de confus ion (Esquema 5.1). En un estudio observacional, ademas de las diferencias aleatorias entre los gru pos de comparaci6n, puede haber fae(ores relacionados con la exposici6n capaces de confundir la asociaci6n bajo estudio, como se ilustra en los ejemplos que s igucn y en la secci6n siguiente, donde el lema se discute con mas amplilud . Esquema 5.1 Confusion e ll estudios cpidcmiolOgicos ex pcrimcntalcs y no cx pcrimcntales Disano del estudio
Experimental: Ensayo cl inico aJeatorizado
ObseNacional: Estudio prospectivo
Variante de asignaci6n
AsignaciDn alealoria
Asignaci6n no aleatoria
/ '"
A
B
A
A
B
Ejemplo
A", vaclX'la B '" placebo
A::o tum adores B '" no tum adores
Causa de confusi6n (diferencia(s) entre grupos)
Diferencia(s} aJeatoria(sj
Diterencia(s} alealoria(s} y taclores asociados con la exposicion de interes
• Ejemplo 1. Las tasas de mortalidad bruta general en 1986 para seis paises en las Americas()) fue ron las sigu ientes:
Costa Rica: Venezuela: Mexico: Cuba: Canada: Estados Un idos:
3,8 4,4 4.9 6,7 7,3 8,7
por por por por por por
1.000 1.000 1.000 1.000 1.000 1.000
Admit iendo que este ordenamiento de la monalidad es preciso, la interpretacion literal (y correcta) de estos datos crudos es que los E.>;tados Unidos y Canada IlIvieron las tasas de muerte mas altas durante 1986. Aunque la valoraci6n de datos brutos es uti! para prop6sitos de planificaci6n en salud publica, puede conducir a errores cuando se usan tasas de mortalidad como indicadores del estado de salud. ya que no toman en consideraci6n las diferencias de edades entre las poblaciones . En este ejemplo. las altas tasas de mortalidad en Canada y en los Estados Unidos rellejan el hecho de que hay una proporci6n muy alta de individuos viejos en estas poblaciones: debido a que la edad es un <
LA IDENTIFlCACI6N DE ASOCIACIONES NO CAUSALES, CONFUSI6N
157
dro muy diferente, con las tasas de monalidad mas bajas observadas en Canada, los Estados Unidos y Costa Rica para cada grupo de edad. Con el ajuste por edad (usando el metodo directo y la poblaci6n de America Latina en 1960 como patron, vease el Capit ulo 7, Secci6n 7.3. 1), se invienen las posiciones relativas de Estados Unidos y Canada (monalidad por 1.000: Costa Rica: 3,7: Venezuela: 4,6: Mexico: 5,0: Cuba: 4,0; Canada:3.2: Estados Unidos: 3,6). La edad es, por tanto, un confusor de la asociacion observada entre pais y mortalidad . • EjelllJJlo 2. En un est udio de cohone Ilevado a cabo en Inglaterra(2J• se comprob6
que los participantes que al comienzo testimoniaron una frecuencia de actividad sexual mas alta (como indica la frec uencia de orgasmos comunicada) tenlan un decrecimiento del riesgo de monalidad en 10 :mos, comparado con quienes tenlan act ividad sex ual menos intensa. (,Causa la actividad sexual una monalidad mas baja? 0, (,son las personas con los mas altos niveles de actividad sexual (0 capacidad para tener orgasmos) mas saludables en general y quienes, consecuentemente, tienen menos riesgo de mOl1alidad? Aunque los autores de este est udio, estando avisados del problema, intentaron controlarlo aj ustando segun cieno numero de variables asociadas con la salud (vease el Capitu lo 7), la posibilidad de un efecto por «confll';i6n residual» se mantiene y deja la concl usion en tela de ju icio (veanse la Secci6n 5.4.3 Yel Capitu lo 7, Secci6n 7.5). • EjelllJJlo 3. La hemorragia gastrointestinal se ha considerado efecto colateral de los antagonistas del cak io, empleados en el Iratamiento de la hipenensi6n. Sin embargo, se ha sefialado que esta complicacion puede derivarse del uso conc urreme de otras drogas de uso frecuente entre consum idores de antagonistas del caicio, u otros esrados m6rbidos que concomitan en estos pacientes(3). Act uando como confusores. estos estados m6rbidos concomitantes y/o el uso de medicaciones adicionales pueden por tanto ser parcial 0 completamente responsables de la asoc iaci6n observada entre los antagonistas del calcio y la hemorragia digestiva. • Ejellll'lo 4. En un est udio anidado de casos y comroles entre hombres americano-japoneses. se ha descubierto que una dieta pobre en vitamina C esta relacionada con el riesgo de cancer de colon(4). Aunq ue es pos ible que esta relaci6n sea causal, una expl icaci6n alternat iva consiste en que los indiv iduos que consumen mas vitamina C tienden a lener un est ilo de vida en general mas saludable, y por tanto. estar bajo eI efecto de factores de protecci6n (por ejemplo, olros elementos dieteticos, ejercicio ffsico) que actuan como confusores.
5.2. LA NATVRALEZA DE LA ASOCIACION ENTRE EL CONFVSOR, LA EXI'OSICION Y EL DESEN LACE 5.2.1. Regia general EI asunto que hay que atender al valorar la confusi6n es si la asociaci6n entre la exposici6n y un desenlace dado es inducida, fonalecida, debilitada 0 eliminada por una tercera variable 0 grupo de variables (confusores) . La nat uraleza esencial de este fen6meno se puede establecer como sigue:
158
EPIDEMIOLOGiA lNTERMEDIA ; CONCEPTOS Y APLICACIONES
La variable confusora se asocia causalmente con el desenlace y
esta asociada causalmente 0 no con la exposici6n
PC'" no es una variable intennediaria en el camino causal entre exposici6n y desenlace. Esta regia general se representa esquematicameme en 1a Figura 5. 1. La asodadon de imeres (es decir, si lIna exposic i6n dada esta causalmente relacionada con e l desen lace) se re presema med iante una Ifnea discontinua y un signa de interrogacion; n6tese que esta Ifnea tiene una flecha apuntando a1 deseniace, dado q ue e l asunto de imeres aquf es si la exposici6n causa e l desen lace. (Una asociaci6n entre ex posici6n y desen lace tambien puede OC lIrrir porq ue este causa cambios en 1a «cxposic i6n»: es decir, wlI.wlidad inver.m , situaci6n exam inada en el Capitulo 4, Seccion 4 .4.2). En la Secci6n 5.2 .3 se disc uten algunas excepc iones a la regia general ex puesta; sus componentes se analizan detenidamente en la proxima secci6n (5.2.2), usando los ejemplos prev iamente considerados como ilustraciones (Figu ra 5.2). N6tese que las variables confusoras en las Figuras 5.2A y 5 .2B se ident ifican de manera extremadamente simplificada, «
E
0
-?•
Y Figura 5.1. Definici{m general de confusion. El confusor (C) esta causalmente asociado con el desenlace de interes (Y) y asociado causalmente 0 no causalmente con la exposici6n (E): estas asociaciones pueden distorsionar la asociaci6n de interes: si E causa Y. Una flecha unidireccional indica que la asociaci6n es causal: una flecha bidireccional indica una asociaci6n no causal.
LA IDENTIFlCACI6N DE ASOCIACIONES NO CAUSALES, CONFUSI6N
J
A
Distribuci6n por edad
V
Pais
B
1
~
IAntagonistas del calcio
Otros medicamentos
r
Comor· bilidad
I
/
. : ?
l!
.: ,
Salud general
Mortalidad
Mortalidad
c
Actividad sexual
. : ?
159
t
Hemorragia gastrointestinal
o
Consumo de vitamina C
SSE
~t
.: ,
,
Otras dietas yestilos de vida
Cancer de colon
Figura 5.2. Represenlacion esquemalica de las relacioncs hipolclicas de confusores, exposiciones de inlercs y desenlaces, basada en los ejemplos del lexlo. Una flecha unidireccional indica que la asociaci6n es causal: una tlecha bidireccional indica una asociaci6n no causal. Una flecha discontinua COil un signo de interrogaci6n indica la pregunta de investigaci6n de interes. SSE. situaci6n socioecon6mica.
medicamentos» estan relacionadas con la presencia de eslados morbidos concomitantes (otras manifeslaciones de enfennedades que estan asociadas con hipertension, la indicacion para la prescripcion de antagonislas del calcio). En la Figura 5 .2D , el «confusof» esta confinnado por una constelacion de variables relativas a la situacion socio economica general (SSE) y caracterfsticas del estilo de vida que tienen sus propias interrelaciones . Usualmente, oplar por la simplicidad en lugar de la complejidad se lOrna un compromiso a la hora de caraclenzar estas variables y de la conceptualizacion de sus interrelaciones; esle compromiso es de relevancia direcla p..1ra el arle de la «modelaci6n» estadfstica y es e l ndcleo central de la ciencia del analisis muitivanante, herramienta clave en epidemiologfa analftica (vease e l Capfmlo 7, Seccion 7.4) .
5.2.2. Elementos de la regia general para la definicion de la presencia de confusion «La Variable de confusion esta causa/mente asociada con eI desenlace » En todos los ejemplos incl uidos en la Figura 5 .2, las variables de confusion (distribucion de la edad, salud general, otros medicamentos y otras caracterfslicas del est i10 de vida) detenninan en cierlO grado la verosimilitud del desenlace (tasa de morta-
]60
EPIDEMIOLOGiA lNTERMEDIA; CONCEPTOS Y APLICACIONES
Jidad, riesgo de mucrte, hemorragia gastrointestinal y riesgo de cancer de colon, respect ivamente).
«EI deselliace esla asociado, casllaimetlle 0 no, cOllia exposicioll» Los ejemplos en la Fi gura 5 .2 ilustran las fa rmas diferentes que aSLImen las rclaciones entre los confusores postulados y las respect ivas exposiciones de inten!s (pais, act ividad sexual, antagonislas del calc io y consumo de vitamina C) . En las Fig uras S .2A y C, ,I(Jt:mas tIt: It:nt:r n: ladont:s ~a u saks ~O[J los ut:st:n la(;t:s, los confusores se relacionan con las ex posic iones de modo no causal, sit uaci6n cO[Jsistente con la definic ion tradic iona l de confusi6n . Por ejemplo, en la Fig ura S.lA, la re laci6n de la edad (e l confusor) con el pa is (variable de inten!s) se postula como contex tual y no causal; e~ decir, dele rminada por un conj unto de circ unslancias hist6ricas y sociales propias de cada pa is. Analogamente, en la Fi gura 5.2C, la asociaci6n entre e l usn de antagonistas del caleio y las medicaciones concurrentes se conceptua li za como no causal, de manera q ue, por ejemplo, los hipertensos a los que se les ha eSlado prescribiendo antagon istas de ca leio, probablemente tambien ut ilicen aspirina (Ia causa «verdadera» de sangram iento gastrointest inal) debido a los dolores de cabeza ind ucidos por la propia hipertensi6n, y no po rq ue la aspirina haga q ue los medicos presc riban antagonist as de calcio. La aspirina, no obstante, se relaciona ca usalmente con la hemorrag ia gastrointestina l. Las variables confusoras pueden ademas eSlar relacionadas con la exposici6n de modo causa l, como en el caso de la relaci6n postulada entre «buena salud» y act ividad sexual ejempli ficada en la Figura 5.2B . Finalmente, el ejemplo en la Figura 5.2D muestra los dife rentes tipos de relaci6n entre la exposici6n de interes con Ja constelaci6n de factores incluidos en e l «complejo de confusi6n»: por ejemplo, la mas baja SSE puede estar causalmente relacionada con el consumo de vitamina C en la medida en que determina e l acceso a prod uctos alimenticios q ue son ricos en dicha vilamina (asociaci6n causa l) . Por otra parte. algunas otras caracleristicas del estilo de vida relacionadas con la SSE (por ejemplo, ejercicio ffsico) pueden estar relacionadas con e l consumo de vitamina de modo no causaL Una ilustraci6n adicional de la regia segun la cual se prod uce la confusi6n cuando la variable de confusi6n se relaciona causalmente con la exposici6n de interes se muestra a traves del habito de fuma r y e l colesterol ligado a lipoprotefnas de alta densidad (HDL) (que no se muestra en la Figura 5.2). El habito de fumar. por ejemplo, se sabe que causa un decrecimiento en los niveles de HDUSJ; de ese modo, por tanto, explica la posible relaci6n entre un bajo HDL y el cancer de pul m6n .
«Pero no es una variable illtermedia enla cadena causal entre la exposicion
y el desenlace» La regia general para la definici6n de una variable de confusi6n excluye la situaci6n donde la ex posici6n determina la presencia 0 nivel del presunto confusor. En los ejemplos anteriores. el supuesto de que tal situaci6n no existe puede no estar enteramente justificado. Por ejemplo, en el ejemplo de la Figura 5.28 , puede ex ist ir una asociaci6n inversa entre la exposic i6n y el confusor: es decir, el incremento de la
LA IDENTIFlCACI6N DE ASOCIACIONES NO CAUSALES , CONFUSI6N
161
Actividad sexual
••••••••••••••••••••••••
..
,-----, ~ " Salud general
Mortalidad
Figura 5.3. Modclos hipotCticos alternativos para las relaciones de la Figura 5.28: «salud general,. es la cadena causal de la rclacion entre actividad sexual y mortalidad
actividad sexual puede CUI/sa,. un mejoramiento de la salud general, 10 que a su vez resu lta en un decrecimiento de la monalidad (Figura 5.3). Si este tipo de relaci6n oc urre, y panicularmente constituye el linico mecanismo a traves del c ual la act ividad sexual se relaciona con la monalidad (vease la Secci6n 5.2.3), la «salud general>, no debe ser considerada un confusor verdadero, debido a que es eI enlace entre la aClividad sexual y la monalidad. Olro ejemplo se refiere a la relacion causal conjet urada entre la obesidad y el riesgo de monalidad. Aunque puede argumentarse que esta asociacion se debe al efecto «confusor» de la hipenensi6n, una explicaci6n alternat iva es que la hipenension es una mediadom de la asociaci6n entre obesidad y monalidad, y no un confusor(l;).
5.23. Excepciones de la regia general para la presencia de confusion «Collfu sioll» debida a asociaciolles aleatorias Aunque la regia general es que la variable de confusion tiene que estar causalmente asociada con el desenlace (Figura 5.1), en la practica es posible encontrar situaciones donde una asoc iacion no causal (estadlstica) Ileva a la confusi6n. ASI, por ejemplo, en un estudio de casos y controles, la variabilidad del muestreo (aleatorio) puede crear un desbalance entre casos y controles con respecto a la variable dada, aun cuando no haya un desbalance en la poblaci6n total de referencia. Incluso en los ensayos clfnicos aleatorizados, particularmente si el tamano muestral es pequeno, desbalances que conciernen a variables relacionadas con el (los) desenlace(s) pueden ocurrir por azar. En estos ensayos los investigadores encaran el efecto de confusion (producido aleatoriamente) usando alguna de las tecnicas dispon ibles de ajuste (vease eI Capltul07).
162
EPIDEMIOLOGiA lNTERMEDIA ; CONCEPTOS Y APLICACIONES
El «confusor» como mriable intermedia en/a cadena causal de fa relacion entre exposici6n y desenlace Como ya se discut i6, el confusor potencial no debe ser una variable intcrmedia en la cadena causal entre el posible factor de riesgo y e l desen lacc . De ahf que sea inapropiado aj ustar para una tal variable . Aunquc esta regia es valida en general, se producen excepciones cuanda e l investigador explora deliberadamente mecanismos q ue ex plican la asociaci6n entre la exposicion y el desenlace de inten!s. La asociaci6n de l habito de fumar materna du rante el periodo de embarazo con un im:n:rm:nlo t:[J t:l ri t:sgo lit: mm:rlt: pt:rinalai propon;ion(l un t:jern plo dt: una situacion en la que p uede ser apropiado aj ustar para una variable intenned ia . Se sabe que e l bajo peso al nacer es un eslab6n import ante en la cadena causal entre el habito de fumar y la muene perinatal (Figura 5.4).
Hltbito de fuma r de la madre
Bajo peso alnacer
Muerte perinatal
Figura 5.4. Represcntacion esquematica del bajo peso al nacer como el unico mecanismo entre habito materno de fumar y mllerte perinatal
De modo que si la pregunta del estudio es «i,causa el habiw de fumar la muerte perinatal?» (10 c ual no apunta a un mecanismo espedfico, como serfa el caso en que se examina una hip6tesis por primera vez), es a todas luces inapropiado ajustar para un posib le mecanismo , maxime si se (rata de un mecanismo clave como bajo peso al nacer. No obstante, una vez establecido e l eslab6n principal en la cadena de causalidad (bajo peso al nacer), se puede fonnu lar una pregunta d iferente: i,es e l habiw de fumar e l causante de muerte peri natal mediante otro(s) mecanismo(s) dife rente(s) at bajo "e.w (11 nacer ? (Figura 5 .5) . En esta situaci6n procede tratar e l peso al nacer como un «confusor» (al menos en el sentido de que se garantiza su control); la presencia de un efecto resid ual (peso al nacer ajustado) del habiw de fumar sobre la mortalidad perinatal indicarfa que, adie ionalmente al efecto negativo del peso al nacer, el habito de fumar puede tener un efecw taxieo directo(7). En e l ejemplo de obesidad e hipertensian que se mencion6 antes, aun cuando el mecanismo principal por conducw del c ualla obesidad incrementa la mortalidad sea
LA IDENTIFlCACI6N DE ASOCIACIONES NO CAUSALES , CONFUSI6N
163
Habito de lumar de la madre
Muerte perinatal Figura 5.5. Representacion esquematica de un mecanismo diferente al bajo peso alnacer para explicar la relacion entre habito materno de fumar y muerte perinatal
un aumento de los niveles de presion arterial(6) , puede ser de interes examinar la asociacion entre obesidad y mortalidad , ajuslada por la hipertensi6n, con el prop6sito de explorar la posibilidad de que otros mecanismos pudieran explicar la relacion bajo consideracion. EI grado en el c ual un mecan ismo dado (0 confusores positivos) ex plica la relacion de interes, se expresa mediante la comparacion de medidas de asociaci6n ajusladas (A) y no ajusladas (N) (por ejemplo, un riesgo relativo, RR). Esta comparaci6n puede hacerse usando la razon de los RR. no ajuslados, RR N/RRA(S), 0 el porcentaje de exceso de riesgo ex plicado por [a(s) variable(s) ajuslada(s) mediante: % Exceso de Riesgo Explicado =
x 100
Como ejemplo de aplicaci6n de la f6rm u[a del porcentaje de exceso de riesgo, si el riesgo relativo ajuslado es 2,0 y el riesgo relati vo no ajustado es 3,0, e[ mecan ismo representado por la variable de ajuste (por ejemplo, bajo peso al nacer) se puede considerar como responsable del 50% de la asociacion . Es imporlante tener presente, no obstante, que si persiste una asociacion residual despues de haber sido controlada una variable su puestamente intermedia, de ahf no necesariamente se deriva que tenga que existir otra cadena causa l u Olros mecanismos; la asociaci6n puede que se deba a una confusion reJ·idual (veanse la Secci6n 5 .4.3 y el Capit ulo 7, Seccion 7 .5). Por ejemp[o, aun cuando la hipertensi6n fuera un mecan ismo import ante, se podrfa observar una asociaci6n entre obesidad y morlalidad despues de l control (ajusle) para niveles de pres ion sang ufnea a causa de e rrores de medicion . Se producirfa asf un aj uste incompleto para presi6n sangufnea, Ilevando a una confusi6n residual.
164
EPIDEMIOLOGiA lNTERMEDIA ; CONCEPTOS Y APLICACIONES
En resumen, al encarar e l problema de la confusion cuando la exposic ion y los confusores son pane de la misma cadena causal ha de tenerse en cuenta la hi p6tesis q ue se esta evaluando: en otras palabras, depende del modelo conceptual q ue se aplica a las preguntas del estudio y a los resu ltados.
Corre/adoll exces;vQ entre el confusor y la exposici6n de interes Aunque, por definici6n, una variable confusora esta correlacionada con la exposidon de interes (Figura 5 .1 ), en ocasiones la correlaci6n es tan fuerte que los ajustes resultan d ifkiles, e inclu so imposibles . Este es un problema analogo a la situacion conocida en bioestadfstica como colinealidad. Considerese, por ejemplo, la ex posici6n «conramillacion ambiental» y eI presunto confusor <<
CONFUSOR Presente
Ausente
I. A
~
:r"x in w
0
Figura 5.6. Correlaci{m perfecta entre t xposicion dicotomica de intercs y factor de confusion : no hay celdas en las que la exp05icion cstc prcsentc y cl confusor estc ausente, ni vicevcrsa
LA IDENTIFlCACI6N DE ASOCIACIONES NO CAUSALES , CONFUSI6N
165
CONFUSOR Presente
Ausente
I.
• • c
~
z
A
B
C
0
~
-Q
u in 0
~
x
w
•, c
~
<
Figura 5.7. Correlacion entre una exposicion de interes y un factor de confusion: las cuatro celdas de la tabulacion cruzada de variables categoricas cstan reprcsentadas. En esta representaci6n esquematica. los tamaiios mas grandes de las celdas A y D denotan la magnilUd de la correlaci6n positiva entre la exposici6n y el confusor.
diffcil controlar el posible papel de confusi6n de las grasas en la dicta, dada la fuene correlaci6n entre protefna animal y consumo de grasas(breml'arejamiento. vease el Capftulo 7 . Secci6n 7.6) que se produce cuando el ajuste (0 el emparejamiento, vease el Capitu lo I. Seccion 1.4 .5) se lIeva a cabo para una variable {an fnti mamente relacionada con la variable de interes que no se produce variabilidad alguna en esta ultima. Por ejemp[o, en un estudio de casos y controles, al tomar casos muy similares 0 identicos a [os contro[es OCUfre que unos y olros tenn inan siendo muy simi[ares 0 identicos con respecto a la exposici6n, 10 que da lu gar a una
EPIDEMIOLOGiA lNTERMEDIA ; CONCEPTOS Y APLICACIONES
166
asociaci6n aparentememe nu la. En general, siempre ha de tenerse presente que cuando e l ajuste se lleva a cabo para una dctcnninada variable de confusi6n, {ambitn se veril.ea para las variables con ella relacionadas. Por ejemplo, c lIando se aj usta por area de res idencia, de hecho se ajusta, en una 0 en olra medida, por factores relacionados con la residencia, tales como antecedentes emicos, renla, religi6n y habitos dieteticos .
5.3. EVAL UACION DE LA PRESENCIA DE CONFUSION En un estudio observacional , la evaluaci6n de los efec(Qs de confusi6n se lIeva a cabo para variables que son confusor<:s conocidos 0 sospechosos . La identificaci6n de confusores potenciales se basa usualmente en e l conocimiento a priori de la asociacion dual entre e l posible confusor con la exposic ion y con e l desenlace, los dos po los de la hip6tesis del estudio. En adicion al conoc imiento u priori acerca de las asociaciones. es imponante verificar si la confusion esta presente 0 no en el estudio. Hay varias vias para establecer la presencia de confusi6n, que estan relacionadas con las sigu ientes preguntas: I . (.Esta relacionada la variable confusora tanto con la exposic ion como con e l desenlace del estudio? 2. (. Tiene la asociaci6n ex posici6n-desenlace observada en el anal isis crudo la misma direcci6n y magnitud similar a las asociaciones que se producen dentro de los estratos de la variable confusora? 3. (. Tiene la asociaci6n ex posici6n-desenlace observada en el anal isis crudo la misma direcci6n y magnitud que las asoc iaciones obtenidas despues de l control (aj uste) para la variable de confusion? Estas di ferentes vias para establecer la presencia y magnitud de los efectos de confusion se ilustran usando un ejemplo basado en un estudio hipotetico de casos y controles donde eI sexo masculino se valora como posible factor de riesgo para la infecci6n de malaria. EI analisis cmdo que se muestra en el Esquema 5 .2 sugiere que los hombres tienen un riesgo mas alto de contraer malaria que las mujeres (odds ratio LORI = 1,7; Ifmites de confianza al 95%: I ,1-2,7). Se puede infen r que existe una asociacion «real» entre ser de sexo masculi no y contraer malaria si estos res ultados estan libres de errores aleatorios (muestreo) y sistematicos (scsgo): esto es, los hombres, sin discusion, tienen un riesgo mas alto de infeccion en esta poblaci6n . De inmediato la pregunta es si la asoEsquema 5-2 Ejemplo de confusion: estudio hipotetico de sexo masculino como factor de riesgo para la infeccion de malaria Casos
Controtes
Totat
Hombres
88
68
156
Mujeres
62
82
144
150
150
300
Total
Oddsratio:1,71
LA IDENTIFlCACI6N DE ASOCIACIONES NO CAUSALES , CONFUSI6N
167
ciaci6n es call.m/; es decir. si hay algo inherente al sexo que hace a los hombres mas susceptibles de enfermar que las mujeres (por ejemplo, un factor hormonal). Altemativamente, una caracteristica que este asociada tanto con el sexo como con un gran riesgo de infectarse puede ser la responsable de la asociad6n. Una caracteristica de ese tipo es el ambiente de trabajo, en el sentido de que individuos que fundamemalmente trabajan en espacios abiertos (por ejemplo, agricultura) estan mas expuestos a la picadura del mosqu ito que transmite la enfennedad que aquellos que trabajan en areas interiores (Figura 5.8). Es decir, si la proporci6n de individuos con ocupaci6n en areas exteriores es m;'is ;l Ira en homhres '1"e en mujeres, e1 ;lmhiente lie Ir;lhajo polirfa e xplicar 1a ;lSOciad6n observada entre sexo y malaria .
Glmero masculino
?
Trabajo aJ aire libre
Malaria
5.8. Ambicntc dc trabajo como un posible eonfusor dc la asoeiaei{m entre eI scxo masculino y cl ricsgo dc malaria
Fi gura
5.3.1. ;,Esta relacionada la variable de confusion con la exposicion y con el desenlace del proceso estudiado? En el Esquema 5.3 se muestran las asociaciones del confusor con la exposic i6n y el ambiente de (rabajo en este ejemplo hipotetico . • EI 43,6% (68/ 156) de los hombres, pero solamente el 9% ( 13/ 144) de las mujeres, tiene ocupaciones fundamenlalmente en espacios abiertos, dando como resultado un odds ratio de 7,8 . • Tiene ocupaciones fundamemalmente en espados abienos e142% (631150) de los casos de malaria, pero solo el 12% (18/ 150) de los controles eslaba en ese caso; ello arroja un odd.\· ratio de 5.3 . Las asociaciones positivas y fuertes del confusor (ambiente de trabajo) con el factor de riesgo de interes (sexo mascu lino) y el desenlace (<
168
EPIDEMIOLOGiA lNTERMEDIA ; CONCEPTOS Y APLICACIONES
E.iquema 5.3 Asociacioll del snpucsto confusor (trabaja fUlldamclltalmcllte en cspacios abicrtos) COli la exposici6n de illtcres (sexo m asculino) y eI desenlacc (malaria) en cI estudio hipotCtico del Esquema 5.2 y Figura 5.8 Trabajan en espacios abiertos
Trabajan en espacios cerrados
Total
Hombres
68
88
156
Mujeres
13
131
144
Conlusor y exposlclon
Odds ratio : 7,8
3(](]
Confusor y desenlace CasDS
Controles
Trabajan en espacios abiertos
63
18
Trabajan en espacios cerrados
87
132
Total
15O
15O
Odds ratio ", 5,3
3(](]
5.3.2. ;,Tiene la misma direcci6n e identica magnitud la asociaci6n exposici6ndesenlace observada en el amilisis crudo que las asociaciones observadas dentro del estrato de la variable confusora? L1 estratificaci6n de aClIerdo al confusor re presenta una de las estrategias para controlar por su efecto (vease el Capitu lo 7, 5ecci6n 7.2). Cuando hay un efecto de confusion, las asociaciones que se yen a traves de los estratos de la variable potencial mente confusora son todas de magnitud similar, pero son diferemes a las de la estimaci6n cmda. En e l ejemplo expuesto, los datos se pueden estratificar por medio del confusor (ambiente de trabajo) para verificar si la asociaci6n entre la exposici6n (sexo mascu lino) y el desenlace (malaria) esta presente dentm de los estratos relevantes (ocupaciones fundamentalmente al aire libre 0 fundamentalmente en espacios cerrados) . Como se muestra en el E.,>quema 5.4, los odds ratio estimados en ambos estratos estan muy pr6ximos a uno y difieren del res ultado que arrojo el analisis cmdo (1,7 1), 10 que sugiere que el ambiente de trabajo es un confusor que explica virtualmente toda la asoc iaci6n del sexo masculino con la presencia de malaria. 5i la asociaci6n observada en el analisis no aj ustado hubiera persistido dentro de los estratos del posible confusor, habrfa sido apmpiado concluir que eI efecto de confusion del ambiente de trabajo no explico la asociacion observada entre sexo masculino y malaria . Con respecto al uso de la estratificaci6n como medio para verificar la presencia de confusion, hay q ue enfatizar q ue, como demostraron Miettinen y Cook(lO) para odd,~' ratios (y subsigu ientemente Green land O ' ) para razones de tasas y diferencias absolutas entre razones), el odds ratio no ajustado es algunas veces diferente de los odd.~· ratios especfficos segun estratos al/n euando la cOllfl.lsi6n esti 1ll.lSente. Por tanto, la estrategia de comparar estos odds ratios con e l odds ratio combinado (no ajus-
LA IDENTIFlCACI6N DE ASOCIACIONES NO CAUSALES , CONFUSI6N
169
Esquema 5.4 Analisis estratificado de la asociaci6n entre suo y malaria (del Esquema 5.2) de acuerdo a si los individuos trabajaban rundamentalmente en espacios abiertos o en espacios cerrados TrabaJan fundamentalmente en espaclos ablertos
Casos
Controles
Hombres
53
Mujeres
10
3
Total
63
18
Casos
Controles
Hombres
35
53
Mujeres
52
79
Total
87
132
TrabaJan fundamentalmente en espaclos cerrados
OddS ratIO :: 1,06
Odds ratio :: 1,00
tado) para el estabJecimiento de confusion debe confirmarse a traves de la estrategia arriba expuesta y de la que se expone a continuacion.
533. iTiene la asociaci6n exposici6n-desenlace observada en el amllisis crudo identica direcci6n y magnitud a la observada despues del control (ajuste) por la variable confusora? Puede ser que la vIa mas indicada para detenninar si existe un efecto confusor sea la comp..1raci6n entre asociaciones ajustadas y crudas . EI ejemplo sexo/infeccion por malaria se usa ademas en el Capitulo 7, Seccion 7.3.3, para il ustrar el metodo de Mantel-Haenszel para calcu lar un odd.\· ratio ajustado . Conforme se describe en esa secci6n, el odds ratio ajustado de Mantel-Haenszel en este ejemplo es 1,0 1. (E.<;te odd.\· ratio es meramente un promedio ponderado de los odds ratios especfficos por estrato que se muestran en el Esquema 5.4). La comparacion entre el odd.\· ratio crudo (1,7 1) Y el ajustado por el ambiente de trabajo ( I ,0 I) es consistente y confirma la inferenc ia basada en las estrategias previas en cuanto a que eI incremento en el riesgo de malaria en hombres (odd.\· incrementados en un 7 1%) se debi6 a que se trataba. con mayor probabilidad, de trabajadores que se desempefian en espac ios abiertos (Esq uema 5.3). Otro ejemplo que ilustra las dife rentes vIas para evaluar el efecto de confusi6n se orrece mediante un estudio de cohorte de empleados de edad media (Estudio de la Compafifa Electrica del Oeste) que evaluo la relacion del consumo de vitam ina C y dosis de beta caroteno y el riesgo de muerte(12) . Para las tablas que siguen, el presunto factor de riesgo y se define sobre la base de un Indice resumen que loma en consideracion los consumos de vitamina C y beta carotenos . Con el prop6sito de simplificar, este Indice de consumo que define la ex posici6n de interes se clasifica como
170
EPIDEMIOLOGiA lNTERMEDIA ; CONCEPTOS Y APLICACIONES
Tabla 5.1 Razoncs de mortalidad no ajustadas y las correspondicntes razones de tasas ell la poblaci{m del Estudio de la Compania Elcctrica del Oeste de acuerdo 31 indice de cOlISumo G
N. de Miosobservaci6n
N.o de Muertes
Mortalldadfl.000 Anos-Persona
Bajo MOderado
10.707
195
18,2
1,00
lU.1:I5
16:i
U,!!2
Alto
11.376
164
15,0 14,4
indlce de consumo
Persona de
Razen de
tasas
0,79
Fuente; DK Pandey et al. , Dietary Vitamin C arICI [I-Carotene and Risk of Death in Middle·Aged Men . The Western Electric SlLKly. American Journal 01 Epidemiology, Vol 142, 1269-1278, Cl1995. Tile Johns Hopkins Univers ity School of Hygiene & Public Health.
«bajo», «moderado» 0 «al(O». El confusor potencial para estos ejemplos es 1a cond icion actual en relaci6n con el habito de fumar, categorizada como ausente 0 presenteo En este ejemplo el asunto de interes es si existe una relaci6n inversa entre el {ndice de consumo y el desenlace, la tasa de muerte por todas las causas, y, si asi fuera, si se puede explicar en parte 0 total mente por el efec(Q confusor del habito de fumar. La primera via para evaluar si el efec(Q de confusi6n puede explicar la tendencia que se ha1l6 en este estudio (Tabla 5.1) - esto es, si e l confusor esta asoc iado con la exposic i6n y e l desenlace - se ilu stra en las Tabla.>; 5.2 y 5.3 . Una relaci6n inversa entre el habi(Q de fumar actual y la exposic i6n, indice de consumo. se observa en este estudio: concretamente hay un porcentaje mayor de bajo consumo (y menor en las otras dos categorfas) en fumadores actuales que en no fumadores (Tabla 5 .2). $e encontr6 tambh!n que para los fumadores actuales se registra un incremento de un 72% en la monalidad por todas las causas (Tabla 5.3). A causa de la asoc iaci6n dual con e l indice de consumo (exposici6n) y con la monalidad (desenlace), el habito de fumar se puede considerar un confusor de la asociaci6n del indice de consumo compuesto vitamina Clbeta caroteno con la mortalidad por todas las causas.
Tabla 5.2 Distribucion porccntual de alios-persona de observacion en la poblacion del Estudio de la Compaliia Electrica del Oeste, segun al indice de cOlISumo vitamina C!beta caroteno y M.bito de rumar actual Olstrlbucl6n porcentual [ndlce de consumo Hilblto de fumar actual
N.ode Indlvlduos
Aj'iosPersona
BaJo
Moderado
Alto
No
657
Sf
899
14.534 (t oo,O"!,,) 18.401 (100,0 %0)
29,3 35,0
35.3 31,1
35,4 33,9
Fuenl.r; DK Paooey er al., Dietary Wamin C aM ~-Carotene aoo Risk 01 Death in Middle·Aged Men. The Wes· lern Electric Study, American Journal of EpidemiokJgy. Vol 142, 1269-1278, 0 1995 , The Johns Hopkins University School 01 Hygiene & Public HeaHh.
LA IDENTIFlCACI6N DE ASOCIACIONES NO CAUSALES , CONFUSI6N
171
Tabla 5.3 Tasas de mortalidad y las correspondientes razones de tasas en la poblaci6n del Estudio de la CompaiUa EI&trica del Oeste segun lul. bito de rumar actual Hablto de fumar actual
N.Ode AnosPersona
N.Ode Muertes
Mortalldadl1000 personas-ano
Razon de tasa s
No
14.534 18.401
165
357
11.3 19,4
1,00 1,72
S;
~uente: UII. I-'andey et al., u letary vrtamln t,; and 1I·t.;arotene and HISk ot ueath In Mlddle·Aged Men. I ne wes· tern Electric Study, American Journal 01 Epkle:niDlogy, vol 142, 1269'1278, 1tl1995. The Johns Hopkins University School 01 Hygiene & Public Hea lth.
EI seg undo enfoq ue para exam inar la confusion (estrat ificaci6n de acuerdo a categorfas del confusor potencial) se ilustra en la Tabla 5.4, la c ual muestra que las las razones de tasas en los estratos formados por las categorfas de l habito de fumar act ual son similares a las razones de las tasas no aju stadas . Los resultados del tercer enfoque (ajuste) se presentan en la Tabla 5.5, donde aprecia que la raz6n de tasas aju stadas usando el mewda direcw (vease el Capftulo 7, Secci6n 7.3 .1 ). Aunque ligeramente debilit ada, la relacion inversa gradua l de l fndice de consumo con la mortalidad por todas las causas se mantuvo despues del ajuste por el habiw de fumar act ual. De modo que se puede concluir que, aunque el habito de fumar act ual (categorizado dicot6micamente como «s f» 0 «no») sat isface los dos criterios necesarios para definirlo como un confusor (estrategia I , Tablas 5.2 y 5.3), su influencia fue la de un confusor extremadamente debil en este eswdio. Este leve efecto de confusion se puede ex plicar por la re lat ivamente debil relacion entre el habiw de h lmar y el fndice de consumo (Tabla 5.2) aparejada con una raz6n de
Tabla 5.4 Tasas de morta lida d y las correspondientes rawncs de tasas asociadas con el indice de consumo vitamina Clbeta caroteno, de aCllerdo al h:ibito de rumar actual, Estudio de la Compania EI&trica de l Oeste
Hablto de fumar actual
No
S; Tolal (no ajuslado)
[ndlce de consumo de IIltamlna C/ beta Caroteno
N." de personas-ano
Mortalldadl1000 personas-ano
Razon de tasas
Bajo Moderado Allo Bajo Moderado Allo Bajo Moderado Allo
4 .260 5 .1 31 5 .143 6 .447 5 .721 6 .233 10.707 10.852 11 .376
13,4 10,7 10,3 2 1,4 18,9 17,8 18,2 15,0 14,4
1,0 0,80 0,77 1,0 0,88 0,83 1,0 0,82 0,79
Fuente: OK Pandey er al., Dietary Vilamin C and [I·Carolene and Risk of Oealh in Middle· Aged Men. The Wes· lern Electric Study, American Journal 01 Epidemiology. vol 142, 1269· 1278. 1tl1995, The Johns Hopkins Univers ity School of Hyg iene & Public HeaRh.
172
EPIDEMIOLOGiA lNTERMEDIA ; CONCEPTOS Y APLICACIONES
Tabla 5.5
Razoncs de tasas para 13 mortalidad por todas las causas 110 ajustadas y ajustadas por eI habito de rumar en cI Estudio de 13 Campania Electrica del Oeste Razones de tasas del indice de consumo vltamina CfBeta caroteno Razon de tasas
Baja
Moderado
Alto
No ajustada
1.00
0,82
0,79
Ajuslada-
1 ,00
0,85
0,81
• Ajustadas usando 81 metoda directo y la coh,,'!e total (suma de arios-persona de oooorvaci6n para las I res categorias del indice de consumo) como pobIad6n estlmdar (vease el Capitulo 7, Secd6n 7.3.1). Fuente: DK Paooey 91 a/.• Dietary Vitam in C ard [I-Carotene and Risk of Death in Middle-AgM Men. The Western Electric Study, American Journal 01 Epidemiology. Vol 142. 1269-1278, 11:11995. The Johns Hopkins University School 01 Hyg iene & Public HeaHh.
{asas de mortalidad {otal para la categorfa de los fumadores ac{uales de solamente 1,72 (Tabla 5.3) . Esto se debe probablcmente a la fa lta de especificidad de l desenlace, el cual incl uyo tanto las muertes relacionadas con el habiw de fumar como las no relacionadas . (Se podrfa haber argumentado tambicn que el ajuste contempl6 solamente dos categorfas de l habi{o de fumar que no denen en cuenta ni su duracion ni su cuantfa , 10 que da cabida a una sus{ancial confusion residual; vease Secci6n 5.4 .3).
5.4. ELEMENTOS ADICIONALES RELACIONADOS CON LA CONFUSION 5.4.1. La importancia de utilizar diferentes estrategias para evaluar la confusion Aunque, como ya se discuti6. el mejor argumento de caracle r probatorio para sus{entar la presencia de confusion es la demostraci6n de que los es{imados crudos y ajustados difieren, es litH considerar las otras estrategias discutidas en eSle capftu10 para evaluar la confusi6n. Por ejemplo, la observaci6n de las direcciones de las asociaciones del confusor con la ex posicion y e l desenlace pro po rciona una expec tativa a priori en cuanto a si la e liminaci6n de la confusi6n conduce a un inc remento 0 a una disminuci6n de la intens idad de la asociaci6n (vease la Secci6n 5.4 .4) . Si el estimado ajustado fu era inconsistente con 10 esperado, e l procedimiemo de aj uste {iene que verificarse para descartar un posible error. Por ejemplo, en un estudio de casos y controles donde los casos son mas jovenes que los controles y la edad esta re lacionada direc tamente (positivamente) con la exposici6n de interes, es de esperar que la confus i6n de como resultado una estimaci6n del riesgo re lativo no ajustado muy proximo a 1,0 . Por tanto, se tendrfa a lgo o puesto a 10 espe rado - yen consecuencia requerirfa verificacion - s i se hubiera encontrado que la estimacion no ajustada estaba mas alejada de la hip6tesis nu la que la ajustada.
LA IDENTIFlCACI6N DE ASOCIACIONES NO CAUSALES , CONFUSI6N
173
La estratificaci6n es ademas un paso litH cuando se analizan datos epidemiol6g icos, debido a que const ituye Olra estrategia que pennite la formu lacion de una expectaliva a priori de los efectos de la confusi6n sobre la asociaci6n y, de este modo , de los efeclOs del ajuste sobre la asociaci6n (a pesar de la advertencia, a la que se hizo referencia previa , de que incluso cuando la confusion esta ausente, la medida combinada de asociaci6n puede ser diferente de la de los estratos especfficos). Por ejemplo, cuando los estimados en los estratos formados por el confusor eslan mas cerca de la hip6tesis nllia que el valor combinado no ajuslado, el riesgo relativo deberfa estar cerca de 1.0 despues del ajuste . (Las excepciones incluyen determinadas situaciones en las que multiples variables se confunden unas con otras .) Adicionalmente, como se discute en los Capftulos 6 y 7, la estratificaci6n permite la valoracion de la interacci6n .
SA.2. La confusion no es un fenomeno de ·d odo 0 nada» En el ejemplo que se ex pone a traves de los Esquemas 5.2 hasta 5.4, la variable de confusi6n (ambiente de Irabajo) e~ enteramente responsable de la relaci6n entre la exposici6n de interes (sexo masculino) y el desenlace (malaria). En la Tabla 5.6 se ofrece otro ejemplo de un efecto de confusion que explica IOtalmente la relaci6n: alii se muestran los resultados ajustados y no ajustados del estudio sobre los antagonistas del calcio y la hemorragia gastrointest inal, discutido al inicio de este capitulo (vease el ejemplo 3 en la Secci6n 5. 1)(3). Debido a que la raz6n de lasas decreci6 de 1,8 a 1,5 tras el ajuste segun caracterfsticas demogrMicas y usa de otros medicamentos, se puede concluir que esas variables confunden solo parcialmente la asociaci6n entre los antagonistas del calcio y la hemorragia gastrointestinaL No obstante , cuando Olras enfermedades concom itantes se luvieron en c uenta, la asoc iacion desapare-
Tabla 5.6 Riesgos relatiyos ajustados y no ajustados de hClIlorragia gastrointestinal alta con respccto al uso de antagonistas del calcio, Personas adscritas a Medicaid de Tcnnessc£, de 65 y lIlas aiios de edad , de 1984 a 1986
No ajuslados Ajustados par caracler islicas demograficast y por el usa de olros medicamentos' Lo anterior mas indicadores de comorbilidadf '8asado en tasas de incidencia (po r tiempo-persona) y modelos los Capitulos 2 Y 7) . t
Rlesgo relatlvo'
Intervalo de confianza 95%
1,6
1.2-2,7
1,5 1, 1
1,0-2,2 0 ,7 -1,7
mu~i variados
de regresi6n de Poisson (vl!anse
Edad, raza , sexo y residencla .
• Agentes anti-inflamatorios 00 esteroideos, corticoides orales, anHcoagulantes orales. y medicamentos antineoplas;cos . I Uso racienle de cuidados ml!d icos (hosp italil.aciones y uso de nitralO). Fuenle: WE Small ey el al. , No Association Belween Calcium Channel 810cker Use and Confirmed Bleed ing Peptic Wee r Disease, American Joumalol Epidemiology, Cl1998, The Johns Hop kins Univers ity School of Hygiene & Public Heallh.
174
EPIDEMIOLOGiA lNTERMEDIA; CONCEPTOS Y APLICACIONES
cio casi completameme . En muchos casas, sin embargo, el cfccto de confusi6n es solamente parcial. En el ejemplo mostrado en las Tablas 5. 1 hasta 5.5, el aj uste por e l habiw de fumar tuvo solamente un ligero efec{o sabre la asociaci6n entre e l {ndice de conslI mo de vitamina Clbeta caroteno y mortalidad .
5.4.3 . Confusion residual La confusion residuaL que sera discutida con mayor deta lle en el Capit ulo 7 (Secci6n 7 .5). oc urre c lIando alg unas de las categorfas de l confusor controlado son tan amplias q ue se abI lene un aJuste imperfeclO, 0 cuando a lgunas variables de confus ion no se controlan. Por eso, en uno de los ejemplos ya discutidos (Tabla 5 .5), el de solo dos categorfas para el habito de fumar «< p resente~) 0 «ausente~») puede ex plicar la semejanza entre los riesgos relat ivos crudos y los aj ustados por habito de fumar q ue ex presan la re lacion entre e l Indice de consumo de vitamina C/beta caroteno y la mortalidad . Si el efecto de confusion del habito de h lmar depend iera de otros componentes de la exposicion, ta les como cuantla, duracion 0 fecha de abandono del habito, podrfa haber subsistido una confusi6n residual marcada despues del ajuste basado en tan rudimentaria medicion del habito de fumar. Otro ejemplo es el estud io de la asociaci6n entre la actividad sexual y la mortalidad discutido prev iamente(2) . Conociendo la posib ilidad de confus ion, los autores de este est udio aplicaron la regresi6n log fstica multiple (vease e l CapIt ulo 7, Seccion 7 .4.3) para ajustar por varias variables re lacionadas con la salud. Los datos sobre estas variables se recogieron en e l momenta del examen inicial, incl uycndo la prcscncia dc cnfcrmcdad coronari a prcva lcntc, colcstcrol scrico tota l, habito de h lmar, presi6n arteria l sist6lica, y ocu pacion (man ual contra no manual). La menor mortalidad de los participantes en el estudio con mayor frecuencia de re laciones sexuales pers isti6 c uando se aj ust6 por estas variables . Los autores, sin embargo, concluyeron adecuadamente que «a pesar de esto, la confusi6n bien puede explicar nuestros hallazgos»; en tal contexto nos recuerdan que en un estudio observaciona l, algunas variables no consideradas pueden confundir la asociacion observada aun despues de haberse realizado e l ajuste inicial. Por ejemplo, en este estudio, no se tomaron en consideraci6n otras enfermedades que afectan tanto la actividad sexual como la mortalidad (por ejemplo, diabetes, y posiblemente condiciones psiqu iatricas). Adicionalmente, diferencias sutiles en el est ado de sa lud que no se aprecian por la presencia 0 ausencia de enfermedades conocidas y fac tores de riesgo (por ejemplo, perfil psicol6gico 0 «bienestar» general) se mant ienen sin ser consideradas, y por tanto, subrayan las dificultades de tomar tota lmente en consideraci6n los efectos de confusion del est ado general de salud en estudios ep i dem i ol6gico~ observacionales . Otro tipo de confusi6n residual se prod uce c uando la variable q ue se usa para e l aj uste es una trazadora imperfecta de la verdadera variable por la que se q uiere hacer el ajuste . As\, se ha cuest ionado la idoneidad del nivel educacional como un sucedaneo de la clase social, particularmente cuando se comparan blancos y negros en los Estados Unidos(ll). Otras causas de confusion residual (por ejemplo, errores en la medici6n de la variable confusora) se discuten en el Capitu lo 7, Secci6n 7.5.
LA IDENTIFlCACI6N DE ASOCIACIONES NO CAUSALES , CONFUSI6N
175
SAA. Tipos de efectos de confusion: confusion negativa, positiva y «cualitativa» La confusion puede conducir a una sobreesti maci6n de la verdadera fuerza de la asociacion (confusion I'0sitiva) 0 a una subestimacion (confusion negativa) . En otras palabras, la confusion posit iva exagera la magnitud de la asociaci6n no ajustada (frente a la ajustada); la confusion negativa, la atenua. Adviertase que los terminos .wbreestimacion y subestimacion se usan en relaci6n con la hip6tesis nula. As f, por ejemplo. un odds ratio ajuslado de 0.7 es (en terminos absolutos) «mayon> que un odds ratio no aj ustado de 0,3; no obstante, el hecho de que el primero este mas proximo que el segundo al oddJ' ratio que indica no asociaci6n ( 1,0) defi ne el efecto de confusi6n como «positivo». En la Tabla 5 .7 se muestran ejemplos hipoteticos de estimados de riesgos relativos que ilustran el efecto de la confusion. Los primeros tres ejemplos muestran asociaciones no ajustadas, en las c uales 0 bien desaparece, 0 bien se debilita c uando se aj usta por confusion . Los ejemplos de confusi6n positiva son abundantes, incluyendo la mayorfa de los que se usaron antes en este capitulo (por ejemplo, sexo/malaria frente a ocupaci6n, el cual serfa analogo al ejemplo n .o I en la Tabla 5.7,0 el ejemplo de consumo de vitamina C/dncer de colon frente a estilos de vida saludables, posiblemente comparable al ejemplo n.o 3 en la Tabla 5 .7) . Los ejemplos del n.o 4 al 6 en la Tabla 5.7 muestran la situaci6n inversa - es decir, confusi6n negativa, en la cual el riesgo relat ivo no ajustado es un «estimado por defecto» del ajustado (frente a la hip6tesis nu la). EI aj uste pone de manifi esto 0 forta lece una asociaci6n que fue considerada como ausente (ejemplo n.o 4) 0 debilitada (ejemplos n .o 5 y 6) a causa de la confusion. Un ejemplo de confusion negativa, en el cual el riesgo relativo ajustado se encuentra bastante alejado de 1,0 cuando se Ie compara con el valor no ajustado, puede hallarse en un estud io de Barefoot et. al.\14l . Usando la escala de Hostilidad de Cook-Medley, que es una subescala del ampliamente utilizado Inventario Multifasico de Personalidad de Minnesota (IMPM) para medir constructos psicologicos, los autores exam inaron la relaci6n de la hostilidad con la incidencia de infarto agudo del miocard io. Aunque no se dieron los resultados sin aj uste alguno, se informo de que el riesgo relativo cambi6 de 1,2 cuando solamente se ajust6 para la edad y el sexo y a alrededor de 1,5 cuando la ten-
Tabla 5.7
Ejemplos hipotCtieos de ricsgos relativos ajustados y no ajustados segun tipo de conrusion (positivo 0 negativo) EJemplo N."
Tlpo de confusion
Rlesgo relatillo no aju stado
Aie sgo ralativo aju stado
2 3 4 5 6 7 8
Positillo Positillo Positillo Negalivo Negalivo Negalivo CualitativCl CualitativD
3,5 3,5 0,3 1,0 1,5 0,8 2,0 0,6
1,0 2,1 0,7 3,2 3,2 0,2 0,7 1,8
176
EPIDEMIOLOGiA lNTERMEDIA; CONCEPTOS Y APLICACIONES
sian arterial sist6lica, habito de fumar, trigliceridos, trabaja sedentario y desocu pacion sedentaria se incluyeron tambien en el modelo de regresi6n de riesgos proporcionales de Cox (vease el Capitulo 7. Secci6n 7 .4 .4) . Con atras palabras, se puede cond uir que una 0 mas de estas covariables adicionales (tension arterial, habita de fumar, trigliceridos, est ilo de vida sedentaria) fue ron confusores negat ivos de la asociaci6n entre hostilidad e incidencia del infarto de miocardia . Un caso extrema de confusi6n se tiene cuando su efeclo ocasiona la inversi6n de la direcci6n de la asociaci6n (Tabla 5 .7, ejemplos n.o 7 y 8), fenomeno que pucde designarse propiamcntc como confusi6n walitativtl . En el ejemplo n ." I. Secci6n 5 .1 , la raz6n de tasas crudas de morta lidad entre US/Venezuela es 8,7/4,4 = 1,98; sin embargo, cuando se usan las tasas ajustadas por edad, esta raz6n pasa a ser: 3,6/4,6 = 0,78 . Los patrones opuestos de la razon de tasas crudas y ajustadas se producen en virtud de la gran diferencia en las distribuciones de la edad entre eslOs dos pafses. A modo de resumen, la Figura 5.9 muestra representaciones esquematicas de efectos de confusion negativos, positivos y c ualitativos .
ej. 1
•
No ajuslado
D
Ajuslado
. . . . . ej.2
ej. 3
ej. 4
ej. 5
0,1
10
Riesgo relalivo
Figura 5.9. Ricsgos rclativos (RR ) 110 ajusta dos y ajustados : Se aprecia confusi6n negativa en los ejemplos 1 y 3 (los riesgos relativos ajustados estan bastante mas apart ados del valor nulo de 1.0 que los no ajustados): se aprecia confusi6n posiliva en los ejemplos 2 y 4 (los riesgos relativos ajuslados estan mas pr6ximos al valor nulo de 1.0 que los RR no ajuslados ). EI ejemplo 5 denota confusi6n en la que cambia la direcci6n de la asociaci6n (confusi6n cllalilaliva).
La direccion de l efecto de confusion (positivo 0 negativo) se puede inferir a part ir de las direcciones de las asociaciones del confusor con la exposicion y el desen lace, siempre que se conozcan . La Tabla 5.8 res ume 10 que debe esperarse para los cam bios debido al ajuste en funci6n de las direcciones de estas asociaciones . De esta manera, se espera una confusion positiva cuando la asociaci6n
LA IDENTIFlCACI6N DE ASOCIACIONES NO CAUSALES ; CONFUSI6N
177
Tabla 5.8 Direcciones de las asociaciones del conrusor con la exposicion y eI descnlace y 13 expectativa de cambio de la estimacion con el ajuste. (Se asume una relacion directa entre exposicion y descnlace, es decir, para exposicion/no exposicion, RR, u odds ratio> 1,0) La asoclaclon del confusor con la exposlcion es
La asociacion del confusor con el desenlace es
TIpo de confusion
Expectatlva de camblo del estimado no ajustado al ajustado
Direcla" Direcla' Inversal Inversal
Direcla" Inversa t Inversat Direcla'
Posiliva' Negalival Posiliva l Negaliva!
No Ajuslada > Ajuslada No Ajuslada < Ajuslada No Ajuslada > Ajuslada No Ajuslada < Ajuslada
• Asociaci6n directa; la prasancia de l confusor sa ralaciona con un aumanto da probabilidad da la axposicion 0 al desanlace. • Asociaci6n inversa: la prasencia de l confusor se reiadona con una dism inlJCi6n de la probabi lidad de la axpo-sicion 0 del desanlace. • Confusi6n positiva; cuarnlo el electo de coofusi6n resulta en una medida no ajustada de asociad6n (por ajam· plo. riesgo relativo) bast ante mas apartada de]a hip6tasis nula que el astimaoo ajustado. I Confusi6n negativa: cuarnlo al efecto de confusion rasulta an una madida no ajustada de la asociacion mas pr6xima a la hip6tesis nula que a l astimado ajustado.
entre e l confu sor y la exposicion esta en la misma direccion de la asociacion entre e l confusor y e l desenlace . Cuando estas asociaciones estan en direcciones divergentes, habra una confu si6n negativa (0 una confusion c ua litat iva, en c asos extremos) .
SA5. Significacion estadistica en la evaluacion de la confusion Es inapropiado descansar en la significacion esladfslica para idenl ificar la confusi6n. especialmente cuando, ya sea la expos ici6n (en esl udios de c asos y conlroles) 0 e l desenlace (en estudios de cohone) varian marcadamenle con relacion a la variable de confu si6n. Por ejemplo, en un est udio hipotetico de c asos y conlroles donde se exam ina la relacion de oc urrencia de menopau sia con la enfermedad Y, en mujeres con edades entre 45 y 54 anos, pequenas diferencias estadfslicamente no significalivas en la edad entre los c asos y los controles pueden c au sar un efeclo confu sor imporlanle en visla de la fuerte relacion enlre la edad y la presencia de menopau sia en esle intervalo de edad. Po r tanIo , aunque no hay asociacion de ninglin lipo entre la oClIrrencia de menopau sia y enfermedad, s i para c ada ano de edad e l odds de menopa usia hipoteticamenle se incrementara de I: I a 1,5 : I (para un incremento de prevalencia de la menopa usia de l 50 % al 60 %), una diferencia de edad entre los casos y los conI roles tan pequena como lin ano (Ia c ual puede no ser esladfsticamenle significat iva si la m uestra del estudio no es grande) resultarfa en un odds ratio de 1,5 para la menopausia no ajustada po r la edad (Figura 5. 10) . Para aquellos que deciden usar e l valor p como crilerio para idenl ificar confusion, serfa ju icioso e l uso de un valor p mas dndll igente» (conservador) como gufa para identificar confusores: ejemplo , 0,20 . Procediendo asf se permite la posibilidad
178
EPIDEMIOLOGiA lNTERMEDIA ; CONCEPTOS Y APLICACIONES
2
CaSDS
Conlroles
0+--47
48 Edad media (anas)
Figura 5.10 Odds de la ocurrcncia de mcnopausia en un estudio hipotCtico de casas y cOlltroles. El odds de menopausia se incrementa en un 50% por cada aiio de edad. correspondiendo a una diferencia absoluta de 10% en la preva\encia de menopausia (en este ejemplo 60% y 50% en casos y controles respectivamente). Los casas y los controles tienen un ano de diferencia en edad. De modo que. el odds ralio de 15 (15 / 1,0) retleja completamente la diferencia de edad y no es consecuencia de una asociaci6n entre menopausia y enfennedad.
de aceptar 1a presencia de confusi6n ann cnando haya pequefias dife rencias entre casas y controles en los est udios de casas y comroles . 0 entre sujetos expuestos y no ex pues(Qs en est udios de cohorte. Esta estrategia, sin embargo, no deberfa sust ituir la consideracion del investigador con respecto a la Jorraleza de las asociaciones del presunto confusor con la exposic ion y el desenlace como medio para identificar confusi6n .
5.4.6. Confusion condicional Una presunta variable de confusi6n puede estar confundida por otras variables. Siendo aSI, una evaluaci6n univariada puede sugerir que una variable Z es un confusor, pero la misma variable puede no actuar como confusora c uando se ajusta por otras variables . De modo similar, puede que Z no aparezca como confusor univariadamenIe porque esta negativamente confundida por otras variables, y en este caso el efec(Q de confusion de Z puede hacerse evidente despues del ajuste .
5.4.7. Confusion y sesgo (. Debe considerarse la confusi6n como un tipo de sesgo de selecci6n? Algunos libros de texto de e pidemiolog la consideran que la confusi6n es Olro tipo de sesgo (por ejemplo, Rothman y Greenland('S)), esencialmente porq ue una asociaci6n confund ida puede entenderse como un «estimado sesgado» de una asociaci6n causal
LA IDENTIFlCACI6N DE ASOCIACIONES NO CAUSALES , CONFUSI6N
179
(aq uella q ue se expresa por el estimado aju stado , supon iendo que e l proced imiento de ajusle es apropiado y no esta sujeto a confusi6n resid ual). En contraste , otros libros de texto (por ejemplo, Lilienfeld y Stolley(16) y Gordis(l7)), dife rencian entre asociaciones ••espurias» debidas a sesgo y asociaciones «ind irec t as~) (0 «estadfsticas>,) debidas a la confusi6n, sug iriendo as! q ue conjusi6n es distinta de sesgo. La 16gica de mantener la confusi6n como algo conceptualmente diferente al sesgo se puede describir como sigue . S uponiendo que no hay variabilidad aleatoria. se muestra una representacion esque matica de confusion y sesgo en las Fig uras 5 .11 y 5.12, res pect ivamente . En estas figuras, los cfrc ulos re present an casos 0 controles, Z e l factor de confusion y X la exposic ion de interes. Los cfrcu los grandes y peq uefios denotan la poblacion de referencia y los subconjuntos de muestras del estudio, respectivamente. En la Figura 5 .11 , la proporci6n de Z (por ejemplo, habito de h lmar) en la poblacion de referencia es en verdad mas grande en los casos que en los controles: as!, c ualqu ier factor relacionado con Z, tal como X (por ejemplo, consumo de alcohol), es mas frecuente en los casos. En la confusion, las m uestras del est udio refl ejan muy bien e l hecho de que X (po r conducta de Z) es mas com lin en casos que en controles . Por otra parte, en la Figura 5.12, la proporci6n de casos y controles en los q ue Z esta presente es la misma que la de la poblaci6n de referencia; sin embargo, en las muestras, e l sesgo de se leccion ha resultado en casos que tienen una proporcion mas a lta (espuriamente) de Z (y por tanto de X) que los controles. Considerese, por ejemplo, un estudio de casos y controles en que los casos proceden de hospitales que adm iten preferentemente a pacientes con una alt a SSE, y los controles se e ligen de entre los no casos de la poblacion de referencia . Como resu ltado de este tipo de sesgo de selecci6n, se observaran asociaciones positivas de exposiciones relacionadas con alta SSE .
Poblaci6n de referencia
Muestra del estudio
w(D a'cD
do
ok
Z '" Con/usof X :0 Presunlo !actof de riesgo
Figura 5.11. Rcprcscntaci{m esquenui tica de la conrusion. En la poblaci6n de referencia. el factor de confusi6n Z es real mente mas comun en los casos que en los controles. Suponiendo que no hay variabilidad aleatoria.la frecuencia mas alta de Z en los casos (representados por las areas de intersecci6n sombreadas de los cfrculos) se refleja la muestra en que se basa el estudio. y como resultado, la frecuencia de exposici6n de interes X (que. por definici6n. se relaciona con Z) es mas alta en los casos que en los controles.
180
EPIDEMIOLOGiA lNTERMEDIA; CONCEPTOS Y APLICACIONES
CASOS ...... Poblaci6n
de referencia
(
O
Muestra del
esludio
~··CD······..: \
l................... / /
~ JAu
Ole[)
ok
z ~ Factor relacionado con la selecci6n (por ejemplo, SSE alia) X '" Presunto factor de riesgo
Figura 5. 12. Rcprescnta cion esqucma lica del sesgo de seleccion. En la poblaci6n de referencia.la proporci6n del factor Z es la misma en los casos y en los controles. Suponiendo que no hay variabilidad aleatoria. la frecuencia mas alta de Z en la muestra de casos (representados por las areas de intersecci6n sombreadas entre los cfrculos que denotan casos y Z) es el resultado del sesgo de selecci6n dot:de la elecci6n de los casos esla intluida por la presencia de Z. SSE . situaci6n socioecon6mica.
Esta dist inci6n conceptual entre confusi6n y sesgo, qu izas solo sea de interes intelectual c uando se evallian relaciones causales (porque, para aceptar una relaci6n como causaL tanto la confusion como el sesgo tienen que poder ser descartados como explicaci6n probable); en todo caso, se torna importante c uando los resultados epidemiol6gicos se consideran en el contexto de la practica de la salud publica . Aunque la confusi6n se clasifique 0 no como sesgo, hay un papel claro para asociaciones verdaderas, aunque esten confundidas, ya que permiten la identificaci6n de trazadores que pueden ser utiles para definir gmpos de alto riesgo con vistas a la prevenci6n secundaria . Como se resume en el Esq uema 5.5, a los efectos de la prevenci6n primaria tiene que ex ist ir una asociaci6n causal entre el factor de riesgo y la enfennedad; en otro caso, la modificaci6n de dicho factor no conducirfa a una reducci6n del riesgo de padecerla. Sin embargo, para la prevenci6n secundaria, es suficiente que exista una asociaci6n estadfsrica entre el factor de riesgo y la enfennedad, al margen de que tal asociaci6n sea 0 no causaL Un ejemplo es la relaci6n de niveles altos de trigliceridos sericos (TO) y la enfermedad arteriosc ler6tica. Durante afios, ha reinado incert idumbre con respecto al papel independ iente de niveles altos de TO sobre el desarrollo de arteriosc lerosis, ya que esta relaci6n podrfa ser un mero reflejo de la fuerte relaci6n inversa entre altos niveles de TO y bajos niveles de HDL que estan causalmente enla7.acio~
a l ciesarrollo cie
arle riosclerosi~
(Figllra .<; .1 1) .
F. x i ~la
0 no lin nexo causa l
entre altos niveles de TO y arteriosclerosis, no hay dudas de que individuos con altos niveles de TO son mas propensos al desarrollo de la arteriosclerosis. Por tanto, a diferencia de una relaci6n espuria resul rante de sesgo. una relaci6n verdadera, aunque confundida, permite la identificaci6n de individuos con gran probabilidad de ocu rrencia de la enfermedad.
LA IDENTIFlCACI6N DE ASOCIACIONES NO CAUSALES , CONFUSI6N
181
Esquema 5.5. La relacion entre tipos de evidencias necesarias en estudios epidcmiologicos y tipo de prevencion Ilevada a cabo (primaria 0 secundaria) OBJETIVO Prevenci6n primaria: prevenci6n 0 cese de la exposici6n aJ factor de riesgo. (por ejemplo, consumo de grasa salurada y arteriosclerosis) .
Prevenci6n secundaria: diagoostico temprano a Iraves de tamizaje selectivo en sujelos de allO riesgo (por ejemplo, tipificaci6n de individuos con niveles alios de Irigliceridos).
TlPO DE EVIDENCIA NECESARIA La asociaci6n causaJ debe eSlar presente; de otro modo, la inlervenci6n sobre et factor de riesgo no afectara el desenlace de la enfermedad. Por ejemplo. si la grasa no causa la arteriosclerosis. un con sumo bajo de grasas no afecta el riesgo de padecerla. La asociaci6n puede ser causal 0 eSlad islica (Ia ullima no puede ser sesgada): esto es, la asociaci6n puede ser confundida. Por ejempto. aunque los individuos hipertrigliceridemicos tengan una probabilidad mayor de desarrollar la enfermedad arterioscler6tica debido al efecto confusor de los niveles bajos de lipoproleinas de alia densidad, la arteriosclerosis es realmente mas comun en estos individuos.
Trigliceridos elevados
HDL bajo
?
Arterioesclerosis
Figura 5.13. Relacion entre hipertrigliceridemia, bajos niveles de colesterol de alta densidad y arteriosclerosis
55. CONCLUSION La confusi6n acompafiada de sesgo constituye un notable inconveniente para la evaluacion de relaciones causales . En este capItu lo se discutieron vados aspectos relacionados, tanto con la definici6n de efec(Qs de confusion, como con vados enfoques para verificar la presencia de confusion . La evaluacion de la confusi6n antes de hacer aj ustes se destaco como medio para la prediccion de la magnitud y la direcci6n
182
EPIDEMIOLOGiA lNTERMEDIA ; CONCEPTOS Y APLICACIONES
de posibles cambias (sf se diem ese caso) en la medida de asociaci6n detectada mediante ajuste. EI concepto de confusi6n residual (que se d isclite ademas en el Capfmla 7), se imrodujo en este capitu lo, as! como la noc i6n de que las prucbas estadfsticas de significaci6n no deben usarse como un criteria para evaluar la confusi6n. FinalmenIe , se discuti6 1a 16gica para no clasificar la confusion como un tipo de sesgo,en eI con-
texto de la utilidad de asociaciones confundidas pem verdaderas; como un modo de identificar grupos de alto riesgo con prop6sitos de prevenci6n secundaria .
BlBLIOGRAFiA I. Organizaci6n Panamericana de la Salmi/Pan American Health Organization. Las cOlldiciolleJ de salmi ell las Americas. Washington, DC: OPSIPAHO : 1990, Publicaci6n Cientifica n," 524, 2, Davey Smith G, Frankel S. Yarnell J .Sex and death: are they related? Findings from the Caerphilly Cohort Study. Bf Med J 1997: 315: 1641-1644. 3. Smalley WE, Ray WA. Daugherty JR el al. No association between calcium channel blocker use and confirnled bleeding peptic ulcer disease. Am J Epidemiol 1998: 148: 350-354. 4. Heilbrun LK , Nomura A, Hankin JH el al. Diet and colorectal cancer with special reference to fiber intake.fnl J Cancer 1989:44: 1-6. 5. Broda G. Davis CE oPajak A el al. Poland and United States Collaborative Study on Cardiovascular Epidemiology: A comparison of HDL cholesterol and its subfractions in populations covered by the United States Atherosclerosis Risk in Communities study and the Pol-MONICA project. Anefios(Jer Thromb Vc/Sc Bioi 1996: 16: 339-349. 6. Manson lE, Stampfer MJ. Hennekens CH el al. Body weight and longevity: a reassessment. JAMA 1987: 257: 353·358. 7. Rush D. A correction by the author: «Maternal smoking: a reassessment of the associaIlon wIth pennatal mortality.» Alii J t'pidemiol 1Y7J: Y7: 425. 8. Breslow NE. Day NE . Slalislicalmelhods in cancer research. Vol. f. The analysis of case·col1lrol sludies. Lyon. France: International Agency for Research on Cancer Scientific Publications . 1980. 9. Shimakawa T. Sorlie P. Carpenter MA el al. Dietary intake patterns and sociodemographic factors in the Atherosclerosis Risk in Communities (ARIC) study. Prev Med 1994: 23: 769-780. 10. Miettinen OS. Cook EF. Confounding: essence and detection. Am J Epidemiol 1981: 114: 593-603. II . Greenland S. Absence of confounding does not correspond to collapsibility of the rate ratio or rate difference. Epidemiology 1996: 7: 498-50 I . 12 . Pandey OK. Shekelle R. Selwyn BJ e/ al. Dietary vitamin C and l3-carotene and risk of death in middle-aged men. The Westem Electric study. Am J Epidemiol 1995: 142: 1269-1278. 13 . Krie ger N, Williams DR , Moss NE. Measuring social class in US public health research: concepts. methodologies. and guidelines. Amw Rev Public Heallh 1997: 18: 34 1-378. 14 . Barefoot Jc, L1rsen S. von der Lieth L eI al. Hostility. incidence of acute myocardial infarction, and mortality in a sample of older Danish men and women. Alii J Epidellliol 199'1: 42: 477_41<4.
15 . Rothman K1. Greenland S. Modern t'pidemi%gy. 2nd ed. Philadelphia. Lippincott.Raven Publishers. 1998. 16. Lilienfeld DE , Stolley PD . Foundalions of epidemiology. New York. Oxford University Press. 1994. 17. Gordis L Epidemiology. Philadelphia. WB Saunders. 1996.
CAPITULO 6 Definicion yevaluacion de la heterogeneidad de efectos: Interaccion 6.1. INTRODUCCION El {enn ino interacci6n se emplea en epidemiologfa para descri bir una situaci6n en la ellal dos 0 mas factores de riesgo modifican el cfccto que cada ellal Ilene sobre la ocurrencia 0 eI nivel de un desenlace dado. Este fenomeno, tambitn conocido como modificacion de efectos. debe dist ingu irse de la confusion. Tal como se discllt i6 con dctalle en e l Capitulo 5, la confusion concierne a la situaci6n en la e llal una variable que se asoc ia tanto con la exposici6n como con el desenlace de interes es responsable enteramente 0 en parte de la asociaci6n estadfstica observada entre la exposici6n y el desenlacc. La interacci6n entre lIna variable dada (modi fi cador de efec(Os) y dena exposic ion es un fen6meno diferente, tal y como se detalla en las sigu ientes secciones. Con respeclo a las variables dicotomicas, la illleraccion signi fi ca que el efecto de la exposic ion sobre e l desenlace difiere en dependencia de si olra variable (modifi cador de efectos) esta 0 no presente. Si la presencia del efecfO modificador potencia (acentua) e l efecto de la exposic ion de interes, entonces esta variable y la exposici6n se consideran J'inirgicas (interaccion I'ositiva); si la presencia del modificador de efecto d ism inuye 0 elimina eI efecto de la exposici6n de interes, puede decirse entonces que e l efecto modificador y la ex posici6n son antugoniJ·tuJ· (interacci6n ncgativa). Este concepto puede ser eXlendido a variables continuas . En este contexfO, el fenomeno de la interaccion signi fi ca que el efecfO de la exposicion sobre e l desenlace difiere depend iendo del nivel de otra variable (la modificadora de efecto). AI menos tres factores son necesarios para que el fenomeno de la interacci6n se presente . En este capitulo, e l principal factor de riesgo impmado sera designado como facfOr A, la variable que representa el desen lace, como Y, y el tercer facfOr (modificador potencial de efecfO) como Z. Adicionalmente, aunque se reconoce que hay diferencias en medidas relativas y absolmas segun que se reHeran a un riesgo, lasa u odds, los terminos genericos riesgo, rie.\'go arribuible y rie.\·go relarivo seran fundamentalmente los empleados . Por otra parte, e l tenn ino hOlllogcncidad indica que los efectos de un fac tor de riesgo A son homogeneos 0 similares para los diferentes estratos fonnados por el factor Z. Heterogeneidad de efecfOs, por tanto, alude a fl lle
ra l e~ efeclo~
ciifieren entre
~ i.
La discusion que sigue se basa en muy buena medida en la situacion mas simple, aque lla que involucra a la interacci6n entre dos variables con dos categorfas cada una, con un desenlace discreto (por ejemplo , la enfermedad esta 0 no presente) y con asociaciones positivas (es decir, caraclerizadas por un riesgo relat ivo mayor que 1,0). Dtros tipos de interacci6n que pueden ser evaluadas, pero que no se d iscuten en
184
EPIDEMIOLOGiA lNTERMEDIA; CONCEPTOS Y APLICACIONES
detalle en este libra, abarcan los que se basan en mas de dos variables .; diferemes aunq uc compatibles. Cada definicion conduce a una estrategia especffica para la evaluaci6n de la imeracci6n .
1. Definicion basada ell la IlOlIIogeneidad 0 la heterogeneidad de los efecto.\": La interacci6n ocurrc cuanda eI efcc(O de un factor de riesgo A sobre eI riesgo de que se prod uzca un desenlace Y no es homogeneo para los distintos estratos fo rmados por una tercera variable Z. Cuando es esta la defin ici6n que se emplea. la variable Z suele ser cali ficada como lIIodiJicadora de eJeeto. 2. Defillici6n bas{/(ia en fa eOlllparaci611 entre efeetos cOlljllntos observados y espemdo.\· liel factor lie riesgo A y IIlIa tercera variable Z: La interacci6n se produce c uando el efecto conjunto observado de A y de Z difiere del que cabe esperar si los efectos de A y de Z fueran independientes.
6.2. (,COMO SE MlDE EL EFECTO? Una decisi6n importante en la evaluaci6n de la interacci6n usando c ualquiera de las dos defin iciones concierne a c6mo medi r el efecto. EI efecto puede ser medido ya sea a traves del riesgo atribuible (Illodelo aditivo) 0 med iante la diferencia relativa, por ejemplo. usando el riesgo relativo (IIIOc/eiO IIIlI/riplicarivo). La base conceptual para la evaluaci6n de la interacci6n, sin embargo, es la misma para ambos modelos.
6.3. ESTRATEGIAS PARA EVALUAR LA INTERACCION 6.3.1. Evaluaci6n de la homogeneidad de efectos La variabilidad en materia de susceptibilidad a que se produzca determinado desenlace, dada una exposici6n a un factor de riesgo, rellejada como heterogeneidad entre individuos del efecto del factor de riesgo, parece ser un fen6meno universal tanto para enfermedades infecciosas como para no infecciosas . Por ejemplo, induso cuando estamos ante una asociaci6n fuerte, tal como la que se produce entre el habito de fumar y el cancer pu lmonar, no toda persona expuesta desarrolla la enfennedad. Suponiendo que el azar no desempefia papel alguno en determinar qu ienes entre los fumadores desarrollan cancer pulmonar, ello demuestra que fumar en sf mismo no es una causa suficiente . As!. los fumadores que desalTollan cancer pulmonar probablemente difieran de aq uellos fumadores que no 10 desarrollan en que algun otro componente causaf) debe estar presente entre fumadores que desarrollan cancer pulmonar para hacerlos susceptibles de tener una enfennedad inducida porel habito. La presencia de este componente causal necesario puede ser concebida genericamente como un factor de susceptibilidad, que pudiera estar genetica 0 ambientalmente determinado .
DEFINICION Y EVALUACION DE LA HETEROOENEIDAD DE EFECTOS
185
Una represemaci6n eloc uente aunque simplista del marco conceptual para la interaccion definida como heterogeneidad de efectos se muestra en la Figura 6.1. Tras observar que existe una asociacion estadlstica entre un factor de riesgo A y un desenlace morboso Y, y admitiendo como razonablememe cierto que la asociacion no se debe a confusion 0 sesgo, la pregunta cmcial en la evaluaci6n de la interaccion es: (, Varia la magnitud 0 la direcci6n del efecto A sobre Y concordamememe con la oc urrencia de alguna otra variable Z en la poblaci6n que se est udia? Una res puesta posit iva sug iere la presencia de interaccion. Por ejemplo, puesto que la diabetes es un factor de riesgo mas fuerte para la enfermedad coronaria (EC) en mujeres que en hombres, se puede concl uir que hay interacci6n: esto es, que el genero mod ifica el efecto de la diabetes sobre el riesgo de Eel). La conceptualizacion de interacci6n como ocurrencia de heterogeneidad de efec(Os de A (por ejemplo, la exposici6n al asbesto) de acuerdo con la presencia 0 ausencia de Z (por ejemplo, fumar) explica por que la expresi6n, lIIodificaci6n de cicero se usa como sinonimo de interaeci6n. Por ejemplo, el lenguaje apropiado a la hora de describir la imeracci6n entre el habi(O de fumar y el asbesto en relacion con el riesgo de cancer pulmonar es que, «el efecto de la exposici6n al asbes(O sobre el riesgo de cancer pulmonar es modificado por el habiw de fumar cigarrillos en el sentido de que es mucho mas fue rte en fumadores que en no fumadores». La expres i6n lIIodifi· cador de eJeero sugiere que el investigador ha eleg ido algun tipo de nivel jerarquico en la aproximaci6n a dos variables independientes: A es la variable fundamemal de interes y Z es el modificador de efec(O . Desde el punto de vista prevent ivo, la varia-
/.Hay asociaci6n entre ellaclO! de tiesgo X y la enfermedad?
Si
/.Es ella debido a sesgo 0 confusi6n?
Si
No
/.Es la asociaci6n en los subgrupos de similar magnilud?
~
Asociaci6n espuria 0 debida a confusi6n
Existe interacci6n 0 modificaci6n de efectos
0;No hay interacci6n
Figura 6.1. Marco conceptual para la definicion de interaccion basada en eI concepto de homogeneidad
186
EPIDEMIOLOGiA lNTERMEDIA; CONCEPTOS Y APLICACIONES
ble no susceptible de intervenci6n (por ejemplo , un gen) es usualmente considerada como modificador de efecto, en contraste con lIna exposic ion que puede ser preven ida 0 eliminada. Tal y como se mencion6 previamente, un aspecto clave en la evaluaci6n de la interacci6n es que esta involucra al menos a tres variables: el factor principal de imeres A (por ejemplo , d iabetes), e l modificador de cfccto potencial Z (por ejemplo, genera), y un desenlace especffico Y (por ejemplo, enfermedad coronaria). Pucden existir, sin embargo, mas de dos variables independientes interact uando: por ejemplo . si la d iabetes es un factor de riesgo mas imponante para las mujeres que para los hombres solo entre aquellos suje{Qs mas viejos. En este ejemplo hipotetico. la presencia simultanea de dos variables sedan necesarias para modificar el efecto de la d iabetes: genero yedad.
Deteccioll de interaccion aditiva: fa diferencia absofllta 0 lIlodelo de riesgo atribllible La interaccion aditiva se presema cuando el riesgo atribuible en los expuestos al factor A (RA..p , es decir, la d iferencia absolma de los riesgos entre los expuestos y los no expuestos a A; vease Capitulo 3, Ecuaci6n 3.4) varfa (es heterogenea) en la med ida que cambia una tercera variable Z. La manera mas simple de evaluar la interaccion en este ejemplo consiste en calcular los riesgos atribuibles para aquellos que estan expuestos al factor de riesgo A para cada estrato definido por los niveles del modificador de efecto potencial Z. Ejemplos hipoteticos de esta estrategia para evaluar imeracci6n aditiva se muestran en la Tabla 6.1 y 6.2. En la Tabla 6.1, el exceso de riesgo absoluto de Y atribuible a A no se modi fica en la medida que cambia la exposici6n a Z. En la Tabla 6.2, el riesgo atribu ible para A es mayor para aquellos que estan ex pues{Qs a Z que para los que no 10 estan, 10 que indica heterogeneidad de los efectos absolutos de A. Notese que, en estas tab las hay dos categorfas de referenda diferentes para los riesgos atribuibles asociados con A: para e l estrato en el cual Z esta ausente, la categorfa de referencia es Z auseme, A ausente: para el estra{Q en el cual Z esta presente la categorfa de referencia es Z presente, A ausente. Los patrones mostrados en las Tablas 6.1 y 6.2 pueden examinarse graficamente (Figura 6.2A). Se emplea un grafico con escalas aritmeticas para evaluar la imerac-
Tabla 6.1 Ejemplo hipotCtico de ausencia de interaccion a ditiva Ta sa de incidencia (por 1.000)
Riesgo atribuible (por 1.000)"
z
A
No
No
10,0
o
Sf
20,0
10,0
No
30,0
o
Sf
40,0
10,0
Sf
• Riesgo atribu ible de A dentro de los estratos de Z.
187
DEFINICION Y EVALUACION DE LA HETEROOENEIDAD DE EFECTOS
Tabla 6.2 Ejemplo hipotctico de presencia de interacci{m aditiva
z
A
Tasa de Incldencia (por 1.000)
Rlesgo atribuible (por 1.000)'
No
No
5,0
o
Si
10,0
5,0
Si
No
10,0
o
Si
30.0
20.0
Riesgo alribu ible de A dentm de kls estratos de Z.
A. Inleracci6n aditiva Ausente
Presente
§100
§ 100
80
80
b
>
6()
z. z-
6()
~ ,. ~ •
~
••
40
~0 20 ~
~
•
~
••
60 40
~0 20 ~
•
0
A-
b
>
~
A. S, Interacci6n
90
3~ 1~ A-
Presente
§ 100
b >
8. 3()
v?
••
~
~
if
15 10
10
A-
A.
multi~icaliva
§100
•
z-
0
Ausenle
~
z.
A.
z. z-
90 Z+
>
•
~
••
15
~
~
if
10
20
z-
10
A-
A.
Figura 6.2. Evltluacion de la interal'Cion pur medio de gnificos. Pam la intemcci6n aditiva (A), sc emplean escalas aritmeticas en las ordenadas (las pendientes representan diferencias absolutas). La intemcci6n esta auscnte en el panel de la izquierda porque la diferencia absoluta entre A+ y A· es la misma, independientemente de la presencia de Z (60 - 30 = 40 10 = 30 por I (X){). La intemcci6n esta presente en el panel de la derecha porque la diferencia absoluta entre A+ y A- es mayor cuando Z esta prescnte (90 - 30 = 60 por I J){)O) que cuando Z esta ausente (40- 10 = 30 por 1.000). Para la interaccion multiplicativa (B), ha de emplearsc una escala logarftmica en las ordenadas (las pendientes representan diferencias relativas). La interaccion esta ausente en el panel de la izquicrda porque la diferencia relativa entre A+ y A- es la misma, independientemente de la presencia de Z (30115 = 20/ 10 = 2). La interaccion esla presente en el panel de la derecha porque la diferencia relativa entre A+ y A- es mayor cuando Z esta presente (90/ 15 = 6) que cuando Z esta auscnte (20/ 10 = 2).
188
EPIDEMIOLOGiA lNTERMEDIA; CONCEPTOS Y APLICACIONES
cion aditiva. Los riesgos para carla categorfa del factor de riesgo A son ubicados en e l sistema de ejes separadamente para individuos ex pucslos y para aquellos que no estan expucstos a la tercera variable Z. En este tipo de graficos (aritmCiicos), la inclinaci6n (magnitud de las pendientes) es una fllnd6n de las diferencias absolutas. As!, cuanda la diferencia absoluta en el riesgo del desenlace (riesgo atribuible en aquelIos que estan expuestos a A) es la misma, independientemente de la exposici6n que se tenga a Z, las dos Iincas son paralelas. Cuanda las diferencias absoluta difieren, 10 que pone de manifiesto interacci6n aditiva, las Ifneas no son paralelas.
Deteccioll de inleraccioll multiplicativa: fa diferellcia refativa 0 modelo de razon La interacd6n multiplicativa se con~ idera presente cuando la diferenda rei at iva (razon) en e l riesgo de un desen lace Y entre sujeros expuestos y no expuestos a un presunto facto r de riesgo A difiere (es heterogeneo) como una fundon de una tercera variable Z. En las Tablas 6.3 y 6.4 se muestran ejemplos hipoteticos de la evaluadon de la interacdon multiplicativa. (N6tese que, consistentemente con las Tablas 6.1 y 6.2, hay dos categorfas de referenda diferentes para los riesgos relativos asociados con A: para el estrato en e l cual Z esta ausente, la categorfa de referenda es Z ausente, A ausente; para el estrato en el cual Z esta presente, la categorfa de referenda es Z presente, A ausente). En la Tabla 6.3, e l riesgo relativo para A es e l mismo tanto para aquellos que estan expuestos a Z como para los que no 10 estan .
Tabla 6.3 F.j.. mrio hirotelko til' 1I11..... nda til' int"r!I~d{m mnitiriklltil'1I
z
A
Tasa de incidencla (por 1.000)
Rlesgo atrlbulbte (por 1.000)"
No
No
10,0
1,0
Sf
20,0
2,0
Sf
No
25,0
1,0
Sf
50,0
2,0
, Riesgo relativo de Adentro de kls estratos de Z.
Tabla 6.4 Ejemplo hipotCtico de interaccion multiplicatil'a Tasa de incidencla (por 1.000)
Rlesg o atrlbulbte (por 1.000)"
z
A
No
No
10,0
1,0
Sf
20,0
2,0
Sf
No
25,0
1,0
Sf
125,0
5,0
, Riesgo relativo de Adentro de kls estratos de Z.
DEFINICION Y EVALUACION DE LA HETEROOENEIDAD DE EFECTOS
189
En la Tabla 6 .4. el riesgo relativo para A es mayor para aquellos que estan expuestos que para los que no eSlan expuestos a Z, 10 que sugiere que los efectos de A medidos como riesgo relat ivo son heterogeneos en los que concierne a Z. AI igual que para la interacci6n adit iva, la interacci6n multipl icat iva puede ser evaluada graficamente mediante la ubicaci6n en el grafico de las tasas para cada categoria de A de acuerdo a los eSlratos definidos por Z (Figura 6.2 8 ). Para la evaluacion de la interacci6n multiplicativa, sin embargo, se emplea una escala logarftmica en el eje de ordenadas . Asi, la incl inaci6n de las pendientes es una funci6n de las diferencias relativas: cuando las razones de riesgo para A son iguales para expuestos y para no expuestos a Z, las curvas especfficas para Z son paralelas, eslO indica la ausencia de interacci6n mu ltiplicativa. Las lineas no paralelas sugieren la presencia de interaccion multiplicat iva .
63.2. Comparaci6n de efectos conjuntos observados y esperados Como ya fue disc utido, una defin ici6n alternativa de interaccion se asoc ia a la situacion en que el efeclO conjunto observado de A y Z difiere del esperado . EI efeclO conjunto esperado puede est imarse apl icando el supueslO de que los efectos de A y Z son independientes. As!, para comparar efectos conj untos observados y esperados de A y Z, es necesario est imar primero sus efectos independientes. Como ocurrfa en la evaluacion de la homogeneidad, la estrategia de comparar los efectos conj untos esperados y observados se basa en un marco conceptual comun, tanto para modelos ad itivos como mulli plicat ivos: la unica diferencia entre estos modelos radica en que se emplea la diferencia relativa 0 absoluta en la evaluaci6n de la interaccion . EI marco conceptual que subyace a tal estrategia se muestra de manera esquemalica en el Esquema 6.1. En este esquema, los rectangulos designados con las letras A y Z representan los efectos independientes del factor de riesgo potencial A y del modificador de efecto Z . Si no hay interacci6n c uando la exposic ion se produce en ambos factores, entonces el efecto conj unto debe coincidir con la suma de los efectos independientes, como se representa mediante el rectang ulo A + Z en el Esquema 6.lA . (EI tennino suma no se usa aquf en el contexto de una simple suma (aritmetica), 10 que 10 limitarfa al modelo adilivo; mas bien, este alude a los efectos combinados de A y Z). En el Esquema 6.1 B, el efeclO conjunto observado excede el efecto conjunto esperado . EI area a la derecha de la linea punteada representa el exceso debido a la interaccion. Puesto que el efecto conjunto observado es mayor que el esperado, hay una interaccion posit iva 0 sinergismo . Sin embargo, si el efecto conjunto observado de A y Z es menor que el esperado, entonces hay una interacci6n negativa 0 antagonismo (Esq uema 6.1 C).
Detecciotl de itlteracciotl aditiva: la diferetlcia absoluta 0 lIlodelo del riesgo atrwuible Cuando se evalua la presencia de interacci6n ad itiva mediante la comparaci6n de efectos observados y esperados, el efecto conj unto de A y Z se estima como la suma aritmetica de los efectos independientes medidos mediante riesgos atribuibles en sujetos expuestos (RAexp). EI Esquema 6.2 presenta dos ejemplos hipotelicos que
]90
EPIDEM IOLOGiA lNTERMEDIA ; CONCEPTOS Y APLICACIONES
E.iq uema 6. 1
Ma rco conceptual de 13 definicion de intcr accion basada ell 13 compar acioll de cfedos conjuntos cspcr ados y o bscr vados A. Cuando no hay interacciOn, el ejecta conjunto de los l actores de riesgo A y Z as igual a la suma de sus efeclos indepen dientes:
z
A
Esperado Observado B. Cuando hay una interacci6n posifiva (sinergismo) el ejecto conjunlo observado de los facio· res de riesgo A y Z as mayor que el esperado cuando se suman los efeclos independientes deAyZ:
z
A
Expectador Observador • "Exceso· detlido a interacci6n positiva,
C. Cuando hay una inleracci6n negaliva, la suma de las areas para e/aclas independientes A y Z deberfa ser de la misma Iongilud que 10 . esperado», con Iongilud menor para 10 Qobservaoo" .
z
A
Expectador
Observador • 'Thificit" deDido a inleracci6n negaliva
muestran la ausenda (A) y la presencia (8 ) de interacd6n aditiva . El primer paso es calc ular las tasas de inddenda para cada una de las c uatro celdas de la tabla defi nidas por los factores A y Z . La celda que representa la ausenda de ambas exposic iones (-1-) se designa como la categorfa de referend a. Los riesgos atribuibles observados en el Esquema 6.2 represeman las dife rendas observadas en la inddenda absol u{a entre cada categorfa y la categorfa de referenda . De esta manera, es posible separar los efectos independientes observados de A y Z Y asf estimar el efecto conjunto. Los sign ificados de las diferemes categorfas en el Esquema 6 .2 se describen en la Tabla 6.S.
DEFINICION Y EVALUACION DE LA HETEROOENEIDAD DE EFECTOS
191
Esquema 6.2
Detecci{m dc intcraccion a traves de la comparacion de cfcdos conjuntos esperados y obscrvados: intcraccion aditiva A. No hay interacci6n aditiva.
Z
•
lasas de incidencia observadasll.OCO
Riesgos atribuibtes observadosl1.000
A
A
-
•
10,0
30,0
20,0
40,0
Z
•
-
•
0,0
20,0
10,0
30,0
RA conjunlo esperado '" 10,0 + 20,0 '" 30,0 RA conjunlo observado '" 30.0
B. Interacci6n adiliva presente. Tasas de incidencia observadasll .000
Riesgos atribuibles observadosll .000
A
A
Z
-
•
Z
-
•
-
10,0
30,0
-
0,0
20,0
•
20,0
<;0,0
•
10,0
50,0
RA conjunlo esperado '" 10,0 + 20,0 '" 30,0 RA corjunlo observado '" 50,0
Tabla 6.5 Evaluacion de la intcraccion: modelo aditiyo Factor Z
Factor A
Los rles90 atrlbulbles observados representan
Ausente Ausente
Ausente Presente
Presente
Ausente
Presente
Presente
Categoria de relerencia '" 0,0 Electo independienle deA (ej, en ausencia de Z}(ej. , en el Esquema 6.2A, 30,0-1 0,0 '" 20. 0) Electo independienle de Z (ej, en ausencia de A)(ej ., en el Esquema 6.2A, 20,0·10,0 '" 10, 0) Electo conjunlo de A y Z (ej, en Esquema 6.2A, 40.0-10,0 '" 30, 0)
La estimaci6n del efec(Q conjunto esperado (Esp) de A y Z med idos medianle el riesgo atribu ible (RA) se lleva adelante medianle la simple suma de los riesgos atribuibles independientes que se han observado (Obs), de la manera que sigue:
EPIDEM IOLOGiA lNTERMEDIA ; CONCEPTOS Y APLICACIONES
192
IEcuacion 6. IJ
As!, el riesgo atribuible conjunto esperado en el ejemplo que se recoge en el Esquema 6.2A es 20,0 + 10,0 = 30,0 i 1.000. Este efec!O conjunto esperado es iden{ieo a1 efeclo conjunto observado, 10 eual indica ausencia de imeracci6n adillva. Por otra parte, el cfccto conjumo observado que se muestra en el Esq uema 6.2B. que asciende a 50.D/l.OOO. es mayor que eI riesgo atribuible esperado de 30,0/ 1.000, 10 e llal indica que hay interacci6n adiliva posit iva. EI efeclo conjunto esperado (Esp) tambien puede estimarse mediante una incidencia conjunta esperada. del modo que se muestra a continuaci6n:
IEcuacion 6.2J Esp IncA+z+ = Obs IncA_z- + (Obs IncMz- - Obs IncA_z-) + (Obs IncA_z+- Obs IncA_z-) = Obs Ine,,_z- + Obs RA A+z- + Obs RA,,_Zt Por ejemplo, para el Esquema 6.2B Esp IncA+z = 10,0 + (30,0 - 10,0) + (20,0 - 10,0) = 40,0/ 1.000 que es menor que la incidencia eonjunta observada de 60,0/ 1.000, 10 que nuevamenIe indica una interaeci6n aditiva positiva .
Deteccioll de illteraccioll muftiplicativa: fa diferencia refativa 0 elmodelo de razon La estrateg ia para deteetar interaeci6n mu ltiplicativa es an.i.loga a la que se emplea para detectar interaeci6n ad itiva; sin embargo, en la evaluaci6n de la interacci6n mu ltiplieat iva, e l efeeto eonjunto esperado se est ima multiplieando los efeetos relativos independientes de A y de Z: IEcuacion 6.3J
Los efeetos eonjuntos independientes expresados mediante riesgo relativo (RR) se muestran en el Esquema 6.3, con interpretaciones similares a las realizadas para la interacci6n adit iva basadas en el Esquema 6 .2 . En e l Esq uema 6.3A, e l efeeto eonjunto esperado (3,0 x 2,0 = 6,0) Y e l observado son iguales, 10 e ual sugiere que no hay interaecion multiplicativa . En el Esquema 6.3 B. el riesgo relativo eonjunto esperado es tambien 6,0 , pero el riesgo relativo eonjunto observado es 9,0, 10 eual indica interaeci6n mu ltiplicativa positiva .
DEFINICION Y EVALUACION DE LA HETEROO ENEIDAD DE EFECTOS
193
Esquema 6.3
Detecci{m de la intcraccion a traves de la comparacioll de cfedos cOlljulltos esperados y obscrvados: intcraccioll multiplicativa A. No hay interacci6n mutlipticativa. lasas de incidencia observadasl1 .000
Riesgos retativos observados
A
A
Z
-
-
-
10,0
30,0
•
20,0
60,0
Z
-
•
-
0,0
3,0
•
2,0
6,0
RR conjunlo esperado '" 2,0 x 3.0" 6,0 RR conjunto observado '" 6,0 B. Interacci6n muHiplicativa presenta. lasas de incidencia observadasl1.000
Riesgos relalivos observados
A
A
Z
-
-
-
10,0
30,0
•
20.0
90.0
Z
-
•
-
1,0
3,0
•
2,0
9,0
RR conjunlo esperado e: 2,0 x 3,0" 6,0 RR cO:"ljunto observado e: 9,0
633. Ejemplos de evaluaci6n de interaccion en un estudio de cohorte Los datos de un estudio de cohone conducido en e l condado de Washington , Maryland , permiten la evaluaci6n de interacciones aditivas y mu ltiplicativas entre el nivel educacional de los padres y el habiw de fumar de la madre sobre los riesgos de muene neonatal y postneonatal(4) (Tablas 6.6 y 6.7) . Tal como se mueslra en la Tabla 6.6A, tanto e l riesgo relativo como e l riesgo atribuible para las asociaciones del habiw de fumar de la madre y la mortalidad neonatal son heterogeneas en relaci6n con el nivel educacional del padre. indicio de que hay interaccion tanto mulliplicativa como aditiva , 10 c ual expresa la magnificaci6n del efecto del habito de fumar sobre la mortalidad neonatal cuando el nive! educacional del padre es bajo . (Nolese que la heterogeneidad en la Tabla 6 .6 puede deberse a la confusion residual que resu lta del uso de categorfas poco refinadas para la educaci6n y e l habito de fumar; vcanse Capitulo 5, Secci6n 5.4.3 y Capitulo, 7 Secci6n 7.5. Para los pro pOsitos de este ejemplo, sin embargo, se su pone que la heterogeneidad no es debida a confusion residual). La interacci6n de ambas escalas se confinna c uando se comparan e l
EPIDEM IOLOGiA lNTERMEDIA ; CONCEPTOS Y APLICACIONES
194
Tabla 6.6 Tasas de mortalidad neonatal par 1.000 nacidos vivos de acucrdo al habito de rumar de 13 madre y cducacion del padre , condado de Washington , 1953 a 1963 A. Estralegia de homogeneidad Nivel de educaclon del padre
Hablto de fumar de la madre
estlmado de nacldos vivos
o-a grados
No
1.967
Numero
Sf 9+ grados
5.967 3.833
Sf
nacidos viI/os (expuestos)
RR"
1,0 ',6 1 ,0 1 ,1
16,4 4 0,1
'"
No
RAt/l.ooa
Tasal1.000 nacldos villos
14,9 17,1
0 29,7
0
','
B. Comparaci6n de eleclos conjuntos obseNados yesperados
Incidenclall.000 nacidos viI/os Hablto de fumar NIl/a]
de educacion del padre 9+ grados (no expuestos) 0 - 8 g rados (expuestos)
de la madre
RAI/t.OOO nacidos viI/os (expuestos) Hablto de lumar de la madre
RR"
Hablto de fumar de la madre
No
Sf
No
Si
No
Si
14,9
17.1
0
','
1,0
1, 1
16,4
4<,1
1,5
31,2
1 ,1
3,1
Efectos conjuntos esperados: Aditivo - RA '" 1,5 .;. 2,2 '" 3,7/1,000 nacidos vivos Multiplicativo - RR " 1, 1 >< 1,1 '" 1,2 Efectos conjuntos observados: Ad~ivo- RA",3 1,211,000 Multiplicativo - RR ,,3,1 • Riesgo relativo. t Riesgo atribuible. FUMte. GW Comstock and FE Lundin, Pa rental Smoking and Perinatal Mortali ty, American Joumalof Obstetrics and Gynocology, Vol 98, 708·718 , 1Cl 1967 .
efecto conj umo observado y el esperado en la Tabla 6.68. Para el modelo aditivo, el riesgo atribu ible conjumo observado es 3 1,2/ 1.000 naddos vivos, en tanto que el esperado es solameme 3,7/ 1.000 (es dedr, I j + 2,2) . Para el modelo multiplicativo, los riesgos relativos conjumos observados y esperados son 3, 1 y 1,2 respectivamente . Cuando se evalua la asociad6n del habito de fum ar de la madre y el nivel educad onal del padre con la mortalidad postneonatal (Tablas 6.7 A Y 8 ), hay escasa 0 nula interacd6n en cualquiera de las escalas. Las peq uefias di ferendas entre efectos conjuntos observados y esperados (0 la ligera heterogeneidad de los efectos) son probablemelHe deb idas a la varia bilid ad a leatoria .
195
DEFINICION Y EVALUACION DE LA HETEROO ENEIDAD DE EFECTOS
Tabla 6.7 Tasas de mortalidad postnconatal por 1.000 nacidos vivos de acuerdo allulbito de fumar de la madre y educacion del padre,condado de Washington, 1953 a 1963 A. Estrategia de homogeneidad Nivel de educaclon del padre
Hablto de lumar de la madre
Numero estlmado de nacldos vivos
Tasal1.000 nacldos vivos
RR"
G-8 grados
No Sf No Sf
1.967
12,3 19,6 6.1 t t ,t
1,0 1 ,0 1,0 1 ,8
9+ grados
'"
5.967 3.833
RA1/1.0OQ nacldos vivos (expuestos) 0 7,5
0 5,0
B. Comparaci6n de efaetos conjuntos observados y esperados
NII/el de educacion del padre 9+ grados (no expuestos) 0 - 8 grados (expuestos)
Incidenclalt .000 nacidos vivos Hablto de fumar de la madre
RA'/1.000 nacidos viI/os (expuestos) Hablto de lumar de la madre
RR" Hablto de fumar de la madre
No
Sf
No
51
No
51
6.1
1t , 1
0
5.0
1,0
1,8
12,3
t9.8
6,2
13,7
2,0
3,2
Efaetos conjuntos esperados: Aditil/o - RA '" 6,2 + 5,0 '" t1 ,21t .000 Multiplicatil/o - RR '" 2,0 >< 1,8 '" 3.6 Efectos conjuntos observados: Ad~il/o - RA '" t3 ,711.000 nacidos vivos Multiplicativo - RR '" 3,2 • Riesgo relativo. t Riesgo atritluible. Fuente : GW Comstock and FE Lundin. Parental Smoking and Perinatal Morta lity, American Joumalof Obstetrics and Gynecology, Vol 98, 708-718 , 1tl 1967.
6.4, EVALVACION DE LA INTERACCION EN ESTVDIOS DE CASOS Y CONTROLES La discusi6n precedente acerca de la evaluacion de la interacci6n ha descansado en medidas absolutas 0 relativas de riesgo (tasas de incidencia, riesgos atribu ibles y riesgos relativos) obtenidas en estudios de cohone. La que sigue es una d isc usion de los mismos conceptos y estrategias, pero aplicadas al analisis de datos de casos y controles. Debe notarse que . puesto que los estudios de casos y controles meramente proveen de un enfoque eficiente para analizar d1tos de cohorte, e l concepto de interacci6n no liene un significado especial en estos estudios. As!, la discusion que sigue solo procura facilitar la aplicaci6n del concepto de interacci6n al analisis de datos procedentes de estudios de casos y controles . Las f6nnulas presentadas en esta secci6n son indist intamente aplicables a los estudios de cohortes y a los estudios de casos y controles.
196
EPIDEMIOLOGiA lNTERMEDIA ; CONCEPTOS Y APLICACIONES
6.4.1. EVllluaci6n de homogeneidad de efectos En un est udio de casas y controles la estrategia de homogeneidad puede ser empleada solo para evaluar la presencia 0 la ausencia de interacci6n multiplicat iva . La raz6n para ello es que las medidas absoiutas del riesgo de enfermar usualmente no estan disponibles en los est udios de casas y comroles: por tanto. no es posible med ir la dife rencia absoluta entre expuestos y no ex pucs(Qs (esto es, el riesgo atribu ible 0 exceso absoluto de riesgo) en aq ucllos sujetos expuestos al factor de riesgo principal. Como consec uencia. la homogeneidad de los riesgos atribuibles (en sujetos ex pucstos) en los estratos farmadas por el modificador potencial de efeclo Z puede no ser evaluable en estudios de casos y controles . Sin embargo, como se muestra en la pr6xima secci6n, es posible evaluar interaccion adit iva en un estudio de casos y controles mediante la estrategia consistente en comparar efectos conjuntos observados yesperados . En la mayorfa de los estudios de casos y controles, la evaluacion de la homogeneidad de los efectos se basa en los odds ratios . Esta evaluacion, como se ilustra en la Tabla 6.8, es analoga a la de los riesgos relat ivos. En esta tabla, los casos y los controles se estrat ifican tanto considerando las categorfas del presunto factor de riesgo de interes A, como las del modificador de efecto potencial Z. Se emplean diferentes categorfas de referencia para la comparacion de las razones de odds asociadas con A en los estratos formados por Z: cuando Z esta ausente, la categorfa de referencia - a la que corresponde un odds ratio de 1,0- es aquella en la c ual A tambien esta ausente . Por otra parte, para los individuos expuestos a Z, la categorfa de referencia con un odds ratio de 1,0 se forma con sujetos expuestos a Z pero no ex puestos a A. As!, cada oddJ' ratio obtenido en la Tabla 6.8 se refiere al efecto de A, primero en ausencia (mitad superior) y luego en presencia (mitad inferior) de Z . Es impon ante enfatizar que el oelth ratio para A c uando Z esta presente no representa el efecto independiente de A, sino mas bien el efecto de A en presencia de Z. Este punto deberfa ser tenido en cuenta cuando se contrasta esta estrategia con la que se describe en la secci6n que sigue, de comparar efectos conj untos observados y esperados . La interpretacion de los resultados de la Tabla 6 .8 es clara: cuando la interacci6n multiplicativa esta presente, los odds ratios seran dife rentes; cuando esta ausente, seran similares. Por ejemplo, en el estudio de Shapiro et al .(S) se examina la interaccion entre el uso de anticoncept ivos orales y el habito de fumar intensamente sobre el odds de infarto de miocardio (Tabla 6.9), los odds ratios no eran marcadamente heterogeneos (4,5 frente a 5,6) indicando que la interacci6n multipl icat iva, en caso de estar presente, no era muy fuene . (Shapiro et a/ . examinaron tres categorfas del habito de fumar: ning uno, de I a 24 cigarrillos por dfa, y 25 cigarrillos por dfa 0 mas . Con la fi nalidad de hacer mas simples las cosas, sin embargo, solo las categorfas de no fumadores y de fumadores intensos se discuten en esta y en las secciones subsiguientes.) En contraste, en el estudio de Coughlin(6) sobre la relacion existente entre asma y cardiomiopatfa idiopalica dilatada (Tabla 6.10), a pesar de que los numeros son pequefios, los oddJ' ratios parecfan ser bastante heterogeneos, sugiriendo de ese modo la presencia de interacci6n mul tipl icat iva . Se ha sefialado por Morabia et al,m que los odds ratioJ' pueden ser heterogeneos cuando los riesgos relativos no 10 son, fenomeno que estos autores denominaron como la/a/acia de la interaccion . Morabia y colaboradores arguyeron que, aunque
DEFINICION Y EVALUACION DE LA HETEROOENEIDAD DE EFECTOS
197
Tabla 6.8 Esbozo de la tabla que ilustra la estrategia de homogeneidad para la evaluacion de la interaccion multiplicatiYa en estudios de casos y controles "Expuestos aA? Z ausenle
Casos
Controles
No
Odds Rallo 1,0
Categoria de relerenda '=' Electo de A en ausencia de Z
1,0
Categoria de relerencia '=' Electo de A en presencia de Z
Si Z presente
No Si
"Que slgnlflca?
Tabla 6.9 La relacion dcllul. bito de rumar y los anticonceptiYos orales (AO) en relacion con los odds de inrarto del miocardio en mujeres Hilbito de lumar intensamente'
deAO
No Si
U" Odds ratio
i.Que slgnillca1
No
1,0
Si
4,5
No
1,0 5,6
Categorfa de relerencia Electo del uso de AO en no lumadoras Categorfa de relerencia Eleclo del uso de AO en lumadoras
Si inlensas
o
• '" 25 cigarrillosJd ia. Fuente: Shapiro et al.. Oral·Contraceptive Use in Relation to Myoca rdial Infarction. Lancet. Vol t. 743-747 . t979 .
Tabla 6.10 La re lacion de hipertension y asma con cardiomiopatia dilatada idiopatica Odds ratio
i.Que slgnlfica?
No
1,0
Si
2,4
Categoria de referencia Eleelo del asma en normotensos
No
1,0 13,4
Hlpertensl6n
Asma
No Si
Si
Categoria de relerencia Eleelo del asma en hipertensos
Fuente: SS Coughlin, A Case-Control Studjt 01 Dilate
la posibilidad de que se presente esta «falacia» es usualmente muy pequefia 0 despreciable en la mayor parte de los ejemplos de la vida real en relaci6n con la epidemiologfa de las enfennedades cronicas, ella puede tornarse apreciable cuando el riesgo del desen lace sea alto, por ejemplo. en una situaci6n epidemica, 0 c uando se estudian grupos de poblaci6n en los cuales hay una fuerte susceptibilidad genelica al factor de riesgo en enfennedades inducidas .
198
EPIDEMIOLOGiA lNTERMEDIA ; CONCEPTOS Y APLICACIONES
6.4.2. Comparaci6n de efectos conjuntos observados y esperados La estrategia de comparar efectos conjuntos observados y esperados en los estudios de casas y controles es simi lar a la tecnica cmpleada cuando se dispone de datos de incidencia. Esto es, los efeclOs indepcndientes de A y de Z se est iman con 1a fina lidad de computar los efectos conjuntos esperados, los c lIales son entonces comparados con los efec(Qs conjumos observados . Cuando los cfcctos conj untos esperados y observados difieren, se considera que hay interacci6n . La Tabla 6.11 muestra de maDera esq ucmatica c6mo puede consumarse 1a evaluaci6n de ambas interacciones, aditiva y multiplicativa, en los es(udios de casas y controles . En esta tabla, los efectos independientes (medidos mediante odd,\· rario.\") de A y de Z pueden estimarse med iante e l empleo de una linica categorfa de referenda fonnada por aquellos individuos no ex puestos ni a A ni a Z . EI efecto de A solamente - q ue es el efecto independiente de A en ausenda de L se estima mediante e l mids de la categorfa A+ L relativo a aque llos de la categorfa de referenda, A- L. Simi larmente, el efecto independiente de Z se estima mediante la razon de los odd,\· de la categorfa A_ respecto de la categorfa de referenda.
z..
Detecci6n de interacci6n aditiva Tal y como ya se mendono, en los estudios de casos y controles no es posible emplear la Ec uad6n 6.1 (ni la 6.2) (Secd6n 6.3.2), puesto que esto demanda datos de inddenda usualmente no disponibles cuando se emplea dicho disefio. Consecuentemente, es importante reformu lar esta ecuadon en {enninos de riesgo relativo o de odds ratios de manera que pueda ser aplicada a los datos procedentes de los esmdios de casos y eontrolcs mostrados de manera esquemat ica en la Tabla 6.11 . La Figura 6.3 pennite una derivad6n intuit iva de una formu la basada en oddJ· ratios que es eq uivalente a las Ecuadones 6 .1 y 6.2 . En la Figura 6.3, el valor inicial (OR = 1,0) que se muestra en la columna 1 representa e l mids para individ uos no expuestos ni a A ni a Z. EI exceso absoluto debido a A (columna 2) y a Z (columna 3) se e:
i.,Expuesl os a A?
No
Electo independiente de A
No No
Sf
OR ~ +z_
Electo independiente de Z
Sf
No
OR ~ _z+
Eleeto conjunto observado
Sf
Sf
OR ~ +z+
"Que se mlde? Calegoria de relerencia
Casos
Control
Odds ratio OR~ _z_ :o
1,0
DEFINICION Y EVALUACION DE LA HETEROOENEIDAD DE EFECTOS
199
(SjOR-70 ~
g
(3) OR" 3,0
(2jOR=2,0
(1jOR=1,0
I
~
V~
MI
Momento inicial
Momento inicial .;. exceso debido aA
1
(4) OR 0:4,0 A
A
Z
Z
Z
MI
MI
MI
Momento OR conjunto OR conjunto observado > OR esperado, inicial esperado en la .;. exceso suma de excesos Exceso debido a I absolutos debido a Z (Interacci6n) no independientes debidos a A y a Z' explicable por el exceso debido a A y Z
Figura 6,3, Representacion esquematica del significado de la rormula
OR A•z esperado = ORfl .7~ observado + OR A _7ft observado - 1,0 N61ese que cuando se adicionan los odd.! ratio.! indepcndientes para A y para Z, d valor inicial se adi ciona dos veces: conSCCllcntemcnte, cs nccesario sustraer 1.0 del OR conj umo espcrado: CSIO CS, OR A• Z+ espcrado = (Exccso dcbido a A + valor inicial ) + (Exccso dcbido a Z + valor iniciaJ) - valor inicial = ORA+Z_ + OR A_Z+ - 1,0.
1Ecuacion 6.41 Esp ORA+z+ = 1,0 + (Obs ORA+z- - I ,0) + (Obs OR A_Z +- I ,0) = = Obs OR,,+z- + Obs OR,,_z+ - I ,0 La derivaci6n fonna l de la Ecuacion 6.4 se demuestra del modo sigu iente. Comenzando con la Ecuacion 6.2. en la cual Esp Inc y Obs Inc denotan incidencia esperada e incidenc ia observada, respectivamente (Secci6n 6.3.2) . Esp IncA+z+ = Obs Inc,,_z- + (Obs IncA+z- - Obs IncA_z-) + (Obs Inc"_b - Obs IncA_z-) Y, dividiendo cada termino de esta f6 rmula por Inc,,_z- , la ex presi6n p uede ponerse en {erminos del riesgo relativo del modo siguiente: Esp RR A+z+ = I ,0 + (Obs RR,,+z- - I ,0) + (Obs RR,,_z+ - I ,0) y por {anto.
Esp RR A+z+ = Obs RR A+z- + Obs RR,,_z+- I ,0 En un estudio de casos y controles, los riesgos relativos se estiman mediante los odd.\· ratio.\· .
200
EPIDEMIOLOGiA lNTERMEDIA ; CONCEPTOS Y APLICACIONES
N6tese que la Ecuaci6n 6 .4, aunque emplea odds ratio.\" 0 riesgos relmivos, se basa en excesos absolutos positi vos y negat ivos, respect ivameme (riesgos atribui bles entre expuestos), de modo que estima los cfcctos aditivos espcrados conjuntos. Un ejemplo se muestra en la Tabla 6.12, basado en el mismo estudio emplcado como ejemplo en la Tabla 6.9. Los datos en la tabla sugieren que hay una fucrte interaccion ad itiva, tal como Esp ORA+Z+ = 10,5 « Obs ORA+z+ = 39,0
N6tese tambien que la Ec uaci6n 6.4 no puede emplearse para evaluar interacci6n aditiva cuando una de las variables (A 0 Z) ha sido objeto de emparejamiento, pucsto que su odd,\" ratio ha sido fijado en 1,0 por disefio (vease Capitu lo I, Secci6n 1.4 .5); en otras palabras, el efecto independiente de una variable para la cual casos y controles han sido emparejados no puede ser estimado. Puesto que la estrategia de homogeneidad no puede emplearse para examinar interacciones adit ivas en los estudios de casos y controles, se tiene como corolario que no es posible evaluar interacciones aditivas entre un fac tor emparejado y otros factores en los est udios de casos y controles (emparejados).
Deteccioll de interaccion lIlultiplicativa En eSiudios de casos y controles, la evaluaci6n de la interaccion multiplicativa basada en la comparacion de efectos conjuntos observados y esperados es analoga a la estrategia empleada en el contexto de un estudio de cohorte. La evaluaci6n de la interacci6n m ultiplicati va comparando efectos conjuntos esperados y obser-
Tabla 6.12 Ejemplo de como evaluar la interaccion en ambas cscalas en un estudio de casos y controlcs emplcando las formulas Esp OR.\+7~ = Obs ORA+7~ + Obs OR,I_Z+- 1,0 (adith'o) y Esp Obs OR A+7.. = Obs OR.\+z.- )< Obs OR.\-z+ (multiplicativo): La rclacion de personas que fuman intensalllente y uso de anticonceptivos orales (AO) con eI odds de infarta del miocardia en mujercs Odds ralio
Habito intense de fumar (Z)"
Uso de AO (A)
No
NO
1,0
No
Sf
4,5
Sf
No
7,0
Sf
Sf
39,0
ORA.Z+obselVado: 39,0 ORA.Z+esperaClo: Modelo aditivo: 4,5 + 7.0 - 1.0 ~ 10,5 Modelo multiplicativo: 4,5 ~ 7,0 '" 31.5 • ~ 25 cigari llosJd ia. Fuente. Shapiro et a/.• Oral· Contraceptive Use in Relation To Myoca rdiallnlarc:tion, Lancet, 743·747, 1t1 1979.
DEFINICION Y EVALUACION DE LA HETEROOENEIDAD DE EFECTOS
201
vados se basa en el mismo tipo de tabla empleada para la valoraci6n de la interacci6n ad itiva (por ejemplo, Tabla 6.12). La razon de odds (OR) conjuma esperada se est ima meramente como el producto de la mult ipl icacion de los odds ratios independiemes. IEcuacion 6.51
la cual es analoga a la Ec uacion 6.3 (tambien puede acudirse a estas ec uaciones para eva luar interacci6n mu ltiplicaliva c uando los odds ratioslriesgos re lativos son inferiores a 1,0) . Usando los hallazgos de la Tabla 6.12, es pos ible est imar el odds ratio conjumo esperado como Esp O R,\+z+ = 4,5 x 7,0 = 3 1,5. Puesto que el odds ratio conjunto esperado (3 1,5) es bastame cercano al observado (39,0), la interaccion, si esta presente, es debil en la esca la mul tiplicativa, 10 c ual conduce a la misma conclusion antes obtenida al usar la estraleg ia de homogeneidad (Secci6n 6.4 .1 ) . N6tese que, tal y como ocurrfa para la interacci6n adit iva, esta estrateg ia no puede ser empleada para eva luar interacci6n mul tiplicativa entre una variable pareada y Olro factor, puesto que no puede medirse el efecto independieme de l pri mero. Sin embargo, la estrateg ia de homogeneidad puede ser aplicada para evaluar interaccion mul tiplicativa en estudios emparejados de casos y controles. Esto se hace mediame la estratificaci6n de conjuntos emparejados de acuerdo a los niveles de las variables emparejadas y evaluando la homogeneidad de los odd.\" ratios a 10 largo de los estratos . De esta manera, en el ejemplo esquematico que se muest ra en la Tabla 6 .1 3, la heterogeneidad de los odd.\" ratios para consumo del alcohol (basada en pares disc repames de casos y controles) en estratos formados por el habiw de h lmar «
Tabla6.13 Eje mplo hipotCtico de evaluacion de la interaccion en un cstudio de easos y controies e ntre eonsumo de alcohol y de tabaeo, en cI que los casos y los controles eshln emparejados seg un lul.bito actual de fumar (<
Par N." 2
3 4 5 6 ;
8 9 10
Habllo de fumar
No No No No No Si Si Si Si Si
Ca so
• • • • •
Co nlrol
Odds ratio para con sumo de alco hol segun habll o de lumar'
+
OR '=' 211 "2,0
OR", 4/1 '" 4,0
• •
Nora: los signos (+) y {-I denotan kls consumido,es y no consumidores de alcohol ,espec!ivamente. • Uti lizando Ia ,az6n de pares disc,epantes.
202
EPIDEMIOLOGiA lNTERMEDIA ; CONCEPTOS Y APLICACIONES
interacci6n m ultiplicati va . En 1a Tabla 6.1 4 se resumen los aspec tos relacionados con la evaluaci6n de interacci6n entre 1a variable de emparejamiento y otro fac(Or en los estudios de casas y controles cmparejados .
Tab la 6.14 Resumen de los aspectos rclaciollados COli 13 evaluacion de la intcraccioll en estudios de casos y controlcs cmparcjados US311do el cjcmplo del h:ibito de fumar como variable de cmparejamicnto y cl alcohol como la cxposici6n de intcres
Escala
Estrategla
Informacion necesarla
i.Es esta la estrategla factlble?
"Por que?
Adiliva
Homogeneidad de efectos
Los RA para el consumo de alcohol de acueroo al hltbito de fumar
No
Oebido a que la lasa de incidencia para el alcohol de acuerdo con el hltbito de tumar no esla disponible en los eSludios de casos y controles
Adiliva
Eteclos conjunlos observados y esperados
Los OR que expresen los efectos independianles de fumar y consumir aloohoj
No
EI OR que expresa el efecto independienle de tumar no esta d isponible debido a que los casas y conlroles han sido emparejados de acuerdo al habjlo de tumar
MuHiplicaliva
Homogeneidad de efectos
Los OR para el consumo de alcohol riA a<":IJArm al hahito de fumar
Sf
Los OR pa ra el consumo de alcohol eslan d isponibles para los parA~ riA <":aM~ y controles de acuerdo al habilo de tumar
MuHiplicaliva
Eteclos conjunlos observados y esperados
Los OR que expresan los efectos independienles de fumar y consumir alcohol
No
EI OR que expresa el efecto independienle de tumar no esta disponible debido a que los casas y conlroles han sido emparejados segun hab~os de tumar
Nota; RA
= riesgos atribu ibtes en sujetos expuestos; OR .. odds ,-ario.
Tal y como se estableci6 al comienzo de esta secci6n. las Ecuaciones 6.4 y 6.5 pueden tambicn aplicarse cuando se evallia interacci6n en estud ios de cohorte . Por ejemplo. usando los riesgos relativos de la Tabla 6 .6. es posible construir una tabla simil ar a la Tabla 6. 11 (Tabla 6. 15) . N6{ese que en las Tablas 6.6 y 6 .1 5 (odo padre cuyo nivel educacional fue ra de a 8 grados fue categorizado como «expues{o». Los efectos conjuntos esperados se expresan med iante riesgos relat ivos ( 1.1 + I , I - I ,0) = 1,2 en una escala aditiva y ( I ,Ix I, I) = I ,2 en una escala mu ltiplicativa (Tabla 6.1 5) . La diferencia entre estos valores esperados y observados de los riesgos relativos conjumos, de 3, 1, conduce a la misma conclusi6n alcanzada previamente, cuando se usaron tasas de incidencia (Tabla 6 .6), consistente con que existfa imeracci6n en ambas escalas.
°
DEFINICION Y EVALUACION DE LA HETEROO ENEIDAD DE EFECTOS
203
Tabla 6.15 Tasas de mortalidad neonatal por 1.000 nacidos vivos de acuerdos al habilo de rumar de la madre y de educacion del padre, condado de Washington, 1953 a 1963 Nlvel de educaclon del padre (grados)
HlIbito de lumar de la madre
Tasall .000 nacldo vivos
Alesgo relatlvo
Mas alto (9+) (<
No
14.9
1,0
Mas alto (9+) (<
Si
17.1
1, 1
Mas bajo (G-8) (<
No
16.4
1, 1
Mas bajo (G-8) (<
Si
46.1
3, 1
Fuente: GW Comstock and FE Lundin. Parenta l Smoking and Perinatal Mortal ~y. Al116Tican JoumalolObsletrics and Gynecology. Vol 98 . 708·718. Cl l967.
65. MAS ACE RCA DE LA INTERCAMBIABILIDAD DE LAS DEFINICIONES DE INTERACCION Es hidl demostrar matematicameme que las dos defin iciones de imeracci6n (es decir, la que se basa en la homogeneidad de efec(Os y la que descansa en la comparacion entre efectos conjuntos observados y esperados) son completameme intercambiables: esto es, si los efectos son heterogeneos (es decir, hay interacci6n) entonces el efecto conj unto observado es diferente del esperado y viceversa . Consideremos por ejemplo dos variables, A y Z, Ysus efectos potendales en reladon con un desenlace dado . Para evaluar el efecto aditivo conjunto, bajo la hip6lesis de no inleraccion:
1Ecuacion 6.61 Esp RRA+z+= Obs RR.\+z+= Obs RR A_Zt + Obs RRA+Z- - 1,0 La Ecuaci6n puede ser refonnulada como:
1Ecuaci6n 6.71 Obs RRA+z+- Obs RRA_Z+= Obs RRA+z- - I ,0 Tal y como se demostro previamente (Seccion 6.4 .2), para oblener el riesgo relat ivo de la formu la con el fin de evaluar el efec(O aditi vo conjumo esperado, (Odos los terminos de inddencia, en la ecuacion se dividen por la incidencia c uando ambos fac(Ores eslan ausemes (es decir, por IncA_z-). Operando hacia aids, la incidencia c uando ambos fac(Ores eslan au sentes, mu ltiplicada por el riesgo re lativo para una calegorfa de ex posic i6n dada es igual a la incidencia en esa calegoria de exposici6n (p. ej ., IncA+z- '" IncA_z- )( RRA+z-). De esle modo, la Ecuaci6n 6.7 es equivalente a:
1Ecuaci6n 6.81
204
EPIDEMIOLOGiA lNTERMEDIA ; CONCEPTOS Y APLICACIONES
Por consigu iente, cuanda el efecto aditivo conjunto observado de A y de Z es e l mismo que e l efecto esperado (Ecuad6n 6 .6), el efeclo de A en presencia de Z sera. e l mismo que el cfccto de A en ausencia de Z (Ecuacion 6.8) . Alternativamente, cuanda los efectos conjuntos observados difieren de los esperados (es decir, cuanda la imeracci6n esta presente), entonces los cfcctos de A variaran de acuerdo a la presencia 0 allsencia de Z . El mismo razonamiento vale para la evaluaci6n de la imeracci6n multiplicativa . Por ejemplo, bajo eI supuesto de no interacci6n en una escala multiplicativa , se tiene: I Ecuaci6n 6 .9J
Esp RR A+Z+
= Obs RRA+z+ = Obs RR A+z_ x Obs RR,,_z+
La Ecuaci6n 6.9 puede ser ahara rcformu lada del modo sigu ieme: IEcuad6n 6 .I OJ Obs RRA+z+ lObs RR A_Z-t = Obs RRA+z-1 1,0 La equivalenda entre las Ecuadones 6.9 y la 6 .1 0 significa q ue cuando los efec{Os conjuntos observados sean ig uales a la mu ltiplicad6n de los efectos independientes (Ecuadon 6 .9), entonces el riesgo relativo de un factor no varia como fundon del n ivel del otro fac{Or (Ecuad6n 6. 10), y viceversa .
6.6. ;.CUAL ES EL MODELO RELEVANTE?: INTERACCION ADlTlVA FRENTE A INTERACCION MULTU'LlCATlVA La popularidad del ajuste de Mantel-Haenszel (Capllllio 7, Seccion 7.3.3) Y de los metodos de reg resi6n multiple basadosen modelos multiplicativos (Capitulo 7, Secdones 7.4.3 hasta 7.4 .6) ha conducido frec uentemente a que la interaccion se ident ifique casi exclusivamente con la interacci6n mu ltiplicativa . S i los oddJ· ratios 0 los riesgos relativos son homogeneos de acuerdo con los estra{Os de un potencial modificador de efectos, puede concluirse que no hay interacci6n general , incluso aunque esta conclusion se aplique exclusivamente a interacci6n multiplicativa . Sin embargo, como se discut ira mas adelante en este capit ulo, si eI interes esta centrado en la prevencion de la enfennedad , la interacci6n aditiva puede ser de mayor inten!s. Coherentemente con ello, incluso cuando se usan los odds ratios 0 riesgos relativos para descri bir los datos del estudio, puede resu ltar importante explorar tambien la presencia de interaccion aditiva . La presencia de interaccion aditiva puede sondearse incluso en el contexto de modelos inherentemente mu ltiplicativos, tales como el modelo de regresi6n log lstica(~) . En las dencias biologicas, la noci6n de interacci6n ha estado int imamente reladonada con los mecanismos subyacentes en una relaci6n causal. Una discusi6n de los lfmites en el proceso de inferir acerca de mecanismos biol6gicos a part ir de la observad6n de interacciones en estudios epidemio l6gicos pueden encomrarse en la literatura(9), pero esto esta mas alia del alcance de este libro de texto. Thompson(lO) ha sefialado que la epidemiologia puede detectar la mayorfa de las asociaciones a gran escala y q ue su sensibilidad para identificar variables imennedias tiende a ser
DEFINICION Y EVALUACION DE LA HETEROOENEIDAD DE EFECTOS
205
limitada, 10 cual obslac uliza la interpretacion de las interacciones por conducto de resu ltados de invesligaci6n epidemiol6gica. Usualmente, la interacci6n detectada en est udios epidemiol6gicos puede meramente representar el efecto conj unto de las ex posic iones que ocurren tempranamente, antes del desarrollo de la enfermedad clfnica (Figura 6.4). Una interaccion detectada mediante observaci6n epidemiol6gica no lOrna en c uenta las cadenas causales usualmente largas. Estas cadenas pudieran ser caracterizadas por efectos conj untos mu ltipl icativos 0 aditivos 0 por otros componentes causales, necesarios para establecer entramados causales(2} responsables de la progresi6n temprana de la enfermedad de una fase (por ejemplo. cclu las metab6licamente alteradas) a otra (por ejemplo, celulas que se multiplican de manera anormal). La incapacidad para describir las anormalidades celulares fisio l6gicas y anat6micas en la secuencia patogcnica que conduce a la enfennedad lim ita ac usadamente la capacidad de la epidemiologfa para seleccionar los mejores modelos de interacci6n. Como consecuencia, la selecci6n de un modelo por parte de los epidemi610gos es usualmente detenninada por el pragmatismo (por ejemplo, cuando se selecciona el modelo estadfstico con prop6sitos de ajusle 0 cuando se considera la posible aplicaci6n de hallazgos en el establecimiento de polfticas de salud publica y prevenci6n) . Desde el punto de vista de la trad ucci6n de los hallazgos epidemiol6gicos a practicas de salud publica, es importante la presencia de interaccion aditiva, incluso cuando la interaccion mul li pl icat iva esta ausente(IIJ. Un ejemplo hipotclico puede aprec iarse en la Tabla 6. 16; allf se exam ina la relaci6n de antecedentes familiares de una enfermedad Y y el habito de fumar con la incidencia de Y. Aunque los riesgos relativos que describen la relaci6n entre el habilo de fuma r y la incidencia son homogeneos tanto en aquellos con antecedentes fam iliares como en quienes no los tienen, los riesgos atribuibles difieren de manera marcada en dependencia de una u otra situaci6n: 20% entre qu ienes tenfan el antecedente fam iliar y solo 5% entre los que no 10 tenfan. Se registra entonces una fue rte interacci6n adiliva pero no mu ltiplicativa. Dependiendo de la prevalencia de la combinaci6n del
At + A2
i
i
Cambios metab6licos 'f Mulliplicaci6n Normal ---~. en las celulas --~. de celulas estudiadas an6malas
_ _'_~.Enfermedad
•
..!f .----
Ambito usual de los esludios epidemiol6gicos ----
Figura 6.4. Represcntacl6n esquem:hlca de una cadena causal en la cual sc producen tanto efectos inte ractivos a diti vos como multiplicativos. Las causas Al y A2 interactuan de manera aditiva para producir cambios metabOlicos en las celulas de destino. Para la multiplicaci6n de celulas anomlales y la progresi6n de la enfermedad clfnica. se requieren factores de riesgo adicionales (A3 y A4. A5 Y A6 respectivamente). que interactuan de manera multiplicativa.
206
EPIDEMIOLOGiA lNTERMEDIA ; CONCEPTOS Y APLICACIONES
Tabla 6.16 Ejcmplo hipotCtico de interaccion aditiva (interaccion de salud publica) con intcraccion multiplicativa: Incidencia de la cnfcrmcdad Y por habito de fumar y los antecedentes familiares de Y Historia familiar Ausente
Presenle
Fumadores
Incidencia/IOO
No S, No
10,0
S,
5,0 20,0 40 ,0
Alesgo atrlbulble (en los expuestos)
Rlesgo relativo
Referencia 5,0 Referencia 20,0
1,0 ',0 1,0 ',0
amecedente fam iliar y del habito de fumar en la poblaci6n de interes, la prevenci6n 0 e liminaci6n del habiiO de fumar entre aquellos con antecedentes fam iliares positivos comparados con aquellos que la tienen negativa, podrfa conducir a una mayor reducci6n en e l nlimero de casas incidentes en 1a poblaci6n de referenda *. La interacci6n aditiva positiva puede incluso ocurrir en presencia de interacci6n mu ltipl icativa negativa (Tabla 6.17), y torna precedencia sobre la anterior en tenninos de definici6n de gmpos de alto riesgo, que deberfan constituir e l objelivo de la acci6n preventiva . Una discusi6n adic ional acerca de interacci6n multiplicat iva negativa e interacci6n aditiva positiva, puede hallarse en la Secc i6n 6.1 0 en este capitulo .
6.7. LA NATURALEZA Y RECU'ROClDAD DE LA INTERACC ION 6.7.1. Interaccion cualitativa frente a interacci6n cuantitativa Cuando existe asociaci6n entre el fac tor A y e l desen lace Y y esta en la misma direccion en cada uno de los estratos formados por Z pero la intensidad de la asociaci6n Tabla 6.17 Ejemplo hipotctico de interaccion aditiva positiva y multiplicativa negativa: incidencia de la enfermedad Y segun antecedcntes familiares de Y y habito de fumar Historia familiar
Fumadores
Incldenciall00
Ausente
No
10 40 40 100
S, Presente
No
S,
Rlesgo atrlbulbie (en los expuestos)
Rlesgo relativo
Referencia Referencia
1,0 4 ,0 1,0
60/1.000
',5
30/1 .000
* EI impacto de la eliminaci6n del habito de fumar entre aquellos que tienen antecedentes familiares sc estima mejor por conducto de los riesgos atribuibles poblacionales. que toman en consideraci6n la magnitud de la intensidad de la asociaci6n entre el habi to de fumar y la enfermedad en cada estrato de la historia familiar de la enfermeddd. asi como la prevalcncia de la presencia conjunta de estos factores (vease Capitulo 3. Secci6n 3.2 2).
DEFINICION Y EVALUACION DE LA HETEROOENEIDAD DE EFECTOS
207
varia de un eslralo a olro, se dice que existe interacci6n cllantitativa. Por olra parte, la interacci6n cualitativa se considera presente cuando los efectos de A sobre e l desenlace Y estan en d irecciones opuestas (cruzamiento) de acuerdo a la presencia de una tercera variable Z, 0 bien cuando hay una asociacion en uno de los eslratos formados por Z pero no en el otro (Figura 6.5) . A
X
L
y
y
z. 'RR>' ,0, R'->O} Z - (RR<1 ,0, RA
A.
A-
B
z. ,Ro",0, R-'>O} Z - (RR"I,O, RA=O)
AA" Exposici6n da interes Z '" Modificador de afaetos Y '" Riesgo de desenlaee
Figura 6.5. La inter accion cualitativa siemprc sc \'C en ambas cscalas (aditiva y multiplicath'a) pucsto que cuando el riesgo relativo (RR) > 1,0, eI riesgo atribuible (RA) > 0; cuando RR < l,o, cntonccs RA < 0; y cuando RR =1,0 , RA = 0. En el caso A. hay cruzamiento: esto es, RR A ",,,-_ > 1.0 Y RA A ",,,-_ > 0 cuando Z (modificador de efecto) esta presente, y RR < 1.0 Y RA < 0 cuando Z esta ausente. En B. RR > 1.0 Y RA = 0 cuando Z esta ausente.
Un ejemplo de interaccion cualitativa aparece en e l estudio de Estanton y Gray(1 2). Para examinar los efectos del consumo de cafefna sobre eI tiempo de espera para la concepcion, los autores obtuvieron informacion retrospect iva acerca de nacim ientos que ocurrieron entre 1980 y 1990 en 1.430 panos correspondientes a mujeres que no habian tornado anticoocept ivos. EI princi pal factor de exposicion fue e l consumo diario de cafefna, est imado como la ingesti6n de bebidas con cafefna d urante el primer mes del embaraw. La informaci6n acerca de la concepcion demorada fue analizada como una variable dicotomica (menor 0 ig ual a un ano frente a mayor de un ano) con el proposito de calcular riesgos relativos . Mientras que los riesgos relativos estaban por debajo de I para e l consumo de cafefna entre mujeres fumadoras, un incremento en el riesgo de presentar concepcion demorada se apreci6 entre mujeres no fumadoras con un alto consumo de cafeina (mas de 300 mg diarios) (Tabla 6. 18) . De acuerdo con los autores, la interacci6n cualilativa encontrada en su estud io se ex pl ica por el hecho de que el habito de fumar incrementa la lasa de metabolismo de cafefna, y que, en contrasle, el abandono del habito de fumar da Illgar a IIna
ma~
lenta e lim inacitin fie la cafefna
En el ejemplo que aparece en la Tabla 6.1 8, los efectos de un alto consumo de cafefna parecen invert irse como ulla funcion del habito de fumar; es decir, hay una asociacion posit iva entre el consumo en grandes cantidades de cafefna y la d ilaci6n en la concepc ion entre no fumadoras, y una asociaci6n negativa entre fumadoras . La interaccion c ualitativa puede ser expresada por e l tipo de cmzamiento (Figura 6.5A)
208
EPIDEMIOLOGiA lNTERMEDIA ; CONCEPTOS Y APLICACIONES
Tabla 6.18 Relaci{m entre cI cOlISumo de caft'ina y el ricsgo de dilacioll de 13 concepcion (mayor de un ano) de aClIcrdo al habito de fumar cntre 2.465 embarazos ocurridos en mujeres que no ulilizaball allticollccptivos entre 1980 y 1990 MuJeres no fumadoras Consumo de cafeina (m9"dia) Ninguno
H50 151·300 • 300
MuJeres lumadoras
Embarazos
Abortos
RR
Embarazos
'"
"69
290 90
26 17
',0 0,9 1 ,1 2,3
233 166 83
'"
"
Abortos
RR
"
',0 0,7 0,5 0,7
33 18 11
Fuente: CK Stanton and RH Gray, The Effects d Caffeine Consumption on De layed Conception, American Journal of Epidemiology, Vol 142, 1322·1329 1Cl1995. The Johns Hopkins University School of Hygiene & Public Health.
o por una asociaci6n entre el fac{Qr de interes y e l desenlace en presencia pero no en ausencia de un modificador de efccto (0 viceversa) (Figura 6.58) . Un ejemplo de l ulti mo tipo de interacci6n se deriva de los resu ltados del ensayo clfnico aleatorizado sobre e l plan de seguros de salud 0 la efectividad de la mamograffa(l3). En este estud io, e l estado menopausico pareda modificar e l efecto de la mamograffa en e l sentido de prod ucir una tasa mas baja de mortalidad por cancer de mama en el grupo que habfa sido objeto de mamograffa, comparado con el grupo control, 10 cual se observo solo en mujeres postmenopausicas. En mujeres premenopausicas. no se hallaron d ife rencias entre las tasas del grupo experimental y del grupo control. Tanto el ejemplo de la cafefna. e l habito de fumar y la concepc ion demorada como e l de la menopausia, la mamograffa y e l cancer de mama subrayan la noci6n de que cuando la interaccion cualitati va esta presente, ella siempre se produce en los modelos aditivos yen los multiplicativos y es por tanto independ iente de la escala de medici6n (Figura 6.5). Consideremos, por ejemplo, los datos que muestra la Tabla 6. 18: puesto que e l riesgo relati vo en mujeres no fumadoras con un consumo de cafefna por encima de los 300 mg diarios es mayor que 1,0, e l riesgo atribui ble, por definicion, debe ser mayor que 0; en los fumadores, por otra parte, eI riesgo relat ivo es menor que 1,0; de manera q ue, por definici6n, el riesgo atribui ble tiene q ue ser menor q ue O. Notese q ue aunq ue la Tabla 6. 18 presenta solo riesgos relat ivos, y por tanto en una primera mirada pudiera ser considerada como adecuada unicamente para la evaluacion de la interaccion multiplicativa , la ocurrenda de interacci6n cualitativa indica que la interacdon esta presente en ambas escalas; en otras palabras, cuando hay interacci6n cualitativa , la escala no necesita ser especificada.
6.7.2. Reciprocidad de la interacci6n La interaccion es completamente redproca en e l caso de dos variables A y Z, dado que si Z modifica e l efecto de A entonces A modi fica el efecto de Z . Como se mencion6 previamente, la eleccion de A como presunto factor de riesgo y la de Z como un modificador potencial de efecto son arbitrarias y la decisi6n acerca de d ial desempefia un papel u otro es una funci6n de la hip6tesis q ue esta siendo considera-
DEFINICION Y EVALUACION DE LA HETEROOENEIDAD DE EFECTOS
209
da 0 evaluada . Por ejemplo. puesto que el efecto de fuma r cigarrillos sobre el cancer pulmonar es fuerte. y puesto que esto ha sido finnemente eSlablecido. puede ser de interes ex plorar su papel como un modificador de efecto cuando se estan evaluando otros factores de riesgo potenciales para el cancer pul monar. EI concepto de reciprocidad de la interacdon se ilustra en la Tabla 6. 19,donde se han reorganizado los datos de la Tabla 6. 18 de suerte que el habilo de fumar se convierte en un factor de riesgo de interes y el consumo de cafefna se torna un modificador de efecto (por razones de simplicidad. solo se emplean dos categorias de con sumo de cafefna). Tal y como se ha vislo. el habito de fumar esta posilivamente asociado con la demora en la concepci6n en madres que no lOman cafefna, pem parece ser un factor de proteccion para aquellas que tienen un alto nivel de consumo. E.>;te patron es la imagen especu lar del patron que exhibe la Tabla 6. 18, con 10 que se pone de manifiesto nuevamente que no hay un patron jecirquico intrinseco cuando se decide que variable debe ser tratada en calidad de modificador de efecto y cual en calidad de fac tor de interes primario .
Tabla 6.19 Relacion entre eI ha bito de fumar materno y el riesgo de concepcion demorada de acuerdo con un consumo fuerte de cafclna entre 824 embarazos que ocurrie ron entre mujeres que no emplearon anticonceptivos entre 1980 y 1990 Consumo de cafeina ,, 300 mgldia
No co nsume cafeina Fumadores
Embarazos
Abort os
RR
Embarazos
Abortos
RR
No
m
"
' ,0 2,'
"83
"
',0 0,7
Si
76
"
"
Fuente. CK Stanton aoo RH Gray, The Effects of Caffeine Consumption on Defayed Cooceplion, American Journaf of Epidemklfogy, Vol 142, 1322- 1329 11:11995, The Johns Hopkins Univers ity School 01 Hyg iene & Public Health.
6.8, INTERACCION, EFECTO DE CONFUSION Y AJ UST E
Aunque, ocasionalmente, la misma variable puede ser a la vez un confusor y un modificador de efecto. la confusi6n y la interaccion son fenomenos por 10 general dist intos . Los efectos de confusion son indeseables, puesto que ellos dificu ltan la evaluad6n acerca de si la asociaci6n, ademas de estadfstica, es tambien causal. La interacd6n, por otra parte, si es derta, es parte del entramado de ca u sa li dad(l ~) y puede lener impl icaciones importantes para la prevencion, tal y como ocurre en el ejemplo del habito de fumar y el consumo de cafefna recogido en las Tabla.>; 6. 18 y 6. 19 . Cuando se encuentra que una variable c umple ambas condiciones, la de ser de confll~itin
y Ia ele
~r
un moo ific<1elor ele efecfo.
e~
im proceelenle
<1j ll ~lar
pm elich<1
variable . Cuando se halla interaccion aditiva, no es apropiado ajustar por el modifi cador de efecto con la fina lidad de oblener un riesgo atribuible ajustado, y cuando se liene interaccion mult iplicativa, es inapropiado obtener un riesgo relat ivo ajustado por el modificador de efecto. Esto se debe a que, cuando hay interacci6n, la noci6n de un valor medio (efecto principal) globalmente ajustado (ponderado) tiene poco
EPIDEMIOLOGiA lNTERMEDIA; CONCEPTOS Y APLICACIONES
210
sent ido. Por ejemplo. si los OR resultan ser 2,0 para hombres y 25,0 para mujeres, un «promedio» q ue resuma e l incremento en los oddJ' para (Odos los individ uos, independ ientemente del genera, earcee de sent ido . Esta noci6n es incl uso mas importante cuando nos ocupamos de imeracci6n cualitativa; si el oddJ' ratio para una ex posici6n dada es 0,3 en hombres y 3,5 en mujeres, un odds ratio «promedio aj us(ado por genero» puede indicar ausencia de asociaci6n , una inferencia il6gica dado que asociaciones fuertes, aunq uc en direcciones opuestas, existen en ambos sexos (para vcr un ejemplo adicional, acudasc al Capitulo 7, Secci6n 7.3 .1 ). Pues(Q que siempre se halla alguna heterogeneidad. con frec ucnda el epidemi610go se enfrenta a un dilema consislente en si ha de aj uslar por el posible modificador de efec(Q 0 no. Una soluci6n es lIevar arelanle una prueba de hip6lesis estadislica y no aj uslar si se rechaza 1.1 hip6lesis de nulidad para 1.1 homogeneidad (veanse la Secci6n 6.9 y e l Apendice C). Pero si, porejemplo, los dos odds ratio son 2,3 y 2,6, serfa erroneo no aj ustar y obtener un efec(Q ajustado promedio, independientemente del valor de p. (Si e l tamafio muestral es muy grande, una imeraccion de pequefia magnitud puede ser estadfsticamente significativa incluso en caso de que no tenga verdadero peso desde el punto de vista medico 0 de 1..1 salud publica) . Por otra parte, si los odds ratio fueran 12,0 y I j, incluso en caso de que la helerogeneidad no fuese estadfsticamente significativa, eI aj uste podrfa eslar contraindicado . A unque no existe una regia que establezca claramente cuando ajuslar en presencia de hetemgeneidad, podrfa ser utilla consideraci6n de 1..1 siguiente pregunta: ••dado que se tiene una heterogeneidad de esta magnitud, (.deseo yo estimar un efecto promedio (ajustado) que sea razonablemente representativo de todos los estratos de la poblaci6n que se estudia formados sobre la base del presunto modificador de efectos?». Algunos ejemplos y posibles res puestas a estas preguntas se muestran en 1..1 Tabla 6 .20 y pudieran ayudar en la evaluaci6n pragmatica de este problema . Independientemente de si un efecto «ajustado por Z» se comunica 0 no. frecuentemente es infonnativo comunicar los valores especfficos de los estratos tambien .
Tabla 6.20 Riesgos relativos (RR) para el ractor A en relacion a l descnlace Y, estratificado, por eI modificador de decto potencial Z Presunlo modlflcador de efeelo (Z) Ausente
Presente
2.3
2.6
2.0
20,0
0.'
3.0
3.0
4.'
Suponiendo que esta magnitud exhiba heterogeneidad, i,deberfa comunicarse un efecto promedio ponderado (ajustado por Z) que se aplique a todos los estratos de Z en la poblaci6n de eSludio? Si; incluso si la diferencia en los RR es esladisticamente significativa,liene sentido decir que, en promedio --es decir. independientemente de Z- el riesgo relativo tiene un valor ubicado enlre 2,3 y 2,6. Incluso si esta diferenda no es estadislicamenle signi!icativa, la presentaci6n de un RR «promedio» ajustado por Z puede no ser apropiada en vista de la gran diferencia en la magnitud de los RR. Se recomien da presentar riesgos relativos especilicos para cada valor de Z. No. Cuando existe una sospecha /undada de interacclon cuat itativa, deberian presentarse los riesgos relativos especifioos para cada valor de Z. Quizas. Aunque esta inleracci6n cuanlilativa puede ser de interes. los efectos estan en la misma direcci6n y puede ser apropiado presentar un riesgo relativo ajustado par Z. Ademas. seria aconsejable presentar riesgos relativos especilicos para cada valor de Z.
DEFINICION Y EVALUACION DE LA HETEROO ENEIDAD DE EFECTOS
211
6.9. MODELACION ESTADiSTlCA Y PRUEBAS ESTADisTICAS PARA LA INTERACCION Los ejemplos que se dan en eSle capitu lo conciemen al riesgo de enfennar en calidad de desenlace, pero la interacci6n puede ser estudiada con relaci6n a cualqu ier resultado, por ejemplo, e l valor medio de una variable fi siol6gica lal como los niveles de glucosa . Como ya se ha mencionado, es lambien posible examinar la interaccion para variahles conl inlJas , como clJanlio se va lora la homogeneiliali lie los efeclos lie los niveles continuos de presi6n sangufnea sobre el accidente cerebrovascu lar entre hombres y mujeres, 0 entre blancos y negros. En eSla situaci6n, el invest igador a menudo emplea modelos eSladfslicos mas complejos para evaluar la interacci6n, por ejemplo, dncluye terminos de interaccion» en la ecuaci6n de regresion (vease CapItu lo 7, Secci6n 7.4 .2). EslOs modelos tambien pueden ser empleados para evaluar la interaccion entre variables categ6ricas como una altemativa a los metodos de estratificaci6n que se presentaron en las secciones previas . Otra pregunta con implicaciones practicas importantes es si la heterogeneidad observada es prod ucida 0 no por mero azar. Cuando se emplean modelos de regresi6n para evaluar la interacci6n, la respuesta a esta pregunta viene dada simplemente por la significaci6n estadlstica del tenn ino de interacci6n en la ecuaci6n de regresi6n (veanse Capitulo 7, Seccion 1.4 .8 y Apendice A, Secci6n A.9) . Cuando se evalua la interacci6n empleando las tecnicas de estratificacion descritas en secciones previas, las pmebas estadfsticas forma les permiten valo rar si una heterogeneidad observada es 0 no estadlsticamente significativa . Estas pruebas, incluyendo las pmebas para la interacci6n aditiva en estudios de casos y controles, han sido descritas delalladamente en olros libros de tex tos (veanse por ejemplo, Schlesselman(l S) ° Selvin( 16)) y se ilustran en el Apendice C. Debe subrayarse nuevamente que las pruebas estadfsticas de homogeneidad, aunque utiles, no son suficientes para evaluar cabalmente la interacci6n. Cuando los lamanos de muestra son g randes, como ocurre en un estudio multicentrico, incluso una ligera heterogeneidad carente de valo r practico pud iera ser estadfsticamente significat iva . Por olra parte, aunque no sean estadfsticamente sign ificativos, los estimados de riesgos relativos puntuales marcadamente diferentes unos de otms, sugieren la pos ibilidad de una helerogeneidad real. Idealmente, aunque la heterogeneidad no sea estadfsticamente sign ificativa, si es acusada, deberla ser confinnada por un estudio con poder estadfstico su fici ente como para detectarla.
6.10. INTERPRETACION DE LA INTERACCION Hay muchas razones por las cuales e l efecto observado de una exposic i6n puede diferir en dependencia del nive l Ia presencia de lIna te rcera variable . La aparente heterogeneidad puede deberse a l azar, a la confusion select iva 0 a l sesgo. Ademas podrfa resultar de una dosis heterogenea de exposic i6n (frec uentemente desconocida por e l invest igador) . La susceptibilidad diferencia l a diferentes niveles en la patogenesis de la enfennedad de que se trate puede ofrecer otra explicaci6n potencial para la heterogeneidad de los efeclOs . A continuaci6n se ofrece una g Ula prac-
°
212
EPIDEMIOLOGiA lNTERMEDIA; CONCEPTOS Y APLICACIONES
fica resumida de los mas imponantes aspectos concern ientes a la interpretacion de interacc iones observadas .
6.10.1. Heterogeneidad debida a variabilidlld aleatoria La heterogeneidad puede ser resultado de la variabilidad aleatoria producida por la estrat ificaci6n de acuerdo a un posible mod ificado r de efecto . La variabilidad alea(Oria puede producirse alln en easa de que se haya hecho una especificacion a priori de la imeracci6n en el contexlo de la hip6tesis que va ser eva luada. Una situaci6n mas cornun, sin embargo, se prod uce cuanda la interacci6n no ha sido especificada a priori, pero el investigador decide lIevar adelante un analisis por subgmpos. La decision de examinar subgru pos esla frec uentemente motivada por hallazgos «negativos» en el es(udio. El investigador puede decidir la evaluaci6n de hip6tesis mas espedficas una vez que la asociacion original que ha post ulado no sat isfizo las expectat ivas. Entre las preg untas a posteriori que podrfa formu lar el epidemiologo frustrado pueden, por ejemplo, estar las siguientes: «Puesto que no pude encontrar una asociaci6n cuando se est udiaron a todos los participantes en el est udio, lsere yo capaz de encontrar tal asociacion solo en los hombres? l En hombres de edad avanzada? lEn hombres mas viejos con un nivel educacional mayor?», y asf suces ivamente . El tamano de muestra inevitablemente decrece en la medida en que se crean mas estratos dentro de los subgmpos de analisis, 10 que hace probable que no pueda descartarse que la heterogeneidad observada sea debida solamente al azar. EI examen por subgrupos deberfa ser considerado como una estrategia exploratoria . La deteccion de heterogeneidad deberfa evaluarse solo en la medida que haya motivos para considerarla plausible. Un ejemplo puede hallarse en un est udio de intervenci6n sobre mu ltiples factores de riesgo, ensayo cl fnico aleatorizado que evaluo la eficacia de las estrategias de eliminaci6n de multiples factores de riesgo cardiovasc ulares . Se encontr6 un incremento de mortalidad entre participantes hipertensos con cambios electrocardiografi cos que eran objeto de las intervenciones experimentales(l7). Aunque no fue previsto c uando el est udio se planifico, el efecto adverso de la intervencion lim itada a este subconjunto de partic ipantes condujo a la hip6tesis de que los medicamentos depletadores de potasio pueden estar contraindicados en pacientes hipertensos con trastornos cardiacos. Una vez observada por conducto del analisis de subgrupos, la interacci6n debe ser confirmada en un est udio especialmente disefiado para evaluarla .
6.10.2. Heterogeneidad debida a la confusion Cuando se exploran las asociaciones entre A e Y en estratos defi nidos por niveles de Z. los efectos de confusion diferenci ales acordes a dichos estratos pueden ser responsables de la heterogeneidad de los efectos . Como un ejemplo hipotetico, consideremos un est udio de casos y controles con el c ual se evalua la relaci6n entre el consumo de cafe y el cancer Y (Tabla 6 .2 1). El investigador desea evaluar el genero como un posible mod ificador de efecto; de acuerdo con ello estratifica los casos y los controles segun consumo de cafe (sf/no) y segun genero . En este ejemplo, el
DEFINICION Y EVALUACION DE LA HETEROO ENEIDAD DE EFECTOS
213
Tabla 6.21 Intcraccion aparcntc dcbida a la confusion (cjcmplo hipotCtico) Generolhabito de fumar Femeninofno fumador
Consumo de cate
sr No Total
Masculino/total
sr No Total
Masculinoflumador
sr
10 90 100
90
100
38 62
22 78
2.2
100
100 15 15
1.0
10
sr No
27
63
Total
30
70
Total Masculinofno lumador
Controles
35 35 70 3
No
Odds Ratio
Casos
1.0
3(1
7 1.0
Nora: Supor.ga que el htlb~o de lumar causa cancer Y; que el 50% de kls lumadores pero sokl el10% de los no fumadores lOman call!; que el consumo de caM no esta iooepeooientemente reladonaoo con el cancer Y; que todas las mujeres son no fumadoras; y. finalmente. q...e el 70% de los casos de los hombres y el 30% de los controles mas· cul inos son fumadores.
habito de fumar es una causa de cancer Y, las mujeres (tamo casos como comroles) incluyen solo no fumadoras, el habito de fumar esta asociado con el consumo de cafe, y entre los casos masc ulinos hay una proporci6n mas alIa de fumadores que entre los comroles . Puesto que el habito de h lmar se relaciona con el consumo del cafe y con el cancer Y, eSle actlia como un confusor positivo en hombres . Supon iendo que el consumo de cafe no esta causalmente relacionado con el cancer Y. en mujeres (q uienes son todas no fumadoras) se encontro un odds ratio de 1,0. EI caracler confusor del habito de fumar en hombres, por Olra parte, es responsable de que los casos masc ulinos lengan odd.\· mas altos de consumir cafe que los controles, y como una consecuencia que el odd.\· ratio este marcadamente por encima de 1,0. Hay, por tanto, una apariencia de interaccion debida a la confusi6n por el habito de fumar limitada a los hombres . La posibilidad de que la interaccion pueda ser ex plicada parci al 0 enteramente por el efeclo de la confusion torna esencial que se ajuste por confusores potenciales c uando se esta evaluando dicha interaccion . En el ejemplo de la Tabla 6.2 1, el efecto confusor del habito de fumar explica enteramente la apareme helerogeneidad de l consumo de cafe segun sex os . En la mayor parte de los ejemplos de la vida rea l, la confus ion no explica completamente la heterogeneidad del efecto, sino que mas bien la agranda 0 la dism inuye . Yu et al .(' 8) ofrecen un ejemplo al exam inar la interaccion de l habito de h lmar cigarrillos y el consumo de alcohol en portadores del antfgeno de superficie (HB sAg) en la hepat it is c ron ica B con respecto al riesgo de cirrosis hepal ica (Tabla 6 .22). Podrfa detectarse helerogeneifiafi no aj tls lafia pm e l hahiro fie fllmar fie ac tle rfio a l constl mo fie alco ho l,
hecho que se torno algo mas marcado para personas que fuman intensamente (20 cigarrillos diarios 0 mas) frente a no fumadores (pero menos para fumado res moderados) cuando el riesgo relal ivo rue sim ult aneamente ajuslado por cinco, facto res de confusion lIsando el mode lo de riesgos proporcionales de Cox (vease Capllu lo 7, Seccion 7.4 .4) .
EPIDEMIOLOGiA lNTERMEDIA ; CONCEPTOS Y APLICACIONES
214
Tabla 6.22 Ricsgo rclatiyo de cirrosis hepatica de acucrdo al cOlISumo de alcohol y h:ibito de fumar en portadores cronicos de HBsAg Rlesgo relatlvo Variable
N." total
Numero de casos incidentes
'"
"
Sin ajuste
Con ajuste multlvariado·
No bebedOf
No turnado. <20 cigarrosJdfa ,,20 cigarros/dia Bebedor No turnado.
<20 cigarrosJdia ,,20 ciga rrosJdia
'" '" '" HJO "5
" "
','
2,0
',0 ',5 ',9
,
' ,0 6,' ' ,4
' ,0 3,9 9,3
6
',0
• SimuMneamente ajustado per edad, la situaci6n de ser 0 no portador de HBsAg en el momenta del recluta· miento, la elevaci6n de la coocentrad6n serica de aminotransferasa PO ' 10 meoos durante 6 meses, e l nivel educacional y el 9"'PO sanguine<>, utilizalldo un modelo de riesgos propordonales de Cox (vlmse Capitulo 7, Se
7.4.4) . Fuente: MW Yu el al., Prospective Study of Liver Cirrhos is in AsymplomatK: Chron K: Hepatitis B Virus Carriers, American Journal of Epidemiology, Vol 145. 1039· 1047 11:11997. The Johns Hopkins Univers ity School 01 Hygiene & Public Health.
6.103. Heterogeneidad debida al sesgo En 10 que concieme a la confusi6n.la heterogeneidad observada bien pudiera provenir de un sesgo diferendal entre los e~tratos. Por ejemplo, en un esmdio de inddenda de abortos espontaneos tratados medicamente en un condado de Carolina del None, Savitz et al .(l9) encontraron que, globalmente, las mujeres negras paredan tener un riesgo menor de aborto que las blancas. Los autores interpretaron este hallazgo como algo probablemente producido por un sesgo debido al subregistro de abonos entre las negras. Tal y como se muestra en la Tabla 6.23, cuando la estratificad6n fue realizada de acuerdo al nivel educadonal, el decredmiento aparente del riesgo de abono en negras se present6 solo en el estrato de menor nivel educadonaL Este patron de una aparente modificad6n del efecto de la raza por el nivel educadonal es probablemente debido a la subvaloradon del sesgo que opera solamente en negras con un nivel educadonal menOL
6.10.4. Heterogeneidad debida a la intensidad diferencial de la exposici6n Una interacdon aparente puede ocurrir cuando hay heterogeneidad en los niveles de eXJlOsicion rle aCllerrlo a lin sllpllesto morl ificarlor rle efeclo Por ejemplo, en lin eSfl\ dio reciente de una epidemia de asma, White ef a/.l20) invest igaron eI papel del polvo
de soja en el aire originado por la carga de contenedores del puerto de Nueva Orleans . La asodaci6n fue mas fuene cuando la velocidad maxima del viento estaba por debajo de 12 millas por horas (odds ratio igual a 4.4) que cuando la veloc idad del viento era mayor (odds ratio igual a 1.7) . Esta heterogeneidad fue debida, verosfmil-
DEFINICION Y EVALUACION DE LA HETEROOENEIDAD DE EFECTOS
215
Tabla 6.23 Riesgo de aborto espontaneo por 100 embarazos, corrcgido por abortos inducidos en relacion a afios de cducacion materna: Condado de Alamance, Carolina del Norte, 1988·1991 Blanco
Total Anos de educacion de la madre <9 10-11
12 . 13
Negro
N."
Rie sgoJl00
N."
RiesgoJl00
NegroJBlanco Ratio
325
7,7
93
5,5
0,7
12
10,4
52 111 150
8,0 6,3 9,2
0 15 44
4,5 4,7 9,5
0,6 0,7 1,0
33
Fuente: OA Saviz at al.. Medically Treated Miscarriage in Alamance County, North Caro li na, 1988'1991, Ameri· can Journal of Epidemiology, Vol 139. 1100-1100, 11:11994. The Johns Hopkins University School 01 Hygiene & Public HeaHh.
mente, a una ex posici6n mas fuene al pol vo de soja resultante de una velocidad del viento menor y no representarfa par tanto la «verdadera» interaccion usando un criterio estrecho de susceptibilidad biol6gica diferencial bajo las mismas condic iones de intens idad de exposici6n ambiental. Por razones praclicas, sin embargo, establecer este tipo de heterogeneidad tiene relevantes implicaciones para la salud publica.
6.105. Interacci6n y factores del huesped La presencia y, en el fondo, la intensidad de la exposici6n pueden tambien oc urrir en vinud de caracterfst icas anat6micas 0 fis iopatologicas del hucsped. Por ejemplo, se encontr6 una interacci6n c ualitativa en un est udio de casos y controles realizado por Reif ef U/ .(2] ) entre la forma del craneo en perros domesticos y la exposic ion a humo e tabaco en relacion al cancer pulmonar: el incremento en los odd.~· de cancer pulmonar asoc iado con el hecho de que el dueno del perro es un fumador se limit6 a perros con una nariz corta (braqui y mesocefalicos), presumiblemente debido a una barrera mecanica para las partfculas carcinogenicas, representada por los cilins de los perros con nariz larga (dolicocefalos). (Lna explicaci6n alternat iva es que hay diferencias geneticas en la susceptibilidad al cancer pu lmonar inducido por el habito de fumar entre estos tipos de perros). En un estudio subsigu iente realizado por los mismos aUlores, una interacci6n cualitativa fue nueva mente encontrada entre la exposici6n a humo de tabaco y la fo rma del craneo en relaci6n con cancer nasal, excepto que se encontro un odds mayor de cancer entre los perros de nariz larga que entre los perros de nariz corta(22). esto condujo a los alllores a especu lar acerca de que «un riesgo incrementado de cancer nasal entre los perros que tenfan nanz larga puede explicarse por la fil traci6n aumentada, y el impacto de panfcu las en la mucosa~) . Estos ejemplos subrayan la importancia de considerar la intensidad y/o la faci litaci6n de la exposic i6n c uando se intenta ex plicar la heterogeneidad de efectos. Una dosis efect iva de ex posici6n es obviamente una fundon del resultado neto del monto
216
EPIDEMIOLOGiA lNTERMEDIA ; CONCEPTOS Y APLICACIONES
de la «exposici6n» en el ambiente ind ividual (como en e l ejemplo del paiva de soja), la dosis absorbida dentro del o rganismo, y la dosis q ue alcanza los niveles celulares (los ejemplos de cancer nasal y pulmonar caninos) . Desde el punto de vista del huesped, los modificadores de cfecto pueden actuar en diferentes puertas de entrada.>; (piel, aparato gastrointestinal, sistema respiratorio). Por ejemplo, es bien conocido que la expmici6n a la m isma intensidad de un p..1t6geno de piel (por ejemplo, estreptococo) se relaciona con lIna probabilidad mayor de infecd6n en individuos con rash en la piel que en aquellos que {cngan la piel normal. De ese modo, los factores que prod ucen lesiones en la piel (por ejemplo. alergenos en la pieL trauma mecanico) interactlian con agentes infa::ciosos para incrementar el riesgo de infecci6n. EI mecanismo biol6gico de los modificadores de efecto p uede tambitn variar en e l ambito celular 0 metab6lico. La interacci6n entre vias melab61icas y la exposicion a factores de riesgo se ejcmplifica mediante desordenes gem!ticos tales como la fenilceton uria . En este trastorno, la incapacidad para oxidar un producto metab6lico de la fen ilalanina encontrada en muchos ali mentos puede dar lugar a una grave deficiencia mental. Las d iferencias genet icas entre individuos tambitn p ueden ser res ponsables de la susceptibilidad d iferencia l entre individuos en relaci6n a una enfermedad inducida por un factor de riesgo. Por ejemplo, a juzgar por los resultados de experimentos en ratones, es posible que los hu manos, tambitn, tengan una susceptibi lidad genetka difere ncial a la hipertensi6n inducida por e l consumo de sal(2]). En e l marco inmunologko, son bien conocidas las interacciones entre ciertos med kamentos (por ejemplo esteroides, inmunodepresores) y agentes infecciosos en relacion con eI riesgo y/o la gravedad de las infecciones. EI riesgo relativamente bajo de enfermedad coronaria en mujeres blancas con niveles similares de exposicion a factores de riesgo cardiovascu lar tradk ionales con respecto a los hombres en los Estados Unidos sugiere que las honnonas p ud ieran desempenar un pape l en ia modificaci6n de efectos de tales factores de ri esgos(2~) .
6.11. INTERACCION Y BUSQUEDA DE NUEVOS FACTORES DE RIESGO EN GRUI'OS DE BAJO RIESGO La fuerza de una asociaci6n medida por conducto de una magnit ud relativa (por ejemplo, un riesgo relativo) es una funcion de la prevalencia relativa de Olros factores de riesgo(l5· 25). Este concepto parece haber sido reconocido por primera vez por Cornfield e t al.(26.I'ig I'»), quienes establecieron: Si cada uno de dos agentes no correlacionados. A y B. incrementan el riesgo de una enfermedad, y si el riesgo de enfennar ell ausencia de cualquiera de ellos es pequeno". entonces el riesgo reiativo para A. .. es menor que ei riesgo (relativo) para A en ausencia de B. Esta noci6n es facilmente comprens ible cuando consideramos una situaci6n en la cual un fac tor de riesgo esta fue rtemente asociado con la enfermedad, como en e l caso del habito de fuma r y el cancer pu lmonar: para examinar e l papel de un factor A mas dtbil , serfa intu itivamente lagk o estudiar a los no fumadores, ya que de Olra manera la inmensa mayoria de los casas eslarfan explicados por e l habito de fumar. En otras palabras, se espera una magnificaci6n del riesgo relativo para A entre aque-
DEFINICION Y EVALUAC ION DE LA HETEROOENEIDAD DE EFECTOS
217
1I0s no expuestos al habito de h lmar (frente a fumadores), esto es, una interacci6n multiplicat iva negativa('S). La tendcncia hacia una interacci6n m ulti pl icat iva negat iva cuando se examinan efectos conj untos de un fac(Or de riesgo fuerte Z y un factor de riesgo debil A , puede ser intuitivamente comprendida al considerar dos hechos: I ) e l riesgo absoluto maximo asociado con la exposici6n a c ualquiera de los fac(Ore s no puede sobrepasar el 100 % , Y 2) mientras mayor sea el riesgo relativo independiente asociado con la ex posici6n a Z, mas se aprox imara al 100 % el riesgo en los expues(Os a Z . Con prop6sitos ilustrativos. supongamos un ejemplo hipotetico extremadameme simplista que involucra los factore s de riesgo Z y A mostrados en la Tabla 6.24 , en la cual la incidencia de base de la enfennedad (es decir, la incidenda en aque llos no expues(Os a ninguno de los factores de riesgo) es alrededor del 10% Y el riesgo relativo independiente para Z (es decir, en ausencia de A) es 9,0 (10 q ue supone q ue, entre aquellos no expuestos a A pero expuestos a Z, la incidenda asc iende al 90 %). Pueslo q ue la incidenda en los expuestos a A en el estrato de expuestos a Z no puede sobrepasar e l 100 %, el riesgo relativo maximo posible para A si Z esta presente es 100 % """ 90 % = I , I . Una diferenda absoluta similar del 10 % debida a la exposid6n a A en los no expuestos a Z producirfa un riesgo relativo del 20 %""" 10 % = 2,0 . Un razonamien(0 similar puede aplicarse a una situaci6n en la q ue Z es una constelaci6n de factores de riesgo, en lugar de una variable simple: por ejemplo, c uando se estudian resultados de una enfennedad cardiovascular, Z puede definirse como la presencia simultanea de hipertensi6n, hipercolesterolemia, habito de fumar, d iabeles y as! sucesivamente. Tabla 6.24 Ejemplo de interaccion negati va e ntre un factor de riesgo mas fuerte y uno mas debit Factor Z Ausenle
Factor A
Ausente Presenle Presente Ausenta Presenle
Tama iio de la po blacio n
Incidencia
100
Riesgo atribuible para All 00
Riesgo relativo para A
1.000 1.000 1.000 1.000
10,0 20,0 90,0 100.0
0 10.0 0 10.0
1.0 2,0 1.0 1,1
Riesgo relativo pa ra Z
1,0 1,0 9 ,0 ' 5 ,0"
• Riesgo relativo de Z en personas 00 ex~uestas .. Riesgo relativo de Z en pe rsonas expuestas
Un ejemplo se tiene en la conoc ida diferencia de sexos en relaci6n con la prevalencia de dlc ulos en la vesicula. Se estima q ue en la poblaci6n general, e l 80% de las mujeres y e l 8% de los hombres tienen enfermedad de la veslcula(27) . Po r tanto. los riesgos relativos para factore s de riesgo d ife rentes al sexo tenderfan a ser mayores en hombres q ue en mujeres . Debido a su atractivo int uitivo. la idea de est ud iar factore s de riesgo «emergenles~) en individ uos q ue no poseen fac(Ore s de riesgo conocidos es ocasionalmente considerada al disefiar un estudio. Por ejemplo. en un estudio reciente del presunto efecto protector de los antibi6ticos sobre la enfermedad coronaria (EC), Meier et al.<2~) compararon el uso pre vio de ant ibi6ticos (oblen ido a part ir de registros farmaceuticos) en casos de EC y en controles; al seleccionar estos grupos , los au (Ores excl uyeron a todos los individuos que tuviesen una historia conoc ida de enfennedad coronaria 0 de otras enfermedades cardiovasculares, as! como a los ind ividuos q ue
218
EPIDEMIOLOGiA lNTERMEDIA; CONCEPTOS Y APLICACIONES
padecieran hipertensi6n, hipercolesterolem ia 0 diabetes. Es importante comprender, sin embargo. que el uso de esta estrategia puede limitar la generalizaci6n de los hallazgos del esmdio a la poblacion, que incluye tanto individuos de bajo como de alto riesgo . Ademas, las asociaciones que descansan en e l sinergismo entre fac(Qres de riesgo pueden no ser detectadas. Por ejemplo, si las infecciones no son causas suficientes 0 necesarias para la arteriosclerosis sino mas bien estan involucradas en la merogenesis en virtud de su sinergismo con alros fac(Qres de riesgo cardiovasculares (por ejemplo, hipercolesterolemia, diabetes), como se ha sugerido en alro 5ill0(29). entonces e l enfoque de «bajo riesgo» puede subest imar e l impac(Q potencial de las infecciones, (0, por analogfa, de los antibioticos) sobre la arteriosclerosis.
6.12. INTERACC ION Y ~ REPRESENTAT IVlDAD )I DE LAS ASOCIACIONES Un importante supuesto cuando se generalizan resultados empfricos es que la poblacion que se est udia debe tener «en promedio» susceptibilidad a la exposici6n bajo estudio con respec(Q a un desenlace dado. Cuando la susceptibilidad es escasa, los resu ltados no pueden ser f:k ilmente generalizados . Por ejemplo, los resultados de un esmdio sobre la efect ividad de una vacuna en ninos africanos puede no ser aplicable a ninos suizos, ya que la nutric ion inadecuada en los primeros pudiera alterar significativamente e l sistema inmune y, por tanto, modificar la prod ucci6n de anticuerpos a los agentes muertos 0 inact ivados . Cons ideremos, por ejemplo, los hallazgos en la Tabla 6.10 para valorar la inlluencia de la interacci6n sobre la capacidad para hacer generalizaciones . Suponiendo que los hipertensos son efectivamente susceptibles de cardiom iopatfa inducida por el asma, los resu ltados en hipertensos son obviamente no generalizables a los no hipertensos . De aquf se deriva que e illamado efecto «promedio» del asma sobre la cardiomiopatfa es una funcion de la prevalencia de hipertensos en la poblacion a la c ual uno desea generalizar los resultados. Suponiendo que los odds ratio del est udio de Coughlin(6) (Tabla 6. 10) representaban estimaciones verdaderas, en poblaciones en las c uales la mayorfa de los individuos eran hipertensos, el odds ratio serfa aproximadamente igual a 13,4: por otra pane, en poblaciones con una proporci6n baja de hipertensos e l odds ratio estarfa pr6ximo a 2,4. Mientras que el ejemplo de hipertension y asma se basa en un mooificador de efecto facilmente medible (hipertens ion), diferencias en la intensidad de una asoc iacion de poblaci6n a poblaci6n puede tambien deberse a las diferencias entre poblaciones con respec(Q a la prevalencia de modificadores de efecto ambientales 0 geneticos no med idos, Aunque es diffcil establecer hasta que punto la susceptibilidad de una poblaci6n en est udio difiere de la susceptibilidad «promedio», la evaluaci6n de su perfil epidemiol6gico (basado en factores de riesgo bien conocidos) puede indicar c uan «usual » o <
DEFINICION Y EVALUACION DE LA HETEROO ENEIDAD DE EFECTOS
219
BlBLlOG RAFiA 1. Petitti DB. Associations are not effects. Am J Epidemiol 1991: 133: 10 I-I 02. 2. Rothman KJ. Greenland S. Modem epidemiology. 2.' ed. Philadelphia. Lippincott-Raven Publishers. 1998. 3. Kannel WB. Li pids. diabetes and coronary heart disease: insights from the Framingham slUdy.AmHeartJ 1985: 110: 1100-1107. 4. Comstock G W. Lundin FE . Parental smoking and perinatal mortality. Alii J Obslel Gyne£'011967: 98: 708-718. 5. Shapiro S. Slone O . Rosenberg L ei al. Oral-contrnccptivc usc in relation to myocardial infarction. Lanai 1979: I: 743-747. 6. Coughlin SS. A case-control study of dilated cardiomyopathy. Doctoral dissertation. Johns Hopkins University School of Hygiene and Public Health. 1987. 7. Morabia A. Ten Have T. Landis JR. Interaction fallacy. J Clin Epidellliol 1997: 50: 809-812. 8. Thompson WO . Statistical analysis of case-control studies. Epidemiol Rei' 1994: 16: 33-50. 9. Darroch J . Biologic synergism and parallelism. Am J Epidemiol 1997: 145: 661-668. 10. Thompson WD. Effect modification and the limits of biological inference from epidemiologic data. J Clin Epidemiol 1991: 44: 221-232. II. Rothman KJ, Greenland S. Walker AM . Concepts of interaction. Alii J Epidemiol1980: 12: 467-470. 12. Stanton C K. G ray R H. The effects of caffeine consumption on delayed conception. Alii J Epidellliol1995: 142: 1322-1329. 13. Shapiro S. Venet W. Strax P. Selection. follow -up. and analysis in the Health Insurance Plan study: a randomized trial with breast cancer screening. Nail Canur hw Monogr 1985: 67: 65-74. 14. Mac Mahon B. Pugh TE. Epidemiology: Principles and melhods. Boston. Mass: Little. Brown & Co .. 1970. 15. Schlesselman JJ . Case-cof1lrol slUdies: Design, L'ondllL"l, analysis. New York. Oxford University Press. 1982. 16. Selvin S. Sia/is/ieal analysis of epidemiologic da/a. New York. Oxford University Press. 1991. 17. Cohen JD . Abnonnal electrocardiograms and cardiovascular risk: role of silent myocardial ischemia. Am J Cardiol 1992: 70: 14F-18F. 18. Yu MW. Hsu FC. Sheen IS el al. A prospective study of liver cirrhosis in asymptomatic chronic hepatitis B virus carriers. Am J Epidellliol 1997: 145: 1039-1047. 19. Savitz OA. Brett KM . Evans LE. Bowes W. Medically treated miscarriage in Alamance County. North Carolina. 1988-1991 . Am J Epidellliol 1994: 139: 1100- 1106. 20. White Me. Etzel RA . O lson DR el al. A re-examination of epidemic asthma in New Orleans, Louisiana, in relation to the presence of soy at the harbor. Am J Epidemiol 1997: 145: 432-438. 21. Reif JS. Dunn K. Ogilvie G K e / al. Passive smoking and canine lung cancer risk. Alii J Epidemiol 1992: 135: 234-239. 22. Reif JS. Bruns C. Lower KS. Cancer of the nasal cavity and paranasal sinuses and exposure to environmental tobacco smoke in pet dogs. Am J Epidemiol1998: 147: 488-484. 23. Szklo M . Epidemiologic patterns of blood pressure in children. Epidemiol Rev 1979: I: 143-169. 24. Szklo M . Epidemiology of coronary heart disease in women. En: Gold EB . (ed.). The dwnging risk of disease in womOl. Lexington. Mass: Collamore Press. 1984: 233-241. 25. Rothman KJ . Poole e. A strengthening programme for weak associations. In/ J EpidelIIio11988: 17: 955-959.
220
EPIDEMIOLOGiA INTERMEDIA; CONCEPTOS YAPLICACIONES
26. Cornfield J . Haenszel W. Hammond EC el al. Smoking and lung cancer: Recent evidence and a discussion of some questions. 1 Nail Cancer Insl 1959: 22: 173-203. 27. Greenberger Nl. Isselbacher KJ . Diseases of the gallbladder and bile ducts. En: lsse lbacher KJ . Braunwald E. Wilson lD el al .. (eds.). Harrison's Prindples of inlernal medidne. 13 : ed. Ne w York. McGraw-Hill Inc. 1994: 1504-1516. 28. Meier CR. Derby LE. lick SS. el al. Antibiotics and risk of subsequent first-time acute myocardial infarction. lAMA 1999: 2&1: 427-431. 29. Nieto Fl. Infections and atherosclerosis: new clues from an old hypothesis? Am 1 Epidem;011998: 148: 937-948.
PARTE
IV
EL DESAFio DE LA VALIDACI6N
CAPITULO 7 Estratificacion yajuste: Amilisis multivariante en epidemiologfa
7.1. INTRODUCCION Los esmdios de epidemiolog fa analftica se disefian para evaluar la asoc iaci6n entre exposiciones ambientales u otras caracterfsticas de los individuos (por ejemplo, variables demograficas y polimorfismos gendicos) y e l riesgo de enfermar. Incluso en caso de que el intcres del epidemi61ogo re concentre en una exposici6n unica , nonnalmenIe son varios los fac(Qres que deben ser considerados en el analisis, ya sea porque ellos pueden d istorsionar (confundir) la relaci6n entre la exposici6n y la enfennedad (vease Capitulo 5) como porque la magnitud de la asociaci6n entre la exposici6n y la enfermedad puede variar a 10 largo de los niveles de dichas variables (modificaci6n de efec10; vease Capitulo 6). La eJ·tratificacion y e l unulisis multivariunte (mode/acion) son las herramientas analfticas empleadas para controlar los efec{os de confusi6n, para evaluar la modificaci6n de efectos. y para resumir la asociacion de varias variables predictoras con e l riesgo de enfermar de una manera efici ente . EI me{odo mas simple para analizar la presencia de posibles confusores es la es{rat ificacion; este es frecuentemente, un metodo muy infonnat ivo puesto que: I) penni{e un examen d irecto y simu ltaneo de la posible presencia tanto de la confusion como de la modificacion de efectos y; 2) el examen de resultados estratificados es a menudo (itil para seleccionar la tecnica estadfs{ica apropiada para e l ajuste (vease mas adelante) . EI anulisis mulrivariante se refiere a una serie de tecnicas analfticas. cada una basada en un modelo matematico mas 0 menos complejo, que son utilizadas para Ilevar adelante e l ajuMe eJ"rad6"rico: esto es, la es{imacion de cierta medida de asociacion entre una exposicion y una variable de desenlace mientras «se controlan» una 0 mas variables confusoras. La modificaci6n de efectos puede tambien ser evaluada en e l contex{o del analisis multivariante. L1 proxima seccion presenta un ejemplo que ilus{ra la idea basica de la estratificaci6n y el ajuste como dos altemativas a menudo complementarias para identificar y controlar variables confusoras. Las sigu ientes secciones discuten con mas detalle algunas de las tecnicas de ajuste mas usadas en epiclemiologfa . Ntilese q lle e l emparejamienro , aclemas cle ser tina lecn ica (ilil para e l
ajuste, constituye tambien un rasgo del d isefio de un eSllldio (incluyendo el emparejamiento individual y el de frecuencias); consecuentemente, ha sido previamente considerado en el Capitu lo 1 de este Hbm, en e l que fueron d iscmidas las estrategias fundamentales de disefio observacional (Secci6n 1.4 .5). En el presente capitulo, el problema del emparejamiento indh'idual se vuel ve a considerar. pero solo en la medi-
224
EPIDEMIOLOGiA lNTERMEDIA ; CONCEPTOS Y APLICACIONES
da que se relaciona con la aplicaci6n de esta estrategia con vistas al ajuste en un segu imiento propio de los eswdios de cahorte (Secci6n 7.4 .6) y para demostrar su convergencia analftica con e l enfoque de Mantel-Haenszel cuanda los conjuntos emparejados son tratados como estratos para el ajuste de un odds ratio (OR) (Secci6n 7.3.3).
7.2. TllcNICAS DE ESTRATIFICACION Y AJUSTE I'ARA RESOLVER EL I'ROBLEMA DE LA CONFUSION La Tabla 7.1 muestra un ejemplo de un esmdio de casas y controles sabre el sexo mascu lino como posible fac!Or de riesgo para la infecci6n por malaria . Este ejemplo fue considerado en e l Capitu lo 5 para ilustrar como evaluar si una variable es confusora (Secci6n 5.3). El analisis crudo contenido en la parte superior de la tabla sugiere que los hombres tienen un riesgo mayor de malaria (OR = 1,7 1). Si los errores aleatorios y sistematicos (sesgos) se consideran poco probables como explicaciones de la asociaci6n observada, entonces procede contemplar la posibilidad de que este presente el fen6meno de confusi6n; esto es, hay que valorar si la asociacion puede ser explicada por caracterlsticas que se relacionan tanto con el genero como con los odd.\· incrementados de malaria . Una caracterlstica de ese tipo es la ocu pacion: los individuos que trabajan fundamentalmente en espacios abiertos (por ejemplo, trabajadores agrkolas) estan expuestos con mas probabilidad a la picad ura de mosquitos que aquellos que trabajan en espacios cerrados y tienen, por ende, un riesgo mayor de malaria. De tal suerte , la asoc iaci6n observada pudiera ser ex plicada por ese conducto si la proclividad a trabajar en espacios cerrados difiere entre generos. En la Seccion 5.3 se vio que la oc upaci6n estaba relacionada tanto con el genero (la ••ex posicion ») como con la malaria (el «desenlace») (estrategia nlimero I para la evaluaci6n de la confusion, vease Esquema 5.3); tambien se vio que cuando los datos se estratificaban seglin tipo de ocu pacion (estrategia numero 2 para evaluar la confusi6n), entonces los estimados estratificados diferfan de los estimados globales (cmdos). Tales result ados son presentados en la parte inferior de la Tabla 7 .1 . Los OR estimados en ambos estratos son muy cercanos a I. AI estratificar los resultados del esw dio de ac uerdo al confusor potenciaL se hace posible contra/a,. su efecto . Esto es : puede evaluarse la asociaci6n entre el presunto factor de riesgo (en este caso, el sexo masculi no) y la enfennedad (malaria) separadamente para aquellos que trabajan fundamentalmente en espacios abiertos (OR = 1,06) Y para aquellos que trabajan fundamenta lmente en espacios cerrados (OR = 1,0) . EI hecho de que esos OR espedfi cos de los dos estratos sean similares entre Sl y bastante diferentes del estimado crudo sugie re que la oc upaci6n es, en efecto , un confusor de la asoc iaci6n entre el sexo masc ulino y la presencia de malaria . En contraste con el estimado crudo (O R = 1,7 1), los OR de ambos estratos son muy cercanos a I , esto sugiere que una vez que se ha ten ido en Cllenta la ocupacion . ya no hay asociacion entre el genero y la presencia de malaria; en otras pa labras, que la asociaci6n cruda puede ser «explicada» por el efecto confusor de la ocu pacion . (Como se disc mio en el CapItulo 5, Seccion 5.3, los estimados no aj ustados de las razones de odd.\·, las razones de tasas y las dife rencias absolutas, pueden ser diferentes en los estratos espedfi cos inclu so c uando la confusi6n no esta presente(I.2), As\, la evaluaci6n de
ESTRAT1FlCACl6N Y AJUSTE:ANAUSIS MULT1VAR1A!\'TE f.,,, EPlDEM10UXIIA
225
los efectos confusores potenciales por cond ucto de la estrat ificaci6n debe ser confirmada mediante el uso de O{ras estrateg ias discutidas en el Capitu lo 5 y en este capitulo). Los datos estratificados que recogen las tablas 2 x 2 ubicadas en la parte inferior de la Tabla 7.1 penn iten un examen mas estrecho de por que la oc upacion es un confuso r en este ejemplo hipotetico: I) e143,6 % (68/ 156) de los hombres tienen ocupaciones que se desarrollan mayormente en espacios abiertos, comparado con solo un 9% (13/144) en el caso de las mujeres (OR = 7,8) Y 2) el 42% (63/ 150) de los casos de malaria se desempefian principalmente en oc upaciones en espacios abiertos. comparado con el 12% (18/ 150) de los controles (OR = 5,3) . Las fuertes asociaciones pos itivas del confusor (ocupadon) tanto con el factor de riesgo de interes (sexo mascu lino) como con la situadon de ser un caso 0 un control explica el efecto confuso r (positivo) . EI analisis estrat ificado tambien penn ite la valoradon de la posible presencia de interacciones. En el ejemplo antes mencionado, el hecho de que los OR espedficos por estrato fuesen muy sim ilares (homogeneos) (Tabla 7 .1 ) indica que no hay intemcdon (vease Capitulo 6), de manera que puede calc ularse un odds ratio ajustado globalmente por ocupaci6n. Como se describe mas adelante en este capitu lo, esto puede concretarse mediante el computo de un proll/uJio ponderado de las estimacio-
Tabla 7.1 Ejcmplo dc a ml.lisis estratilicado: Estudio hipotCtico del gcncro masculino como ractor dc riesgo para la inrcccio n por malaria Anall si s Crudo TocJcs los Casos y Con/roles
Casos
Controies
Total
Hombres
88
6B
Mujeres
62 150
82 150
156 144 300
Total
OR", 1,71
Anallsi s estratil icado por ocupa clon Casos y Con/roles can ocupaciones propias de espacios abiertos
Casos
Controles
Total
Hombres
53
15
68
Mujeres
10 63
3
13
18
81
Total
OR", 1,06
Casos y Con/roles can ocupaciones propias oe eS(Ulcios ceffedos
Hombres Mujeres Total
Casos
Controles
Total
35
53
I 52
79
87
132
88 131 219
OR", 1,00
226
EPIDEMIOLOGiA lNTERMEDIA ; CONCEPTOS Y APLICACIONES
nes espedficas por estrmo usando, por ejemplo , e l odd.\" ratio ponderado de MantelHaenszel, ORWh el eua] pasa a ser 1,0 1 en este ejemplo particu lar (vease Secci6n 7.3.3). A diferencia del examen de los resultados espedficos por estrato , el calculo de este promedio ponderado (es decir,dei OR ajustado) req uiere del supuesto de que 1a asoc iaci6n sea hOllloginea a 10 largo de los estratos . En vista de la similit ud de los OR calculados en los estratos , cabe aceptar e l supuesto de homogeneidad para los resu ltados que se mucstran en la Tabla 7 .1. Por otra parte, c lIando los OR no son demasiado simi lares (por ejemplo , 1,4 Y 2,0), puede ser di fkil decid ir si 1a heterogeneidad observada es 0 no real: esto es. si hay lIna verdadera modificacion de efectos. o si meramente se trata de una consecuencia de la variabi lidad aleatoria causada por e l pequeno tamano que tienen las muestras en los estratos (vease Capitulo 6, Secci6n 6.1 0 .1 ), en cuyo caso puede ignorarse esta heterogeneidad y proceder al aj uste . En otras palabras, el problema consiste en decidir si la presencia de la interacci6n debe o no ser aceptada por el invest igador. Como se discuti6 en el Capitu lo 6, Secd6n 6.9, ademas de valorar la significaci6n estadfstica de la heterogeneidad observada, para decid ir si la interaccion esta 0 no presente, debe tenerse en Cllenta la magnitud de la heterogeneidad; as!, OR espedficos por estralOs de 1,4 Y 20,0 rellejan con mayor probabilidad una verdadera interacci6n que OR de 1,4 Y 2,0. Otros factores que deberfan ser considerados son si la interacci6n es c uant itativa (por ejemplo, OR espedficos por estralO de 1,4 Y 2,0) 0 cualitativa (por ejemplo, OR espedficos de 1,4 Y0,3) y. 10 que es mas importante, la plausibilidad biologica percibida . Si se juzga que la interaccion esta presente, el ajuste (por ejemplo, obtener un odd.\· ratio combinado) no se j ustifica, porque en este caso el odds ratio «ajustado» no tiene relevanda, como la tendrfa en e l caso de un promedio ponderado de OR espedficos heterogeneos. Consideremos, e l estudio de Rei f et al.(3) citado en e l Capitulo 6. en el que se muestfa ]a e:dstenc ia de una asociac i6n entre el humo del tabaco ambiental y e l cancer de pu lmon en perros de nariz corta (OR = 2,4) yestaba virt ualmente ausente (OR = 0,9) en perros de nariz larga . La plausibilidad biol6gica de esta posible interacci6n cualitativa se disc llli6 en la Secci6n 6.1 0.5. Aceptando que esta interacci6n es real, e l aj uste seg(jn fonna del cra.neo (longillld de la nariz) obviamente no esta justificado, pues lin odd.\· ratio ajustado re presenta el odd.\· ratio ponderado promed io de los OR espedficos por estrato de 2,4 y 0,9, 10 cual no tiene una interpretacion (jtil . Otro ejemplo aparece en la Tabla 7 .2, donde se resumen los resultados de un estudio de casos y controles sobre uso de anticonceptivos orales como un posible factor de riesgo para e l infarto de miocardio en mujeres en edad re prod uctora (4). Como se mostr6 en la parte superior de esa tabla, el odds de enfermar entre mu jeres que usaban anticonceptivos o rales se estimo en alrededor de un 70% mas alto que eI odds entre aq ue llas que no usaron anticonceptivos orales . La posibilidad de confusi6n por edad, sin embargo, se considero por los autores de l estudio . Puesto que era conocido que la edad estaba directamente relacionada con el desenlace (riesgo de infarto de miocard io) e inversamente relacionada con la ex posici6n (un uso incrementado de antic.onceptivos entre mujeres j6venes), esta podrfa aClUar como un confusor negativo (vease Capitulo 5 Seccion 5.4.4). En un analisis estratificado por edad , tambien mostrado en la Tabla 7.2, salvo en uno de los estratos los OR estaban mas alejados de 1,0 que el estimado global (crudo), 10 cual confirmaba la expectativa de una confusi6n negativa (es decir, que la edad lIevaba a una asociad6n cruda estimada en direccion de la nu lidad). EI odd,\· ratio ajusta-
ESTRAT1FlCACl6N Y AJUSTE:ANAUS1S MULT1VAR1A!\'TE f.,,, EPlDEM10UXIIA
227
Tabla 7.2 Ejcmplo dc analisis estratificado: cstudio dc casos Y cOlltroics sobre el cfcdo de anticonceptivos oralcs (AO) sobrc illfarto del miocardio cn mujercs Anallsis Crudo Todos los Casos y Con/roles
Casas
AO
Coolroles
29
No AO
135
~5
1.607
234
OR", 1.7
1 .742
Anallsis estratilicado por edad Edad 25-29
Edad 30-34
Casas Coolroles
AO NoAO
4 2
62
OR:o 7.2
224
Casas
Conlroles
AO
9
NoAO
12
33 390
Edad 35-39
Edad 40-44
Casas Coolroles
AO NoAO
4
26
33
330
OR ",S.9
OR:ol.5
Casas
Conlroles
AO
6
NoAO
65
9 362
OR ",3.7
Edad 45-49
Casos CoolrolQS
AO NoAO
6 93
5 301
OR:o 3.9
Fuente: Datos tom ados de S Shapi ro al a/. Ora l·Contraceptive Use Vol 1 , W743·747 , 10 1979.
in Relation to Myocard ial lnlarction, Lancet.
do (vease Seccion 7.3.3) de los cinco OR espedficos por edad en la Tabla 7.2 resu lto ser 4,0, mas de dos veees mayor que el estimado cmdo. Como se menciono previamente, hecho impifcito cuando se calcu la cualquier promedio, este estimado del odds ratio ajustado req uiere del supuesto de que los OR sean homogeneos; esto es, que las diferencias observadas entre los OR de los estratos son producto de una variacion aleatoria. En este ejemplo, eI supuesto es probablemente razonable , dados los pequenos tamanos muestrales en algunas de las celdas y debido a que todos los OR estan en la misma direccion (indicando ausencia de interacci6n cualitativa; vease (:;lpfllllo n, Seccitin n 7.1 ). Pm Olr:l p;lrle, ptJ(licr;l ;lrgiifrsc '1uc b ~ fliferenc i ;l~ ctmnlitativas de la Tabla 7.2 son demasiado grandes, y por tanto que no procede la estimaci6n de un unieo odds ratio promedio (aj ustado) supuestamente «representativo» de {odos los estratos de edad. En otras palabras, pudiera objetarse que el efecto parece ser mas fuerte en mujeres mas j6venes de 35 anos (OR de 72 Y8.9) que en mujeres mayores (OR que se mueven entre 1,5 Y 3,9) . La aceptacion de esta heterogeneidad de OR
228
EPIDEMIOLOGiA lNTERMEDIA; CONCEPTOS Y APLICACIONES
sugiere un enfoquc alternativo consislente en calcular dos O R ajustados por edad: lIno para mujeres entre 25 y 34 afios - cstoes, e l odd.\" ratio promedio aj ustado para los dos gmpos mas jovenes - y alro para m ujeres entre 35 y 49 afios de edad - vale decir, eI odds ratio promedio ponderado para los Ires grupos mas viejos. (Estos calc ulos prod ucen valores de O RMH ascendentes a 8.3 y 2,7 respectivamente: vease Secci6n 7.3.3). Este ejemplo ilustra las vemajas de la estratificaci6n para la evaluaci6n de la presencia de confusion ylo interacci6n y para decidir clIando e l ajuste es apropiado y como debe ser Ilevada adelante . Tambien pennite apreciar lIna situaci6n comlln del an.i.lisis epidemio l6gico: la exposic i6n de imen!s parece tener efectos heterogeneos de ac uerdo a cienas agrupaciones de una tercera variable, a veces no considerada a priori en el analisis de los datos . Dado el gran numero de posibilidades para el agmpamiento de variables cuando se hace un analisis estratificado y teniendo en cuenta la variabilidad aleatoria potencial de aparentes efectos subgrupales (Secci6n 6. 10. 1), este tipo de anal isis, si no se basa en hi p6tesis q ue de antemano sean b iol6gicamente plausibles, deberfa considerarse exploratorio. Puesto que los ejemplos previos se ocupaban de los OR, la interacci6n que interesaba en esos casos era la mu ltiplicativa . S in embargo, ha de tenerse en mente que si la medida de asociaci6n de interes es el riesgo atrib uible (Secci6n 3.2.2), entonces es la interacci6n aditiva la que debe considerarse (vease Secci6n 6 .6), como se discuti6 en el contexto del metodo d irecto de aj uste en la Secci6n 7.3 .1.
7.2.1. Estratificaci6n y ajuste: slipuestos Comparada con e l ajuste, la estratificad6n esta virt ualmente (aunque no completamenIe) libre de supuestos. Solo se requ iere e l supuesto de que los estratos tienen sentido y estan adec uadamente definidos . Esto significa q ue debe haber homogeneidad dentro de cada uno de e llos. Por ejemplo, para los estratos de la Tabla 7 .1 , se supone implfcitamente que hay unifonn idad en 10 que concierne a la asociaci6n de genero respecto de la malaria en cada uno de los dos estratos ocupacionales (los que trabajan fundamenlalmente en areas cerradas y aquellos que 10 hacen sobre todo en areas abienas); de igual manera , en la Tabla 7.2, se supone que la asociaci6n entre anticonceptivos orales y el infarto de miocardio es homogenea dentro de cada grupo q uinq uenal de edad . S i este supuesto no fuera apropiado en cada uno de dichos ejemplos, otras categorfas mas precisameme defi nidas (por ejemplo, categorfas ocupacionales mas especfficas 0 intervalos de edad mas refinados, respectivamente) hubieran tenido que ser seleccionadas para el analisis estratificado. Este supuesto es equ ivalente al supuesto de la ausencia de collfusi6n residual, desc ri ta mas adelante en este capftulo (Secci6n 7.5). Para el ajuste, deben hacerse sup uestos adic ionales. Tal y como se desc ribe en la pr6xima secci6n, todas las tecnicas de ajuste se basan en el supuesto de la validez de algun ti po de modelo e.~·tadiHico q ue resume la asociaci6n entre las variables q ue se investigan . Ocasionalmente, el modelo estad fstico es simple, como en e l caso de los milodos de ajllste basados ell /a estratijicaci6n. es deci r. el aj uste directo y el indirecto (Secciones 7 .1 y 7.3.2) 0 el metodo de Mantel-Haenszel (Secci6n 7.3.3). Como se disc uti6 anteriormente, para el dlc ulo de una med ia (ponderada) de cierto numero de OR especfficos por estrato, se asume q ue estos son homogeneos a 10 largo de los estratos; esto es, que no hay interacci6n (multi plicat iva). Estos metodos de ajuste mas simples, basados en la estratificacion, son los mas comunmente empleados
ESTRAT1FlCACl6N Y AJUSTE:ANAUSIS MULT1VAR1A!\'TE f.,,, EPlDEM10UXIIA
229
cuando se controla por un n umero limitado de confusores potenciales que son categ6ricos 0 q ue p ueden ser categorizados (vease Secci6n 7.3.4). Por otra parte, modelos matematicos mas complejos constituyen la base de los procedimientoJ' de ujusfe mlllfivariunfes basados en los melOdos de regresi6n· . Tal y como se describe mas extensamente en la Secci6n 7.4, estos modelos mas complejos se emplean como herramienta para la inferencia epidemiol6gica acerca de relaciones entre cierto numero de factore s y una enfermedad, cuando se controlan simultaneamente (se ajusta) por e l efecto potencial mente confusor de todos esos factores. Estos metodos de regresi6n multi ple pueden tambien manejar covariables cont inuas . En los sigu ientes parrafos se describen brevemente algunas de las tecnicas mas frec uentemente empleadas para e l ajuste y eI analisis multivariante de datos epidemio l6gicos. Las Secciones 7.3 Y 7.4 describen las tecnicas basadas en estrati fi caci6n y aquellas que se basan en los metodos de regresi6n mul ti ple. Cada una de estas tecnicas analfticas se basa en un modelo conceptual y en un modelo matematico; eslO es algo a 10 que podemos aludir como •• modelo estadfstico». Las Secciones 7 .5 y 7 .6 discuten algunas limitaciones potenciales del ajuste mu ltivariante (confusi6n residual y sobreajuste) y la secci6n fina l de este capftu lo (Secci6n 7 .7) presenta un res umen y una mirada global a los usos comunes de las tecnicas de la modelaci6n estadfstica mu ltivariada en la practica epidemiol6gica .
73. METODOS DE AJUSTE BASADOS EN LA ESTRATlFlCACION 73.1. Ajuste directo
EI ajusre d irecto ha sido tradic ionalmente empleado para aj ustar por edad cuando se comparan tasas de morbilidad y mortalidad entre pafses 0 regiones, 0 entre d ife rentes periodos temporales. EI ajuste par edad, sin embargo, dista de ser la unica apl icacion . La popularidad de melOdos estadfsticos matematicamente mas sofi sticados (tales como aquellos q ue se presentan en las secciones q ue siguen) ha li mitado e l empleo del ajuste d irecto en la investigaci6n epidem iol6gica en arios recientes, pero e l metodo se mantiene como una tecnica inmediata, particu larmente litH para Hustrar los principios basicos del aj uste estadfstico . EI metodo d irecto se descri be en la mayor parte de los libros introd uctorios de epidemiologfa (por ejemplo, Gordis(S)). La Tabla 7.3 bosqueja el procedimiento cuando 10 que se comparan son tasas de incidencia entre dos gmpos A y 8 (par ejemplo, ex puestos y no expuestos) estratificados de acuerdo a una variable sup uestamente confusora (estratos desde i = I hasta k) .
*- Et termino ami/isis l/Jullimria/JIe comunmente se emplea en la literatura epidemiol6gica en contrdste con cl anal isis «crudo». que evalua la rclaci6n entre una variable y un desenlace. La mayor parte de las veces. el termino IIIl1ifil"ariame se utiliza cuando se controla mas de una variable simul· taneamente (en contraste con el aIJ(i/isis bimriado). Sin embargo. este termino tiene por 10 general un alcance semantico difercnte en el campo de la biocstadistica. donde ami/isis nlll/lil"arianle alude a las tecnicas de regrcsi6n multiple que inwlucran a mas de una variable dependieflle.
N
~
Tabla 7.3 Ajuste directo para la comparacion de incidencias (0 en dos grupos de estudio Grupo de estudio A Presuntll variable confusora
No.
(1 )
(2)
Estrato 1
"..
Estrato 2 Estrato 3
Estrato k
Total
". ".
..
Casos (3)
,-, ,-, ,-,
"
""
N,
!(,
Grupo de estudio B
Incldencla (4) " (3Y(2)
'..
'. '. '. "
No. (5)
"" "" "" "" N,
Casos (6)
Incldencla (7) " (sy(S)
,,,
'..
'. '.
'" '" "',
...
X.
,
m
IS
Poblaci6n esl{indar
~ 5r
Casas esperado$ cuando se usa I de A (9) " (4) x (8)
Casas esperados cuando se usa
W, W, W,
W, I,., x W,
Is, X W,
I"" " W,
'm "
W,
~
W,
lAO" W.
",X w•
18 z
No (8)
IAI X
'" B (10)" (7) x (8)
/""" W2
8;;Z
" "< m
n
I, W,
,
I [I", ,,W;j
,
I [4.."W.]
~
I~ ,>
C
n
Incidencia ajustada
I [I", X W,J rA= ' --~-
I, W,
I [/& x Wi] r 8 = -'-~~
I, W,
~ is
z
rn
ESTRAT1FlCACl6N Y AJUSTE:ANAUS1S MULT1VAR1A!\'TE f.,,, EPlDEM10UXIIA
231
I. Para cada estrato de la variable supuestamente confusora, se calc ula la incidencia para los dos gmpos de est udio (columnas 4 y 7). 2. Se ident ifica una poblacion estandar con un numero especffico de individuos en cada estrato (columna 8) . 3. EI numero eJperado de casos en cada estrato de la poblaci6n estandar se calcul a mediante la mu ltiplicaci6n de las tasas especffi cas por estra{Q observadas en el grupo de estudio A (columna 9) y en el gru po de est udio 8 (columna 10) por el numero de su jetos en el estra{Q de la poblacion estandar. 4. Las sumas globales de casos esperados en la poblacion estandar (basadas en las tasas de A y 8 ) dividido por el numero {Qtal de individuos en la poblaci6n estandar son las tasas de incidencia ajl/Madas 0 eJ·tandarizadas; eS{Q es, las tasas de incidencia que sedan observadas en A y 8 si tales poblaciones tuvieran exactamente la misma distribuci6n de edad que la poblaci6n estandar o. inversamente, la tasa de incidencia que hubiera sido observada en la poblaci6n estandar si esta hubiese tenido las tasas esped ficas de los estratos del grupo de estudio A (/* A) 0 las tasas especfficas por estratos del grupo de eSllldio 8 (/ *8) . Al observar las f6rm ulas para el calcu lo de las tasas ajustadas resultara obvio que estas no son mas que prolllelbos pondemdoJ· de las tasas especfficas por estratos en cada gmpo de eSlUdio. donde los correspondientes numeros de suje{Qs en cada uno de los estratos de la poblacion estandar son empleados en calidad de factores de ponderacion . EI hecho de que ambos promed ios se computen empleando las mismas ponderaciones permite la comparaci6n . Las tasas aj ustadas resultantes pueden entonces ser aprovechadas para calcu lar tanto el riesgo atribuible aj ustado (RA) entre los expuestos (para un error estandar de esta estimaci6n, vease el Apendice A, Secci6n A.6) como el riesgo relativo (RR): RA aj ustado = 1*A- /*8 . 1*A RR aJustado = - -
I',
Tal y como se discuti6 en la secti6n previa. el principal supuesto implkito en el d lcu lo de riesgos atribu ibles 0 riesgos relativos ajustados obtenidos por ajuste directo es que los efecto.\· SOli hOlllogeneos a 10 largo de los estratos de la variable 0 variables confusoras: esto es, si se calcula una medida global resumen del efecto a 10 largo de los estratos de una variable dada, se supone que este promedio es razonablemente representativo de {odos y cada uno de los estratos involucrados. Una especificacion adicional de este supuesto se hace necesaria: si la homogeneidad se refiere a una escala absolllla (modelo aditivo) 0 a una escala relativa (modelo multiplicativo). Este concepto se ilustra de manera simplificada por conducto de situaciones hipoteticas como las mostradas en las Tablas 7.4 Y 7.5, en las que hay una fuerle confusi6n debida a la edad: esto es, el desenlace es mas frecuente en personas mayores que en sujetos mas j6venes, y los gmpos en estudio son complelamenle rliferenles en re b cion con b s rlisrrihllciones segfin erlarl.
En la Tabla 7.4, los riesgos atribuibles son homogeneos a 10 largo de los dos estralOS de edad (RA especffico del estrnto igual a 10%) y ambos son diferentes del riesgo atribu ible cmdo global (20%), hecho que revela un efec{Q de confusi6n por edad. Puesto que los riesgos atribu ibles especfficos por estratos son homogeneos (identicos en este ejemplo hipotetico) el promedio ponderado de estas diferencias (es decir, el
232
EPIDEMIOLOGiA lNTERMEDIA ; CONCEPTOS Y APLICACIONES
Tabla 7.4 Ejcmplo hipotCtieo del ajuste directo cuando las dircrcncias absolutas especfficas por cstratos (ricsgos atribuibles) SOli homogencas Grupo de estudio A
Edad (anos)
<40 . 40 To!al
N
Casos
100 200
120
40
""
Grupo de estudlo B
Tasa ('Yo)
N
Casos
Tasa ('Yo)
RA (%)
AR
20
20
40 80
10 40
2,00
50
400 200
10
100
10
1,25
'20
20
20
2,00
'"
Caleulo de estimaciones ajustadas:
Poblaci6n estandar mas joven
Casos Edad (anos)
<40 . 40 Total
N
esperados con lasas A
500 '00 600
Casos esperados
con lasas 8
N
100
50
50
40 90
' 00 500
'50 25
Tasas ajusladas (% )
Poblacl6n estandar mas vleja
RA RR
10 %
Casos
Casos
esperados con lasas A
esperados
con lasas B
20 250 270 45
600
"
10 200 210 '5 10 %
1,67
1,29
Nota: RA, riesgo atribuible; RA , riesgo relativo
Tabla 7.5 Ejcmplo hipolctico de ajuste dirccto cuando las direrencias relativas espccfl'icas por estrato (ricsgos rclativos) SOli homogcllcas Grupo de estudio A
Edad (arios)
<40 . 40 Total
Grupo de estudio B
Casos
Tasa (%)
N
Casos
6 60
6
200 '00
66
400 200 600
" "42
N @
"" 22
Tasa (%)
,
RA (%)
"7
" "
RR
,
2,00 2,00 3, 14
Calculo de estimaciones ajustadas: Poblaci6n eslandar mas joven Edad (arios)
<40 . 40 Total Tasas ajustadas (%)
N
500 @
600
Casos esperados con tasas A
Casos esperados con tasas 8
"" ""
" " "5
GO W
RA RR Nota: RA, riesgo atribu ible: RR , riesgo relativo
5% 2,00
Poblacl6n estandar mas vleja
N @
500 600
Casos esperados con lasas A
Casos esperados con lasas 8
6
,
' 50
75
'56
78
n
26
13 % 2,00
ESTRAT1FlCACl6N Y AJUSTE:ANAUSIS MULT1VAR1A!\'TE f.,,, EPlDEM10UXIIA
233
riesgo atribuible ajustado) no varia con la eleccion de la poblacion estandar (mitad inferior de la Tabla 7.4). Sin embargo, ello no es cierto cuando se calc ula un riego relativo ajustado en este ejemplo: puesto que los riesgos relativos varIan con la edad, el riesgo relativo ajustado (es decir, el promedio ponderado de los riesgos relativos no homogeneos segun gmpos espedficos de edad) depende de a cuM estrato se Ie ha dado mayor peso cuando se eligi6 la poblaci6n estandar. Por ejemplo. puesto que el riesgo relativo es mas alto entre los j6venes (2.0) que entre los viejos ( 1,25), el uso de una poblacion estandar mas joven resulta en un riesgo relativo ajustado mas alto ( 1,67) que el que se obtenla cuando se usaba una poblacion estandar mas vieja (I .29). En concl usion, puesto que los riesgos atribuibles son homogeneos (es decir, no hay interacci6n aditiva), es apropiado usar directamente tasas ajustadas con el prop6sito de calcu lar un riesgo atribuible ajustado por edad . Sin embargo. dada la heterogeneidad de los riesgos relativos por edad, no es apropiado estimar un riesgo relativo ajustado por edad en este caso. N6tese que, en esta situaci6n, el riesgo relativo aj ustado puede variar dependiendo del estandar que se haya elegido. Esto es un asunto de especial preocupacion en situaciones en las que hay una interaccion fuerte, sea c ualitativa 0 c uantitativa. Una situacion opuesta a la que se recoge en la Tabla 7.4 se muestra en la Tabla 7.5 . En el ejemplo hipotetico contenido en esta tabla, los riesgos relativos espedficos por estratos son homogeneos; sin embargo, esto no se cumple para los riesgos atribuibles . ASI, los riesgos relativos ajustados son identicos, independientemente de cual haya sido la eleccion de la poblaci6n estandar, pero el valor del riesgo atribuible ajustado estimado depende de a cual estrato se Ie haya otorgado mayor peso . Porejemplo.la poblacion estandar mas vieja produce un riesgo atribuible ajustado mas alto puesto que el riesgo atribuible es mayor para los mas viejos (15%) que para los mas j6venes (3%) . Como consecuencia. la heterogeneidad de los riesgos atribuibles en los estratos especfficos. puede tornar inadecuado el dlc ulo de un riesgo atribuible ajustado por edad. Por otra parte, un riesgo relativo ajustado por edad refleja de manera precisa la homogeneidad de los efectos mu ltiplicativos por la edad cuando se comparan los gmposA y B. Otras consideraciones practicas acerca del metodo directo de ajuste se desarrollan a continuacion. Este metodo es empleado para la cOIIIl'aracion de tasas en dos 0 mas gmpos de estudio; el valor absoluto de una tasa aj ustada no es usualmente el ndcieo del analisis, puesto que dicho valor depende de la selecci6n de la poblaci6n estandar, la c ual es frecuentemente arbitraria. Se cuenta con diversas opciones para la eleccion de la poblacion estandar, varias de las cuales se enumeran y comentan a continuacion: I. Una poblaci6n enteramente artificial (por ejemplo, I .000 SlUetos en cada estrato). 2. Uno de los gmpos de estudio. Esto hara los dlcu los mas simples y ahorrara tiempo, ya que las tasas observadas en el grupo elegido seran las de la poblacion eSlandar que es, por defi nici6n, «estandarizada>,· . " Cuando uno de los grupos de esludio es particulannenle pequeno debe USaThe como el eslandar. de manerd tal que se minirniee la variabilidad aleatoria. Esto es dcbido a que euando el grupo mas pequeno sc ernplea wmo eslandar. no hay nel"Csidad de ernplear sus tas.as especfficas por estrdto. estadisticamente iJ\Cslables, pard eslimar los niimeros esperados de eventos. pueslo que su las.a obscrvada tOlal es la ajuslada. Adernas. las lasas especfficas por edad mas precisas de la o lrd poblaci6n (mayor) produce un niimem de evenlos espcrados mas eSlable y as! una lasa ajuslada lambicn mas precisa.
234
EPIDEMIOLOGiA lNTERMEDIA ; CONCEPTOS Y APLICACIONES
3. La suma de las poblaciones 0 grupos en est ud io . 4. Una poblacion que puede ser, 0 bien lIna poblacion de referenda, 0 bien lIna poblaci6n «externa», tal como 1a poblacion del estado , de 1a provincia 0 del pais del que proceden los gmpos objeto de estud io (0 el mundo completo, cuanda se Irma de comparar varias palses). C uando se comparan grupos ocupacionales entre residentes de un area metropo litana , por ejemplo, serfa razonable seleccionar como el estandar a la poblaci6n trabajadora de l area metropolitana total. Aunque esta elecci6n no deja de ser arbitraria, las lasas aj ustadas resultantes seran por 10 menos en alguna medida representat ivas de las «verdaderas» lasas del grupo estudiado. 5. La asf Hamada poblacioll est6ndar de variallza minima, la cual prod uce los estimados ajustados mas estables estadisticamente yes, por tanto, particularmente (iti! cuando los tamanos de muestra son peq uenos. Cuando dos gru pos se comparan, usando la misma notac i6n que en la Tabla 7.3, para cada estrato (i), se calcula la poblacion estandar de minima varianza especffica por estrato del sig uiente modo: IEcuaci6n 7. 11 W, =
-,---'----,--1 1 -- + -nM
II Ai X IIlIi
nlli
Para e l ejemplo mostrado en la Tabla 7 .4, la poblaci6n estandar de mInima varianza serla por tanto: Estrato de edad por debajo de 40 anos : Poblacion estandar =
100 x 400 100+400
= 80
Estrato de edad mayor 0 igual a 40 anos: Poblacion estandar =
200 x 200 200 + 200
= 100
N6tese que si uno de los gmpos (por ejemplo. poblacion A) es mucho menor q ue e l otro: esto es, si nAi «nlli entonces (l.lnAi)>> (1/IIIIi), y aSI la ecuaci6n 7 .1 se reduce a Wi '" " Ai , circunstancia que otorga respaldo fonn al a la recomendaci6n mencionada anterionnente consistente en que cuando uno de los gmpos es peq ueno. este deberla ut ilizarse como el estandar. • Aunque, como ya se mencion6, e l metodo de aj uste directo ha sido trad icionalmente empleado para realizar comparaciones, aj ustadas por edad, de tasas de mortalidad y morbilidad por tiempo 0 lugar, este es un metodo apro piado para Hevar adelante e l aj uste para cualquier variable categ6rica. Tamb ien puede usarse para ajustar simu ltaneamente por mas de una variable (vease eI fonnato
ESTRATIFlCACl6N Y AJUSTE:ANAUSIS MULTIVARIA!\'TE f.,,, EPIDEMIOUXIIA
235
Tabla 7.6 Ejemplo de formato de tabla para usar el mCtodo dirccto en el ajuste simultaneo por genero, raza y educaci{m (categ6ricamente definida) Genero
Raza
Hombres Negros Blancos Mujeres
Negras Blancas
Educaclon (alios)
<12 . 12 <12 . 12 <12 . 12 <12 . 12
Estratc
Tasa del grupo de estudlc A
Ta sa del grupo de estudlo B
Pcblaclon estandar (ponderaclones)
2 3 4 5 6 7 8
en la Tabla 7.6). Obviamente, la ultima aplicaci6n estara li mitada si hay demasiados estratos y los datos estan dispersos . • EI metodo directo puede ser empleado para ajustar cualq uier tasa 0 proporcion (mortalidad, tasa de letalidad, incidencia por persona-tiempo, prevalencia) . Puede tambien ser uti l en el contexto de los estudios de casas y controles con la fina lidad de obtener proporciones ajl/stadas de casos ex puestos y comroles, que en su momento podrfan ser empleadas para calcular un odds ratio ajustado .
73.2. Ajuste indirecto AI igual que el metoda de ajuste directo, el ajuste indirecto ha sido tradic ionalmente usado para aj ustar datos de mortalidad 0 morbilidad por edad. En el metodo indirecto de ajuste, particulannente popu lar en el campo de la epidemiologfa ocupacional, el nlimero de eventos esperados, (por ejemplo, muertes) en un grupo de estudio (por ejemplo, una cohorte ocupacional) se calcu la mediante la aplicaci6n de tasas de referencia (tasas «estanda",) al nlimero de individuos en cada estrato del gmpo 0 grupos de estudio. Para cada gmpo, la rawn del nlimero total de eventos observados respecto del numero esperado (si las tasas en el gmpo de estudio fueran las tasas ••estanda",) nos provee de un estimado del riesgo relativo ajustado por el factor 0 de la razon de tasas que compara el grulJO de estlldio con la I'oblacion que sirvio como fuellfe para las rasas lie referencia (Tabla 7.7). Cuando se usa en el contexto de los datos de mortalidad , esta raz6n es conocida como la ruzon e.l"tandarizada de lIIorrafidad (REM), con tenninos similares empleados para los datos de morbilidad, tales como razon de inciliencia eJ·tandarizada (RIE) y ruzon de I'revalencia e.~·tandarizada (RPE). EI lI amado metodo indirecto se considera particu lannente uti! ya sea cuando los riesgos espedficos 0 las tasas espedficas por estrato se desconocen en uno de los gru pos bajo comparacion, 0 cuando los grupos que se estudian son peq uefios, de manera tal que las tasas esped fic as por estrato se consideran demasiado inestables, dando lugar a nlimeros espcrados que serfan estadfsticamente poco confiables si se empleara el metodo dirccto (colu mnas 9 y 10 en la Tabla 7.3) .
236
EPIDEMIOLOGiA lNTERMEDIA ; CONCEPTOS Y APLICACIONES
Tabla 7.7 Ajuste indirccto: Comparacion de la mortalidad obscrvada en ulla poblaci6n de cstudio con la de una poblaci6n de referenda extcrlla Poblacl6n de estudio A
Variable presuntamente confusora
Poblacl6n de referencla Muertes esperadas en A sl esla poblacl6n
Muertes observadas
Tasa
tuviera las tasas de la
No.
de mortalldad
poblacl6n de referencia
I')
I')
")
ESlrato 2 ESlrato 3
n" n. n.
'"
M, M, M,
M" ~ n....
ESlrato Ie
n.
M,
M.~
"
)
ESlrato 1
Total
'. '.
'" I
(5) .. (4)
M,
~
~
(2)
n A1
Me, ~ n",
x...
nA.
I [M~n.. J
Raz6n estandarizada de mortalidad
MJertes observadas
I )(.;
"'uertes esperadas
I, 1M, >< "IV]
REM '"
Cuando se ha aplicado un ajuste ind irecro, no es apropiado definir la poblaci6n que ha servido como fuente de las tasas como una «pobladon estandar»; la razon es que la verdadera pobladon estandar es realmente el grupo de estudio al que se aplican las tasas de referenda externas «
ESTRAT1FlCACl6N Y AJUSTE:ANAUS1S MULT1VAR1A!\'TE f.,,, EPlDEM10UXIIA
237
Tabla 7.8 Ejemplo hipotetico de dos grupos de cstudio con idCllticas tasas especificas por edad pero d istribuciones de edad diferelltes : cl uso del metodo illdirccto empleando tasas de referenda externas resulta en REM diferelltes Grupo de estudlo A Edad (anos)
. 40 Total
N
defuncl ones
100 500 600
10 100 110
Grupo de estudi o B
N
defunci ones
ta sa
Ta sas externa s de referencia (%)
"20%'"
"" <00
'"20
'"'" 0%
50%
18,3%
600
70
11.7%
tasa
,,."
N." esperado de defunclones obtenldos mediante apllcaclon de ta sas de referencia a los grupos A y B Edad (anos)
Grupo de estud lo A
<40 . 40
Numero total esperado REM (obervado/esperado)
Grupo de estudi o B
12 % ... 100,,12 50% ... 500",250
12 % ... 500:::60 50% ... 100:::50
110/262: 0,42
<10 70/110::: 0 ,64
,.,
sin embargo, que c uando las RE M se obt ienen solo para un par de pobladones (por ejemplo, un gmpo ocupadonal frente a la pobladon total del area que sirve como fuente de tasas «estandar», 0 cua[quier gmpo de es{udio frente a la poblad6n de referenda), los metodos directo e indirecto convergen: en esta situadon, el d lculo de las REM tambien puede ser interpretado como metodo directo, con uno de los grupos bajo comparadon (ej., un gmpo ocupadonal) sirv iendo como «poblad6n estandar» (Figura 7 .1 ).
veces
Presunta variable confusora
Distribu cion de la pobla cl on A
Ta sas especfficas por estrato en la poblaclon B
Estralo 3
M, M, M,
Estrato k
Mk
Estralo 1 Estralo 2
Figura 7.1. C uando se comparall solo dos poblacioncs, los metodos dircdo c illdirccto convergclI . El enfCKjue puede ser considerado como un metodo directo en el cual una de las poblaciones (A) es la estandar 0 como un metodo indirecto empleando la olra poblaci6n (8) como la fuente de las tasas de referenda (<
238
EPIDEMIOLOGiA INTERMEDIA; CONCEPTOS Y APLICACIONES
7.3.3. Metodo de Mantel-Haenszel para ajustar la estimaci6n de UUlI medida de asociaci6n Cuando la medida de asoc iaci6n de interes es el odds ratio (por ejemplo, euando uno esta analizando resultados de un estlldio de casos y controles) frecuentemente se aplica el metodo descrito por Mantel-Haensze({7) para calcular el odds ratio ajustado global por uno 0 mas confusores potenciales definidos categoricamente. La Tabla 7.9 muestra la notaci6n para la formulaci6n del olids ratio ajuslado de MantelHaenszel para datos estral ificados en k eslratos:
O RMf.=
I a/~ _--'----'N "'-,_ I b,c, N,
10 eual es equ ivalenle al promedio ponderado de los OR espedficos por estralo*. Para el error estandar y la eslimaci6n de un intervalo de eonfianza, vease Apendice A, Seeci6n A.8. EI dlculo de los OR MH se ilu slra en los sig uienles ejemplos. En la Tabla 7.1 la asociaci6n cruda enlre la presencia de malaria y el genero s ugeria que los hombres len ian un riesgo mayor de enfermar; sin embargo, euando la asociaci6n se exam ino teniendo en cuenta eslratos de ocupaci6n, no se observ6 asociacion con el genero en ninguna de las calegorias ocupacionales. Ademas de inspeccionar los OR espedficos por oeupaci6n, se puede ealcu lar un olfd.\· ratio resumen, que expresa la asociaci6n ajuslada por oeupaci6n entre genero y ma laria. EI OR MH ajuslado (e l promedio ponderado de los OR espedfieos por estralo) se calcula de l modo s igu ienle:
Tabla 7.9 Notacion para eI cilculo del odds ratio ajustado de Mantel-Haenszel en un estudio de casos y controles, estratificado de acuerdo a una variable confusora potencial Estrato I
Casos
Controles
Total
0,
m"
No expuestos
"c,
d,
m"
Total
n"
n.,
N,
Expueslos
*
N6tese que esta f6rmula es algebraieamente idCntica a la siguiente:
OR
"" =
" b,c; x a,{l; _-'----" NC,,--cb~,cC'c_
I
h,c; ; N;
As!. el OR M " es un promedio ponder.tdo de los OR espedficos por estr.ttos (OR;) con pesos iguales a (b;e;l N ;).
ESTRAT1FlCACl6N Y AJUSTE:ANAUSIS MULT1VAR1A!\'TE f.,,, EPlDEM10UXIIA
I OR MH =
I
al~
53 x 3
N,
81
35 x 79
+
b jCj
10 x 15
N,
81
239
219
= 1,01
52 x 53
+
219
N6tese q ue el estimador del OR,\IH se ubica entre los est imados especffieos por estrato (1,06 Y 1,00) . S in embargo, esta mas proximo al estrato «ocu pacion fundamentalmente en espacios eerrados» puesto q ue e l tamafio de muestra es mayor en este estrato, para euyo eomponente la est imaci6n recibe, eonsee uentemente, mas «peSO» (b j Cj / M) c uando se ealc ula e l OR~1Il promedio ajustado. En el ejemplo de la Tabla 7.2, el OR~1Il est imado aj ustado por edad es:
I OR MH =
4 x 224
aid. N,
I bjci
=
+
292 2 x 62
+
292
N,
9 x 390 444
+
12 x 33
444
+
4 x 330
393
6 x 362
+
33 x 26
393
442 65 x 9
+
442
6 x 301
+ +
405
=4,0
93 x 5 405
EI modelo estadfstico implfcito en el procedimiento de Mantel-Haenszel para e l dlc ulo de un odds ratio ajustado es q ue haya homogeneidad de efee(Qs (expresada por los OR en este caso) a 10 largo de las categorfas de la variable de estratificaci6n. En otras palabras, se supone que no hay interacci6n mu ltiplicativa entre la ex posicion y la variable de estrat ificaci6n (vease Seccion 6.3.1). Especfficamente en e l ejemplo de la Tabla 7.2, euando se calc ula un odds ratio global ajuSlado, se supone que el odds ratio del infarto de miocardio en relacion al uso de anticonceptivos orales es aproximadamente igual a 4 (el promed io ponderado calculado) para todos los estratos de edad. Como fue analizado previamente (Secci6n 7 .2), en este ejemplo las diferencias observadas en los valores de los OR especfficos por eslrato sedan una consec uencia de la variaci6n aleatoria; si la heterogeneidad observada se considera excesiva, entonces una opc ion es calcular O R aj ustados separados por edad para mujeres mas j6venes y mas viejas (vease Secci6n 7.2), de la manera sig uiente: 4 x 224
I ad OR.\IH .2S _ 3~.""" =
N,
I b,t-i
=
292 2 x 62
292
N,
OR ,\nUS _ ~9.oo.
=
I , I
4 x 330
all;
N,
=
393
bjLj
33 x 26
N,
393
+ +
+ +
9 x 390 444
12 x 33
444
6 x 362
442 65 x 9
442
= 8,3
+ +
6 x 30 1 405 93 x 5
405
= 2,7
240
EPIDEMIOLOGiA lNTERMEDIA ; CONCEPTOS Y APLICACIONES
Razon de tasas ajustada segun Mantel-Haenszel El metoda de Mantel-Haenszel ha sida ex tcndido al calculo de una raz6n de tasas ajustadas en el contexto de un estudio de cohortes con datos de incidencias basados en personas-tiem po( ~ pag 219. 221 ). La Tabla 7. 10 m uestra el farmata general de los datos para cada una de las tablas especfficas de los estratos. Basandonos en la nolacion de esta tabla, el estimado de la razon de tasas ajustada de Mantel-Haenszel se calcula como sigue :
I
ali
I
(lo;
RRMH =
yo;
T,
Y Ii
T,
Un ejemplo de la apl icaci6n de estas f6nnulas se presenta en la Tabla 7 .11 , basado en datos de uno de los ejemplos empleados en el Capitulo 5 para ilustrar las u!cnicas para 1a evaluaci6n de la confusi6n (Secci6n 5.3 ('1)) . N6tese que la RRMH estimada q ue compara el «alto» fndice de consumo de vitaminas con el «bajo» valor que se obtiene en la Tabla 7 .11 es identica a la correspondiente razon de tasa aj ustada seglin habiw de fumar que fue presentada en la Tabla 5.5 basada en e l metodo directo de ajuste.
Metodo de Malltel-Haenszel y el odds ratio para datos de casos y colltmles emparejados Tal y como se presema en los textos basicos (por ejemplo, Gordis('!), y como se discuti6 brevemente en la Secci6n 3 .4 .1 , en los estudios de casos y controles emparejados, e l odds ratio se calcula mediante la d ivision de los nlimeros de pares en los cuales el caso esta expuesto y el control no 10 esta por el nlimero de pares en los que e l caso no esta expuesto y el control si 10 esta . En la Tabla 7 .12 , cada celda re presenta e l nlimero de parejas para la categorfa correspond iente defin ida por la condic ion de caso 0 control y de exposicion. As!, en la Tabla cruzada de 2 x 2 mostrada en e llado izquierdo, e l odds ratio se estima como la raz6n de pares discordantes, b/c . Un ejemplo se p uede ver en la parte derecha de la tabla , a partir de una comunicaci6n del
Tabla 7.10 Nolacion para el caleulo de la razon de tasas ajustadas de Mantel-Haenszci en un estudio prospectivo basado en lasas de incidencia de tiempo-persona cstratilicadas de acuerdo a una variable confusora potencial Estrato i
Casos
Controles
Expueslos No expuestos Total
Y.
ESTRAT1FlCACl6N Y AJUSTE:ANAUSIS MULT1VAR1A!\'TE f.,,, EPlDEM10UXIIA
241
Tabla 7.11 Ejemplo para cl caiculo de la razon de lasas ajuslada de Mantel-Haenszel (RR.\lII): Datos de mortalidad en individuos con indice de consumo de vilamina CIBetacarotenos alto y bajo segun hiibito de fumar, Estudio de la Compaiiia de Electricidad del Oesle [ndlce de Consumo de Vltamlna C/ BetaNumero de carotenos defunclones No lumadores
RR:o 0,77
53
5 .143
Bajo
57
4.260 9 .403
Ano
111
6.233
Bajo
138
6.447
TOlal
I :0
53 ~ 4.260 9.403
a"yOi
,
RR:o 0,83
12.680
i
RR ....
Alesgos relatlvos por estratos
Ano TOlal
Fumadores
Personas· alios
Ti
8 .. y1i
"
T,
•
111 ~ 6.447 12.680
•
138 ~ 6.233 12.680
'" 0,81 57~5 . 143
9.403
Nota: La categoria "moderada_ del indicede consumo de v~aminas de la Tabla 5.4 se ha omitido PO' simplicidad. Todas las ra20nes de tasas en la labia comparan los que tienen nivel _aho_ del indice de consumo de vitamina con los que lienen nivel -ba;O-. Fuente: DK Pandey at al., Dietary Vitam in C and !I·Carotene and Risk 01 Death in Middle-Aged Men. The Wes· tem Electric Study, American Journal of Epidemiology, Vol 142, 1269·1278, 1Cl1995, The Johns Hopkins Unive,sity School of Hygiene & Publi c Health.
Tabla 7.12 Configuration para una tabla 2 x 2 para calcular un odds ratio emparejado y un ejemplo EJEMPLO'
NOTACION Controles
Casas
Controles
Expuestos
No expuestos
,
b
Expueslos No expueSlos
d
OR emparejado:o ~
,
Casos
CMV+
CMV+
CMV-
214
65
42
19
OR emparejado:o ::
:0
1,55
Not"; C"d" celd" ,epre3ent" el nume,o d~ t>",e~ P"'" cad" categ<> ,i" delinidB 3"9':'n 3e \,ete de un caM> 0 un conl,oI y sag.:.n nive l de exposici6n . • los casos ,epresentan individuos con a,terOoesclerosis carolidea delinida por el ultrasonido modo B; los controles son individuos sin arterioescierosis individualmente emparejados con los casos por grupo de edad, sexo. etn ia, centro y fecha de examen. La situaci6n rob,e la infecci6n por cytomegalovirus (eMil} se define de acue,do a la presencia 0 ausencia de anticuerpos sericos IgG. Fuente: PD Sorlie al al., CytomegalovirusJHerpesvirus and Carotid Atheroscleros is: The ARIC Study. Journal of Medical Virology, Vo l 42. J3-37,1Cl1994. John Wiley & Sons.
242
EPIDEMIOLOGiA lNTERMEDIA; CONCEPTOS Y APLICACIONES
Est udio de Riesgo de Arteriosclerosis en Comun idades (AR IC) sabre 1a asociaci6n entre la infecci6n cr6nica por citomegalovirus (CMV) y la arterioesclerosis carotfdea (medida a (raves delultrasonido modo B) (IO) . En este estud io, los casas de artcrioesclerosis y los controles fueron indiv idualmente emparejados por edad, sexo, etnia, centro y fecha del examen; el odds ratio pareado (es decir, e l odds ratio controlando por todas las variables de emparejamiento) se estima como 65/42 = 1,55. La base radonal para la estimaci6n del odd,\" ratio como la raz6n de pares discordantes en un est udio de casas y controles emparejados es faci lmente captada mediante 1a aplicacion del metoda de Mantel-Haenszel para promed iar OR estrat ificados. Los datos de la Tabla 7.1 2 pueden ser reorganizados como se aprecia en la Tabla 7 .1 3, donde cada uno de los 340 pares en este estudio es ahora un estrato con un {amano n = 2 . Las resultantes 340 {ablas de 2 x 2 puede ser organizadas como se ve en la Tabla 7 .1 3 puesto que los pares pueden ser solo de I de los 4 posibles tipos (cada una de las celdas de la Tabla 7 .1 2): Por ejemplo, para el primer tipo de par, en e l cua l tanto e l caso como e l control son CMV+ (celda «a» en e l panel de la izquierda de la Tabla 7.12), habrfa un total de 2 14 {ablas identicas; para e l segundo ti po (la ce lda •• b», discordante, con caso ex puesto y control no expuesto) habrfa 65 tablas; y asf sucesivamente. En las dos ultimas columnas de la Tabla 7. 13, se indica la contribuc i6n al numerador y al denominador del OR MH de cada uno de los 340 pares .
Tabla 7.13 Calculo del odds ratio e mparejado para los datos de la Tabla 7.12 , basado en el enroque de cstimacion de Mantel-Haenszel Co ntrlbuclon de cada par aIOA"H Cuatro tlpos posibles de pares Tipo 1 Concordante
E,. •
Tipo 3 Oiscordante
• •
0
OR""",
•
2
a::: 214
0
0
2
b",65
'I,
0
2
C:: 42
0
'I,
2
d~19
0
0
( ' ~ d)
Oen ominador
(b
~'
0 0 0 0
Tipo 4 Concordante
Numerador
Ca sos Co ntroles
0
Tipo 2 Oiscordante
N.o de pares en la Tabla 7.12
0
0
(214xO}+(65><1I2)+(42xO)+(19xO) (21 4 x O) + (65 >< O) + (42 x 112) + (19 x 0)
Nota: Exp, estalus de exposici6n.
::
65><112
42>< 112
65 42
""
b C
)
ESTRAT1FlCACl6N Y AJUSTE:ANAUSIS MULT1VAR1A!\'TE f.,,, EPlDEM10UXIIA
243
N6tese que la contri buci6n (tanto al numerador como al denominador) de todos los estratos basados en pares concordantes es siempre D. mientras que los pares discordantes contribuyen al numerador (pares tipo •• b») 0 al denominador (pares tipo «C»). Todas estas contribuciones. que son siempre 112 - esto es, ( Ix I) I 2- se cancelan. con el verdadero ntl mero de pares discordantes en el numerador y en el denominador res ultando en la bien conocida fonnula OR MH = ble. Asf. esta f6nn ula representa Ill! promedio pan· derado de los OR para (Jaros esrrmijicados (empleando eI enfoque de ponderaci6n de Manrel·Haellszel) (Jande los estrarw' se definen sabre la base de pares emparejado.L
73A. Limitaciones del ajuste con metodos basados en la estratificaci6n
Las tecnicas descritas en las secciones previas (aj uste directo e ind irecto. odd.\· rario de Mantel-Haenszel 0 raz6n de tasas) pueden utilizarse para el au
244
EPIDEMIOLOGiA lNTERMEDIA ; CONCEPTOS Y APLICACIONES
7.4. TECNICAS DE REGRESION MULTIPLE PARA EL AJUSTE Las tecnicas de regresi6n mu ltiple son mas adecuadas para encarar las dificultades relacionadas con la aplicaci6n de las lecnicas mas simples que se disc lItieron hasta ahara, ya q ue permiten e l examen de los cfcctos de todas las variables de ex posici6n de manera recfproca y simultanea aju stando para todas las otras variables en e l mode lo. Ademas, JX:nniten ajustar por covariables continuas, y, dentro de Ifmites razonables, son generalmeme mas eficientes que los metodos basados en la estratificadDn para el uso de datos dispersos . Alin mas. ademas de ser empleadas para e l ajuste mult ivariante, las lecn icas de regresi6n multiple son lit iles con vistas a la prediccion - esto es, para estimar el valor de cierto desen lace como una funci6n de valores de variables independientes especificadas, tal como en el caso de la ecuaci6n de prediccion de riesgo coronario desarroll ada en el esmdio de Framingham a traves de la regresi6n 10gistica(ll) (vease Seccion 7.4.3). Las Secciones que siguen describen cuatro de los modelos de regresi6n mas frec uentemente empleados para e l aj uste mu ltivariante en epidemiolog la: I) La regresion lineaL empleada cuando e l desen lace es una variable continua (por ejemplo, tension arterial); 2) La regresi6n loglstica , preferentemente empleada cuando e l desenlace es categorico (incidencia acumulada, prevalencia); 3) Modelo de riesgos proporcionales (Cox), empleado en analisis de superv ivencia; 4) Regresion de Poisson , usada cuando el desen lace de interes es una tasa de incidencia (basada en personas tiempo). La discusi6n detallada de estas tecn icas desborda e l alcance de este capitulo; por e llo se sugiere al lector que acuda a textos de estadlstica generales (por ejemplo, Armitage y Berry(l 2)) y a las referencias especfficas que se dan en cada una de las secciones. En su lugar, la discusi6n se centrara en aspectos aplicados de la regresi6n mUltiple. A pesar de sus diferentes aplicaciones, e incluso aunque solo uno de los modelos esta especfficamente definido como «linea l», la med ula de todas las tecn icas de regresion discut idas en este capitulo es una funcion linea l. Ello puede apreciarse claramente en la Tabla 7.14 en la cual la parte derecha de todos los modelos es exac tamente la misma (b o + h,x, + blX2 + ... + bkXk): e lla ex plica por que son colec tivamente abarcados por la expresion lIIodelo lineal general. N6tese que los mode los listados en la tabla difieren solo en relaci6n con e l tipo de variable depend iente (0 desenlace) posrul ada para ser re lacionada con los predictores de manera lineaL Consec uentemente, y como se subraya en las secciones que siguen, la interpretacion de los coeficientes de regresion multiple es s imilar para todos esos modelos, variando solamente en dependencia de la variable de respuesta . En la proxima seccion se revisa el concepto de regresi6n lineal en e l contexto de la situaci6n mas simple: cuando esta involucrada solo una variable predictora (una x) . Las c uatro secciones siguientes se destinan a exam inar brevemente los rasgos basicos de los mode los de regresion listados en la Tabla 7 .1 4. Finalmente, las Secciones 7 .4 .6 , 7.4 .7 Y 7.4.8 cubren aspectos concernientes a la aplicaci6n de estos modelos en estudios emparejados y anidados y en situaciones en las que el modelo <
ESTRAT1FlCACl6N Y AJUSTE:ANAUS1S MULT1VAR1A!\'TE f.,,, EPlDEM10UXIIA
245
Tabla 7.14 Modelos de regresion multiple e interpretacion de los coeficientes de regresion Modelo Lineal
Logistico
Incremento en el resultado del valor medio de y (variable continua) por unidad de incremento en x" ajustado por todas las otras variables en el modelo. log (odds) '"
Do.;. b, x, .;. b,x• .;. ... .;. b,x,
log (riesgo instantaneo) '" be,.;. 1>,x, .;. b,x, .;. ... .;. b,x,
Poisson
Interpretacion de 1>,
log (tasas) '"
be,.;. 1>,x, .;. b,x, .;. ... .;. boX,
Incremento en el109 odds por unidad de incremento en x" ajustado por todas las otras variables en el modelo. Incremento en el109 riesgo instantaneo del resultado por unidad de incremento en x" ajustado por todas las otras variables en el modelo. Incremento en el109 de la tasa del resultado por unidad de incremento en x" ajustado por todas las otras variables en el modelo.
7 A.1. Regresion lineal: Conceptos generales
La regresion lineal simple es una lecnica estadfstica usual mente empleada para evaluar la a~ociac itin entre oos vari ahle~ cont inuas I.a Figura 72. por ejemplo, mllesIra la ubicaci6n en un sistema de ejes de valores transversales de tensi6n arterial sist6lica (TAS) y el grosor de la capa intima-media de la car6tida (G1M) , una medida de arterioesclerosis obtenida med iante el ultrasonido modo B. en un subconjunto de 1.410 participantes del eswdio AR ion). Cada punto en el diagrama de dispersion representa a un individuo con su correspondiente TAS y GIM en la abscisa y en la ordenada , respeclivamente. Puede apreciarse que , aunque se trata de una nube de puntos muy amplia, hay ciena tendencia a que los valores de GIM sean mas altos cuando la TAS es tambien mas alta, y viceversa. Este patron permite la evaluaci6n acerca de si la TAS y el GIM estan linealmente asoc iados . La hip6tesis que considera que hay una posible asociaci6n lineal entre estas dos variables continuas puede expresarse a (raVeS de las siguientes preguntas: 1. (, Esta asoc iado el incremento medio de los niveles de GIM con un incremento dado en los valores de TAS aproximadamente constante a 10 largo del recorrido completo de los valores de TAS? 2. (, Puede suponerse que la asociaci6n entre la TAS y el GIM sigue un patron de lfnea recta (//Ior/plo e~taofs tico) onnne la nllhe oe punt n~ alreoeoor oe la lfnea es solo consec uencia del error aleatorio? Ademas de la inspeccion visual de la nube de puntos (por ejemplo, Figura 7.2), la evaluacion de si la relacion entre las dos variables continuas (por ejemplo, TAS y G IM) es 0 no estadfsticamellfe compatible con una Ifnea recta perfecta puede reali-
EPIDEMIOLOGiA lNTERMEDIA ; CONCEPTOS Y APLICACIONES
246
2.00
,
1.75
, "
1.50
E E
, , , • , " •"
1.25 1.00
~
B
,
0.75
0.50 0.25 0.00 0
20
40
60
80
100
120
140
160
180
200
TAS (mm)
Figura 7.2. Rclacio n entre tensio n a rtt ria l sist6lica (TAS) y grosor de la capa intima media de la car6 tida (G IM) en UII subconj unto de pa rticipa ntes e n cI cstudio ARIC
zarse por conducto del coeficiente de correlaci6n lineal de Pear.wn (r) (vease, por ejemplo. Armitage y Berry( 12 p 163 _ 16S), aSI como una aplicacion en el Capitu lo 8, Sec-
cion 8.4.2) . Los valores del coeficienle de correlaci6n se mueven en e l recorrido que va desde - 1,0 (c uando hay una correlaci6n negativa perfecta , es decir, cuando (odos los puntas fannan LIlia lfnea recta perfecta, con una pendiente negativa) hasta + 1,0 (cuanda hay LIlia corre laci6n positiva perfecta, es decir, cuando los puntos fonnan una Ifnea recta con una pendiente positiva). Un valor de 0 indica que no hay correlac ion lineal alguna. En el ejemplo de I.. Figura 7.2, e l valor del coeficiente de correlac ion de Pearson es 021, al que corresponde un valor de P igual a 0,0001. Este pequeno valor de P del ejemplo sugiere que hay algun tipo de correlacion lineal entre TAS y G IM probablemente no explicable por el azar, incluso aunque la magn itud de este coeficiente implica que la correlaci6n es solamente moderada. Tal conclusion se ajusta con la vision grafica que muestra la Figura 7.2: aunque hay una tendencia a que los valores mayores de TAS se asocien con valores mayores de G IM, tambien hay una dispersi6n sustancial de los valores alrededor de esta hipotetica relacion lineal. N6tese que e l valo r del coeficiente de correlaci6n no contiene informacion acerca de la fuerza de la asociaci6n entre las dos variables; tal magnitud esta representada por la pendiente de Ia linea hipotetica, la cual infonna la magnitud del incremento esperado del valor del G IM por cada un idad de incremento en la TAS. Para estimar la fuerza de la asociaci6n lineal, es necesario hallar la formu la para la linea de regresion que mejor se ajuste a los datos observados. En general, esta Ifnea puede ser ex presada en terminos de dos parametros ([30 y 13 1) los cuales relacionan el valor medio (esperado) de la variable dependiente (convencionalmente denotado como
ESTRAT1FlCACl6N Y AJUSTE:ANAUSIS MULT1VAR1A!\'TE f.,,, EPlDEM10UXIIA
247
E(y) Y ubicada en la ordenada del sistema de ejes) como una funci6n de la variable pruJicrora 0 il/dependiellte (convencionalmente deno{ada como x, en las abscisas). La f6rmula general de la linea de regresi6n es:
(a part ir de este punto, «E(y)>> se denota como «y" para simplificar la notacion) . La Figura 7.3 muestra la representaci6n gra.fica de esta linea de regresi6n general. Una inspeccion de esta f6 rmula y de la figura pennite una comprensi6n inmedia(a de la interpretacion que corresponde a cada uno de los dos parame{ros «Iio y 11 1»: • •
es el intercepto que es el valor estimado de y c uando x es igual O. es el coejiciellte de regre.~i6n que es el incremento estimado en la variable dependiente (y) por unidad de incremento en la variable predictora (x) . As!, cuando x = I, entonces y = ~c + ~ I: para x = 2, Y = f30 + 2~1' Y as! sucesivamente oEste coeficiente de regresion, desde el punto de vista geome{rico, es la pendiente de la Ifnea de regresi6n y relleja lafilerza de la asoc iacion entre las dos variables, eS(Q es, cuanto incremento (0 disminucion, si se (rmara de una Ifnea descendente) cabe esperar que se prod uzca en y en la medida que x crece. N6tese que el valor absoluto de 131depende de las unidades de medic i6n tanto dex como de y . ~o ~I
Una vez que se fo rmula el modelo eJ·tadfstico, la pregunta pr:ktica es c6mo est imar la linea de regresion que mejor se aj uste a un conjunto de da(Qs, tales como los de la Figura 7.2. (En la regresi6n lineal, el procedimiento convencional para est imar los coeficientes de regresi6n L0 « p..1rametros~) J es el metodo de minimoJ· C/Iadrado.~·. Este cOllsiste ell hallar los valores de los parametros que mi ll imizall la suma de cuadrados de las distancias verticales entre cada uno de los puntos observados y la linea. y
"J
o
'.
. '
1 Unidad
Figura 7.3. Represcntacio n gnlfica y matematica de un modclo lincal
248
EPIDEMIOLOGiA lNTERMEDIA ; CONCEPTOS Y APLICACIONES
Para obtener dctalles acerca de los metodos que permiten estimar la regresi6n lineal, vease un tcxto de estadfstica general tal como e l de Annitage y Berry(1 2) 0 el de Kleinbaum et al (l ~) 0, uno alga mas especializado, como e l de Draper y Smith(lS).) Por ejemplo, la Figura 7 .4 mucstra la linea de regresi6n que mejor se ajusta a los datos observados que fueron recogidos en la Figura 7.2. La notaci6n tradicionalmente usada para representar la Ifnea de regresi6n estimada es como sigue:
Esto es: los sfmbolos de los parametros denotados por la letra griega beta se reemplazan par la letra b para dejar claro que se trata de eJ"rill/aciolles . El Icnnino de error, e, represema la d iferencia entre cada valor observado de y, y el correspondiente valor predicho por e l mode lo (por ejemplo , la distancia vertical entre cada punto de la nube de la Figura 7.4 Y e l valor de y en la linea). (Por razones de simplicidad, el tennino de l error sera omitido en el resto de este Capitu lo) . Regresando a la Figura 7 .4 , la f6rmula matematica para la estimaci6n de la Ifnea de regresi6n mostrada en la fi gura es:
IEcuaci6n 7.21 GiM (mm) =0,4533 + 0,0025 x TAS (mm Hg) El valo r del intercepto (0,4533 milimetros, en este ejemplo) es puramente te6rico; carece de toda relevancia biol6g ica en este caso . Corresponde al GIM estimado c uando la TAS es igual a O. Esto es: cuando la ec uaci6n de arriba se reduce a GIM (mm) = 0,4533. EI hecho de que el intercepto carezca biol6gicamente de significado es (fpico en muchas aplicaciones de la regresi6n lineal en la investigaci6n biomedica
2.00
•
1.50
E
•
.
• • • • .~• • • • ••
1.75
1.25
.s
1.00
"
0.75
••
~
•
•
0.50
0.25 0.00 0
20
40
60
80
100
120
140
160
180
200
TAS (mm Hg)
Figura 7.4. Linea de regrcsion que mejor se ajusta a los datos (estimacion por minimos cuadrados) para la nube de puntos de la Figura 72 (vease texto)
ESTRATIFlCACl6N Y AJUSTE:ANAUSIS MULTIVARIA!\'TE f.,,, EPIDEMIOUXIIA
249
puesto que el valor 0 para muchas variables no es biologicamente posible 0 no tiene relevancia practica. Esto se ilustra en la Figura 7.4 Y se reneja esquematicamente en la Figura 7 .5 .la cual muestra como el valor del intercepto es una mera extrapolaci6n de la linea de regresi6n para alcanzar la ordenada (eje y), mas alia del recorrido de valores biol6gicamente plausibles' . EI valor del coeficiente de regresion es mas relevante en la mayorfa de las circunstancias en que se emplea regresion lineal. En el ejemplo de arriba, el estimado del coeficiente de regresion para la TAS implica que, en estos datos transversales, un incremento de la TAS ascendente a un mm Hg se asocia con un incremento promedio de 0,0025 mm en el GiM . Este coeficiente de regresion es la pendiente de la Ifnea en la Figura 7.4, la cual expresa lajilCrzu de la asoc iacion entre TAS y GIM, en contraste con el coeficiente de correlaci6n, el c ual s610 comunica el grado en el c ual el conj unto de datos c uant itat ivos se ajusta a la linea recta .
GIM (mm)
Recomdo de valores biologicamente plansibles
1.20
....-_ ..-.-.-.. -1.00
Valores
.,/ ..-.-.-.. -_ ...
.
observado~
0.80
\
_.-.-.,0.6()
Recla de regrasi6n e:o;timada 0.40
b 0.20
o
Extrapolaci6n de la recta de regresi6n o
20
40
6()
80
100
120
140
160
180
lAS (mm Hg)
Figura 7.5. Datos o bser vados y ext rapolaci6n de la linea de re gresi6n hacia el ej e de ordcnadas (intcreepto)
* EI valor que tiene el intereepto es cruc ial si 101 intenci6n del investigador es emplear los resu l· tados de rcgres i6 n para predecir el valor espcrddo de 101 variable depcndiente. dadas ciertas carOle· teristicas . Para reso lver la ecuaci6n. se ncces ita usar los valores de todos los cocficientes, induyendo el intercepto (vease el ejemplo en el contexto de 101 regrcs i6n logistica en la Secci6n 7.4.3). Una via pard mejorM 101 intelJlrctaci6n del intel'l"Cpto consiste en hal"Cr trdnsfomlaciones de las varia· bles continU,l\ originales en 101 regresi6n . Por ejemplo. 101 media de tension sanguinea sist61ica pudierd sus trdersc de 101 tensi6n arterial de cada individuo en 101 poblaci6n de estudio de 101 Figurd 7.4 . Esta nueva variable (es decir. la diferencia entre 101 presi6n arterial de cada individuo y !a media) podrfa entonces ser empleada en 101 regrcsi6n. en lugar del verdadero V"dlor de tensi6n arterial. En este caso. a pcsar de que el interl"Cpto continua estando definido como el valor estimado del G IM pard un individuo con un valor nulo pard la variable indepcndiente (x). este puede ser interpretado como el V"dlor de G IM que cOlTCspon· deria a un individuo wn 101 tensi6n sanguinea promedio igual a la de 101 poblaci6n de estudio.
250
EPIDEMIOLOGiA lNTERMEDIA; CONCEPTOS Y APLICACIONES
EI modelo arriba comentado parte del supuesto de q ue e l incremento es lineal: esto es, q ue el incremento en GIM como una fllncion del incremento de la TAS es constante . Este su pucsto es(a implfcito, obviamente, en e l hecho de q ue se informa un unico coeficiente de regresion en la ecuaci6n (incremento de 0,0025 mm en G IM por carla mm Hg de incremento en la TAS), el ella ] supucstamente se aplica al recorrido complcto de valores de la TAS. Si este simple modelo es 0 no apropiado depended de las circ lInstancias particulares, como se discute mas dctalladamentc en la Secci6n 7.4 .7. Otro importante aspec!O, c uando se interpreta la «pendiente» (coeficiente de regresi6n) de lIna fllnci6n de regresi6n, es la unidad de medida a la que este corresponde. Por ejemplo, puede expresarse como eI incremento en GIM por 5 mm Hg de incremento de la TAS, mejor q ue por un mm Hg, 10 cual serfa entonces traducido como un valor de 5 x 0,0025 = 0,0 125 mm en este ejemplo . Es diffci l exagerar la importancia que tiene la especificacion de las unidades en que se ex presan las variables x e y cuando se comunica e interpreta la magn itud del coeficiente de regresion (pendiente) para todos los modelos de regresion (Tabla 7. 14) . Es imponante recordar, sin embargo, que la comparacion de la fuerza de la asociacion entre diferentes variables (particu larmente variables cont inuas) basada en e l tamano de los coeficientes de regresi6n debe ser, por 10 general, evitada. Esto se relaciona con e l problema general q ue entrana la comparaci6n de la intensidad de las asociaciones entre diferentes variables que ya fue discutido en e l Capftu lo 3 (Seccion 3.5) . Una disc usion adic ional del problema se presenta en el Capitulo 9, Seccion 9.3.4. El coeficiente de regresion (bd est ima e l incremento promed io en la variable depend iente (por ejemplo, Gl M), por unidad de incremento en la independiente (por ejemplo. TAS) y. como cualquier otra estimacion estadfstica. esta suje(a a la incen idumbre y al error aleatorio. Es imponante, por tanto, estimar e l error estandar del coefi ciente de regresion para evaluar su sign ificacion es(ad fsrica y calc ular los Ifmites de confianza en torno a la estimacion puntual (veanse Seccion 7.4.8 Y Apendice A) . El est imado del error estandar es facil de obtener por conducto de la mayorfa de los paquetes estadfsticos que tratan la regresion lineal; para e l coeficiente de regresion de b l =0,0025 en e l ejemplo, e l error estandar se est imo como ES(b 1) = 0,00032. Tanto la lfnea de la Figura 7 .4 como la correspondiente form ula matematica (Ecuacion 7.2) pueden entenderse como una manera de resum ir datos (una especie de caricatura) q ue intenta capturar su «esencia» a la vez q ue evita detalles innecesarios y abmmadores sujetos a variabilidad aleatoria y a error de medicion (vease Seccion 7.7) . El atractivo del modelo propuesto en el ejemplo - que la relaci6n entre TAS y GIM es lineal- radica en su simplicidad y en e l hecho de q ue e l coeficiente de regresion tiene una interpretacion muy simple e inmediata: es la pendiente de la funci6n de regresion, 0 el incremento promedio en GIM (en mm) por cada milfmetro de Hg de incremento en la TAS . Sin embargo, este modelo puede no ser apropiado, 0 bien no ser el que mejor describe los datos . Es. par ejemplo. posible que parametros adicionales que describan una relacion mas compleja (por ejemplo, una curva) pudieran describir los datos mucho mejor. Adic ionar nuevos parametros al modelo (por ejemplo, un tenn ino c uadratico) podrfa adicionar capacidad a la prediccion por ejemplo, al tomar en consideraci6n relaciones cu rvilfneas (vease Seccion 7.4.7). Sin embargo. frecuentemente esto da lugar a una interpretacion mas compleja de los
ESTRAT1FlCACl6N Y AJUSTE:ANAUS1S MULT1VAR1A!\'TE f.,,, EPlDEM10UXIIA
251
coeficientes de regresion . Usualmente hay un comprom iso entre la simplic idad (interpretabilidad) y la complej idad (poder predict ivo, ajuste estadfstico) en cualqu ier modelo estadfstico . En la ultima secci6n de este capftu lo (Seccion 7.7) se discuten brevemente varios aspectos conceptuales relacionados con e l arte y la ciencia de la modelaci6n estad fstica . Un ejemplo ad icional del uso de la regresi6n lineal 10 ofrecen los analisis ecologicos discutidos en el Capit ulo I. La Figura 1.1 0 muestra las tasas de mortalidad por enfermedad corona ria en hombres procedentes de 16 cohortes incl uidas en el est udio de 7 pafses frente a un est imado del consumo medio de grasas en cada shio est udiado('6). La figura tambien muestra el valor del coeficiente de correlaci6n (r = 0,84), e l cual indica en que medida la nube de puntos se aj usta a una Ifnea recta; la ecuaci6n de regresion correspondiente es: y= - 83+(25,l x x) donde y es la tasa de mortalidad coronaria en 10 afios (por 10.000) y x es e l porcentaje de calorfas procedentes de grasas en la dieta . Las est imaciones de la regresi6n pueden ser interpretadas del modo siguiente: • EI intercepto (-83) carece basicamente de significado 0 posibilidad de interpretaci6n en la «vida real», puesto q ue el re presenta la tasa te6rica en un pafs donde no hay consumo alguno de grasa . Su valor negat ivo pone de manifiesto e l caracter meramente te6rico de su posible interpretacion . • EI coeficiente de regresion (25,1) representa el incremento promedio estimado en la tasa de mortalidad por enfermedad coronaria en 10 afios (por 10 .000) asociada con un I % de incremento en la proporci6n de calorfas que provienen de la grasa en la dieta . En otras palabras, de ac uerdo con este modelo, un incremento de I % en la proporc ion de calorfas procedentes de las grasas se relaciona con un incremento de 0,00251 (0 2,s1 por 1.000) en la mortalidad coronaria en diez afios . (Obviamente , cualq uier inferencia causal generada a part ir de datos como estos debe tener en consideracion la posibilidad de la falacia ecologica). Como en el ejemplo precedente , el modelo anterior tambien supone q ue el incremento es lineal: es decir, q ue e l aumento en la mortalidad como funci6n del incremento de grasa en la dieta es constante, de manera q ue es tan dafiino que el nivel de grasa en la dieta cambie del 10% al I I % como 10 serfa un cambio del 40% al 4 1% . Por otra parte, una inspeccion cu idadosa de los datos de la figura sugiere que e l incremento en la mortalidad pudiera ser no lineal; es decir, q ue la relaci6n pudiera ser curvilfnea, con un incremento mas agudo en la mortalidad para niveles mas altos de consumo de grasas en la dieta q ue para niveles mas bajos . Para examinar esta hip6tesis alternativa, serfa necesario probar modelos no lineales mediante la inclu si6n de term inos c uadraticos o variables dummy (vease Seccion 7.4.7). Escapa al alcance de este texto discutir propiedades estadfsticas y supuestos relacionados con el uso de la regresion lineal. Disc usiones detalladas de estos t6picos pueden hallarse en libros de texto acerca de estadfstica general (por ejemplo, Arm itage y Berry (1 2) , asf como en libros mas especializados (por ejemplo, Draper y Smith('S)) .
252
EPIDEMIOLOGiA lNTERMEDIA ; CONCEPTOS Y APLICACIONES
7.4.2. Regresi6n lineal multiple La extensi6n del modelo de reg resi6n lineal simple (vease scedan previa) a lIna situaci6n multivariada se basa en el Hamada modelo de regresion lineal III/illiple . Los modelos de regresi6n lineal mu ltiple son tfpicamente empleados para los ajustes cuando la variable que mide e l desenlace (Ia y 0 variable dependiente) es continua , aunquc una aplicacion para desenlaces binarim se disclIte brevemente al final de esta secci6n. La cuesti6n es si una variable dada (XI) esta linea/mente asociada con el resu ltado (y) despues de haber controlado cicrto numcro de covariables (por ejemplo. x, y x,) . EI correspondiente modelo de regresi6n lineal se escribe del modo siguiente:
y = ~o + ~lXI + !l2X2 + fhx3 Los factores de riesgo conjetufados (las x 0 variables independientes) pueden ser tanto continuos como categ6ricos (por ejemplo, dicot6micos), como OCUfre en el ejemplo que se muestra debajo. Las variables categ6ricas pueden tener multiples niveles, que pueden ser tratados como ordinales 0 transfonnados en un conjunto de variables binarias (ind icadoras) (vease Secci6n 7.4.7). Consideremos un ejemplo del uso de regresi6n lineal mu ltiple . Puede ser de interes conocer si la presi6n sangu fnea sist6lica (TAS) esta linealmente asociada con el GIM (entend ida esta variable como una posible indicaci6n de la presencia de arterioesclerosis) as! como si dicha asociaci6n es independiente de la edad, el genero y el peso corporal. En la Tabla 7. 15 se presentan los resu ltados de una serie de analisis de regresion multiple para responder esta pregunta usando el subconjunto de individuos del estudio AR IC que fue empleado en el ejemplo de la secci6n precedente(Il). El primer modelo se basa en el mismo ejemplo disc mido anteriormente e incl uye solo TAS como variable independiente (Figura 7.4 y Ecuaci6n 7 .2) . El modelo 2 ad iciona la variable edad y puede escribirse del modo sigu iente: GIM (mm) = i30 + 131x TAS(mmHg) + f32 x edad (anos)
Tabla 7.15 Amllisis de regresion lineal multiple de la asociacion transvcrsal entre tension arterial sistolica y GIM en un subconjunto de participantes de la cohorte del condado Washington del Estudio de Riesgo de Arteriosclerosis en Comunidades (ARIe) , edades de 45 a 64 anos, 1987 a 1989 Coeficlente de regresi6n lineal Modeto 1
Modelo2
Modelo 3
Modelo4
Intercepto
0,4533
-0,0080
0,0107
-0,0680
Tensi6n arterial sist61ica (l mm Hg)
0,0025
0,0016
0,0014
0,0012
EClaCl (1 ano)
No Incluldo
0,0104
0,0096
0,0099
Genero (1 '" hombres, 0 '" mujeres)
No incluido
No incluido
0,0970
0,0981
Indica de masa corporal (1 kgtm')
No incluido
No incluido
No incluido
0,0033
Nota ; EI grosor de la intima·media de las artEnas carotideas (GIM), me
ESTRAT1FlCACl6N Y AJUSTE:ANAUSIS MULT1VAR1A!\'TE f.,,, EPlDEM10UXIIA
253
Los valores estimados de los coeficientes de regresion, obtenidos por el metodo de mfnimos cuadrados (vease 10 anterior), se exponen en la Tabla 7.1 5 (modelo 2). Usando estos valores, la ecuacion puede ser escrita nuevamente como una funci6n de las estimaciones: esto es, en funci6n de b o, hi y h2 (otra vez omitiendo el tennino del error, e, por razones de simpliddad): 1Ecuaci6n 7.31 GIM (mm) = -0.0080 + 0.00 16 x TAS (mm Hg) + 0.0 104 x edad (anos) Para representar este modelo grMicamente serfa necesario un sistema de ejes tridimensional: uno para la TAS, otro para la edad, y un tercero para el G IM. La nube de puntos sera una nube tridimensional en este espacio con tres ejes . EI modelo en la Ec uacion 7.3 expresa la fonnu la de un plano que se supone que nos provea de una buena representaci6n de la nube tridimensional 0, dicho de otro modo, de las relaciones lineales entre las tres variables. Cada uno de los coefi cientes de regresi6n en el modelo 2 puede ser interpretado del modo siguiente: • EI intercepto (h o = -0,008) corresponde al GIM estimado de un indiv iduo con cero anos y con TAS = 0 mm Hg; como en el ejemplo precedente, esto representa una extrapolaci6n carente de uso pr:ktico e incl uso de interpretaci6n alguna (vease Secci6n 7 .4 .1 ). • EI coeficiente de regresion para la TAS (b l = 0,00 16 mm) representa el incremento promed io estimado en GIM por cada mm Hg de incremento en la TAS habiendose controlado eI elecro de fa edad (es decir, luego de el iminar las asociaciones de la edad tanto con la TAS como con el GIM). • Similannente, el coeficiente de regresion para la edad (h2 = 0,0 104 mm) representa el incremento promedio estimado en G IM por ano de incremento en la edad mientras se conrmfa por la TAS (esto es, luego de eli minar las asociaciones de la TAS tanto con la edad como con el GIM) . (Para ver una derivaci6n sucinta y una interpretacion adic ional de los coeficientes de regresi6n ajustados en el contexto de la regresi6n lineal multiple, consu ltese el libro de Khan y Sem pos( ~) . Discusiones mucho mas detalladas sobre la regresi6n multiple pueden hallarse en los ya mencionados libros de texto de estadfstica). N6tese que el coeficiente estimado para la TAS (hi = 0,00 16 mm) en el modelo 2 es mas JX:q ueno que eI coeficiente correspondiente en el modelo I (0,0025 mm). Esto se debe a que la edad es un confusor de la relaci6n entre la TAS y el GIM. En otras palabras, algunas de las relaciones aparentes que se observaban entre la TAS y el G IM en el analisis crudo (modelo I) eran debidas al hecho de que las JX:rsonas con mayores valores de TAS tienden a ser mas viejas, y las JX:rsonas mas viejas tienden a tener mayor grado de arterioesclerosis . En el modelo 2, la fuerza de la asociacion entre TAS y G IM esta reducida en virt ud de que el efecto de confusi6n de la edad (positivo) se elimina, al menos parcialmente (vease Secci6n 7.5). Un importante supuesto implfcito en el modelo de la Ecuaci6n 7.3 es que no hay interaccion entre TAS y edad, las dos variables inclu idas en el modelo . En otras palabras, el hecho de suponer que el cambio en y asociado con el cambio de una unidad en XI es constante en el recorrido entero de X2 y viceversa, esta implfcito en la form u-
EPIDEMIOLOGiA lNTERMEDIA; CONCEPTOS Y APLICACIONES
254
laci6n de este modelo estad fstico (y = bo + b ,x , + b2x2). En este ejemplo, el incremento en e l GIM por un idad de incremenlQ en la TAS, la estimaci6n h i = 0,0016 mm, no solo esta aj ustada por la edad sino que lambicn debe ser aplicable a individ uos de todas las edades (y el inverso es cicrto para b 2 ). 5i hubiera interaccion, esto es, si e l cfccto de la TAS sabre el GIM fue ra diferente entre individ uos mas viejos y mas j6venes - entonces el modelo reslimido en la Ecuaci6n 7.3 no serfa apropiado. Como se discute en e l CapItulo 6, cuando un facIQr dado (en este ejemplo, la edad) modi fica e l cfccto de la variable de interes (en este ejemplo, TAS) se recomienda q ue la asociaci6n entre la variable de inten!s y e l desenlace sea evaluada en estratos formados por las categorfas del modificador de efecto. Asf, en lugar de un ajuste por edad, deben emplearse modelos estratificados por edad (es decir, modelos separados para cada gru po de edad), situacion analoga a la de los ejemplos d iscutidos en la Seccion 7.2. Una tecnica analftica alternat iva para encarar el problema de la interaccion en el contexto de la regresi6n multi ple consiste en incl uir ferminM de infemcci6n (tam bien conocidos como ferminM I'roductos) en la ecuaci6n de regresion. Por ejemplo, en la presente ilustraci6n, si se sospecha una interacci6n entre la TAS y la edad, entonces puede emplearse el modelo siguiente: IEcuacion 7.41 G IM = ~o + (~l x TAS) + (fh x edad) + Ifh x (TAS x edad)] donde (TAS x edad) re presenta una nueva variable que se obl iene multiplicando los valores de TAS y de la edad para cada sujeto. Notese que si TAS y edad fue ran variables b inarias, este modelo serfa an:llogo a los modelos estrarificados. En comparacion con los analisis estratificados. e l uso de los terminos de interaccion incrementa la efic iencia estadfstica y tiene la ventaja de penn itir la eva luaci6n de la interaccion con 0 entre variables cont in uas . EI termino de interacci6n puede ser conceptualizado como el exceso en el cambio no ex plicado por la suma de los efectos indiv id uales de dos variables independientes (x); esto se representa esquematicamente en la Figura 6.3 del Capit ulo 6 (interaccion) por el exceso. < entonces es importante ajustar XI por X2, x ), y el lennino de interacci6n (x~) . Ajustar por el tennino de interaccion es importante puesto q ue las distribuciones de X2 0 de X3 (cuando se examinan individualmente) pueden ser las mismas para d iferentes categorfa de XI (digamos, expuesws frente a no expuesws) pero las distribuciones de la presencia conjunta de X 2 y Xl (X~~) pueden ser diferentes, y asf el termino de interaccion puede actuar como una variable de confusion . Ademas. como la interaccion por sf misrna es susceptible de efcctos de confusi6n (vease Capftulo 6, Secci6n 6.10.2), es obvia la importancia de ajustar el tennino de interacci6n segun otras variables en el mOOeh Para mas delalles acudase a libros de bioestadfsrica (por ejemplo, Annitage y Berry I2). EI modelo 3 en la Tabla 7.15 agrega una n ueva variable, e l genero . Se trata de una variable dicotomica, a la que se ha asignado arbitrariamente e l valor I para hombres
ESTRAT1FlCACl6N YAJUSTE:ANAUSIS MULT1VAR1A!\'TE f.,,, EPlDEM10UXIIA
255
y el valor 0 para mujeres. Como con cualqu ier otra variable, el coeficiente b 3 = 0,097 se interpreta como e l incremento ajustado, en G IM (mm) por «un incremento de una unidad en el genero», solo que 10 que esto efect ivamente significa en e l caso del genero es una diferencia promedio en G IM entre hombres y mujeres, ajustada por otras variables en el modelo (TAS y edad) (Figura 7.6). (Si la variable genero hubiera sido codi ficada como I para mujeres y como para hombres, entonces los res ul(ados hubieran sido identicos a los mostrados en la Tabla 7.1 5, salvo que el signa del coeficiente habrfa sido negativo - es decir, b 3 = .....(),097, representando la diferencia, mujeres menos hombres. en GIM). La interpretacion de los coeficientes en el modelo 4, mos{rado en la Tabla 7.1 5, es consistente con la de los modelos 2 y 3 excepto en que hay un ajuste ad icional para e l Indice de masa corporal (1J\.1 C). Tal y como se vio en la tabla, la magni{ud del coefici ente para la TAS disminufa en los modelos 3 y 4, sugiriendo que no solo la edad sino {am bien e l genero, y el IMC eran confusores (positivos) de la relaci6n observada entre la TAS y GIM. EI incremento en GIM por mm Hg en la TAS despues de controlar simuitaneamente por edad, genero e IMC (modelo 4; 0,00 12 mm) es alrededor de la mitad del valor estimado cuando no se ajustaba por ninguna de estas variables (modelo I ; 0,0025 mm). Con prop6sitos inferenciales, es importante considerar la posibilidad de que los confusores no incluidos en e l modelo y la confu-
°
GIM (mm) 1.20 : 1.00 :
j
0.80 :
. . . . . . . . . . . . . . . . . . . . .,.•• • • • 1,,
0.60 ,.. .
0.40 : 0.20 :
bo
o Ganero
Figura 7.6. Interpretacion gralica del cocliciente de regresion para una variable dicotomica tal como el genero (como en I()s model()s 3 y 4 de la Tabla 7.15). Por analogia c()n la situaci6n de regresi6n c()n una variable continua independiente (per ejemplo. Figura 7.4), la linea de regresi6n se ubica gnificamente entre los dos conglomerados, incluso aunque no haya valores posibles entre x = 0 y x = I. N61ese que el intercepto (h a) corresponde al valor GIM medio en mujeres (x = 0 ). mientras que el coeficienle de regresi6n (hi) representa la diferencia promedio entre hombres y mujeres.
256
EPIDEMIOLOGiA lNTERMEDIA ; CONCEPTOS Y APLICACIONES
sian residual debida a, por ejemplo, la clasificaci6n err6nea de covariables tales como el IM C, puedan ser responsables de al menos una parte del efecto residual aparente de la TAS, como pone de manifiesto un coeficiente de regres i6n de 0,00 12 mm (vease Secci6n 7 .5) . Tal y como se indica en la Figura 7.4. un modelo con lIna variable independiente (modelo 1) puede ser f:k ilmente representado en un grafico; tal es el caso del mode102, aunq uc ei requerirfa un grMico tridimensional. En contraste, los modelos 3 y 4 (es decir, modelos de regresi6n con mas de Ires dimensiones - con una variable y y mas de 2 variables x) no pueden ser representados graficamente . Sin embargo, la interpretacion de los coeficientes de regresion en los mode los 3 y 4 sig ue siendo an
ESTRATIFlCACl6N YAJUSTE:ANAUSIS MULTIVARIA!\'TE f.,,, EPIDEMIOUXIIA
257
Tabla 7.16 Analisis de regresion lineal multiple de variables demograficas y constitucionales relacionadas con eI conteo de leucocitos (en miles por mmj) enlre personas que nunca rumaron (n = 5.392) en la ("ohorte del Esludio de Riesgo de Arterioesclerosis en Comunidades (ARIC), 1987 a 1989 Variable (Incremento para b)
Coeflclente de regresl6n lineal'
Edad (5 arios) Sexo (1
:0
hombres. 0 '" mujeres)
Raza (1 :0 blanco. 0
:0
negro)
Escala de actividad en el trabajo (1 unidad)
Error estandar d. b
-0.066
0.019
0.478
0.065
0.495
0.122
-0.065
0.02 t
Pliegue subescapular (t o mm)
0.232
0.D18
Tensi6n arterial sist61ica (to mm Hg)
0.040
0.D11
-0,208
0.047
0.206
0.020
FEVI (1 L) Frecuencia cardiaca (t o latidos/min)
, Todos kls coeiiciente s de regresi6n SOn estad isticamente si9n~icalivos (E stadislico de Wald : ver Secci6n 7.4.8). P<:O.OI. Fuente: FJ Nieto et a/.• Leukocyte Count GJrrelates in Middle·Aged Adults: The Atherosclero sis Risk in Communi·lies (ARle) Study, American Journal 01 Epidemiology, Vol 136. 525·537 11:11992, The Johns Hopkins Univers~y School of Hygiene & Public Health.
en todas las variables independientes - es decir, una mujer negra recien nacida, con (en~ i on ~ i sto li ca
= 0 , s in larifios fiei corazon, etc)
En esta secci6n y en las secciones previas, los me(Qdos de regresion lineal han sido descri(Qs en el contexto de S ll aplicaci6n usual ; esto es, para la evaluaci6n de predictores de Ilna variable de desenlace continua (por ejemplo, GIM). Sin embargo. es posible extender este metodo a la evaluaci6n de variables binarias (dicotomicas). tales como la presencia de arterioesc lerosis carotfdea definida como variable categ6rica (presente 0 ausente) . 0 la ocurrencia de un evento incidente (por ejemplo. enfermedad . muerte). usando el enfoque propuesto por Feld ste i n ('~) . En esta situaci6n. los coeficientes de regresi6n se interpretan como la predicci611 del incremento ell fa probabilidud (prevulellcia a incidellciu ) del de.\·enlace de interes en relaci6n a un incremento dado 0 cambio en el valor de las variables independientes. mientras se ajusla simu ltaneamente por todas las otras variables en el mode lo(8.p"g . I44- 1 ~7) . Una cautela teorica que ha de observarse al aplicar este metodo se relaciona con la violaci6n de algunos de los supuestos basicos de la relaci6n li neal (por ejemplo. que los errores e estan distribuidos normalmente: vease Annitage y Berry(12). Otro importante problema se relaciona con las extrapolaciones a valores extremos. puesto que pueden resu ltar en estimaciones absurdas de las probabilidades predichas (por ejemplo. m enore~
'1ue 0
0 ma yore~
que I ) Como consecuencia fie
e~lo~ rmhl e ma ~,
e l mooelo
de regresion lineal binaria de Feldstein ha cafdo en desuso, particularmente debido a la creciente dispon ibilidad de poderosos recursos computacionales. tales como el modelo de regresi6n logfstica y los metodos relacionados con el (veanse las secciones sigu ientes) . Sin embargo, el enfoque parece producir estimaciones aju stadas en lfnea con aquellas que son obten idas mediante otras estrategias de regresion.
258
EPIDEM IOLOGiA lNTERMEDIA; CONCEPTOS Y APLICACIONES
7.4.3 . Regresi6n logistica multiple Para variables binarias de respuesta tales como la OC lIrrencia de la muerte, 1a enfermedad, 0 la recuperaci6n, eI modelo de regresi6n log fstica ofrece una alternativa mas rob usta q ue la regresi6n lineal multiple binaria . El modelo de regresi6n log fstica supone que la reladan entre un valor dado de lIna variable x y la probabilidad de un desenlace binario sig ue 1a asf lIamadaflll1ci6n logistica:
[Ecuadon 7.5J
donde P(ylr) denota la probabilidad (P) del desen lace binario (y ) para un valor dado de x. El resuitado de esta ecuadon, una probabi lidad, se constrifie a valores en el recorrido de 0 a I. La Figura 7.7A muestra un panorama grafico de esta funci6n en el caso de lIna variable cont inua x. Procede puntualizar que el aspecto de esta funcion parece ser biologicamente plausible para eI tipo de relaciones dosis - respuesta observada en toxicologfa y la evaluaci6n de riesgos- esto es, situaciones en las cuales bajas dosis de x inducen una respuesta debi l hasta cierto umbral, despues del cualla res puesta se incrementa marcadamente pero, mas alia de cierto nivel de x, ocurre un efecto de saturacion (cuando la probabi lidad de desenlace se torna proxima a uno). La plausibilidad biologica, sin embargo, no es la princi pal raz6n para explicar la popularidad de la regresi6n logfstica para el analisis mu ltivariante de predictores de un desenlace binario . Mas bien, las razones por las que este es uno de los metodos mas populares para el analisis multivariante de datos epidemiol6gicos son la conveniencia e interpretabilidad de las estimaciones de sus parametros, f:kilmente convert idos en es-
A
B 5
1,0 0,8
,
".g °
~ ~
• n•
0,6
~
~
:5
•
~
0,4
'g; ~
0,2 0,0
-0 X
P()Ax) ::
1 1 +e -(Ilo· b,>l
X
log
[ (1~P'j
I"Do
+
tv
Figura 7.7. Dos formulacionc s matcma ticame nte equivalentes de la funcion de rcg resion logistica
ESTRAT1FlCACl6N Y AJUSTE:ANAUSIS MULT1VAR1A!\'TE f.,,, EPlDEM10UXIIA
259
timaciones de odds ratio; esw es obvio cuando la Ecuacion 7.5 se ex presa de una manera matematica eq uivalente como la que sigue: 1Ecuacion 7.61 log
(_P _ )= log odds = bo + b1x I- P
donde P es la variante simplificada para expresar P(ylx) en la Ec uacion 7 .5 . Esta expresion es analoga a la fllncion de regresion lineal simple (Seccion 7.4.1), excepto en el hecho de que la ordenada es ahora el logaritmo del odds (log odds, tambien conocido como logir), en lugar del valor medio usual de una variable cont inua . Asf, si la relacion entre la exposicion (x) y la ocurrencia del desen lace se supone que se ajusta al modelo de regresion log fstica, esto impl ica que el log oddJ" del desenlace se incrementa linealmente con x (Figura 7.78 ) . En el contexto de un estudio de collOrte (en el c ual se obtienen datos sobre la incidencia del desenlace) , la interpretacion de los parametros de la ecuacion de la regresion logfstica es an:lloga a la de los parametros del modelo de regresion lineal (Secc ion 7.4 .1 .), del modo siguiente: • EI intercepw (b o) es una estimacion del log odds del desen lace cuando x=O . Como en la regresion lineal, este valor puede no tener una interpretacion ut il en sf mismo cuando x = 0; en ese caso es una mera extrapolacion del recorrido real (posible) de los valores de ex posicion . • EI coeficiente de regresion log fstica (b j ) es el incremento del estimado del log odds del desenlace por unidad de incremento en el valor de x: o. en otras palabras. e b , es el odds ratio asociado a un incremento de una unidad en la x . Como ilustracion del sign ificado de b l en una fllncion logfstica, consideremos una situacion donde x es la variable dicm6mica sexo, para la cual valores de I 00 se asignan a hombres y m ujeres, respectivamente . Una vez estimado el valor del coeficiente de regresi6n, las ec uaciones de regresion logfstica pueden ser fonnuladas para cada genero del modo siguiente: Para hombres: log (odd.\-)homb«> = bo + b l Para mujeres: log (odds)mujere. = ho + h i
X
X
I = bo + b l
0 = ho
As!, b l es la diferencia en el log odds entre hombres y mujeres, 10 cllal, como un resu ltado de las propiedades aritmeticas de los logaritmos, es tambien el log odd,\" ratio que compara hombres y mujcres: (olids)t.;,mbru ) b l = log(odd)homb«< - log(odds)mujere, = log ( = 10g(OR) (Odd,\-)mujere. Del mismo modo, si la variable x en la Ecuac ion 7 .6 es contin ua, el coeficiente de regresion, h i, que representa el incremento en log odds por unidad de incremento en
260
EPIDEM IOLOGiA lNTERMEDIA; CONCEPTOS Y APLICACIONES
x, puede ser convertido en el lag del udds ratio cuando se campara c ualquier valor de x con un valor(x - I). Consecuentemente el oddJ' ratio correspondiente a una unidad de incremento en la variable independiente (por ejemplo, cuando se comparan hombres y mujeres en el ejemplo anterior) es el antilogaritmo (es decir, la funci6n exponendal) del coeficiente de regresi6n, b j :
OR = eh l A modo de ejemplo, la Tabla 7. 17 llluestra los coeficientes de regresion logfstica correspondientes a las asociaciones entre varios fac(Qres de riesgo y la incidencia de enfennedad coronaria (Eq en un subconjunto de partic ipames del estudiQ ARIO I9). Es(Os an.i.lisis se basan en la incidencia acumulada de EC entre el examen inicial ( 1987-1989) Yd iciembre de 1994, para 3.597 p..1rtic ipantes del condado de Washi ngton q uienes estaban libres de EC c1fnica al comienzo. Un total de 171 eventos incidentes de EC (infarto de miocardio, muerte por EC, 0 cimgfa coronaria con bypass) fueron identificados al fina l del seguimiento . (Para mas detalles sobre los metodos y resultados de este est udio de seguimiento en la cohorte completa de ARIC, vease C hambless et al Y'll)). L1 columna rotu lada «coeficiente de reg resion logfstica» en la Tabla 7. 17 presenta el intercepto y los coeficientes de regresion ajustados para las variables independ ientes consideradas. Cada coeficiente de regresion de la Tabla 7 .17 se aj usto por todas las otras variables en el modelo (listadas en la tabla) y pueden ser convert idos en odds mtioJ" ajustados (vease ultima columna) . Por ejemplo, para el genero, el odds ratio de la EC incidente que compara hombres con mltieres es: ORoombn>sin",jer<.
= elJOi S = 3,70
Tomando un ejemplo de una variable contin ua, la tension arterial sistolica (TAS), e l odd.\" ratio aj ustado para una un idad de incremento ( I mm Hg) es: ORl mmH g7AS
= e!l Jll 6i = 1,017
Tabla 7.17 Resulta do del a mHisis de una regresion logistica de predictorcs binarios y continuos de la enrermedad corona ria y su incidencia en la cohorte del condado de Washington del Estudio de Riesgo de Arterioesclerosis en Comunida des (ARIC), eda des de 45 a 64 en el momento inicial, 1987 a 1994 Vari able Intercepto
Coeficlente de regresl 6n togistica'
Odds Ratio
-8,950 2
Genero (hombres :01, mujeres '" 0)
t .3075
3,70
Fuma (si • 1 ,no . 0)
0.7413
2,10
Edad (1 ano)
0.0114
1.011
Tensi6n arterial sist61ica (1 mm Hg)
0.0167
1,017
Colesterol serico (1 mg/dL)
0.0074
1,007
Indice de masa corporal (1 kg/m')
0.0240
1,024
ESTRAT1FlCACl6N Y AJUSTE:ANAUS1S MULT1VAR1A!\'TE f.,,, EPlDEM10UXIIA
261
Adviertase que e l odd.\· ratio para la TAS es muy peq ueno porque se calcula para un incremento muy reducido de la variable independiente ( I mm Hg) . Un odds ratio relacionado con una unidad de la TAS clfnicamente mas significativa, tal como 10 mm Hg de incremento, puede, si embargo, ser facilmente obtenido mediante transfonnaci6n del valor del coeficiente en esta unidad de TAS y entonces recalcular e l correspondiente odds ratio:
Los OR para la edad, colesterol serico e fnd ice de masa corporal en la Tabla 7 .1 7 tambien corresponden a cambios pequenos ( I ano, 1 mgldl, y 1 kg/m\ respectivamente) y pueden similannente ser convertidos a unidades con mas sentido . Para e l colesterol :rerico, por ejemplo, e l odds ratio correspondiente a 20 mg /dl de incremento es: OR 20mWdLrol =e20·oD07~ =
1,16
Para la edad, el odd.\· ratio correspondiente a un incremento de 5 anos es: ORSaAo, de e
= eS. OJlJ 14= 1,06
La validez de estos d lculos depende de uno de los supues(Qs principales subyacentes en eluso de variables cont inuas en los metodos de regresion multiple (veanse tambien secciones 7 .4.1 y 7.4.7): que las relaciones sean lineales (en la escala de los log OlJd.\·, en este caso particular) a 10 largo del recorrido completo de los datos (por ejemplo. para la edad. que el incremento en los log odd.\· de la incidencia de EC asociada con un incremento de una un idad en la edad es el mismo a 10 largo del recorrido de edades de los partici pantes en eI est udio). Este supuesto, sin embargo, puede ser suavizado si las variables continua5 se convierten en variables binarias de ex posic ion, tales como, «mas viejos» frente a «mas jovene s~) como categorfas de edad, 0 «hipertensi6n presente» frente a «hi pertensi6n ausente», como se ilustr6 en la Tabla 7 .18. Notense los cambios en los valores de las estimaciones resumidas en la Tabla 7.18, comp..1rados con los de la Tabla 7 .1 7. Las definiciones de genera y habito de fumar no cambiaron , pero debido a que las covariables de ajuste (todas las otras variables) 10 hicieron, los coeficientes de «regresion aju stados~> y correspondientes OR para e l genero y el habito de fumar son ligeramente diferentes. Sin embargo, las est imaciones para los otros predictores cambiaron de manera mas acentuada, como resu ltado de su transformacion de la condici6n de continua>; (Tabla 7 .17) a categoricas (Tabla 7 .18). Por ejemplo, el OR ajustado para la hipertensi6n ( I ,67) en la Tabla 7. 18 se interpreta como la raz6n de los odd.\· de incidencia de EC para individuos que cumplen los criterios empleados para definir hipertension (tensi6n arterial sisr6 lica C!: 140 mm Hg 0 dia>;tolica C!: lX) mm Hg 0 terapia antihipertensiva) a los odds de aquellos que no c umplen ninguno de esos criterios de hipertension. Esto es muy diferente de la estimacion para la TAS en la Tabla 7 .1 7, tanto en valor como en interpretac i6n. N6tese que la definicion dicotomica de hipertension (0 la de cualqu ier otra variable intrfnsecamente continua), a la vez que evita e l supuesto de linealidad inherente a la definici6n continua, no esta libre de supuestos, ya que implica que e l riesgo de EC sea homogeneo dellfro de la>; categorfa>; de hipenensi6n. Si hay un gradiente de riesgo dentro de las categorfas
262
EPIDEMIOLOGiA lNTERMEDIA ; CONCEPTOS Y APLICACIONES
Tabla 7.18 Rcsultado de UII analisis de rcgresioll Iogfstica de prcdictores binarios de ellfcrmcdad coronaria (EC) en la cohortc del condado de Washington, Estudio de Ricsgo de Arteriosclerosis en Comunidades (ARIe), edades de 45 a 64 alios en cI momento inicial , 1987 a 1994 Coeficlente de reg res ion logfstica
Variable Inlercepto Genero (hombres
Odds Ratio
--4.5670 I , mujeres
0)
1.3106
3 ,71
Fuma (si::o l , no:oO}
0,7030
2,02
Edad avanzada* (si ::: 1, no ,,0)
0.1444
1,16
Hipertensi6n" (si ::: 1, no ,,0)
0.5103
1,67
Hipercolesterolemia'" (si " I , no::: O)
0.4916
1,63
Obesidad· .. • (si ::: 1, no '" 0)
0,1916
1 ,2 1
:0
:0
, Edad ., 55 ai'Kls . " Tens i6n allaria] sist61ica ., 140 mm Hg 0 di ast6lica ., 90 mm Hg 0 18,apia antihiperte nsiva , ,., Colestero l serico total ~ 240 mgldL 0 tratamento hipolipemiante. •••• looice de masa corporal ~ 27,8 k!}lm' en hombres y ~ 27 ,3 k!}lm' mujeres.
de hipenensi6n, esta infonnaci6n se pierde en e l modelo. Advienase que la perdida de infonnaci6n puede resultar en confusi6n resid ual (Secci6n 7.5). Consideremos , por ejemplo .la evaluacion de la asociaci6n entre e l habito de fumar y el odds de EC. con e l ajuste por hipenensi6n (y otras variables), como se expone en la Tabla 7.1 8: dado e l hecho de q ue la relacion entre la tensi6n arterial y EC sigue un patr6n dosis-respuesta (una gradacion), la confusion residual pudiera haberse prod ucido en caso de que los hipenensos entre fumadores hubieran tenido valores de tension arterial mas altos que los hipertensos entre no fumadores . A pesar de la posible perdida de informacion, a diferencia de algunos de los ejemplos discutidos previamente, eluso de variables dicotomicas como las que se muestran en la Tabla 7.1 8 pennite una interpretacion del illfercepto en la regresi6n logfstica que pudiera ser (itil de varias maneras. En primer lugar, en el contexto de datos procedentes de un estudio prospectivo, y sobre la base de la Ecuacion 7.6, el intercepto puede interpretarse como el logaritmo del oddJ' para ind ividuos con valores nulos para todas las variables independientes . Por ejemplo, de acuerdo a los resu ltados presentados en la Tabla 7.18 , el intercepto representa e llogaritmo del odds de casos incidentes de EC para mujeres no fumadoras que tienen edades entre 45 y 54 afios, no hipertensas, no hipercolesterolemicas, y no obesas. Este valor se calcula como -4,567 + 0, 0, transfonnado al valor correspondiente en la escala aritmetica , odds = e _ ~.St.7 = 0,0 104 . Si e l prop6sito es predictivo, este resu ltado puede ser traducido a uno mas faci lmente interpretable, el estimado de incidencia (probabilidad, p) acumulada, (vease Capitulo 2, Seccion 2.4) del modo que sig ue:
P=
Odds
0,0104 = -:-'-';:-':'c:-:- = 0,0 103, 0 1,03% 1 + Odds 1 +0,0 104
-:-=-::='c-
ESTRAT1FlCACl6N Y AJUSTE:ANAUSIS MULT1VAR1A!\'TE f.,,, EPlDEM10UXIIA
263
Este ejemplo subraya la utilidad del intercepto cuando los valores nu los caen denlro del recorrido de valores de las variables independientes que res ultan biol6gicamente plausibles . En contraste, la interpretacion del intercepto por sf mismo carece de sentido cuando se usan res ultados tales como los que aparecen en la Tabla 7.1 7. Segundo, como ocurre en los modelos de regresi6n en terminos generales, el intercepto se necesita en la regresi6n logfstica para obtener la probabilidad predic ha (incidencia acumu lada) del desenlace para un ind ividuo poseedor de ciertas caracterfst icas dadas . Por ejemplo, basandonos en los resultados que aparecen en la Tabla 7 .18. la probabilidad de EC para un hombre fuma dor. menor de 55 afios. hipenenso, no hipercolesterolemico, y obeso puede est imarse simplemente mediante la sustituci6n de los valores de cada variable x en una ec uacion de la forma que se muestra en la Ecuaci6n 7.5, tal y como se aprecia a continuaci6n:
1
-;-,--:-:"",",-;-;-:;:;-",,;;-c;;;:;;-:-;-;;;;::;I + e-+4.S67 + 13106 + 0.703 +O~10 3 +0.1 916) = 0, I 357 = I 3,57 %
De igual forma, los resultados de la Tabla 7.1 7 pueden usarse para estimar la probabilidad de EC en un individuo con valores espedficos de cada uno de los parametros fi siol6gicos medidos . Esto puede hacerse para un individuo con valores promedios en tOOas las covariables. Por ejemplo, los valores promedio de las covariables presentadas en la Tabla 7.17 para los individuos de esta cohorte de ARIC fueron los sigu ientes (n6tese que el valor promedio de las covariables dicot6micas es la propord6n de indiviuuos (;0[1 d valor qut: fut: (;ouifi(;auo (;omo I): g~nt:ro mas(;u lino = 0,469; habito ut: fumar =0,229; edad = 54,7 arios; TAS = 11 9, 1 mm Hg; colesterol = 2 17,7 mgldl; IMe = 27,8 kg/m2. Asf, usando los resultados de la Tabla 7. 17, la probabilidad predicha de EC incidente para un <
-;-,--,-:,1",,;;;:::;- = 0 0364 = 3 64 % I + e-'- 3.276-1WU)'
,
(EI concepto de individuo I'romClJio es abstracto, especialmente con respeto al promed io de variables binarias. Por ejemplo, en este caso, significa un individuo que tiene «0 ,469 de masc ulinidad» y «0,229 de habito de fuman) y que tiene un valor medio para las o tras covariables cont inuas) . Como otro ejemplo de la aplicaci6n del mOOe lo logfstico para la predicci6n, los investigadores del estudio de Framingham prOOlljeron la Hamada ecuaci611 de riesgo logi~·tico IIlIilfiple de Fram ingham, que puede usarse para estimar el riesgo de enfermedad cardiovascu lar a 10 largo del tiempo para una persona con un conjunto dado de valores para varias variables relevantes (genero, edad, colesterol serico, tensi6n anerial sistolica, habito de fumar cigarrillos, hipertrofia ventricular izqu ierda segun ECG e intolerancia a la glucosa)(II).
264
EPIDEM IOLOGiA lNTERM EDIA; CONCEPTOS Y APLICACIONES
EI uso de estos modelos con prop6sitos prediclivos supone, desde luego, que e l modelo se aj uste razonablemente bien a los datos. Ademas. la discusi6n anterior sabre la interpretaci6n del intercepto y de los calculos de las probabilidades estimadas del evento es relevante cuando los datos son prospectivos. EI uso del modelo de regresi6n logistica para el an.i.lisis de datos de cohorte, sin embargo. se limita a que e l modelo ut il ice datos de incidencia acumulada y, por tanto, tiene q ue descansar en dos importantes sup uestos: que el seg uimiento de los part icipames del estud io sea complc{Q, y q ue e l tiempo transc lIrrido hasta la ocurrencia del evento 0 desenlace no tienen importancia . EI hecho de q ue estos supuestos normalmeme no res ulten satisfec hos viene subrayado por las entradas tardfas en muchos est udios de cohorte en los q ue e l reclutamiento se lleva a cabo a 10 largo de un periodo de tiempo mas 0 menos extenso; por perdidas subsecuemes en el seguimiemo; y por la variabilidad de los periodos de latenda para la mayorfa de los desenlaces de interes, 10 que convierte al tiempo que transc urre hasta que se produce e l evento en un dato importante (vease Capitulo 2, Secdon 2,2), Para el analisis de datos de cohorte con un seg uimiento incompleto para algunas observadones se dis pone de herramientas de analisis mu ltivariame mas apropiadas, como se vera en las dos secdones sig uiemes , La aplicacion mas frec uente del modelo de regresi6n logfstica se da en el contexto de los est udios de casos y controles, dDnde constituye la herramienta analftica fundamental para los analisis multivariantes(21 22) , En un eJ'tudio de caso.\' Y COnfroles, la interpretacion de los coeficientes de regresion es identica a la de un estudio de cohorte (es decir, el log del odds ratio), como se muestra en los ejemplos que siguen, Por olra parte, cuando los datos provienen de un estudio de casos y comroles, el interceplo no es interpretable de una manera sencilla, ya que las fracciones de muestreo para casos y controles han sido arbitrariamente detenninadas por e l investigador (para una d iscusian mas tecnica de este aspecto. vease Schlesselman (22)), Un ejemplo del uso de la regresion multiple en un eSllld io de casos y comroles procede de un estudio de la seroprevalencia del virus de la Hepatitis B en trabajadores de la salud en Boston a fi nales de los afios setenta y comienzo de los ochenta - esto es, antes de la introduccion de la vacuna para el virus de la Hepat itis B 1l3). En la Tabla 7.1 9 se presentan algunos hallazgos de este eSlUdio. espedficamente lo~ resultados de un analisis de regresi6n logfstica multiple orientado a la identificaci6n de variables asociadas con los OlJd,\, de positividad a la Hepatitis B por medio de anticuerpos stricos. L.1 tabla muestra tanto los coefi dentes de regresion logfstica como los OR correspondientes, (asf como los intervalos de confi anza aI 95%: veanse Secd6n 7,4.8 y Apendice A, Secd6n A.9) , EI intercepto fue omitido debido a su irrelevancia (vease arriba) , Debe advertirse que las primeras Ires variables son dicotomicas; consecuentemente, el coeficiente de regresion para cada una de estas variables re presenta la diferencia en ellog odds entre las dos categorfas correspondientes (en olras palabrns, el antilogaritmo del coeficiente de regresi6n representa e l odd,\, ratio que compara la categorfa de «exposicion» - codificada como uno - «con la categorfa de referencia» codificada como cero). Por ejemplo, para la variable «rec iente puncion con aguja» , el valor 0,8459 es la diferencia estimada en e l log odds de anticuerpos positivos entre aquellos con y entre aquellos sin una historia de redente pund6n con aguja, despues de ajustar por todas las otras variables de la labia , Consecuentemente, el odd,\, ratio asociado con la reciente puncion con aguja se estima como e°Jl.l59 = 2,33 . Las dos variables que se hallan mas abajo en la Tabla 7.19 (edad y afios de ocupacion) fueron introducidas en e l modelo como cont inuas, y los coefidentes de regresion asf como los OR correspondientes son los que corresponden
ESTRAT1FlCACl6N Y AJUSTE:ANAUS1S MULT1VAR1A!\'TE f.,,, EPlDEM10UXIIA
265
Tabla 7.19 Analisis de regresion logistica m ultivariada de ractores de riesgo para la presencia de anticuerpos sericos del virus de la Hepatitis 8 en trabajadores de la salud, 80ston, Massachusetts, 1977 a 1982 Caracteristlca
Coeficlente de reg res ion logrstica
Odds ratio (Intervalo de conllanza 95%)
Exposici6n ocupacional aI contacto con sangre (sf/no)
0.7747
2,17 (1 ,31 - 3,5B)
Reciente punci6n con aguja (sf/no)
0.8459
2.33 (1. 19 - 4.57)
Serologfa positiva al virus de la Hepatitis A (s f/no)
0.6931
2,00 (1 ,13 - 3,54)
Edad (1ano)
0.0296
1,03 (0.99 - 1.06)
Arios en la ocupaci6n (t ano)
0.D19B
1,02 (0,97 - 1,0B)
Fuente: A Gibas el al. , Prevaleoce ar.d Incidence 01 Vi ral Hepatitis in Health Workers in the Prehejlatitis B Vaccination Era, American Journal 01 Epidemiology, Vol 136, 603·610 Cl1992, The Johns Hopkins Univers ity School of Hygiene & Pubfic Health.
a un incremento de un ano . Por ejemplo, para «anos de ocupad6m>, el valor 0,0 198 representa el incremento estimado ajustado en el log odds de antic uerpos positivos por cada ano de incremento en la durad6n del empleo como trabajador de la salud . En otras palabras, el oddJ' ratio ajustado correspondiente a un incremento de un ano de ocupad6n se estima como eOJlI98 = 1,02. Debe volverse a enfatizar que el modelo de regresi6n logistica es un mOlielo /ineal ell la escala de log Olids, como se vio en la Ecuaci6n 7.6. En tenninos pr:kticos, eslo s ig ni fica '1lJe ClJanno ti na variahle continlJa se inlmn tlce como tal , e l coefici enle
resultante (y los correspondientes OR) supuestamente representan el incremento lineal en log odds (0 el incremento exponendal en odds) por cada unidad de incremento de la variable independiente a 10 largo de IOlio el recorrido lie lo.~· va/ores de x. Por ejemplo, el incremento estimado en los odds de anticuerpos de Hepatitis B positivo por cada ano de ocupaci6n (es decir, OR = 1,02) mostrado en la Tabla 7. 19 se supone que sea el mismo cuando se comparan 3 anos de ocupaci6n con 2 que c uando se comparan 40 anos con 39 . Nuevamente, como se discute en las Secciones 7 .4.1 y 7.4.7, si este supuesto es incorreclo (por ejemplo, si el incremento en el riesgo de infecd 6n asoc iado con un ano de cambio en la ocu padon es mayor en los trabajadores que han sido contratados mas recientemente, y por tanto, menos ex perimentados), el modelo anterior sera incorreclO y deben emplearse modelos alternativos que manejen definic iones categ6ricas de la variable (variables dummy) u otra forma de parametrizac ion (por ejemplo, terminos cuadraticos) . 7 AA. Modelo de riesgos proporcionales de Cox Cuando el analisis se basa en datos del tiempo transcurrido hasta deno evento (supervivenda), una de las opc iones es modelar los datos empleando la escala de riesgos (0 fuerza instantanea de la morbilidad 0 la mortalidad 0 hazard) (vease Capitu lo 2, Secci6n 2.2.4) . El supuesto subyacente en el uso de este enfoque es que la exposici6n a cierto factor de riesgo (0 la presencia de d ena caracteristica) se asocia
266
EPIDEMIOLOGiA lNTERMEDIA ; CONCEPTOS Y APLICACIONES
con un incremento relat ivo fijo en el riesgo instamaneo del desenlace de interes, comparado con un valor basal 0 riesgo de referenda (por ejemplo, e l riesgo en los no ex pucstos). En otras palabras, se supone que en cualqu ier momenta dado del riempo (t), el riesgo en los sujetos expuestos a cicrto factor de riesgo lh l(t)1 es un multi pio de algun riesgo subyacente lho(t)l. La Figura 7 .8 ilustra este modelo, susceptible de ser matematicamente formu lado del modo sig uiente: I Ecuaci6n 7.7J h ,(t) = ho(t) x B
ES(Q es, en cualqu ier punta dado en e l tiempo, el riesgo para aquellos que estan expuestos al factor X I es igual al riesgo que corresponde a aquellos que no estan expuestos a eJ, mu ltiplicado por un factor constante (B) . Los riesgos, tanto en expuestos como en los grupos de referenda. pueden ser aproximadamente constantes 0 pueden incrementarse con eI tiempo (vease Figura 7.8A, por ejemplo, el riesgo instantaneo de monr a medida que eI individuo envejece) 0 fluctuar en el tiempo (vease el ejemplo hipotetico de la Figura 7.8B, por ejemplo, el n esgo de un acddente a medida que cambia la velocidad a la que se conduce e l autom6vil) . En ambos ejemplos de la Figura 7.8 se supone que en cualquier punto dado en el tiempo, e l riesgo entre los expuestos (por ejemplo, neumaticos viejos en los coches) se multiplica por dos independientemente del riesgo de base (por ejemplo, neumaticos nuevos): en otras palabras, la raz6n de riesgo (0 riesgo relativo), comparando expuestos y no expuestos, es constante . Para estimar B - el facto r de mu ltiplicacion constante en la Ecuad6n 7.7 - es conveniente definirlo en tenninos de la fund6n exponencial: B = e b , obten ida mediante la reformulaci6n de la Ecuaci6n 7.7 de l modo siguiente: IEcuacion 7.8J
B
A
Expuestos Expueslos
~ NO expueslos
Tiempo
No expuestos
~ Tiempo
Figura 7.8. Ricsgo en el tiempo en dos situaciones hipotcticas en las cualcs los individuos expucstos tienen dos veces mas riesgo que los que 110 esta ll expucstos. A) representa una situaci6n con un riesgo re lativamente estable que crece lentamente con el tiempo. tal como los riesgos de morir en los individuos de edad adulta: B) representa una situaci6n en la que el riesgo fluctua en el tiempo tal como el riesgo de tener un accidente automovilfstico. que se incrementa 0 disminuye como funci6n de la velocidad del autom6vil en cualquier instante dado. con la presencia de la exposici6n (por ejemplo, tener neumaticos gastados) que duplica el riesgo de tener un accidente, comparado con su ausencia (conducir con nemm'iticos adecuados).
ESTRAT1FlCACl6N Y AJUSTE:ANAUSIS MULT1VAR1A!\'TE f.,,, EPlDEM10UXIIA
267
Si ho(t) representa el riesgo instantaneo en el grupo no expuesto en c ualquier momento del tiempo, entonces la raz6n de riesgos instantaneos (RI) que compara los expuestos y los no expuestos es: RJ
= h ,(t) = e b ho(t)
0,
aplicando logaritmos: log(R I) = b
N6tese que , puesto que tanto la raz6n de riesgos instantaneos como el odds ratio son medidas multiplicativas de asoc iaci6n (es decir, lineales en una escala logarftmica), muchos aspectos relacionados con la interpretaci6n del coeficiente de regresion en el modelo de riesgos proporcionales (que esrima la razon de los logaritmos de los riesgos instantaneos) son similares a los de la interpretacion del coeficiente de regresi6n en el modelo de regresion logfstica (el cual estima ellogaritmo del odd.~· ratio). As\, los aspectos de interpretacion relacionados con el tipo de variable independiente incluida en el modelo (continuas, ordinales, categ6ricas) son similares en el modelo de regresi6n de Cox yen el modelo de regresi6n log fstica. La Tabla 7.20 muestra los resultados de dos analisis alternativos que emplean la regresion proporcional de Cox (modelos I y 2) para evaluar predictores de EC inci-
Tabla 7.20 Resultados del aniilisis de reg resion proporcionai de Cox de prcdictorcs binarios y continuos de la incidencia de enfermcdad coronaria (EC) en la cohorte del condado de Washington en cI Estudio de Ricsgo de Arteriosclerosis en Comunidades (ARIC), edades de 45 a 64 al10s en el momento inicial , 1987 a 1994 Variable
Coeflciente de regresl6n de Cox
Raz6n de rlesgos Instantaneos
Genero (hombres", 1. mujeres" 0)
1.2569
3.52
Fuma(si",l.no:O)
0,7045
2,02
Edad (1 ano)
0,0 120
1,012
Modelo
2
Tensi6n arterial sist61ica (1 mm Hg)
0,0152
1,015
Coleslerol serico (1 mgtdl)
0,0067
1,007
Indice de masa corporal (1 kglm2)
0,0237
1,024
Genero (hombres" 1. mujeres '" 0)
1,2669
3,55
Fuma(si= l .no"O)
0,6803
1,97
Edad avanzada' (si =1. no ,,0)
0,1391
1,15
Hipertensi6n" (si " I, no ::: 0)
0,5030
1,65
Hipercolesteloremia'" (si '" 1. no ,,0)
0,4552
1,58
Ooosidad···· (si = 1. no " 0)
0, 1876
1,2 1
• Edad .. a 55 ai'Kls . .. Tensi6n arterial sist6lica .. de 140 rnm Hg 0 diast6lica .. de 90 mm Hg. 0 terapia antihipertensiva . ... Cole sterol oorico total .. de 240 mgJdl 0 tratam iento hipolipem iante. .... indice de masa corporal .. que 27,8 kglm' en hom bres y .. 27,3 kgfm' en mujeres.
268
EPIDEMIOLOGiA lNTERMEDIA; CONCEPTOS Y APLICACIONES
dentc en la cohorte del condado de Wash ington del estudio AR IC . N6tese que en esta tabla las variables independientes incl uidas como predictoras son las mismas que las prev iamente empleadas para ilustrar e l modelo de regresi6n log fstica (Tablas 7. 17 Y 7. 18). Aq uf el desenlace de interes es tambien la EC inc idente pero, en contraste con e l analisis de regresi6n loglstica (el eual supone que lodos los part icipantes tienen complctado el segu imiento y que se obtuvieron los odd.\" de incidencia acumu lados), los coeficientes de regresi6n en la Tabla 7 .20 taman en cuenta e l fiempo de vCllrrenciu de cada evento, as! como e l tiempo de ccnsura para los partic ipantes que no fueron observados para e l seguimiento comple{o (vease Capftu102, Seccion 2.2). As\, tambien en contraste con la regresion logfstica, donde los antilogaritmos de los coeficientes de regresi6n se interpretaban como OR, la exponenciacion de los coeficientes de regresi6n (beta) en la Tabla 7 .20 prod uce los riesgos instantaneos (anaJogos a los riesgos relat ivos) . Hay una notable similit ud entre las est imaciones obtenidas de la regresion logfstica en las Tablas 7.17 y 7.1S (odds ratio de incidencia acumu lada; tiempo hasta e l evento y censura no considerada) y las est imaciones de Cox en la Tabla 7.20 (razon lie riesgos instantal/eos; tiempo hasta el evento y censura tomadas en Cllenta). Esta similit ud es probablemente debida a las siguientes circunstancias: I) La EC es relativamente rara, y por tanto, los OR estimados a part ir de la regresion logfstica se aproximan a la ruzon de riesgoJ" instantaneOJ" (Ia cual se asemeja a un riesgo relat iyo) eSlimada por la regresi6n de Cox; y 2) las perdidas en e l seguimiento y las perd idas hasta los eventos son probablemente no dife renciales entre los grupos de ex posicion, y asf los sesgos resu ltantes de lo~ factores relacionados con el {iempo tienden a cancelarse mutuamente, 10 cual representa un fen6meno comparable al «sesgo de compensaci6n» descrito en la Secci6n 4 .2 . Cabe subrayar q ue, a dife rencia de los resultados obtenidos a part ir de la regresion logfstica, en e l modelo de Cox no hay un intercepto . La importante contri buci6n de Cox consistio en constru ir un metodo para estimar los parametros de regresion en e l modelo de riesgos instantaneos I'l"Ol'orcionale.\" sin necesidad de especifi car e l valor 0 la fonna del rie.\"go instanfllneo de base (ho), que es el equ ivalente al intercepto (24). Se han desarrollado metodos que penniten la estimaci6n de la funcion de supervivencia subyacente basados en los resultados de un analisis mu ltivariante de regresi6n de Cox; los detalles acerca de esta y de otras aplicaciones del modelo de Cox pueden hallarse en la creciente literat ura sobre e l tema, y en los libros de (exto ya disponibles sobre analisis de supervivencia(2S1b) . EI modelo de Cox lambien se denomina modelo de riesgoJ" I'l"Oporcionales . Este (ennino enfatiza la «suposici6n de proporcionalidad»; esto es. el supuesto de que la ex posici6n de interes mu ltiplica a los riesgos instantaneos de base (los riesgos ins(antaneos en los no expuestos) por un factor constante, e b (vease Ecuaci6n 7.S) en cualq uier punto d urante e l seg uimiento . Como ilustra la Figura 7.S, esto impl ica que, independ ientemente del valor de riesgo inswnuineo de base en el tiempo, los ex puestos tienen un rie.\"go instanuineo igual al riesgo inJ"tantaneo de base mu ltiplicado por e b . La necesidad de este supuesto esta implfcita en el hecho de que se est ima una razon de riesgos instanuineos para el segui miento completo. Si los riesgos instantaneos no son proporcionales en e l tiempo - esto es, si la razon de riesgoJ" ill.\"· Wntaneos cambia en e l tiempo - e l modelo necesita tenerlo en cuenta mediante la estrat ificacion de ac uerdo al tiempo de seg uimiento . Esta situaci6n podrfa ser
ESTRAT1FlCACl6N Y AJUSTE:ANAUSIS MULT1VAR1A!\'TE f.,,, EPlDEM10UXIIA
269
adecuadamente descrita como un caso de interacci6n «tiempo-exposici6n» - vale decir, una situaci6n en que se presenta modificacion de efecto (vease Capitu lo 6) en la cual el tiempo modifica la relaci6n existente entre la ex posici6n y el desenlace. Para una descripci6n mas detallada de mNodos de evaluacion del supuesto de proporcionalidad cuando se aplica el modelo de Cox asf como aproximaciones para tener en cuenta las interacciones entre tiempo y exposici6n, se rem ite allector a textos mas especializados (por ejemplo, Collet m ) 0 Parmar y Machin (26)).
7 AS. Regresi6n de Poisson El modelo de regresi6n de Poisson es otro metodo de analisis de regresion multiple para datos de una cohorte con desenlace dicot6mico y uno 0 mas predictores categ6ricamente definidos. Se trata de una tecnica empleada, sobre todo, en situaciones en las cuales los desenlaces de interes son tasas (y razones de tasas); especialmente adecuada para esmdiar enfermedades raras en poblaciones grandes. EI modelo especifica que la magnitud de la tasa es una funci6n exponencial de una combinaci6n lineal de covariables y parametros desconocidos:
Esta ecuacion puede ser refonnulada como el logaritmo de la tasa, que es la variable dependiente de una funcion lineal: 1Ecuaci6n 7.91
La Ecuaci6n 7.9 es tambien Ilamada un modelo log lineal, reflejo de que se trata simplemente de una transfonnaci6n logarftmica de una variable de desenlace (una tasa en este caso) relacionada con una ecuaci6n lineal de predictores. Si la «Iasa>, se descompone en sus dos componentes (numero de eventos en el numerador y personas-tiempo en el denominador) la Ecuacion 7.9 puede se reformu lada del siguiente modo: log (eventos/persona-tiempo) = bo + b,x , +
b 2X2
+
log (eventos) - log(persona-tiempo) = bo + b,x , +
b 2X2
+
log (eventos) = log(persona-tiempo) + b o + b,x , +
hX2
+
N6tese que en la ecuaci6n anterior el logaritmo persona-tiempo se incorpora «
270
EPIDEMIOLOGiA lNTERMEDIA; CONCEPTOS Y APLICACIONES
en la mayorfa de los est udios epidem io16gicos, se supone q ue la base mas apropiada para el procedimiento estadfstico de estimaci6n de los para.metros en el modelo anterior es la distribuci6n de Poisson . (Varios libros de texto ofrecen mas detalles sabre las propiedades estadfsticas y los lI SOS de la distribuci6n de Poisson. Vease, por ejemplo, Armitage y Berry(1 2) : Nuevamente, la interpretacion de los coeficientes de la Regres i6n de Poisson es ana loga a la de los coeficientes de la regres i6n log fstica y a la de los modelos de Cox, excepto que donde en estos ult imos modelos se abl iene odds ratio y raz6n de riesgos instantaneos respect ivamente. en la regres ion de Poisson 10 que se abliene es la ra z6n de fasas. Por ejemplo, cuando se comparan exp uestos (por ejemplo, X I = I) Y no ex puestos (t / = 0), la Ecuacion 7.9 se red ucir
X
1+
Para los no expuestos: log (tasaoo.,p) = ho + h i
X
hX2
+
0 +
b 2X2
+
Sustrayendo las ecuaciones anteriores: log (tasa." p) - log (tasa ooup) = b l de manera q ue: log (
(asa.,xp ) = log(raz6n de tasas) = b l {asa oo np
Consecuentemente, el antilogari{mo de la es{imacion del coeficiente de regresi6n (e bl ) corresponde a la raz6n de tasas que compara expuestos y no expuestos. ajustada
por {odas las o{ras variables incl uidasen el modelo (X2' .. . ,Xk) . Como se sefial6 anteriormente, para usar la regresion de Poisson, todas las vari ables independientes (x) necesitan ser categoricas, puesto q ue el metodo esta de{erm inado para usar el monto total de tiempo pe rsona y e l numero tota l de eventos po r categorfa 0 celda (q ue representan a cada combinacion unica de predictores) . Por ejemplo, la aplicaci6n del metoda de regresion de Poisson al analisis de incidencia de EC en el estudio ARIC, incluyendo las mismas variables que en e l mode lo 2 de l ejemplo de la regresi6n de Cox (Tabla 7.20) se muestra en los datos de la Tabla 7 .2 1. La exponenciacion de los coeficientes de la regresi6n de Poisson produce estimaciones de razones de tasas ajustadas q ue sirven para comparar ex puestos (0 aquellos con la caracterfstica cod ificada como I) y no ex puestos. Para llevar a cabo el analisis de regresion de Poisson en la Tabla 7.2 1, tuvo q ue identificarse cada combinaci6n unica de las 6 variables independientes (total 26 = 64 celdas), el numero total de personas liempo, al que contri buyeron todos los ind ivid uos en cada celda, tuvo q ue sumarse y tambien {uvo que ident ifica rse e l numero total de eventos ocurridos entre estos individuos . Los datos especfficos por celda tienen el aspecto que puede apreciarse en la Tabla 7 .22, en la cual se muestran 8 de las 64 celdas, donde PA indica al numero total de personas-afios en cada celda (log PA es e llogaritmo de ese valor) y EC es el numero correspondiente de eventos de enfermedad coronaria. El d lculo de los coeficientes de regresion (beta) incluidos en la Tabla 7.2 1 se baso en dichos datos .
ESTRATIFlCACl6N Y AJUSTE:ANAUSIS MULTIVARIA!\'TE f.,,, EPIDEMIOUXIIA
271
Tabla 7.21 Resultados de un amllisis de regresion de Poisson , de predictores binarios de incidencia de enrermedad corona ria (EC) en la cohorte del Condado de Washington en el Estudio de Riesgo de Arteriosclerosis en Comunidades (ARIC), edades de 45 a 64 alios en e l momento inicial , 1987·1994 Variable
inlerceplo
Coeficienle de Regresi6n de Poisson
Raz6n de lasas
--6.3473
Genero (hombres", I, mujeres ,,0)
1.1852
3.27
Fuma (si " 1, noe:oO
0.6384
1.89
Edad avanzada' (sf", 1, no ::: 0)
0,2947
1,34
Hipertensi6n" (sf", I. no ,,0)
0,5137
1,67
Hipercolesterolemia'" (si: 1, no ::: 0)
0.6795
1,97
Obesidad .. •• (sf", 1. no '" 0)
0.2656
1,'"
, Edad ., 55 ai'Kls . .. Tensi6n arterial siSl6Hca ., 140 mm Hg odiasl6lica ., 90 mm Hg 0 lerapeulica anlihipe rtensiva . ... Coleslero l oorico 101al ., 240 mgldL 0 I ralamienlo hipolipemianle. .... [,..tHce de masa corporal ., 27,8 k!}lm' en hombres y ., 27,3 k!}lm' mujeres.
7 A.6. Nota sobre modelos para el amllisis multivariante de datos procedentes de estudios de casos y controles emparejados y anidados
En los e.~·fudio.~· de casos y confroleJ' emparejados (vease Seccion 1.4.5), la tecniea de an.i.lisis m ultivariante mas frec uentemente usada es la regresion log6'fica comJi· donal . Este mCiodo es analogo al del modelo de regresi6n logfstica ya presentado (Seccion 7.4.3), excepto en que los parametros (intercepto y los coefidentes de regresi6n) se estiman tomado en cuenta (••condidonados P0f),) el emparejamiento de casos y controles con respecto a las variables consideradas con ese fin . La interpretacion de los coefidentes de regresi6n logfstica cond idonal es la misma que la que corresponde a la regresi6n logfstica ordinaria, salvo que estos coefidentes han de ser considerados «aj ustados» no solo por las variables incluidas en el modelo sino tambien par las variables de emparejamiento. Detalles acerca de las propiedades estadisticas y las aplieadones del modelo de regresion log fstiea condidonal pueden ser encontrados en otro sitio (por ejemplo, Hosmer y Lemeshow(21 ), Breslow y Day (27)) . Este modelo es partieu larmeme litH para el analisis de est udios en los que los casos y los controles estan individualmente empurejudos . Un ejemplo puede hallarse en el examen transversal de variables asociadas can la arterioesclerosis carotidea en el est udio ARlC(28). Para este ana li ~ i s, los casos (n = 386) se definieron como ind ivifillO~
con allmenfO fiel g rosor fie la {nt ima mefi ia (Ci IM ,
vea~e
fiefin icion an te rior) fie
la arteria car6tida a partir de medic iones de imagenes del ultrasonido modo B. Los controles en este estudio se seleccionaron entre individuos con G lM bajo y fue ron emparejados individualmente a cada caso en base a sexo, raza, gntpo de edad (45-54 055-64 afios), centro de est udio y fec ha de examen. Algunos resultados seleccionados de este est udio se presentan en la Tabla 7.23 . Cada uno de los OR en esta tabla
272
EPIDB110LOG fA lNTERMEDlA ; CONC EPTOS Y APLlCAClONES
••
m
£
,"'" '" ,"'" '",", ,"0, 0 '" ~
N
N
W
~
•
~
'"
'••" C C
•
",E ~ ~
~
~
~
~
3
~
~,
0 0
, 0, 0
0
~
0,
'" '" '"
0
0
~
0
N N
N
0
0
~
0
," 0
"'" '" '" , " ri '" .,;" """,
'" '" '"
- '" ~
, N
", ,", ,", '"'"'" " N
~
0
• D•
0
0
0
.,• ii• ~
. • • .. '" .,• . • "'.• ..• • N N
N
'" '"
0
..,
N
N
;;
~
" •~ :0
°
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
N
M
"
0
K
•
~
c
~ '
c
<
K
••
~
~
•c •"> ~ c. • E • •• ~ ~ Q •E
•0
~
~
, • ° g
ii ° ••
• •
~
•
0
N
~
'" '" '"
$
ESTRATIFlCACl6N Y AJUSTE:ANAUSIS MULTIVARIA!\'TE f.,,, EPIDEMIOUXIIA
273
Tabla 7.23 OR ajustados'" para la arterioesclerosis carotidea en relacion a factores de riesgo cardiovascular sclct:cionados en 386 parejas n de la cohorte del Estudio de Riesgo de Arteriosclerosis en Comunidades (ARIC) examinadas entre 1987 y 1989
Varlabte y categoria de referenc la
Odds Ratio ajustado Odds ratio ajustado de manera multlvariada'" por edad (Intervato (Intervato de conflanza at 95%) de co nflanza at 95 %)
Actual lumador versus nunca fum6 0 dej6 de fuma r
3,3 (2,3·4,7)
3,9 (2,6·5,9)
Siempre fum6 versus nuca fum6
2,B (2,0·4,0)
3,1 (2,1 ·4,6)
Hipertenso versus normotenso
2,7 (1,9 ·3,B)
2,9(1,9·4,3)
., 160 vs < 100 mg/dL
2,6 (1,6 • 4.4)
2,0 (1,1 - 3,7)
100 - 159 vs < 100 mgfdL
1,6 (1,0 • 2,6)
1,4 (O,B· 2,4)
LDL cole sterol
'Obtenido por reg resi6n Iog istica condicional. ,- Emparejados por sexo. raza. grupos de >!dad (45 - 54 0 55 - 64 ai'Kls). centro de estudio y lecha de examen. ,-, Ajustados par edad (como variable continua) y todas las demas variables li sladas en la tabla, ademas de las variables de emparejamiento. Fuente: G Heiss el al., Carotid Atheroscleros is Measuroo by B·Mode Ultrasound in Popu lations: Association with Cardiovascular Risk Factors in the ARIC St~, American Journal 01 Epidemiology, Vol 134, 250-256 Cl1991. The Johns Hopkins University School 01 Hygiene & Pub lic Health.
se obtuvo med iante exponenciacion del estimado del coefici ente de regresi6n (e b) obtenido de un modelo de regres ion log fstica cond icionado por las variables de emparejamiento; por tanto, par definici6n, las est imaciones mostradas en la tabla estan ajustadas no solamente por todas las variables mostradas en la tabla, sino tambien par los factares de emparejamiento . N6tese que para evitar la confusi6n potencial residual resu itante deluso de categorfa s amplias de edad para e l emparejam ienw, los invest igadores de este estudio tambien ajustaron por la edad como variable continua (veanse Secci6n 1.4 .5, Figura 1.24, y Secci6n 7.5) . En los estud ios en los c uales los casos y los controles son emparejados por frecuencia (vease Seccion 1.4.5), una estrategia mas eficiente cons iste, simplemente, en usar regresion log fstica ord inaria e incluir las variables de emparejamiento en e l modelo. Un ejemplo de un estud io pareado por frecuencia, citado en el Capitu lo I , es eI examen de la relacion entre ant icuerpos de ciwmegalovim s (CMV) y arterioesclerosis(29). La Tabla 7.24 muestra la asociaci6n entre los niveles de antkuerpos de CMV en muestras de suero coleccionadas en 1974 y la presencia de arterioesclerosis carotfdea en e l primero de los dos examenes del est udio ARI C ( 1987- 1992)(29). Estos OR fueron obtenidos a part ir de los coefk ientes estimados en los modelos de regresion logfstka que contenfan las variables de emparejamiento (OR eml'arejado.\") Y variables ad icionales por las cuales se ajusta (OR ajll.\·/(uJos). ESflldios lie ca.\"O.\· y contmies anidados, en los cuales los controles se seleccionan entre los miembros del «conjumo en riesgo», esto es, entre los miembros en riesgo de la cohorte en el momento en que oc urre e l caso (vease Capitu lo I , Secci6n 1.4.2), pueden ser considerados y analizados como «esmdios emparejados de casos y controles» en los cuales los casos y los controles se emparejan segun duracion del segui-
274
EPIDEMIOLOGiA lNTERMEDIA ; CONCEPTOS Y APLICACIONES
Tabla 7.24 Casos y controlcs, scg un 13 presencia de arteriosclerosis carotidea, ell cl Estudio de Ricsgo de Arteriosclerosis en Comunidades (ARIC) ell rclacion COli los valorcs de los nivclcs de anticllcrpos a citomcgaiovirus (CMV), altos 0 modcrados rrente a positivos y ncgativos en mucstras sericas colcccionadas en 1974 Niveles de anticuerpos de CMV· Saja Moderado Allo
OR ajustados·" OR empareJados" (Intervalo de conllanza (Intervalo de confianza del 95 % ) del 95 % )
Casos
Controles
31
51
104
94
1,9 (1,1·3,2)
1,5 (0,8·2,9)
15
5
5,2(1,7·16,0)
5,3 (1 ,5·18,0)
1,0 ....
1,0·· ..
, Bajo: raz6n pos ilivoloogativo<4 ; Moderado; raz6n pos~ivoInegativo de 4 a 19; AIIo : raz6n positivolnegativo '" 20. o. OR oIltenidos por analisis de reg resi6n Iog[slica mu~i ple que iocluye las variables de emparejamiento por frecuencias : edad (categorias de 10 ar'los) y sexo . ... OR obtenidos por analisis de reg resi6n log'stica multipfe que incluye las va riables de emparejamiento por frecuencias: edad (categorias de 10 ar'los) y sexo mas la edad de forma continua, e l Mbito de lumar (fumador actual exiumador versus nunca ha fumado), aoos de educaci6n (> 12 vS ,. 12), hipercolesterolem ia, hipertensi6n, di abetes y sobrepeso . .... Categorias de relerencia. Fuente: FJ Nieto et al .• Cohort Study of Cy1Ome-~alovirus Infection as Risk Factor lor Carotid Intima-Medial Thicken ing a Measure of Subcli n;cal Atherosclerosis, Circulation, Vol 94 , 922·927 11:11996.
°
miento (Figura 1.2 1) . Tal y como ocurre con otros estud ios de casos y controles emparejados, la tecnica de analisis multivariante mas frecuentemente sugerida es la regresi6n logfstica condic ional en la que la variable condic ional es la duraci6n del seguimiento. Este tipo de modelo de regresi6n logfstica condicional es analogo al modelo de regresi6n de riesgos proporcionales de COX(30) . Ademas de las ventajas log fsticas inherentes (vease Capitulo I, Secci6n 1.4.2), e l estud io de casos y controles anidados se ha convertido en un disefio de estudio al q ue se acude con regularidad como resu ltado de la ex tendida disponibi lidad en afios recientes de paq uetes estadfsticos que pueden llevar a cabo este tipo de anal isis condicional. S u creciente popularidad se puede atest iguar por eI numero creciente de estud ios que la ut ilizan . En el disefio alternativo a los esturlios de casas y comroles dentro de una cohone bien definida, los asf llamados eSfudios lie cusos-cohorfe, los casas que ocurren en la cohone durante el seguimiento se comparan con una muestra aleatoria de la cohone de base (subcollOrfe) (vease Capftu lo I , Secci6n 1.4 .2). Puesto que se identifica una muestra de la cohone de base y de los casos que ocurren d urante el seg uimiento (vease Fig ura 1.20), la regres i6n de riesgos proporcionales instantaneos de Cox puede ser empleada para el analisis multivariante en este tipo de estudio . Debe enfat izarse que cuando se emplea este disefio puede producirse heterogeneidad mues(ral, puesto que el grupo de casos puede incluir casos que estan y casos que no estan en la muestra de la cohone . Esta heterogeneidad debe tomarse en consideraci6n so pena de introducir sesgos . Afortunadamente, tal y como se ha descrito en otro sitio(lU2) , el modelo de Cox puede adaptarse a esta situaci6n penn itiendo entradas tardfas (para los casas fuera de la subcohorte). A modo de ejemplo de este enfoque, la Tabla 7.25 muestra los resu ltados para un esmdio descrito al final de la Secci6n 1.4.2. Este es un estudio de caso-cohorte que
ESTRAT1FlCACl6N Y AJUSTE:ANAUS1S MULT1VAR1A!\'TE f.,,, EPlDEM10UXIIA
275
Tabla 7.25 Razones estimadas de riesgos instantiineos crudas y ajustadas de enfermedad coronaria incidente (e intervalos de confianza al 95%) segun nivel de titulos de anticuerpos a C. PllelllRolliae en cl momento inicial, 1987 a 1991 * Titulos de antlcuerpos IgG para C. Pneumon/ae Negatlvo
1:8 ·1:32
., 1:64
Ajuslado por variables demograficas'
1,2 (0,7 - 2,1)
1,6( 1,0·2,5)
Ajuslado por variables demograficas" y factores de riesgo'"
1,1 (0,6 - 2,3)
1,2(0.7 - 2,1)
, Estimados a parti, kls modekls de regresi6n de riesgos proporcionales ponderados con ent,adas ta ,dias para casos iuera de la subcohorte y estimacklnes robustas de la varianza segim el metodo de Barlow. (>11 ,. Edad (continua). sexo , raza y centro. ,., Hatlito de luma " hipe,coleste ,olem ia, hipertens;6n, diabetes y nivel educadonal. Fuente: Datos de FJ Nieto et al. , Ch lamydia Pneumoniae Inlection and locioon Coronary Heart Disease : The Atheroscleros is Risk in Commun itieS (ARIC) Study, American Journal of Epidemiology, 1101150, 149-156 <:>199-9, The Johns Hopkins University School 01 Hygiene & Pu blic Health.
se llevo adelante dentro de la cohorte AR IC que examina la asociaci6n entre ant icuerpos sericos contra C. Pn elllll oniae y EC incidente a 10 largo de un seguimiento de 3 a 5 anos(33). Los 246 casos incidentes de EC se compararon con una muestra estratificada de 550 panicipantes de la cohone original empleando un analisis de regresi6n de Cox . que toma en consideraci6n el tiempo transcurrido hasta e l evento y permite entradas tardfas para manejar el d iseno muestral propio del estudio caso cohone. Como en los ejemplos prcvios, cada una de las razones de riesgos instantaneos mostradas en la tabla fueron oblenidas mediante la exponenciacion de los correspondientes coeficientes de regresi6n de l modelo de regresi6n de Cox. Los resu ltados de la Tabla 7.25 sugiercn que el riesgo inslantaneo aparentemente incrementado de enfermedad coronaria en aquellos sujetos con altos niveles de anticuerpos a C. Pneullloniae en eI momento inicial puede ser en buena medida explicado por un efecto confusor positivo de Olros faclo res de riesgo.
7.4.7. Modelaci6n de las relaciones no lineales con modelos de regresi6n lineal Los estudios epidem iol6g icos emplean con frccuencia escalas continuas para medir parametros fisio logicos u otras caracterfsticas, tales como las d isculidas en el ejemplo de secciones previas . Dos defin iciones d iferentes de tales variables fueron empleadas para ilustrar la aplicaci6n de un IIllmero de modelos de ajuste: cont inuas (por ejemplo, niveles de tension arterial sisr6 lica - Tablas 7. 15 ; 7. 17, Y 7.20 modelo I) 0 dicotomicas (por ejemplo, hipertensi6n - Tablas 7.18; 7 .20, mode lo 2; y 7.21). En esta secci6n se disc uten brevemente las limitaciones posibles de estos modelos y algunos enfoques altemativos . Para ilustrar los problemas rclacionados con la selecci6n del enfoque modelador, la Figura 7.9A muestra una relaci6n hipoletica en forma de J , observada (su puesta
276
EPIDEMIOLOGiA lNTERMEDIA ; CONCEPTOS Y APLICACIONES
A
y
B
y
:
,,
o
c
y
---
y
:
:
:
-'
............ --~
,,
o
Transformada Referencia x,
,
X2
)(3
X4
variabies dummy
Figura 7.9. Ejcmplo hipotCtico de una rclaci{m tipo J (verdadcra) obscrvada cntre X y ulla variable de dcsclliacc Y (A); B, C y D ilustrall la rclacioll obscrvada (Iinca de puntos) con modclos altcrnativos snpcrpucstos: x continua (8 ), x dicot6mica (C), y variable dummy para los quilltiles de x (D)
como cierta) entre un predicwf cont inuo (x) y LI lia variable de desenlace (y). Notese que aquf y podrfa ser cualquiera de las variables dependientes en los mode los resumidas en la Tabla 7.1 4; por ejemplo, una variable cont inua tal como el grosor de la int ima-media de la car6tida c uanda se usa regresi6n lineal, 0 e llag odd.\" de la ancrioesclerosis carotfdea (definida como una variable binaria) c uando se usa regresi6n log fstica. Este lipo de relaci6n ha sido encontrada , por ejemplo, en estud ios epidemio l6gicos del peso corporal y su efecto sobre la monalidad(34JS), en los q ue ha sido observado un riesgo mas alto de monalidad en individuos de bajo peso (posiblemen(e porq ue hay una morbilidad cr6nica subyacente), un riesgo menor en individuos de peso «normal», y un incremento sostenido en la mortalidad en sujetos con sobrepeso y obesos . (Glros ejemplos de {ales relaciones tipo J 0 U, son aquellos entre el coles(erol serico y la mortalidad W» , y entre el consumo de alcohol y la enfennedad coronaria(37)). La Figura 7 .9 B ilustra el empleo de un modelo de regres i6n lineal para explicar la relaci6n observada entre x e y . Una est imaci6n de l coeficiente de regresion, b, representarfa el incremento promed io lineal de y (por ejemplo, mortalidad) por un idad de incremento en la variable contin ua x (por ejemplo, peso corporal); esto es, la pendiente de la Ifnea recta en la Figu ra 7.9B. Gbv iamente la es(imaci6n de un coeficiente de regresi6n lineal general tal como se muestra en la Figura 7.9B, ignora e l hecho de q ue, efectivamente, hay una di.Hllinllci611 de y en el recorrido mas bajo de
ESTRAT1FlCACl6N Y AJUSTE:ANAUSIS MULT1VAR1A!\'TE f.,,, EPlDEM10UXIIA
277
x, con incremento suave de y en la zona media del recorrido de x. y fina lmente un incremento pronundado de y en el recorrido superior de x . Puesto que esro ultimo es mas pronundado que el primero, el valor promedio de b resu ltara positivo; sin embargo, como se deduce inmediatamente de la Figura 7.98. tal estimad6n no representa adec uadamente la verdadera relad6n de x con y, en la medida que ella <; 7.9D puede escribirse del modo sigu iente: IEcuadon 7.IOJ
278
EPIDEMIOLOGiA lNTERMEDIA ; CONCEPTOS Y APLICACIONES
Tabla 7.26 Dcfiniciones de las variables dummy para cI modclo de la Figura 7.9D Variables dummy Quinta parte de x
"
"
"
1 (refe rencia)
0
0
0
'"0
0
0
0
0
0
2 3
,
0 0
0
5
0
0
0 0
Debe notarse que estas cuatro variables dUIIIIII)' corresponden a diferentes categorlas de LIlia unica variable, x . En efeclo, debido ala allsencia completa de interseccion entre estas «variables» (ningun individuo p uede tener un valor de uno para mas de LI lia de tales variables, simplemente porque ningtin individuo puede pertenecer a mas de uno de esos cinco segmentos mutuamente excluyentes), el modelo en 1a EClIaci6n 7.10 puedc reducirse a las sig uientes ecuaciones para cada LIlia de las qu intas partes: • Para los indiv iduos pertenecientes a 1a pri mera quinta parte, todas las variables dummy tiene un valor de 0, asf y = bo • Para los individuos pertenecientes a la segunda q ui nta pane, donde solo Xl = I , Y = bo + b l X l • Para inrlivirl uw; penenecienres a ]a re rcera '1lJ inla parle , y = ho + h~ x~ • Para individuos penenecientes a la cuarta qu inta parte, y = bo + b) X ) • Para individuos pertenecientes a la quinta pane superior, y = b o + b4 X 4 As!, los coeficientes de regresion tienen la siguiente interpretacion: • bo = valor promedio de y entre los individuos de la categorfa de refe rencia (primera quinta parte). • b l = diferencia promed io en e l valor de y entre individuos de la segunda quinta parte y los de la primera quinta parte. • b 2 = diferencia promed io en e l valor de y entre individuos de la tercera quinta parte y los de la primera q uinta pane. • b) = diferencia promedio en el valor de y entre individuos de la cuarta q uinta parte y los de la pri mera quinta parte. • b4 = diferencia promedio en eI valor de y entre indiv iduos de la ultima quinta parte y los de la primera q uinta pane. La di fe re ncia entre cada quinta parte y una q uinta parle diferente que no sea la de
referencia se obtiene faci lmente mediante sustraccion de los respecrivos coeficientes de regresi6n . Por ejemplo, la diferencia entre la ul tima qu inta pane y la segunda quinta parte puede calcularse como b 4 - b l . En la Figura 7 .9D, bo representa el valor de y correspondiente a la barra horizontal para la categorfa «de referencia», y cada una de las otras b re presenta la distancia ver-
ESTRAT1FlCACl6N Y AJUSTE:ANAUSIS MULT1VAR1A!\'TE f.,,, EPlDEM10UXIIA
279
tical (en unidades de y) entre las barras horizontales para cada una de las quintas partes y la quinta parte de referenda . En e l ejemplo hi potetico q ue muestra esta figu ra los valores de h i y h2 seran negativos (puesto que el valor promedio de y en sujetos de la segunda y la tercera q uintas partes son inferiores q ue el promedio del valor de )' en la primera) mientras q ue los valores h , y h4 seran positivos. N6tese q ue la selecdon de la categorfa de referenda es puramente arbitraria y en buena medida inconsecuente . Por ejemplo, puesto q ue la ~eg unda quinta parte es la categoria con el valor de )' mas bajo, el cual pud iera ser considerado e l recorrido «nonnal» para x, podrfa haber sido selecdonada como la categorfa de referenda en e l ejemplo anterior. Si esto hu biera ocurrido, ho habrfa representado el valor promedio para los individuos en esta nueva categoria de referenda, y los restantes b (todos positivos en esta situaci6n) habrfan sido las diferencias promedio entre cada una de las otras qu i nta~ partes y la segunda. Notese, ademas, que si el modelo de la Ecuad6n 7 .1 0 hubiera inclu ido otras variables, cada una de las estimaciones para las diferencias entre cada categorfa y la categorfa de referenda habrfan resultado ajustadas por esas otras variables . En la Tabla 7.27 se presenta un ejemplo de division de variables independientes continuas en varias categorias cuando se usa e l modelo de regresi6n logfstica mu ltiple. Esta tabla muestra resultados correspondientes al examen de las asociaciones transversales entre caracterfsticas sociodemograficas y la prevalencia de sfntomas de presivos entre americanos de origen mexicano que p..1rticipan en la Encuesta por Examen de Salud y Nutric i6n Hispanica en los Estados U n i dos(3~). En esla tabla, los coefidentes de reg resi6n logfstica y los correspondientes odds ratio (y los valores de P adjuntos - vease eSladfstico de Wald en el Apendice A, Secdon A.9) se presentan uno al lado del otro. N6tese que todas las variables fueron inlroduddas en e l modelo como categoricas, incluyendo variables que podrian haber entrado como continuas (por ejemplo, edad. ingresos). Con la excepcion del sexo y la situacion laboral. todas las variables de la tabla tienen mas de dos categorfas. Para cada una de estas variables, una de las categorfas se emplea como referencia (es dec ir, no tiene coeficiente de regresi6n). EI valor de su odds ratio es, por definidon, 1,0. Todas las olras categorfas han sido modeladas como variables dumm)' . Para cada llna de estas categorfas, se estima un coefidente de regresion logfstica . La exponendacion de dicho coefidente prod uce una estimad6n del oddJ" ratio q ue permite comparardicha categorfa con la de referenda . Por ejemplo, para la edad, el grupo de edad mas joven (20-24 afios) fue elegido como referenda . EI coefidente para •• 25 a 34 afios» esO,1866, correspondiente a un odd,\" ratio de eil lSI!6 = 12; para el proximo gmpo de edad «35-44 afios» , e l coefic iente es negativo (-0,1 11 2), indicando asf q ue el log odds en esta categorfa es menor que el de la categorfa de referenda, loq ue se traduce en un odd.\" ratio inferior a uno (OR = e .(U1 12 = 0,89); y a>;f sucesivamente. Para afios de educaci6n e ingresos, las categorfa s mas alta>; fueron e legidas como referenda>;; de haber elegido los autores las mas bajas, los res ultados habrfan sido los redprocos de aqllellos que se muestran en la tabla. Resulta muy impon ante reparar en que, como ya se sefial6 antes en esta propia secdon, al descomponer la>; variables cont inuas en variables dummy (categoricas), es posible modelar adec uadamente relaciones no lineales observadas en estos datos empleando un modelo lineal. Por ejemplo, el uso de dnco variables dummy (mas la categorfa de referenda) para la edad en la Tabla 7.27 sugiere la presencia de un patron de «a>;pecto J invert ido», puesto que el odd.\" ratio es mayor para la categorfa (25 a 34 afios) que para la categorfa de referenda (20 a 24 afios), pero consistente y credentemente mas bajo para las categorfas de edades mas avanzadas .
280
EPIDEM IOLOGiA lNTERMEDIA ; CONCEPTOS Y APLICACIONES
Tabla 7.27 Amilisis de rcgrcsi6n logfstica para la asociacion entre varias caractcrlsticas sociodcmograficas y 13 prcvalcncia del cstado depresivo, Encuesta par Examcn de Salud y Nutricion Hispanica, amcricanos de origcn mexicano entre 20 y 74 aDos de edad, 1982 a 1984 Caracterfstlca Inlercepto
Coeliciente de regresl6n logistlca
Odds ratio
Valor de P
-3,11 87
Sexo (femenino vs masculinoj
0,8263
2,28
0,0001
Edad (Anas)
20·24
1,00
25 · 34
0, 1866
1,20
0,11
35· 44
-0,11 12
0,89
0,60
45·54
-0, 1264
0,88
0,52
55 - 64
-0, 1581
0,85
0,32
65·74
-0,3555
0,70
0,19
Estado civil Casado
1,00
Matrimonio disuello
0,2999
1,35
0,18
Nunca se cas6
0,7599
2,14
0,004
0·6
0,8408
2,32
0,002
7 - 11 12
0. 4470 0,2443
1,56
0.014 0,21
Arias de educaci6n
. 13
1,28 1,00
Ingresos anuales de la vivienda (US$)
0-4.999
0,7055
2,02
0,019
5 .000 - 9 .999
0,7395
2,09
0,009
10'()()O·19.999
0,4192
1,52
0,08
., 20,000
1,00
Empleo (no empleado
versus empleado)
0,2668
1,31
0,20
Lugar de nacimiento/cultura Nacido en EE UU/de origen saj6n
1,00
Nacido en EE UUlbicultural
-0,3667
0 ,69
Nacido en el e xlranjerolbicultural
-0,6356
0,53
0,026
Nacido e n el e xlranjero Ide origen mexicaro -0,8729
0 ,42
0,0003
0,004
Fuente: EK Moscicki et al., Depressive SymplOOls among Mexican ·Americans :The Hispanic Health and Nutri· tion Examination SUlVey, American Journalof Epide:niology. Vol 130. 348·360 1C1989, The Johns Hopkins Unive rsity School 01 Hygiene & Pu bl ic Health.
ESTRAT1FlCACl6N Y AJUSTE:ANAUSIS MULT1VAR1A!\'TE f.,,, EPlDEM10UXIIA
281
EI uso de las variables dummy es en ocasiones ineludible, como cuando se modelan variables categ6ricas politomicas no ordinale.\· tales como «situaci6n marita!>, 0 dugar de nacimiento/cu ltura» en la Tabla 7.27 . Por ejemplo, un hallazgo potencialmente importante de este ami.lisis es q ue, comparado con sujelos nacidos en los E.>;tados Unidos, americanos de origen mexicano anglo-orientados, la prevalencia de un estado depresivo parece ser significal ivamenle menor entre los nacidos en el extranjero, paniculannente entre aque llos que son de origen mexicano. Nuevamenle, es imponanle considerar que el estimado para cada cada variable se ajusta por lodas las Olras variables q ue ap..1recen en la tabla. Las variables no inclu idas en el modelo . sin embargo, podrian aun confundir estas asociaciones (vease Seccion 7.5); adema.,>, las inferencias causales basadas en los datos mostrados en la Tabla 7.27 pueden estar afectadas por su naturaleza transversal y los sesgos relacionados con esta (vease Capftu lo 4, Seccion 4.4.2) . Con respecto a variables continuas 0 categ6ricas ordinales, las variables dummy pueden servir como un paso intermediario 0 exploratorio para evaluar si es apropiado un modelo de Ifnea recta, 0 si algunas categorfas tienen que ser redefinidas 0 reagrupadas. Por ejemplo, despues de mirar [os res ultados mostrados en la Tabla 7.27, se podria simplificar la definici6n de la variable dngresos» mediante la agrupaci6n de las dos categorias de < 10.000 USD en una sola, en vista de que sus odds de depres i6n aparentan ser homogeneos. Ademas, debido a [a aparici6n de un incremento lineal aproximado en los odds de depresi6n de acuerdo al decrecimiento de los niveles de educaci6n, los autores podrian haber simplificado mas el modelo mediante el remplazo de 3 variables dummy para educacion con una unica variable ordinal (de I a 4 0 de 0 a 3); e[ valor del coeficiente en e l ultimo caso podrfa interpretarse como el incremento en el log odds por unidad de incremento (0 disminuci6n en este caso) en el nivel de educaci6n , En otras palabras, e l antilogaritmo de este coeficiente serfa la est imaci6n del OR q ue compara cua[quier par de categorfas ordinales adyacentes de educaci6n (es decir, comp..1rando aquellos O!: a 13 afios con los q ue tienen 12 afios, 0 aquellos con 12 afios con los de 7 a II afios, 0 aquellos de 7 a I I afios con los de 0 a 6 afios) . EI ult imo enfoque, frec uentemente usado en epidemiologfa (como cuando se redefinfan los niveles de ciertos parametros sericos, nutrientes, etc ., de acuerdo a cuartiles, q uintiles, etc,) es esencialmente equivalente a usar una variable cont inua, excepto en e l hecho de q ue los valores posibles de x estan ahora restringidos a valores enteros de I a 4,0 de I a 5, y asf sucesivamente . Las ventajas de este enfoque, comparado con un modelo mas complejo q ue inc luya c ierto numero de variables dummy son q ue ( I) e l modelo resu ltante es mas parsimonioso y mas simple de explicar (vease Secci6n 7,7) (2) la prueba estadfstica de los correspondientes coeficientes de regresi6n (veanse la proxima Seccion y e l Apendice A, Seccion A ,9) es el analogo multivariante ajustado de la prueba para evaluar la relaci6n dosis respuesta descrita en el Apendice B, Es importante tener en mente, sin embargo, los peligros implfcitos en el uso de estas definiciones ordinales de las variables independientes sin considerar la posible presencia de patrones, tales como los representados esquematicamente en la Figura 7,9A,
Tecnicas altem ativas para la mode/adon de asociaciones no lineales EI uso de funciones matematicas mas complejas constituye otro enfoque para modelar asociaciones p..1ra las cuales una funci6n lineal simple (por ejemplo, una Ifnea recta) parece no constimir un aj uste adecuado, Ejemplos de estos modelos alternativos in-
EPIDEMIOLOGiA lNTERMEDIA ; CONCEPTOS Y APLICACIONES
282
cluyen el uso de terminos cuadciticos (con 10 ellal puede modelarse una relad6n curviIfnea simple) 0 fundones mas complejas de tipo polinomial, 0 de a lros tipos para modelar relaciones con aspec(O de U 0 de J (por ejemplo, Figura 7 .9A). A unque una disclIsi6n de estos modelos esta fuera de la perspectiva de este libra (vease, por ejemplo, Armitage y Berry (12)), en las Figura.>; 7. 10 Y 7 .1 I se recogen dos ejemplos. La Figura 7.1 0 se basa en un estudio que examin61a relaci6n entre IM e y porcentaje de grasa corporal en varias poblaciones de descendientes de africanos(3
femen inos combinadas, del subconj unto de Nigeria en esc estudio: mientras que las Figuras 7.10 B Y C muestran Ifneas de regresi6n estimadas por separado para hombres y mujeres. N6tese que despues de evaluar diferentes opc iones de modelaci6n, los autores concluyeron que la relaci6n entre el IM C y la grasa corporal queda mejor descrita por un simple modelo lineal en los hombres. % Grasa corporal = - 2 1,37 + 1,5 1 (IMC)
en tanto que para las mujeres fue necesario adoptar un modelo c urvilfneo (q ue incluye un termino c uadratico):
"~
A
60
8 50 •• 40
• ~
~
.~
•
~
~
30 20 10 0 0
10 20 30 40 50 60
Indice de masa corporal
;; &
B Hombres
60
&
8 50 •
40
~
30
•••
~
.~
~
60
8 50 •• 40 30 • 20
• ~
~
20
// / /
~ 10 ~
;;
C Mujeres
.~
~ 10 ~
0 0
10 20 30 40 50 60
Indica de masa corporal
~
0 0
10 20 30 40 50 60
Indice de masa corporal
Figura 7.10. Rclncioncs entre el Indice de mnsn corporal y cI porccntnje de grnsa corporal para hombres y mujeres ell Nigeria , 1994-1995. A. diagrama de punlos de los datos crudos (hombres. +: mujeres. 0). 8 Y C , lfneas de regresi6n estimadas para hombres y mujeres. respectivamenle. Fuenle : reproducido con permiso de A Luke el al. , Relation Between Body Mass Index and Body Fat in Black Population Samples from Nigeria, Jamaica and the United States. American Journal of Epide· miology, Vol 145, 62()"628 © 1997, The Johns Hopkins University School 01 Hygiene & Public Health.
ESTRATIFlCACl6N Y AJUSTE:ANAUSIS MULTIVARIA!\'TE f.,,, EPIDEMIOUXIIA
283
% Grasa corporal = -44,24 + 4,0 I (IM C) - 0,043 (IMCr
La Figura 7. 11 procede de un estudio por simulaci6n de la dispersi6n de dos enfermedades trasmit idas sexualmente (gonorrea y clamidiasis) basada en diferentes supues(OS concemientes a patrones de transmisi6n(-iO). La Figura 7 .11 , espedficamente, muestra la prevalencia de estas enfennedades de acuerdo a la tasa de contacto efectiva (una funci6n de la media y la varianza del nlimero de parejas sexuales): en la fi gura se muestran las prevalencias estimadas (observadas) en cada una de las simulaciones (los puntos), asi como los modelos estadfs{icos estimados que mejor se ajustan a los datos observados para (;,uJa t:nft:nm:tlatl . Estas (;orn plcj'l~ fundont:s
hipt:rb61k'l~
son litilt:s para la prt:tlk-
ci6n (vease anterionnente) . Por otra pane, ninguno de los parametros de estos modelos (por ejemplo, b) = 1,89) tiene una interpretaci6n clara en tenninos de resumen de la asociaci6n entre las variables de imeres (por ejemplo, tasa de contac(Q efectivo y prevalencia de gonorrea) . EI compromiso emre la simplicidad y la interpretabilidad por una parte y el ajuste adecuado por otra, esta en el centro del arte y la ciencia de la modelaci6n estadistica, tal y como se sefiala brevemente en la secci6n de resumen de este Capitu lo (Secci6n 7.7). 10,0
o gonorrea j.
clamidia
•
8,0
,
•
•• • •
.
•
6,0
0 c
•
0
~ o~o
~
•
£
4,0
2,0
0,0 '----~_. . 0,0 2,0
4,0
6,0
8,0
Tasa de contacto e/activo
Figura 7.11. Modclos de simulacion para la dispersion de la gonorrea y la Chlamydia tracllOmatys: las tasas de prcvalenda de gonorrea y clamidiasis (como porcentajes de la pobladon modelo) como rundon de las tasas de contacto crectivo. Cada punto representa una ileraci6n de la simu laci6n. Las lfneas s6lidas represenlan funciones hiperb6licas de la forma y = [bo(x - b ) ]1 [b,+ (x - b)].las cuales fueron ajusladas a los puntos con un prograrna de ajuste curvilfneo no lineaL En esta eCllaci6n, y es la prevalencia y x es la tasa de con_ tacto efectivo: el valor del panimetro estimado resullanle fue: para gonorrea . bo = 10.08. b) = I .89. b, = 3.18. y para la clamidiasis, bo = 11,12, b l = I ,85, b, = 2.0. Fuente: reproducido con permiso de M Kretzschmar, YTHP van Ouynhoven. and AJ Severijnen, Modeling Prevention Strategies for Gonorrhea and Chlamydia Using Stochastic Network Simulations, American Journal of Epidemiology, Vol 144, 306-317, © 1996, The Johns Hopkins University School 0/ Hygiene &Public Health.
284
EPIDEMIOLOGiA INTERMEDIA; CONCEPTOS Y APLICACIONES
7.4.8. I'ruebas estadisticas e intervalos de confianza para las estimaciones de la regresi6n Los va lores de los parametros del modelo de regresion lineal , tra.tese del caso simple (Seccion 7 .4 .1 ) 0 del multiple (Seccion 7.4 .2,), se estiman med iante el metodo de III/nilllo.\" cuadrado.\" ordil/ario (MCO). Este metodo de estimaci6n es bastante senci llo y, en el caso de la regresi6n lineal simple, puede resolverse con una calculadora de bolsillo; para la regresion linea l m ulti variame, sin embargo. se req uie re algebra matricial. Por otra parte, el metodo de los mfnimos c uadrados simples no puede ser empleado para los otros tres metodos de regresi6n descritos en las secciones precedentes . Los metodos de la regresi6n logfstiea , la regresion de Cox, y la regresion de Poisson requ ieren un proceso iterativo de est imacion basado en el metoda de I/uixillla veroJ'illlilirud (MMV), tarea notablemente allanada por las modernas computadoras y los programas informatieos estadfst ieos (una introduccion general de los principios de la verosimilitud y el MMV, puede hallarse en Clayton y HiIl s(~ I » . Como con cualquier otra estimaci6n eSladfstica, los parametros de regresi6n obtenidos cuando se emplea MCG 0 MMV estan sujetos a la incertidumbre inherenIe a la variabi lidad muestral. Asf, ademas de los coefie ientes de regresion, los algoritmos de eslimacion proveen el errorestandar asoc iado al parametro estimado (vease, por ejemplo, Tabla 7.1 6) . Con la estimadon puntual del coeficiente de regresi6n y su error estandar (en cualquiera de los metodos de regresion descritos en la secciones precedentes) puede realizarse una prueba de hi potesis para evaluar si el coeficiente de regresion en cuesti6n es 0 no estadfslieamente significativo: esto es, si la hipotesis nula (Ho: f3 = 0) puede ser rechazada con un cieno nivel de significad6n (error alfa) . Esta prueba, que emplea elliamado esradi~·tico de Waltl, se describe brevemente con algunos ejemplos en el Apendice A, Secd6n A.9. Similarmeme, puede construirse un intervalo de confianza para el valor de los coefidemes de regresi6n empleando la estimad6n puntual y el error estandar del coefidente de regresi6n (vease Apendiee A) . Como se ilustra en los ejemplos del apendice, para modelos multiplicat ivos (por ejemplo, logfstieo, de Cox, de Poisson), la ex ponenciacion de los extremos inferior y superior de los intervalos de confianza para los coeficientes de regresi6n da lugar a los Ifmiles de confianza correspondiemes para las medidas multipl ieat ivas del efecto (por ejemplo, odds ratio. razon de riesgos instantaneos, raz6n de tasas). Ademas del estadfstico de Wald y los Ifmites de confianza para evaluar la re levancia estadfslica de cada para metro de regresion estimado. Olros parametros estimados 0 pruebas son utiles para la comparacion de diferemes mode los; estos incluyen el valor de R2 en el comexto de la regresi6n lineal, el cual da una estimaci6n de la pro porci6n de la varianza de la variable dependiente ex plicada por las variables independ ientes, asf como la prueba de la raz6n de verosimilirud (PRV ), una prueba de significadon que compara modelos procedentes de metodos de regresi6n basados en MMV. Adieionalmente . ex isten varias tecnicas numerieas y gra fica s susceptibles de ser empleadas para evaluar los su pueslOs estadfslicos y el ajusle de los datos a un modelo partie ular 0 a un conjunto de variables independientes. Para tener mas detalles acerca de estos metodos, eI lec tor puede acudir a textos mas avanzados, tales como los siguientes: Armitage y Berry (1 2), Kleinbaum et al . (l ~) , 0 Clayton y Hill s (4 1).
ESTRAT1FlCACl6N Y AJUSTE:ANAUSIS MULT1VAR1A!\'TE f.,,, EPlDEM10UXIIA
285
75. AJUSTE INCOMPLETQ, CONFUSION RESIDUAL EI problema de la confusi6n res idual, presente cuando el ajuste no elimina completamente el efecto de confusion debido a una variable dada 0 a un conjunto de variables, fue introducido en el Capitu lo 5, Secci6n 5.4.3 . Las fuentes para el ajuste incompleto 0 confusion residual son diversas; las mas importantes se discuten de inmediato. 1. Definicion inadecuada de las wregor[as de la variable de confuJ·ion . Estamos en ese caso. por ejemplo. cuando se intenta el ajusle por una variable continua utilizando categorfas que son excesivamente amp lias. As!, la Tabla 7.28 muestra los resultados de diferentes alternativas para el ajuste de la edad c uando se explora la relaci6n transversal entre la situacion de la mujer en relacion a la menopausia y la EC prevalente empleando datos no publicados procedentes del estudio AR lC. La disminuci6n en el odds ratio c uando se ajusta por edad como variable continua , indica que los estimados ••ajustados por edad» usando definiciones categoricas de la edad no eliminaron por entero su efecto confusor. La inferencia de que la mejor alternativa para el ajuste de la edad en la Tabla 7.28 es el modelo que emplea la edad como una variable continua, requiere obviamente la suposicion de que la prevalencia de EC se incrementa linealmente con la edad a 10 largo de todo el recorrido de edades de los part ic ipantes en el estudio. Este es un supuesto en principio correclo en este ejemplo particular, dado la estrechez relativa del recorrido de edades de la poblaci6n en estudio (mujer
Tabla 7.28 Relacion transversal entre menopausia natural y enfermcdad coronaria (EC) pre\'alente, Estudio de Riesgo de Arteriosclerosis en Comunidades (ARIC), edades 45·64, 1987·1989 OR
Intervalo de conflanza al 95%
Crudo
4.54
2.67·7,85
2
Aiustado por edad usando dos categor ias: 45·54 y 55-64 anos (Mantel· Haenszel)
3,35
1,60· 6,01
3
Ajustado par edad usando cuatro categorias: 44·49, SO-54, 55-59 Y 60·64 anos (Mantel-Haenszel)
3.04
1,37-6.11
4
Ajustado par edad como variable continua (regresi6n logistical
2.47
1.31·4,63
Modelo
286
EPIDEMIOLOGiA lNTERMEDIA; CONCEPTOS Y APLICACIONES
dos categorfas (es decir, en e l nlimero promedio de cigarrillos diarios 0 de paquctes por ana, tiempo desde que se abandono el habito, etc .) puede ser grande, producicndo en tal caw una confusi6n resid ual importante clIando se evaluan relaciones entre variables confundidas por e l habiw de fumar. 2. La variable empleada para eI ajl/sle eJ" lin sueet/tineo ill/perfecto de la con(lici6n 0 fa caracteri~'fica por fa waf se desea ajustar. Para una variable dada en un estud io epidemiol6gico, es importante considerar el problema de su validez por construCfo: esto es, el grado en e l e llal ella representa la exposic ion 0 e l desenlace que supucstameme representa(42). Un ejemplo Ifpieo q ue conduce a la confusion resid ual es eI usa de la educaci6n para ajustar por clase social cuando se evaluan diferencias ctnicas (por ejemplo, diferencias entre blancos y negros) en un desen lace dado, ya q ue pueden existir diferencias resid uales en eI acceso a bienes y nivel de ingresos entre grupos raciales 0 etnicos, e incluso denrro de cada categorfa de un nivel ed ucaciona l (~3) . 3. Orms ill/portanres cO/ifu.~·o,.e.~· no jilelVn incluitfos ell elll/Olfelo. Si alg unas de las variables de confusi6n se dejan fuera del modelo, el est imado aj ustado obviamente aun estara confundido . Los res ultados en la primera fil a de la Tabla 7.25, por ejemplo, se ajustan por variables demograficas. Si e llos hubieran sido los unicos res ultados d i5ponibles (bien debido a q ue se careciese de los datos sobre los posibles confu5ores adicionales considerados en e l segundo modelo, bien porque estos datos, aunque d isponibles, hubieran sido conside rados no impol1antes por los investigadores), su interpretaci6n habrfa sido que un alto nivel de anticuerpos a C. pneullloniae se asociaba con un incremento del 60% en la razon de riesgos instantaneos «ajustada>, de enfermedad coronaria. N6tese que incluso el segundo modelo, que implica que la asociaci6n es debil 0 inexistente. puede estar sujeto a confusi6n resid ual. debido a la no inclusion de confusores adicionales (no medidos 0 desconocidos). Gtro ejemplo es e l estudio q ue muestra una asociaci6n entre actividad sexual frec uente y baja mortalidad(-U), d iscutido en el Capitulo 5, Secci6n 5.4.3. Como se mencion6 entonces, la monalidad mas b..1ja de los part icipantes en e l estudio con una frecuencia mas alta de relaciones sex uales persi5t i6 luego de ajustar mediante regresion logfst ica mu ltiple por cierto numero de presuntas variables confusoras . En su d iscusi6n, los autores de aq ue! est ud io espec ulaban q ue los confusores desconoc idos pud ieran ser res ponsables de tales resultados. Aunque ellos no discut ieron q ue variables especffi cas pudieran ser responsables de la confusion residual, al menos dos posibilidades pueden sugerirse: primero, la clase soc ial, importante determinante tanto de la enfennedad como de la mOl1alidad, se tuvo en consideracion solo de manera muy cmda mediante una variable ocupacional dicotomica (ocupaciones «man uales» y «no manuales»); por tanto, una confusion resid ual sustancial puede haber pennanecido. Por otra parte, la unica enfermedad prevalente por la c ual se ajust6 fue la enfermedad coronaria; otras enfermedades q ue afectan tanto la actividad sexual como la mortalidad (por ejemplo, diabetes, quizas condiciones psiqu iatricas) no fueron aparentemente consideradas y podrfan ser responsables de ciena confusi6n resid ual. 4. Errores de clasiJicacion ell las m riable.~· de confusion . Gtra fuente de confusion residual es la dasificadon erronca de los confusores, 10 cual desemboca en ajustes imperfectos(-Is l. Por ejemplo, si no hay asociaci6n causal entre la exposic i6n y e l desenlace, pero la asociaci6n confundida se refleja en un riesgo relativo u odds
ESTRAT1FlCACl6N Y AJUSTE:ANAUSIS MULT1VAR1A!\'TE f.,,, EPlDEM10UXIIA
287
ratio mayor de 1,0, entonces el ajuste por confusores mal c1as ificados puede no producir un riesgo relativo u OR ajustado de 1,0. Un ejemplo de este fenomeno, basado en datos hipoteticos, se presenta en la Tabla 7.29. Dicha tabla muestra los mismos datos de la Tabla 7.1 (parte izqu ierda); en este ejemplo, aunque el OR cmdo sugirio que, comparados con las mujeres, los hombres tenfan un riesgo de malaria un 7 1% mayor, en analisis estratificados por ocupaci6n tal asociaci6n desaparece y el OR MH ajustado por ocupaci6n pasa a ser I ,0 I (veanse Secciones 7 .2 y 7.3.3) . Cuando ocurre una c1asificaci6n erronea de los confusores (parte derecha de la tabla). el resultado ajuslado del OR~tH (1.30) se afecta por confusi6n residual y fracasa en su imento de eliminar completamente eI efecto de la confusion que produce la ocupacion. N6tese que el ejemplo en la Tabla 7.29 es uno de los casos mas simples de error de c1asificaci6n: es no diferencial y solo en una direcci6n . Patrones mas complejos de este error de clasificaci6n (por ejemplo, direccional 0 diferencial) pueden conducir a consecuencias impredecibles en terminos de la magnillld de los estimados «ajuslados». Tabla 7.29 Datos hipotCticos que muestran la confusion residual resultante del error de clasilicacion no diferenciai de una variable confusora (estado ocupacional) TOOos los Casos y Con/roles Casos
Conlroles
Tolal
Hombres
88
68
Mujeres
62
B2
156 144
150
150
300
Tolal
OR::: 1,71
CLASIFICADOS CORRECTAMENTE
CLASIFICADOS INCORRECTAMENTE
$iluaci6n ocupacionaJ"
$iluaci6n ocupacional"
Ocupacionf:s propias de espacios atJierlos
Casas
Conlroles Tolal
Mujeres
10
15 3
Tolal
63
18
Hombres
53
68
13 81
Casos OR::: 1.06
Conlroles
Tolal
45
7
10 2
42
12
54
35"
OR::: 1.00
9
Ocupaciones propias de espacios cerrados
Casas Hombres Mujeres
I
~:
Conlroles Tolal
53 79 132
Tolal 87 OR.... «correcto» :o 1,01
Casos 53"
88
131 219
OR::: 1.00
I
55 108
Conlroles
58
eo 138
111 135 246
OR::: 1,33
OR.... «mal clasificado» " 1 ,30
• V6,,"() T"blo 7.t . .. Error de clasificaci6n no diferencial: un te rcia de todos los individ uos con ocupaciones principa lmente en espacios abiertos (independientemente del sexo 0 de que se trate de un caw 0 de un control) se cias ihcan errnooamente atribuyendoles ocupaci6n principafmente en espados cerraoos (todos los numeros cfas~icados err6neamente se redondean af entero mas cercano). Por ejerrplo, de los 53 casas mascu li nos con ocupaciones en espados ablertos, 18 (_ 53 X 0,333) se cfas~ican err6neamente como individuos que trabajan en espacias cerrados, 10 que deja a 35 sujetos en esa cekfa; a su vez, 53 casos masculinos (35 correctamente ciasificados + 18 erroooamente clasilicados) se incluyen ahara en el estrato correspor.ciente a ocupaciones en espados cerrados
288
EPIDEMIOLOGiA lNTERMEDIA ; CONCEPTOS Y APLICACIONES
7.6. SOBREAJUSTES Tal y como se mencion6 en e l Capitulo 5 (Secci6n 5 .2.3), el ajuste para una variable dada implica tambicn un ajuste, al m~nos parcialmente, para variables relacionadas con e lla. As!, clIando se ajusta para el nivel educacional, implkitamente se ha producido tambien un ajuste por ingreso, al menos en derta medida . Como se menciono previamente, dependiendo de las caraclerlsticas especfficas de la poblaci6n que se estud ia, el ajuste por residencia puede resultar en ajustes por variables relacionadas, {ales como situad6n socioeconomica 0 enloma etnico. El sobreajllJ"fe (0 sobreemparejamiento para una variable ajustada por conducto del emparejamiento) se dice que OCllrrc cuando se ajusta inadvertidamente para una variable que, 0 esta en eI camino causal que vincu la la exposici6n con el desenlace (siendo asf una causa dntermedia>,), 0 tiene una relad6n tan fuerte con la exposicion 0 con e l desenlace, que la verdadera relaci6n se distorsiona(46). EI sobreajuste puede, por 10 tanto, oscurecer eI verdadero efecto 0 crear un efecto aparente que realmente no existe(47) . Un ejemplo 10 aporta el ajuste por hipertension en ocasi6n del examen de la asociacion entre el sobrepeso y el accidente cerebrovascu lar hemorragico . ?uesto que la hipertension es probablemente el mecanismo mas comun para explicar esta asociacion, e l ajuste por concepto de este rasgo puede condudr a un oscuredmiento de la relaci6n entre la obesidad y e l accidente cerebrovascu lar. Como se discuti6 en e l Capitulo 5, serfa , sin embargo, apro piado ajustar por una causa intermedia 0 un vinculo ffsico 0 biol6gico cuando se evalua la presencia de efectos resid uales debido a mecanismos alternati vos. EI sobreajuste puede tambitn oc urrir cuando se ajusta por una variable Intimamente relacionada con la exposid6n de interes. Un ejemplo tfpico de sobreajuste notable es eI que introduce el ajuste por residencia cuando se estudia la relaci6n de la contaminaci6n ambiental con las enfermedades respiratorias. Otros ejemplos inclu yen situaciones en las q ue diferentes variables que representan constructos solapados se ajustan simultaneamente; tal es el caso cuando en el mismo modelo de regresi6n se incluyen educad6n, ingresos, ocu paci6n y medidas de ingreso agregadas (ecoI6g icas) u o tros indicadores socioeconomicos. Puesto que todas estas variables son marcadores de «clase sodal», su colinealidad producirfa coefidentes de regresi6n difkiles de interpretar y hasta carentes de sentido . El problema de l sobreajuste subraya la necesidad de considerar los detenninantes bio l6gicos de la relaci6n que se valora. as f como realizar una evaluaci6n cuidadosa de las reladones entre las variables de confusi6n postu ladas, por una parte, y la exposic i6n y las variables de desenlace por otra , como se disc mi6 en el Capft ulo 5 .
7.7. CONCLUSION N ll es/ro propOsi/o es descllbrir y I'lilorar la lIal liraleza y la slis/allcia del alma, v. solo el1toIlL·es. todos los aLTidell/es penelleciell/es a ella.
Arist6teles (citado por Durrant (-Ill . pI, i.. IS,) Los modelos estadfsticos son resumenes conceptuales y matematicos que establecen la presencia de un derto patr6n 0 asociaci6n entre los e lementos de un sistema
ESTRAT1FlCACl6N Y AJUSTE:ANAUSIS MULT1VAR1A!\'TE f.,,, EPlDEM10UXIIA
289
(por ejemplo. factores de riesgo conjeturados y la enfermedad). EI epidemiologo emplea mOOelos estadfsticos para «sintetizar concisamente patrones mas amplios en los datos e interpretar eI grado de evidencia en un conjunto de dalos relevanle a una hip6tes is particu lar» (49 Pas 106-1) . Cuando se intenta ident ificar patrones de asociaciones entre exposiciones y desenlaces en epidemiologfa, el prop6sito del proceso modelador usualmente es hallar e l modelo estadfstico mas pan'imonioso - esto es, e l modelo mas simple que describa satisfactoriamcnte los datos. Una manera simple de comprender esta idea es concebir el mOOelo estadfstico como un bOJ'quejo 0 una caricarura de la asociaci6n que se investiga. Por tanto.la mOOelaci6n estadfstica podria verse como un proceso anaJogo al que sigue un caricaturista tratando de hallar las pocas Ifneas con las cuales capturar la esencia del personaje que esta siendo caricaturizado, como se Hustra en la Figura 7.12 . Los c ualro paneles en esta figura pueden ser concebidos como cualro «mOOelos» del presidente de los Estados Unidos William J. Clinton . EI modelo en la Figura 7.l2A es el mas simple pero falla en representar efectivamente a la persona que se esta Iratando de rellejar (la mayor parte de las personas no reconocerfan al presidente Clinton si solo se exhibiera esta figura). Algunas, pero no IOOas las personas, reconocerfan a Clinton si unicameme se les muestra la Figura 7. 128 , pero virtualmenIe tOOos 10 reconocerfan en el bosquejo contenido en la Figura 7 .l 2C. Asf, cuando se procura hallar un modelo sucinto, parsimonioso, para describir la esencia de un individuo, las altemativas contenidas en las Figura 7. 128 Y 7.1 2C sedan las mas adecuadas. EI «modelo» de la Figura 7.1 20 se ajusta mejor a «ios datos» pero pagando el precio de hacer que cada uno de los elementos contenidos en el bosquejo sea menos litH a los efectos de captar la esencia de este individuo. Este proceso es similar al prOOucido cuando se emplea la modelaci6n estad fstica en el analisis epidemiol6gico. Tal y como sefiala Zegeri 49), los mode los estadfsticos deberfan considerarse como «herram ientas para la ciencia» mas que <
290
EPIDEMIOLOGiA lNTERMEDIA ; CONCEPTOS Y APLICACIONES
A
B
o
~
c
D
Figura 7.12. Construcci6n de un «modelo» del presidente Clinton. Fuente: Kevin «KAL» Kallaugher, 1986, BaHimore Sun Cartoonists and Writers Syndicate .
corresponderfan a los datos (Ec uaci6n 7 .2). As!, el su pucsto es que la linea en la Figura 7.4 relleja la verdadera esencia de la relaci6n existente entre la tensi6n arterial sist6lica y el grosor de la Int ima-media y que la nube de puntas alrededor de la lfnea (los datos observados) es simplemente milia (vale decir: variabilidad dentro de ind ividuos 0 error aleatorio).
ESTRAT1FlCACl6N Y AJUSTE:ANAUSIS MULT1VAR1A!\'TE f.,,, EPlDEM10UXIIA
291
La misma 16giea se apl iea para situaciones que incorporan las relaciones mut uas entre diferentes variables correlacionadas tanto con la «exposicion» (par ejemplo, tensi6n arterial sist6lica) como con el «desenlace» (por ejemplo, grosor de la fntimamedia), tales como los modelos del 2 al 4 en la Tabla 7. 15. Estos modelos de regresion mult iple 0 IIIlIlrivarianreJ", a la vez que no dejan de asumir que la relaci6n entre estas variables es lineal, definen un esp?.cio mu ltidimensional donde pueden contemplarse las relaciones mutuas entre la variable dependieme y las independientes. As\, cada estimaci6n de estos modelos de regresi6n mu ltiple (cada coeficiente de regresion) se diee que ha sido ajl/Mado par todas las otras variables en el modelo . aunque es imponante considerar siempre las limitaciones potenciales de este tipo de inferencia, como se discute en las Secciones 7.5 y 7.6. La discusi6n precedente es valida para tOOos los mOOelos lineales generales presentados en las secciones anteriores de este Capftu lo (vease Tabla 7.14), los c uales difieren solo con respecto al ti po de variable dependiente y, consecuentemente, a la interpretacion del coeficiente de regresi6n correspondiente . Puede producirse, desde luego, que los datos no se ajusten a uno de eS(Qs modelos <
292
EPIDEMIOLOGiA lNTERMEDIA ; CONCEPTOS Y APLICACIONES
7.7.1. Selecci6n del modelo estadistico correcto Hasta aq ul, la disc llsi6n se ha centrado fundamenta lmente en aspectos de modelaci6n con respecto a laforllla de la relaci6n existente entre cicrta variable independiente y una variable dependiente . Obviamente, sin embargo, este no es el linico problema de la modelaci6n estad fstica. Qlras decisiones fundamentales en cualq uier analisis mllltivariado 0 de regresi6n mu ltiple son: 1) la selecci6n de la lecnica espedfica basada en la regresion 0 en la estratifi cacion; y 2) la elecci6n de las variables que han de ser incluidas en la ecuaci6n multivariante 0 en el esquema de estratificad6n. Ln eleccion de fa recnica de ajusre (basada en la estrat ificaci6n 0 en la regresi6n) es con frec uencia materia de preferencia personal 0 conveniencia . La selecci6n de una tecnica de aj uste particu lar sobre las otras que se han descrito en secciones precedentes de este Capitu lo (y otras no recog idas aquf) se basa con frec uencia en el tipo de disefio del estudio, el tipo de variables (dependiente e independ ientes) que se investigan, y el tipo de medida de asociaci6n que uno desea manejar. La Tabla 7.30 resume como las tecnicas de aj uste descritas en este Capitu lo se relacionan con los disefios fundamenta les de est udio, el tipo de variable, y las medidas de asociacion.
Tabla 7.30 Tecnicas analiticas comunmcnte ('mpieadas y disponibles para la evaluacion epidemiologica de relaciones entre exposiciones y desenlaces Tipo de estudlo
TIpo de lIarlable dependiente (desenlace)
Tecnica multillarlada
Medlda de asocl aci6n aju stada
Cualquiera
Pan'lmetros biol6gicos continuos
Analisis de lIarianza Reg resi6n lineal
Diferencia entre medias Coeficiente de reg resi6n lineal
Transllersales
Enfermos/No enfermos
Ajuste directo
Mantel·Haenszel Reg resi6n logistica
Raz6n de tasas de prellalencia Raz6n estandarizada de prellalencias Odds ralio Odds ralio
Ajuste indirecto
Casos - Conlroles
Enfermos/No enfermos
Manlel-Haenszel Reg resi6n logistica
Odds ralio Odds ralio
Cohorte
Incidencia acumulada (al final del seguimienlo)
Ajuste directo Ajusle indirecto
Riesgo relalivo Tasa de incidencia eSlandarizada Odds ralio Odds ralio Raz6n de riesgos instanlaneos R>17rm rlfl '>1':;>1':; Raz6n de lasas
Incidencia acumulada (Iiempo hasla el evento) T>1':;>1 rh~ inc.irlflnr.i>1 (por tiempo-persona) Casos y conlroles anidado Caso· cohorte anidado
Estado de enfermedad dependiente del tiempo (Datos de tiempo hasta el evenlo)
Mantel-Haenszel Reg resi6n logistica Modelo de Cox M>1ntAI-H>1AnpAI Reg resi6n de Poisson Reg resi6n logistica condicional Modelo de Cox con entradas aHernas
Raz6n de riesgos instanlaneos
ESTRAT1FlCACl6N Y AJUSTE:ANAUSIS MULT1VAR1A!\'TE f.,,, EPlDEM10UXIIA
293
Los metodos de analisis de varianza y modelos de regresi6n lineal estan indicados cuando la variable de desenlace cs cont inua. Cuando esta es una variable binaria (como ocurre frecucntemente en epidemiologfa) las tecnicas de ajuste basadas en los populares modelos mu ltiplicativos anterionnente descritos (por ejemplo, odds ratio 0 razon de tasas global de Mantel-Haenszel, regresi6n logfstica, regresion de Cox, regresi6n de Poisson) tienden a producir res ultados similares como se ilustra a traves de la similitud de los resu ltados q ue se obtuvieron en las Tablas 7.1 5, 7. 17, 7.1 8, 7.20 Y 7.2 1. Un ejemplo anaJogo puede hallarse en Khan y Sempos(S) qu ienes utilizaron diferentes metodos de ajuste basados cn la estratificacion y en la regresi6n mUltiple para obtener estimaciones ajustadas de las asociaciones de tres fact ores de riesgo (hipertensi6n, edad, sexo masculino) con EC en un subconjunto de participantes del estudio de Framingham. Todos los metodos dieron lugar a estimaciones basicamente equivalentes, que conduclan, por tanto, a conclusiones similares . Como sefiala Greenland(SO), muchos de eS(Qs metodos frec uentcmente empleados en epidemiologfa (por ejemplo, Mantel-Haenszel, logfstico, Poisson, Cox) se basan en supuestos similares (relaciones mult ipl icat ivas entre factores de riesgo y enfennedad) y tienen parecidos significados epidemiologicos. Asf, no es sorprendente, q ue, con la excepcion de circ unstancias extremas (por ejemplo, groseras vio laciones de los supuestos ba.>;icos del modelo, valores aberrantes extremos) con frec uencia ellos produzcan resultados similares. EI problema de qlle variables indel'endientes (confusoras) han de ser induida.\· en e l modelo esta en el centro de la discusi6n sobre el topico de la confusi6n en general (Capit ulo 5) y de la confusion residual en particular (secci6n 7.5) . Una disc usion detallada de las tecnicas estadfsticas que podrfan ser (jtiles en la selecci6n de un conjunto particular de variables para un modelo esta fuera del marco de este libro . Una elocuente rev ision general puede hallarse en el artfculo de Greenland(SO). Una recomendaci6n importantc cuando se selecciona un modelo estadfstico particular es realizar un (l/uiliJ·i.\· de sensibilidad: eS(Q es, examinar si se obtienen resultados similares c uando se han empleado diferentes modelos 0 se han hecho dife rentes supuestos para e l ana li s i s( SO~') . Debido a la creciente facilidad y disponibilidad de computadoras y de programas infonnaticos, en los ultimos afios se ha visto un florecimiento del analisis multivadante en el analisis de la literat ura biomedica, tanto en 10 cuant itativo (un uso mas intenso) como en 10 c ualitativo (una ampliaci6n en el espectro de variantes empleadas) . Estos modelos matematicos altamente sofisticados, sin embargo, raramente e liminan la necesidad del examen c uidadoso de los datos originales por cond ucto de diagramas de dispersion, simples tablas de n x k y analisis estratificados.
BlBLlOGRAFiA I. Miettinen OS. Cook EF. Confounding: essence and detection. Alii J Epidemiol1981: 114: 593-603. 2. Greenland S. Absence of confounding does not correspond to collapsibility of the rate ratio or rate difference. Epidemiology 1996: 7: 498-50 I . 3. Reif JS, Dunn K. Ogilvie GK el al. Passive smoking and canine lung cancer risk. Am J Epidemiol1992: 135: 234-239. 4. Shapiro S. Slone D. Rosenberg L eI al. Oral-contraceptive use in relation to myocardial infarction. Lancel 1979: I: 743-747. 5. Gordis L. Epidemiology. Philadelphia, WB Saunders. 1996.
294
EPIDEMIOLOGiA lNTERMEDIA ; CONCEPTOS Y APLICACIONES
6. Armstrong BG. Comparing standardized mortality ratios. AnI! Epidemiol 1995: 5: 60-64. 7. Mantel N. Haenszel W. Statistical aspects of the analysis of data from retrospective studies of disease. J Nail Cancer Insl 1959: 22: 719-748. 8. Kah n HA . Sempos CT. SlaliSliea/methods in epidemiology. New York. OxfordUniversity Press. 1989. 9. Pandey OK , Shekelle R. Selwyn BJ fI al. Dietary vitamin C and ~ . carotene and risk of death in middle-aged men: the Western Electric study. Alii J Epic/ell/;ot 1995: 142: 1269-1278. 10. Sorlie PD. Adam E, Melnick SL el ai. Cytomegalovirus/herpesvirus and carotid atherosclerosis: the AR1C Study. J Mcd Viro! 1994: 42: 33 37.
11. Kan nel W8, McGee D. Gordon T. A general cardiovascular risk profile: the Framingham study. Alii J Cardiol1976: 38: 46-51. 12. Armitage P. Berry G. Slatislh'al melhods in medical research. 3.' ed. London. England: Blackwell. 1994. 13. Nieto FJ. Diez-Rou x A. Sharrett AR el al. Short and long term prediction of atherosclerosis by traditional risk factors. J elin Epidemiol 1999: 52: 559-567. 14. Kleinbaum IXi. Kupper LL Morgenstern H. Epidemiologic researdl: Principles alldqllaf1lilalive lIIelhods. Belmont. Calif: Lifetime Learning Publications. 1982. 15. Draper NR. Smith H . Applied regressioll analysis. 3: ed. New York. Joh n Wiley. 1998. 16. Keys A. Sel'ell COlllllries: A m1lltil'arime analysis of dealh alld L'orollary heart disease. Cambridge, Mass: Harvard University Press. 1980. 17. Nieto FJ. Szklo M. Folsom A el al. Leukocyte count correlates in middle-aged adults: the Atherosclerosis Risk in Communities (ARIC) study. Alii J Epidelllioll992: 136: 525-537. 18. Feldstein MS. A binary multiple regression method for analyzing factors affecting perinatal mortality and other outcomes of pregnancy. J Roy Slat Soc fA/1966: 129: 61-73. 19. ARIC investigators. The Atherosclemsis Risk in Communities (ARIC ) study: design and objectives. Alii J Epidemiol 1989: 129: 687-702. 20. Chambless LC , Heiss G . Folsom AR. el al. Association of coronary heart disease incidence with carotid arterial wall thickr.ess and major risk factors: the Atherosclerosis Risk in Communities (ARIC) study. Am J Epidellliol 1997: 146: 483-494. 21. Hosmer OW. Lemeshow S. Applied logislh' regression. New York: John Wiley. 1988. 22. Schlesselman JJ . Case-I'oll lral .f/1ulies: Design, cond1ld, allalysis. New York. Oxford University Press. 1982. 23. Gibas A. Blewet DR. Schoenfeld D/\. . Dienstag JL. Prevalence and incidence of viral hepatitis in health workers in the prehepatitis B vaccination era. Alii J Epidemiol 1992: 136: 603-610. 24. Cox DR. Regression models and life table (with discussion). J Roy Slat SOL' {BI 1972: 34: 187-220. 25. Collet D . Modelling sllrl'il'al da/a inmediml researd1. London. England: Chapman & Hall. 1994. 26. Pannar MKB. Machin D . SlIrl'il'al analysis: A pradiml approad1. Chichester. England: John Wiley. 1995. 27. Breslow NE. Day NE . Slalislimlmelilods in callcer research: Vol I. 77le analysis of mse con/rol s/1Idies. Lyon. France: International Agency for Research on Cancer Scientific Publications. 1980. 28. Heiss G. SharrettAR. Barnes R el al.Carotid atherosclerosis measured by B-mode ultrasound in populations: associations with cardiovascular risk factors in the ARIC study. Am J Epidemiol 1991: 134: 250-256. 29. Nieto FJ. Adam E. Sorlie P el al. Cohort study of cytomegalovirus infection as a risk factor for carotid intimal-medial thickening, a measure of subclinical atherosclerosis. Circ1llalion 1996: 94: 922-927.
ESTRATlFlCACl6N Y AJUSTE:ANAUSIS MULTIVARIA!\'TE f.,,, EPIDEMIOUXIIA
295
30. Pearce N. Incidence density matching with a simple SAS computer program. In/ J Epidemiol 1989: 18: 981-994. 31. Barlow WE . Robust variance estimation for the case-cohort design. Biometrics 1994: 50: 1064-1072. 32. Thomas D. Ne w techniques for the analysis of cohort studies. Epidemiol Rev 1998: 20: 122-136. 33. Nieto Fl. Folsom AR. Sorlie P etili. Chlamydia pnellmoniae infection and incident coronary heart disease: the Atherosclerosis Risk in Communities (ARIC) study. Am J EpidemioI1999: 150: 149-156. 34. Waaler HT. Height. weight and mortality: the Norwegian experience. Ac/a Med Scan Supp11984: 679: I-56. 35. Allison DB. Faith MS. Heo M. Kotler DP. Hypothesis concerning the U-shaped relation between body mass index and mmality. Am J Epidemiol 1997 :146: 339-349. 36. Fagot-Campagna A, Hanson RL . Narayan V et al. Serum cholesterol and mortality rates in a Native American popUlation with low cholesterol concentrations: a U-shaped association. Circlilation 1997: 96: 1408- 1415. 37. Thun M1, Peto R, Lo pez AD e/ al. Alcohol consumption and mortality among middle-aged and elderly U.s. adults. N Engl J Med 1997: 337: 1705-1714. 38. Moscicki EK . Locke BZ. Rae OS. Boyd 1H. Depressive symptoms among Mexican Americans: the Hispanic Health and Nutrition Examination Survey. Am J Epidemiol 1989:130:348-360. 39. Luke A. Durazo-Arvizu R . Rotimi C, el al. Relation between body mass index and booy fat in black population samples from Nigeria. Jamaica. and the United States. Am J Epidemiol1997: 145: 620-628. 40. Kretzschmar M. van Duynhoven YTHP. Severijnen A1. Mooeling prevention strategies for gonorrhea and chlamydia using stochastic network simulations. Am J Epidemiol 1996: 144: 306-317. 41. Clayton D . Hills M. Stalislicalll10dels in epidemiology. Oxford. England: Oxford Universlly I'ress : I'NJ. 42. Krieger N. Williams DR . Moss NE. Measuring social class in US public health research: concepts. methodologies. and guidelines. Ann Rev Pllblic Health 1997: 18: 341-378. 43. Kaufman JS. Cooper RS, McGee DL. Socioeconomic status and health in blacks and whites: the problem of residual confounding and the resiliency of race. Epidemiology 1997: 8: 621-628. 44. Davey Smith G. Frankel S, Yarnell J . Sex and death: are they related? Findings from the Caerphilly Cohort Study. Br Med J 1997: 3 15: 1641-1644. 45. Greenland S. The effect of misclassification in the presence of covariates. Am J Epidemio11980: 112: 564-569. 46. Last J M. A Dictionary of epidemiology. New York: Oxford University Press . 1995. 47. Breslow N. Design and analysis of case-comrol studies. Anl1ll Rev Pllblic Heallh 1982: 3: 29-54. 48. Durrant M. Aristotle's De Anima in Foc·us. London, ORoUiledge : 1993. 49. Zeger SL. Statistical reasoning in epidemiology. Am J Epidemiol 1991: 134: 1062-1066. 50. Greenland S. Mooeling and variable selection in epidemiologic analysis. Am J Pllblh' Heallh 1989: 79: 340-349. 51. Robins 1M. Greenland S. The role of model selec tion in causal inference from non-experimentill rlmil . Am.l F.pidPlllinI 19Rfi: 121 : 192-402.
CAPITULO 8 Aseguramiento y control de la caUdad
8.1. INTRODUCCION Como con olros tipos de invcstigaci6n cmpfrica , la validez de las inferencias realizadas a partir de los resu ltados de la invesligacion epidemio16gica depende de la exactimd de los metodos y procedimientos empleados. En lajerga epidemio16gica. eltermino validez (0 exactiflld) se refiere a la ausencia de sesgo . Los sesgos mas comunes, y algunos enfoqucs para prevenirlos de manera que se maximice la validez de los resu ltados del estudio y las inferencias, se discutieron en el Capftulo 4. Este capftulo extiende la d iselision de los aspectos relacionados con la exact itud de la recolecci6n y el procesamiento de los datos que deberfan considerarse clIando se disefian y realizan estudios epidemio16gicos. Ademas de la validez 0 la ausencia de sesgos, el presente capitulo tambien aborda aspectos relacionados con la evaluaci6n y el aseguramiento de lafiabilidad (precision, reproducibilidad) de los datos recogidos. Aunque los tenninos aseguramrento de la calidad y control de calidad se utilizan a veces indistintamente o. aun mas a menudo. juntos en un solo termino. control de calidad. con prop6sitos sistematiz.adores. las actividades orientadas a asegurar la calidad de los datos antes de su recolecci6n se entenderan en este capftulo como aseguramienfO de /a calidad, y los esfuerzos para Ilevar el control y mantener la calidad de los datos durante la conduccion del est udio se entenderan como control de cali(/ad. Las act ividades de control de calidad y aseguram iento de la calidad son componentes claves de la invest igaci6n epidemiol6gica y se comprenden mejor en el contexto de los rasgos principales del disefto de un eswdio epidemiol6gico . Los aspectos mas relevantes del disefto de un estudio, adecuadamente tratados en el texto de Kahn y Sempos(l), proveen el marco adecuado para la elaboraci6n que sigue (Tabla 8. 1). Puede decirse que la mayorfa de los componentes de un estudio se relacionan con el aseguramiento 0 el control de caUdad de una manera u otra en el amplio contexto de la validez y la fiabilidad de la tnvestigacion epidem iol6gica. Este capitulo, sin embargo, se concentra en el examen en las activ idades mas trad icionalmente comprendidas dentro del dominio del aseguramiento de la caUdad 0 de su control: esto es, en los puntos 7 y 8 de la Tabla 8.1. Para una rev ision sistematica adic ional de este t6pico. vease Wh itney et al.(2) . Para ilustrar algunos de los aspectos tratados en la discusi6n que sigue, el Apendice D incluye una transcripcion tex tual del protocolo de aseguramiento y control de la calidad para dos procedimientos Ilevados a cabo en el estudio de cohortes mu lticentrico sobre arteriosclerosis (Estudio del Riesgo de Arteriosclerosis en Comun idades, AR IO J)): presi6n arterial y ven ipuntura(4) .
298
EPIDEMIOLOGiA lNTERMEDIA ; CONCEPTOS Y APLICACIONES
Tabla 8.1 Elementos rclc\'antes del disciio de Actlvidad (Aseguramiento de la Calldad, AC, 0 Control de la Calldad, eel 1. Formulaci6n de la (0 las) hip61esis principal (es) del estudio (AC)
2. Una especilicaci6n a priori de las variables coniusoras polenciales (AC)
3. Delinici6n de las ca racteristicas de la poblaci6n en estudio para la validez axler·
na (capacidad de generalizaci6n) de los pmp6sitos (AC)
4. Delinici6n de la estralegia de diseno (por ejemplo. cohorts , casos y controles, C<'. W ·
cohorte) y de los grupos que han de com· pararse, y especificaci6n de los procedHes
de selecci6n para la validez inlema (com· parabilidad) (AC) 5. Delinici6n de la estrategia de diseno y muestras para estudios de tiabilidad y \'ali dez (AC/CC) 6. Especificaci6n de la potencia necesaria pa ra detectar la(s) asociaci6n(es) conjetu rada(s) pa ra un nivel de significaci6n dado (AC)
7. Estandarizaci6n de pmcOOe res (AC)
8. Actividades durante la recolecci6n de datos; incluyen el analisis de datos de con trol de calidad y acciones remOOiales (CC)
UII
estudio epidcmiologico Comentarlos
La hip6tesis debe especificar las variables independ ientes (por ejemplo, factor de riesgo) y las variables dependientes (par ejemplo. enfermedad 0 desenlace) . Si los investigadores planifican analizar la interacci6n. las hip6tesis de estudio deben especificar el (0 los) mod~icador (es) de efecto(s) potencial(es). Una revisi6n de la literalura pertinente puede ayudar a los investigadores a ident~icar las principales variables confusoras y, poi" 10 tanto. ayudar en la elecci6n d~ diseilo mas apropiado (por ejempto, casos y controles emparejados frente a no emparejados) y a seleccionar los datos qua sa necesita recolectar. La capacidad de generalizar los resultados a otras poblaciones esta condicionada por diversas circunstancias. que incluyen las diferencias en la distribuci6n de los modi ficadores de efecto y las caracterfsticas de la poblaci6n estudiada. Una caracterizaci6n detallada de los participantes en el estudio pe rmite a los «consumidores» de datos decidir si los resultados son aplicables a la poblaci6n objeto de estudio. La selecci6n de los grupos que van a ser comparado:'; se relaciona con la prevenci6n del sesgo de selecci6n y el nivel de confusi6n que se espera. Se debe especificar la astrategia para la busqueda de confusores. ademas de los sugeridos por estudios previos. Se debe especiticar el enfoque de selecci6n de muestras para estudios de mediciones repetidas (fiabilidad) 0 comparaciones con «estandares de oro» (validez) . La estimaci6n del tamailo de muestra es un importante elemento que permite decidir si el esludio bene suficiente potencia a un nivel dado de error de primer tipo, y esto debe tomaren cuenta la(s) interacci6n(es) potencial(es). si esta(n) especificada(s) en la hip6tesis esludiada. Incluye la preparaci6n de manuales escritos que contengan una descripci6n detallada de los procederes pa ra la selecci6n de la poblaci6n estudiada y la recolecci6n de los datos, asi como el entrenamiento y certi ficaci6n del equipo de investigadores. Abarcan el control 0 veri ficacion de los procederes de recoleccion de datos, asi como la conducci6n de estudios en muestras para aquilatar la validez y fiabilidad de las mOOi ciones. 10 que pudiera dar lugar al reentrenamiento y recerti ficaci6n de miembms del equipo de investigadores. Continua
ASEGURAMIENTO Y CONTROL DE LA CAUDAD
299
Tabla 8.1 Ele mentos relevantes del diseiio de un estudio epidemiologico (colltilll/acioll) Actlvldad (Aseguramlento de la CaUdad, AC , 0 Con trol de la CaUdad, CC) 9. Anaiisis de datos
10. Informe de resultados
Comentarlos EI analisis de dalos se debe hacer de acuerdo a un plan preestablecido. Se deben hacer esluerzos para establecer estrategias de analisis po!" adelantado (por ejemplo, la elecci6n de puntos de «corte" cuando se usan datos continuos u ordinales para crear categorfas discretas). EI anal isis debe proceder a partir de las estrategias mas seneilias (descripci6n de datos, calculo de madidas no ajustadas de asociaciOn, enloques simples ajustados) y continuar entonces con la aplicaci6n de modelos mas complejos (por ejemplo, regresi6n logistica 0 de Cox). Los investigadores tambiEm deben especificar las estrategias analiticas que emplearan para evaluar la validez y fiabilidad de los procederes. Los resultados sa deben informar tan pronto como sea posible despues que fin81icen las actividades de recolecci6n de datos, de manera que sa preseNe la oportunidad del estudio. Para evitar sasgos de publicaci6n, los datos sa deben informar independientemente de la direcci6n de los resultados (vease Capitulo 4, SecciOn 4.5). Los instrumentos empleados y los datos de control de calidad deben estar disponibles para la comunidad cientilica, si sa requiere.
Fuente: HA Kahn and CT Sempos, Statistical Merhods in Epidemiology. 11:11989. Oxford University Press.
8.2. ASEGURAMIENTO DE LA CALIDAD Las act ividades de aseguramiemo de la calidad antes de la recolecci6n de los datos se relacionan con los procedimientos de estandarizaci6n y, por tamo , de prevenci6n 0, por 10 menos, de minimizaci6n de los errores sistematicos 0 aleatorios que pueden aparecer en la recolecci6n y analisis de los datos . Tradicionalmeme, estas actividades comprenden la preparaci6n detallada del protocolo, el desarrollo de los instrumemos y procedimientos para la recolecci6n de los datos y sus mamtales de operaci6n, y el emrenamiento y cenificaci6n de las personas que trabajaran en el equipo de invest igacirin. (EI cleS;lrm llo fie m;lntm les fl tle especifi'1t1en las ;lctivicl;lcles cle l conlrol fie];'l
caUdad tambien puede verse como una actividad del aseguramiento de la caUdad) . EI disefio de las actividades de aseguramiento de la calidad deberfa ser seguido por pruebas y estudios piloto sobre eslas act ividades. Los resu ltados de las pruebas y de los eslud ios piloto, a su vez, contribuyen a modificar los procedimientos y hacerlos aSI mas eficientes, validos y confiables.
300
EPIDEMIOLOGiA lNTERMEDIA ; CONCEPTOS Y APLICACIONES
8.2.1. Protocolo del estudio y mammies de operaci6n EI prorocolo del eJ"!udio consiste en una descripc ion de los componentes genera les de la investigac ion, inc luyendo los que se mucstran en 1a Tabla 8.1 . Provee lIna panora.mica global de las estrategias q ue lIevan al desarrollo de manua les de o perad6n mas detallados. El protocolo describe e l di sefto general y los procedimientos utilizados en e l est udio (incluyendo los que se relacionan con e l mucstreo y e l reclutamiento de los partic ipantes) y ayuda al eq uipo de investigadores a comprender e l contexto en el ellal se llevan a cabo sus act ividades especfficas. Los mGllualeJ" de opemci6n deben contenc r descripciones dctallarlas acerca de como se llevan a cabo exactamente los procedim ientos especfficos de cada instrumento para recoger los datos, de manera q ue se garantice que las {areas se desempenara.n {an uniformememe como sea posible. Por ejemplo, la descri pcion de los procedimientos para las mediciones de tension arterial deben inclu ir la calibracion del esfigmomanometro, la posicion del participame, los lapsos que ha de haber entre med iciones, e l tamano del manguito y la posic ion de este en el bmzo. Con res pecto a las emrev is{as, el manual de o peraciones debe comener las instrucciones acerca de como debera hacerse exactamente cada pregunta d urante la entrevista (ins(rucciones «preg unta por preg unta» 0, utilizando la jerga epidemiologica, «p por P») ·. La estandarizacion de los procedimiemos desempena un papel partic ul armente medular en los estudios mu lt icemrico, en los que varios tecnicos llevan a cabo los examenes 0 adm inistran los mi smos cuestionarios a los part icipantes en e l estud io, reclutados y exam inados en distimas clfnicas 0 lugares. Un manua l de o peraciones detail ado es importante para lograr el mayor nivel posible de uniformidad y estandarizaci6n de los procedimientos de recogida de los datos en tada la poblacion de estudio. En los estudios grandes que involucran diferentes mediciones, los malllwle.\· de operu ci6n pueden hacerse especfficos por actividad : esto es, pueden prepararse manu ales de operacion separados para dife rentes aCliv idades relacionadas con los datos, tales como e ntrevislas, recoleccion y procesamiento de muestras de san gre y pruebas de la funcion pu lmonar. Los manuales de o peracion deben desarroll arse lam bien para la lectura y cl asificacion de los dalos, como cuando se codifican hall azgos e lectrocard iograficos u{ilizando e l codigo de Minnesota(4) o clasificar una enfermedad en diferentes categorfas diagnosticas, lales como in fa rto de miocardio «definitivo», «probable» 0 «au sente)-)-(S). Puede tambien desarroll arse un manual especificando como se crean variables «derivadas» para los propositos del estudio , esto es, variables para e l analis is basadas en combinaciones de variables «crudas» obtenidas durante la recoleccion de los datos. Un ejemplo es la defin icion de hiperfensi61l (presente 0 auseme) basada en niveles de tension arterial medidas con esfigmomanomelro, pero lam bien a partir de la comunicacion hecha por un part icipante seglin la cual un medico ha diagnoslicado una hipertension 0 que consume regu larmeme medicacion antih iperlens iva .
• Se refiere a «q by q's» una manerd que !ienen los epidemi61ogos de habla inglesa para abrev iar question by question , (Nola del T. )
ASEGURAMIENTO Y CONTROL DE LA CAUDAD
301
8.2.2. Instrumentos para la recolecci6n de los datos La confecci6n (0 selecci6n) de instrumentos para la recog ida de los datos y sus correspondientes manuales de operaci6n es un paso crucial en el disefio del estud io y debe Ilevarse a cabo de acuerdo a reglas bien establecidas. como en el caso del disefio del cuestionario(6.7) . Siempre que sea posible, es aconsejable seleccionar instrumentos de recolecci6n de datos y procedimientos que hayan sido ut ilizados con exito en estudios previos para medir factores de riesgo sospechados y enfennedades como desenlace de interes. Entre otros ejemplos, pueden mencionarse el c uestionario desarrollado por Rose(8) para identificar angina pectoris (eillamado «cuestionario de Rose~»), el cuesdonario de la Sociedad Americana del T6rax (American Thoracic Society) para evaluar sfntomas res piratorios(9), los procedimientos para la medici6n de la tensi6n arterial seg uidos por la «Encuesta nacional de examenes de salud» (National Health Examination Surveys)(lO) y los cuest ionarios de frec uencia en el consumo de alimentos disefiados por Block ef al.(II) 0 Willett ef al .(12) para evaluar habitos dieteticos. Ocasionalmente, la validez y la fi abilidad de tales instmmentos y procedimientos previameme probados se conocen(l2), 10 que permite hasta cieno punto la evaluaci6n de sesgos posibles y errores en la clasificaci6n (vease mas adelante). Ademas, el usa de instrumentos y procedimientos ya establecidos permite comparar los hallazgos obtenidos con los de los estudios previos y faci litar de ese modo la preparaci6n de revisiones y el desarrollo de metaanalisis(Il). En ocasiones. un instmmemo bien establecido se modifica para adec uarlo a los prop6sitos del estudio . La modificaci6n de un c uestionario puede hacerse, por ejemplo, para incluir 0 excl uir variables, 0 para reducir la duraci6n de la entrevista. EI grado hasta el cual la version modificada de un instmmento mantiene la validez y la fiabilidad originales puede evaluarse comparando los resu ltados que se dan al ut ilizar ambos instrumentos en la misma muestra . Tal evaluaci6n, sin embargo, puede verse afectada por la fa lta de independencia entre dichos instrumemos cuando se aplican a los mismos ind ividuos (es decir, las res puestas al cuest ionario que se aplique en segundo lugar pueden estar influ idas por el recuerdo del part icipante de las res puestas que dio al primer cuestionario). Cuando no se dispone de instmmentos efectivamente utilizados en el pasado, se hace necesario crear instmmentos especiales que se adecuen a los prop6sitos del estudio; en tales casos deberfan lIevarse a cabo estudios piloto que pennitan aq uilatar la validez y fiabilidad de los imtrumentos y los procedim ientos de medici6n relacionados, preferiblemente antes de comenzar las actividades de recolecci6n de los datos (vease mas adelante) .
8.23. Entrenamiento del equipo de investigadores EI entrenamiento de cada persona del eq uipo de investigadores debe tener el objetivo de fam iliarizar profundamente a esa persona con el 0 los procedimientos bajo su responsabilidad . Estos procedimientos incluyen no solo la recolecci6n de los datos y los proced imientos para su procesam iento sino {ambien la planificaci6n de las citas para entrev istas 0 las visitas a las clfnicas en el estudio, la preparaci6n de materiales para los entrevistadores y otros recolectores de datos, la calibraci6n de los instm-
302
EPIDEMIOLOGiA lNTERMEDIA; CONCEPTOS Y APLICACIONES
mentos y la asignaci6n de los entrevistadores a los part ici pames en el est udio . EI entrenamiento debe tambien involucrar a los lecnicos de laboratorio y a los encargados de la lec(u ra y clasificaci6n de los datos obtenidos de examenes tales como los electrocardiogramas 0 imagenes de rcsonancia magnctica, 0 de estud ios de ultrasonidos en modo B. En los est udios multicentricos, el entrenam iento de los tecnicos de {odos los centros part icipantes se realiza habitualmente en un lugar central camlin. El entrenamiento concluye con la certificaci6n de los miembros del equ ipo de investigadores para realizar eI procedimiento espedfico . Particu larmente en los estudios con una d uraci6n relativamente larga (tales como los est udios prospect ivos conc urrentes; vease Gordis(14) , se lIevan a cabo recertificaciones peri6dicas, con e l reentrenamiento de cualquier miembm del equ ipo de investigadores cuyo desempefio en la conducci6n de las tareas para la recert ificaci6n se considere inadecuado. Pero. debido a que el reentrenamiento y la recert ificaci6n se hacen cuando las activ idades de recolecci6n de los datos estan ya en ejecuci6n, nonnalmente se clasifican como actividades del control de calidad mas q ue del aseguramiento de la calidad. Para la estandarizaci6n de la recolecci6n de los datos y los procedimientos de clasificaci6n es menester q ue se entrene cu idadosamente a todo e l personal del est udio q ue este involucrado en la recolecci6n; debe hacerse enfasis especial en la necesidad de que se cumplan celosamente los procedimientos especificados en e l manual de operaciones (vease arriba). EI entrenam iento minucioso de los recolectores de los datos es clave para preven ir errores de clasificaci6n (Capitu lo 4, Secci6n 4.3.3), de posible aparic i6n cuando los procedimientos de recogida no se aplican de manera un iforme .
8.2.4. Estudios piloto y pruebas previas La verificaci6n de la fac fi bilidad y et1ciencia de los procedimientos del est udio se lIeva a cabo a traves de pruebas previas y est udios pHoto . A men udo los terminos prueha previa y estlldio pi/oro se usan ind ist intamente; sin embargo, una dist inci6n (itil es que la prueba prev ia implica la evaluaci6n de procedimientos especfficos en una muestra rapida, tomada de cualquier manera 0 de conveniencia (por ejemplo, en las mismas personas del equipo de invest igadores 0 en sus am igos 0 fam iliares) con el fin de deteclar problemas graves; e l est udio piloto, en cambio, es un «ensayo» forma l de los proced imientos de l est udio po r c uyo conduc lO se procura re producir todo eI fl ujo de o peraciones, en una muestra tan similar como sea pos ible al universo de partic ipantes en e l est udio . Los resu ltados de las pruebas prev ias y de los est udios pHoto se utilizan para evaluar e l recl utam iento de los participantes y los proced imientos de recogida de los datos y, si es necesario, corregir estos procedimientos antes de que com ience e l trabajo de campo. Por ejemplo, des pues de la prueba previa y de Ilevar a cabo el estudio piloto de un cuestionario. pueden evaluarse los siguientes e lementos: flujo de las preguntas, presencia de preg untas sensibles. pertinencia de la categorizaci6n de la variables. grado en que e l lenguaje empleado resu lla comprensible tanto para el enc uestado como para e l enc uestador, y claridad de las instru::ciones q ue se dan al enc uestador «pregunta po r preg unta». Los eSlud ios pHoto tambien permiten la evaluaci6n de estrateg ias alternativas para el reclutamiento de los part icipantes y la recolecci6n de los datos. Por ejemplo,
ASEGURAMIENTO Y CONTROL DE LA CAUDAD
303
un est udio piloto puede lIevarse a cabo para evaluar si el empleo del telefono const ituye una buena alternativa en lugar de las entrevistas persona a persona. que son mas caras y consumen mas tiempo. Un resumen de algunos de los pasos crudales para el aseguramiento de la calidad se muestra en el Esquema 8. 1. Esquema 8.1 . Pasos para eI aseguramiento de la calidad 1. 2. 3. 4. 5.
6.
Especificar la hip6tesis de estudio. Especificar al diseno general para evaluar la hip6tesis de estudio __ desarrollar un protocolo general del estudio. Seleccionar 0 preparar instrumentos especificos, y desarrollar pmcedimientos para la recolecci6n de datos y su procesamiento __ Oesarrollar manuales de operaci6n. Entrenamiento del equipo -- Cert~icaci6n del equipo. Con un equipo de trabajo certificado, realizar una prueba previa y un estudio piloto para la recoleccion de los datos y para I)s instrumentos y procedimientos que se utilizaran en el procesamiento; incluir en el estudio piloto estrategias alternativas para la recolecci6n de datos (por ejemplo, entrevistas telef6nicas frente a entrevistas por via postal). Si fuera necesario, modificar los puntos 2 y 3, Y reentrenar el equipo sabre la base de los resultados del punto 5
83. CONTROL DE CAUDAD L1 S actividades de control de calidad comienzan despues de iniciada la recolecci6n de los datos y el procesamiento . EI escrutinio de los datos del control de calidad es la base para posibles acciones remediales que conduzcan a minimizar los sesgos y los problemas de fi abilidad . L1 S estrategias de control de calidad incluyen observaci6n de los procedimientos y desempefio de los miembros del equipo de invest igadores 10 que permite la identificaci6n de obvias desviaciones del protocolo y est udios especiales de validez y fi abilidad usualmente Ile\'ados a cabo en muestras de los sujetos en intervalos espedficos a 10 largo dellapso de recolecci6n de los datos y el procesamiento (vease Apendice D). Lo que sigue es un resumen de las estrategias e indices de control de calidad mas comunes. L1 discusi6n estadistica profunda de los indices de fiabilidad y validez esta fuera de los Ifmites de este libro; en su lugar. las secciones siguientes se concentran en su aplicabilidad, su interpretacion y sus limitaciones.
8.3.1. Verificaci6n de las observaciones y valoraci6n de las tendencias Para identificar problemas en la puesta en practica de los procedimientos del est udio por parte de entrevis(adores. tecnicos y procesadores de datos. los su pervisores pueden controlar la calidad de estos procedimientos mediante la observaci6n del equi po de in\'estigadores «por endma del hombro» . Por ejemplo, la verificad6n por observad6n de la calidad de las mediciones de tensi6n arterial se hace a menudo por ••estetoscopios dobles»: esto es, U{ilizando un estetoscopio que permita ados observadores med ir los niveles de presion arterial sim ultaneamente. EI control por obser-
304
EPIDEMIOLOGiA lNTERMEDIA ; CONCEPTOS Y APLICACIONES
vad6n de las entrevistas puede hacerse grabando todas las entrevislas y revisando una muestra aiea{Qria de estas para valorar el grado de adhesi6n de los entrevistadores al protocolo y la exactitud de las res puestas grabadas . Otra tecnica de control mtinariamente ut ilizada en los estudios epidemiol6gicos, particularmente en los mu lticentr1coS, en los que los part ici pantes se reci utan y los datos se recogen a 10 largo de periodos prolongados, es la evaluaci6n estadistica de las tcndencias en el tiempo de l descmpefio de cada observador (entrevistador y tecnieo cifnico 0 de laboratorio )<2) . En el estudio ARIC, por ejemplo, e l centro coordinador realizaba mtinariamente (carla Ires meses) d.lculos eSladfsticos usando la {ension arterial y otras varia bles medidas por cada tecnico para todos los participantes del estudio . Despues de ajustar por edad, sexo y otras caracterfsticas relevantes, se analizaban para cada {ecnico las tendencias temporales de estas estadfsticas (vease Apendice D) . Si se detectaban desviaciones que no pod fan explicarse por cambios en la composic ion demogra.fica de los gmpos de part icipantes, se notificaba al coordinador cifnico correspondiente y se Ilevaba a cabo una revisi6n de la adhesion al protocolo por parte de l tecn ico afectado. Cada tipo de medici6n puede requerir un enfoq ue especial de verificacion de la caUdad . Para la tensi6n arterial y las medidas antropome{ricas, por ejemplo, la evaluaci6n mtinaria del d fgito de prefercncia se lIeva a cabo de manera directa. Para estudios que utilizan centros especializados para la lect ura y clasificaci6n de las mediciones realizadas en diferentes centros (por ejemplo , ultrasonido, imagenes de resonancia magnCiica , Rayos X) , el control de la calidad de los datos en el tiempo es mas complicado, porque tanto la recolecci6n de los datos de campo como los procedimientos centralizados de lec{ura y asignaci6n de puntos pueden ser fuentes de error y variabilidad(2). EI control de caUdad de los datos de laboratorio puede req uerir eI uso de estandares externos 0 internos (datos combinados). como se discute mas adelante.
8.3.2. Estudios de validez En los estudios epidemiologicos, part icu larmente los que involucran a gran cantidades de individuos, a menudo es necesario establecer un comprom iso entre la exact iIud por un lado y los costos y molestias de los participantes por otro . Los proced imientos diagn6sticos muy exactos son usualmente muy invasivos y/o muy caros para ser aplicados en estudios con un gran volumen de personas sanas; la informacion exacta sobre caracterfsticas complejas del est ilo 0 habitos de vida req uiere a menudo del uso de c uestionarios largos (que suponen, por tanto , un alto consumo de tiempo) . Consecuentemente, los epidem iologos deben con frecuencia adaptarse a instrumentos menos invasivos 0 mas agiles, 0 a procedimientos que, aunque mas baratos y mas aceptables para los part icipantes en e l est udio, pueden dar lugar a errores re lativamente importantes en la evaluaci6n de las varia bles de interes . Los eSllldios de validez en submuestras de partic ipantes que pasan por ambos proced imientos . e l general para todo e l estudio y uno mas exacto que sirve como «prueba de oro», permiten la evaluacion del impacto de esos errores sobre los est imados de l estudio. A cont inuaci6n se descri ben algunos de los enfoque s aplicables a la evaluaci6n de la validez en el contexto de los eSlUdios epidem iol6g icos. En la Secci6n 8 .4 se examinan los fndices de validez mas comunmente ut ilizados.
ASEGURAMIENTO Y CONTROL DE LA CAUDAD
305
M ezclas estatldarizadas para m ediciones de laboratorio Cuando se ut ili za sangre u otro especimen biol6gico, un enfoque posible para lIevar adelame un est udio de va lidez es aprovechar la ex istencia de un programa de control de ca lidad externo bien establecido. Este enfoq ue consiste en utilizar e l mismo 1'00/ biol6gico (por ejemplo, suero) para comparar medic iones obten idas al aplicar los procedimientos del eSludio con los resu llantes derivados de la aplicaci6n de las «pruebas de oro». Los va lores de referencia q ue sirven como «prueba de oro» pueden medirse lambien en una combinaci6n de mueslras externa al est udio (Ia l como una combinaci6n proveida por e l programa de eSIandarizaci6n de colesterol serico de los Cemros de Control y Prevenci6n de Enfermedades (Centers for Disease Control, CDC)(15) . A lternat ivamente, puede crearse una m uestra global imerna combinando especimenes obtenidos de los participantes del estudio y probados por un laboratorio «estandar» ajeno a l estudio. (Cada unidad muestral incluida en la global esta fo rmada por espedmenes biologicos conformados por vados partici pantes, de manera que se use una cantidad tan pequefia como sea posible de especimen de cada individuo en el estudio). Idealmente, las desviaciones, si las hay, de las medic iones de l estudio de los resu ltados del «verdadero» estandar deben ser aleatorias d urante la recolecci6n de los datos y las act ividades de medici6n; es importante conocer que estas desviaciones no deben variar en dependencia de la presencia y nivel de variables re levantes como la exposici6n principal y el result ado de interes, 0 e l liempo de reclulam iento, 0 eI de seg uimiento de los partici pantes, para q ue no ocurran errores de clasificacion diferenciales (Capit ulo 4. Secci6n 4.3.3) . Un ejemplo del usa de una combinacion interna de muestras es un est udio de validez en un programa masivo de cribado de colesterol serico que involucr6 a 1.880 residentes del condado de Washington, Mary land. Las medidas de cribado se hadan en sangre obtenida pinchando la yema del dedo sin exigencia de ayuno. En un conjunto de 49 personas exam inadas, qu ienes tambien participaban en un est udio cardiovascular mayor, el colesterol serico pod fa lambien medirse en un laboratorio estandar nacionalmente reconocido (Comstock, comunicaci6n personal, 199 1). Las medidas estandar se hacian en estado de ayuno bajo cond iciones c uidadosamente controladas . La validez (es dec ir, sensibilidad y especificidad; vease Secci6n 8.4 .1) de las medidas del cribado pod fan, por tanto, evaluarse ut ilizando los valores estandar dellaboratorio como «pmeba de oro». Un ejemplo de un est udio q ue partic ipo en el programa de estandarizaci6n del colesterol serico del CDC se debe a Burke et a/ .(I6), q uienes estudiaron las tendencias en el tiempo de los niveles medios de colesterol de los participames del estudio «Encuesta del Coraz6n de M i nnesota~) (ECM). En este Irabajo, los valores obtenidos al apl icar los procedimientos del ECM se comparaban con los obtenidos con la «pmeba de oro» (CDC). Se encontro q ue los valores del ECM eran mas bajos q ue los del CDC, asf como que la diferencia era mayor al principio q ue al final del est udio . En la Figura 8 .1 se muestra esquematicamente este fen6meno de sesgo diferencial en el liempo, al q ue genericameme se alude como desviacion temporal. Una vez que se estima la magnitud de la desviaci6n lIIilizando el estandar, se pueden lIIi1izar lecnicas estadfsticas estandar para estimar los valores «corregidos». Por tamo, con la correcci6n para la desviaci6n temporal, el decrec imiento temporal en el nivel de colesterol en e l ECM se estimo que era inc1uso mayor que el observado sin la correcci6nY'
306
EPIDEMIOLOG iA lNTERMEDIA ; CONCEPTOS Y APLICACIONES
Coleslrol sarico promedio
Val ores observados
Tiempo
Figura 8.1. Dircrcncia cntre valorcs «'"crdadcros» y obscrvados ell un estudio cpidcmiol{)gico COli scguimicnto en el ticmpo. Los verdaderos valores son aquellos determinados por ellaboratorio estandar y los valores observados. los determinados por ellaboratorio del estudio.
Otros enfoques para examillar la validez La comparaci6n de datos de todo el estudio con resultados de «prucba de oro» en muestras de los part icipantes en el estudio no se limita a las mediciones de laboratorio; se aplica tambien a datos del cuestionario . Por ejemplo, en un estudio de casas y comroles que eva!lia la relaci6n de la terapia de reemplazo honnonal con el cancer de mama , la informacion dada por los panicipames del estudio fue verificada contactando a los medicos que presumiblemente hicieron estas prescripciones(l7). Otro ejemplo 10 ofrece un estudio que consider6 la validez del cuest ionario de frec uencia alimemaria de Wi llen en una muestra de 173 mujeres seleccionadas entre las mas de W .OOO panic ipames del Estudio de Salud de Enfenneras (Nurse·s Health Study)(12). Todas las partic ipantes en el estudio respond ieron al cuest ionario de frecuencia alimentaria de 16 items, que es relativamente simple y faci l de administrar y que mide la frecuencia promed io aproximada de consu mo de ali mentos seleccionados. Ademas, las mujeres de la muestra llenaron un diario de dieta a 10 largo de una semana, que fue utilizado como «prueba de oro» para evaluar la validez del cuestionario de frecuencia alimentaria aplicado a toda la cohone. (A esta muestra tambien se la aplico el c uestionario de frecuencia alimemaria en dos ocasiones en un periodo de un ano para evaluar su fiabi lidad: vease Secci6n 8.3.3) . En algunos estudios la «va lidez~) se busca solo para las res puestas positivas dadas por algunos panicipantes . Sin embargo, es importante evaluar muestras tanto de respuestas «positivas>, como «negati va s~), porque ello permite la estimaci6n de la sensibilidad y de la especificidad de la estrategia basica de recoleccion de datos del estudio (vease Secci6n 8.4 .1) como. por ejemplo. cuando se confirman datos de entrevistas tanto a panicipantes que comunican el uso de pfldoras amiconceptivas orales como a otras que afirman no hacerlo . Adic ionalmente, la informacion debe recogerse por separado para los gmpos que se comparan (por ejemplo, casos y controles, 0 expuestos y no expuestos) de manera que se pueda establecer si hay 0 no errores de clasificaci6n y, si los hay, si son diferenciales 0 no diferenciales (vease Capitulo 4, Secci6n 4.3.3) .
AS EGURAMIENTO Y CONTROL DE LA CAUDA D
307
Dispotlibilidad y validez de los datos de estudios previos En ocasiones, existen datos de estudios previos sobre la validez de un procedimiento dado . Por ejemplo, se han publicado datos sobre hipertension comunicada por los propios participantes la cual nunca habra sido diagnostic ada por un profesional de salud en aproximadamente 8.400 participames de la Encuesta Nacional sobre Salud y Nutricion III (National Health and Nutrition Examinat ion Survey, NHANES III), una invest igaci6n nacional desarrollada en los Estados Unidos entre 1988 y 1991 (1 ~) . L.1 disponibilidad de datos de una pmeba, «pmeba de orO», que comprenden niveles reales de tensi6n arterial medidos en estos particip..1ntes e infonnes del uso de medicaci6n antihipertensiva hace posible estimar la sensibilidad y la especificidad de 10 que infonnan los propios participantes, tanto para la muestra 10lal como para subconjumos definidos seglin caracleristicas sociodemograficas (vease Secci6n 8.4.1) . De fonna parecida. un estudio de la validez de variables amropometricas comunicadas por los propios sujetos se condujo entre los partic ipantes del ESllldio Familiar de C llnicas de Investigaciones de Lfpidos (Lipid Research Clinics Family St udy, LRC) . Los pesos y tallas fueron por una parte infonn ados por los propios partic ipanles y, por olra. objet ivamente med idos(l~) . Como en el ejemplo previo, los alllores de este estudio examinaron la validez de la in formaci6n comun icada por los propios part icipantes sobre el peso y la talla de acuerdo a la edad y sexo del part ici pante, e identificaron diferenc ias importantes (vease Secci6n 8.4.1 ). Los estudios que descansan sobre informaci6n comunicada por los sujetos estudiados, tal como la hipertension y el peso/talla , pueden utilizar los estimados de validez de estudios previos para evaluar los posibles errores de clasificaci6n resultames deluso de este tipo de infonnaci6n en sus propias poblaciones de estudio. En este caso. sera nece~a rio
jll7.gar s i los
esti maoo~
rle valirle7. ohten i oo~ en rlic hos
e~tllrlios
previos (pOT ejem-
plo, NHANES III 0 el «LRC Family Study») son relevames y aplicables a la poblaci6n de estudio en cuesti6n , como se discute brevememe en los parrafos siguientes .
Jmportallcia y limitaciolles de los estudios de validez
Como se ilustra con detenimiento en el Capllllio 4, la presencia y la fuerza de asociaciones observadas en los estudios epidemiol6gicos dependen de la validez (y de la fiabilidad) de las variables cmciales del estudio, 10 que a su vez delennina la presencia de errores de clasificaci6n y el grado en que se prod ucen (vease Capitulo 4, Secci6n 4.3.3). Por tanto, un elemcnto importante en el proceso de inferencia causal es el conocimiento de la validez de la exposic i6n, el desenlace y las variables confusoras principales . Ha sido claramente demostrado que muchas variables, incluso las consideradas como aceptablemente «objetivas», tienen una validez relativamente pobre (Tabla 8.2)C20). Considerese, por ejemplo, un estudio de casos y controles en el cual la infonnacion sobre habito de fumar se obtiene de un fami liar pr6ximo en lu gar de provenir directameme de casos y controles . Supongamos que en este estudio la prevalencia de fumadores en el gmpo control es del 10% asi como que, ademas, el odds ratio «verdadero» asoc iado con el habilO de fumar (2,25) puede obtenerse por medio de entrevistas personales directas. Utilizando las cifras de sensibilidad y especificidad para el habito de fumar que se muestran en la Tabla 8 .2 (ultima fila ), si el error de clasificaci6n fuera no diferencial, el odd,\' relativo observa-
308
EPIDEMIOLOG iA lNTERMEDIA ; CONCEPTOS Y APLICACIONES
Tabla 8.2 Ejcmplos de scnsibilidades y especiflcidades que se atribuyclI a difcrcntes prucbas cmpJcadas en cstudios epidcmiologicos Prueba
Senslbilidad (%)
Especlficldad (%)
Crilerios de la OMS
91
94
8iopsia Oiagnoslico radiol6gico
86 50 95
98
Enfoque de validacion" Cohorte
Tolerancia de la glucosa segun criterios del proyecto del gru po universitario de diabetes Prueba cilol6gica de cuello ulerino Ulcera peplica por cuestionario Ensayo de protoporfirina por microhematocrito Cueslionario de Rose Circuncisi6n si 0 no, por cuestionario HAbito de 'umar segun familiar
Concentraci6n de
~omo
en
91 73
sangre Enlrevista clinica Casas y contro/as Examen medico
44
93
53
44
Cueslionario personal
94
88
cercano 'Para las fuentes Dibliognllicas de los estudiosde validaci6n origin ales , vease Copeland er al.''''l , Fuenl.r; KT Copeland el a/.. Bias Due to Miscla,s iiication in the EstimaHon of Relative Risk, American Journal of Epidemiology, Vo l 105, 488·495, 11:119 n, The Johns Hopkins Univers ity School of Hygiene & Public Health .
do (sesgado) en el estudio estarfa casi un 30% mas cerca de la hipritesis nu la (es decir, 1,63) de 10 que estarfa el verdadero valor. (Para el calcu lo de estimados sesgados basados en cifras de sensibilidad y especificidad . vease Capitulo 4. Secci6n 4.3.3). Con estos mismos niveles de sensibilidad y especificidad , una asociacion mas debil podrfa no haberse advert ido . Obv iamente, como tambien se menciono en el Capitulo 4. Secci6n 4.3.3, el conoc imiento de los niveles de sensibilidad y especificidad de variables err6neamente clasificadas (como se muestra en la tabla) permite la correcci6n de una estimaci6n sesgada. Ademas, la evaluaci6n de niveles de validez es crucial en los esfuerzos continuos para desarrollar procedimientos de recoleccion de datos cada vez mas exactos sin sacrificar su eficiencia. A pesar de la importancia de llevar a cabo eSlUdios de validez, deberfa enfatizarse que tales estudios. especialmente (pero no exclusivamente) los relacionados con datos del cuest ionario, pueden (ener limitaciones importantes. y sus resu ltados han de interpretarse con precauci6n . Primero. la «pmeba de oro» en sf misma puede no ser enteramente valida . En los eSlUdios de validacion de informacion sobre dieta. por ejemplo, datos diarios. a menudo uti lizados como pmeba de oro, pueden tener sus propias limitaciones con res pecto a la medici6n de consumo de alimentos(21) . Del mismo modo. el uso de historias medicas, que no son concebidas principalmente con objetivos invest igativos, para «validar» infonnaci6n recogida por entrevistas, puede ser problematico: ello se debe a que estas historias no estan estrictamente estandarizadas y a menudo les falta informacion re1evante . Como consecuencia, incluso datos importantes relacionados con la historia medica del paciente pueden tener exactitud (y fiabilidad) li mitada. Para obtener informacion sobre habilOS 0 conductas (por ejemplo, historia pasada de habito de fumar) que no se recogen rutinariamente en las historias clfnicas, la informacion brindada por el paciente puede ser mas exacta .
ASEGURAMIENTO Y CONTROL DE LA CAUDAD
309
Otro problema relacionado con los est udios de validez es que, aunq ue estos es(Udios normalmente se realizan en una muestra aleatoria de part icipantes, la muestra frecuentemente constiwye un grur-o seleccionado de individuos especialmente mot ivados . Debido a que, por definic ion, e l procedimiento de la «pmeba de oro» tiende a ser mas invasivo y molesto (10 que, ademas del costo, puede precisamente haber sido en primer lugar la raz6n para no emplearlo como medio principal de recolecci6n de los datos en todo el estud io), no es infrec uente que los estudios de validez incluyan voluntarios que cooperan. Como resu ltado, los niveles de validez estimados en estos part icipantes pueden no ser re presentativos de los verdaderos niveles de validez en toda la poblaci6n, particularmente para datos concernientes a un cuest ionario. Por ejemplo, en e l estudio de validacion del cuest ionario de dieta de Willett antes descrito, fueron inv itadas a panicipar 224 enfermeras seleccionadas al azar entre las part icipantes de Boston (las part icipantes de otros lugares se excl uyeron por razones log fsticas); de estas 224, 5 1 declinaron partic ipar, salieron del estudio 0 no ten Ian infonnaci6n suficiente sobre aspectos medulares para la validaci6n del est udio . Por tanto, las 173 mujeres sobre las cuales se evalu6 a la postre la validez y la re prod ucibilidad (73 % de las originalmente inv itadas a panici par del subconjunto de Boston) pueden no ser re presentativas de todas las partic ipantes en e l est udio . Una preocu pacion adic ional proviene de q ue el tamano de muestra habitualmente pequeno y la imprecision estad istica resultante de los est udios de validez limitan la aplicabilidad de sus resu ltados . Esto es especialmente problematico si los est imados de sensibilidad y especificidad se milizan para «corregir» los del riesgo relativo o del odds ratio observados en el estudio . Una correcci6n basada en estimados de la validacion q ue estan marcadamente afectados por un error aleatorio puede prod ucir mas dano que beneficio: en otras palabras, e l est imado «corregido» puede ser incl uso menos «correcto» que el original. Finalmente, es imponante comprender la necesidad de ser cauteloso cuando se extrapolan de una poblaci6n a otra los resultados de un est udio de validacion, especialmente cuando e l instrumento de recolecci6n de datos es un cuest ionario. Por ejemplo, la validez del cuestionario de frecuencia alimentaria de Willett, q ue fue estudiada en una cohone de enfermeras puede no ser generalizable a otras poblaciones con diferentes caracterlsticas socio-demografi cas y ed ucacionales, 0 con diferencias en materia de actitud y conciencia hacia la salud . Particulannente conflictiva es la generalizacion de ci fras de validez para instrumentos de entrevista concebidos para est udiar poblaciones cultu ralmente diferentes. A menudo. es menester desarroliar instrumentos espedficos para cierto entorno cultu ral: tal fue e l caso, por ejemplo, del c uestionario de frec uencia alimentaria desarrollado por Mart in Moreno et al.\22) para ser aplicado a la poblacion espanola.
833. Estudios de fiabilidad En contraste con los estudios de validez. los de fi abilidad evaluan el grado en q ue los resu ltados concuerdan cuando se obtienen de diferentes maneras: esto es, diferentes observadores, instmmentos de estudio 0 procedimientos; 0 de la misma manera, pero en dife rentes momentos . Para evaluar la fiab ilidad es importante considerar todas las fuentes de variabilidad de un estud io epidemiologico. Idealmente, la unica fuente de variabilidad deberfa ser la q ue hay entre los participantes. Desafort unada-
310
EPIDEMIOLOGiA lNTERMEDIA; CONCEPTOS Y APLICACIONES
mente, tambien inlluyen otras fllentes de variabilidad sabre c ualquier medic i6n dada en casi todas las situaciones de la vida real. Tales fuentes incluyen:
• Variahilidad debidv a la imprecision del observador 0 de/metoda, que puede clasificarse en dos tipos: I. Dellfro (0 intra ) observador u variabilidad dentro delmetodo, tal como la variabilidad de una determinaci6n de laboratorio realizada dos veces en la misma muestra por el mismo tecnico, ut ilizando la misma tecnica, 0 la variabilidad de una res pucsta a una preguma dada por los mismos panic ipanics cuanda la entrev ista se produce en diferentes momentos (suponiendo que la respuesta no depende del tiempo) . 2. Entre (0 inter) observador 0 variabilidad entre merodos, tal como la variabilidad de una determinacion de laboratorio realizada en la misma muestra por dos (0 mas) tecnicos difcrentes uti lizando la misma pmeba 0 test, 0 la variabilidad de una detcnninacion de laboratorio rcalizada en los mismos individuos por el m ismo tecnico, pero utilizando d iferentes pruebas 0 tests . • Variabilidad dentro de los I'llrticil'ante.\· del eJ'll1dio, tal como la variabilidad en habitos y cond uctas (por ejemplo, variabilidad en e l consumo de ali mentos dfa a dfa) 0 variabilidad fisio l6gica en los niveles hormonales 0 en la tensi6n arterial. Por ejemplo, la Figura 8 .2 muestra los valores de tension arterial sis200
~
180
r'--~" Participante A
I
E
5
•
160
.0 ~
.;;
• "~ • ,0 • 0
140 Promedio 120
Participante B
0
~
100
80 Tiempo Momento de la medicion
Figura 8.2. Valores de tensio n arterial sistolica hipotCticas en dos individuos en cI tiempo. El participante A es «hipertenso» (presi6n sist61ica promedio, 174 mm Hg): el participante B es «nonnotenso» (tensi6n arterial sist6lica promedio, 135 mm Hg). Si ellos se miden en el momento indicado por la tlecha. un error de clasificaci6n puede producirse debido a la variabilidad entre individuos: el participante A sera mal clasificado como «llOrmotenso» (tensi6n arterial sist6lica por debajo 160 mm Hg) : ademas.la tensi6n arterial del participante B sera considerada mas alta que la del participante A.
ASEGURAMIENTO Y CONTROL DE LA CAUDAD
311
t61ica de dos individuos en eI tiempo. En este ejemplo hipotetico. uno de los individuos es hipertenso y el otro no (es decir, sus niveles promed io de tensi6n arteria l estan respect ivamente por encima y por debajo de l punto de corte para la definic i6n de hipertensi6n sist6lica, 160 mm Hg) . Sin embargo, debido a la variabilidad fisiol6gica de los niveles de tension arterial dentro de ind ividuos, la tension arterial de A ocasionalmente se sumerge por debajo del punto de corte para declararh ipertension . Si la med ici6n se prod ujera en uno de esos momentos, ese partic ipante serfa clasificado err6neamente como «normotenso~). En este ejemplo. la variabilidad dentro de individuos enmascara la variabilidad entre indiv iduos (la diferencia en los valores promedio «verdaderos» que dist ingue a los partic ipantes A y B como hipertenso y normotenso res pect ivamente) . A diferencia que 10 que acaece con la variabilidad debida al metodo/observador, la variabilidad dentro de individuos es real; sin embargo, tiene consecuencias simi lares a las que resu ltan de la variabilidad debida a errores de med ici6n donde tambien se introd uce «ru ido» en la deteccion de diferencias entre los partic ipantes del estud io, que es el prop6sito usua l de la investigaci6n epidemiol6gica. A I igua l que los errores debidos al metodo de medici6n (que se originan en el observador, en el instmmento 0 en el procedimiento), la variabilidad intraindiv idual enmascara la verdadera variabilidad entre individuos y de esta forma produce errores de clasificaci6n. Obv iamente, mientras que los procedimientos de aseguram iento de la calidad intentan prevenir 0 minimizar la variabi lidad intra e inter observador, la variabilidad fisiol6gica dentro de indiv iduos no es suscept ible de prevenci6n . Sin embargo, su inll uencia puede minimizarse estandarizando el momenta de recogida de los datos para med idas con fluct uaciones conocidas en el tiempo, ta les como los niveles de hormonas esteroideas 0 ac tiv idad [(sica. 0 estandarizando las condiciones de medici6n para variables afectadas por el estres 0 la acfiv idad (por ejemplo, la tension arterial deberfa medirse despues de un periodo de descanso en un ambiente tranq uilo) . Todas estas fuentes de variabilidad, si estan presentes, tienden a disminu ir la fiabilidad del valor medido de una variable dada; para cualquier medici6n dada, se afiadiran a la variabilidad del «verdadero valor» para el ind ividuo en c uesti6n cuando se compara con el resto de los individuos en la poblaci6n bajo esmdio . Los est udios de fiabi lidad du rante la recolecci6n de los datos y las act ividades de procesamiento, consisten regu larmente en hacer mediciones aleatorias repetidas que a menudo se denominan medidas «fantasmas». La Figura 8.3 ilustra esquematicamente una de las formas que asumen los est udios de fiab ilidad en el caso de un especimen biologico(23). Los est udios de fiabi lidad pueden inclu ir med idas repet idas en eI mismo indiv iduo para evaluar la variabil idad dentro de individuos . Las medidas de la fiab ilidad dentro de laboratorios (0 tecnicos) pueden realizarse dividiendo la muestra en dos alfc uotas, que entonces se miden por el mismo laboratorio (0 tecnico) en diferentes momentos (Figura 8.3. alfcuotas 1.1 y 1.2). Una alfcuota adic ional (alkuota 1.3) puede enviarse a otro laboratorio (0 tecnico) para evaluar la fiabilidad entre laboratorios. Es importante que todas estas detenninaciones repetidas en muestras fantasmas se conduzcan de manera enmascarada. Tfpicamente, los fantasmas se intercalan espacialmente en el grupo de muestras que se envfan a un laboratorio 0 tecnico dado, de manera que se logre el enmascaramiento.
312
EPIDEMIOLOGiA lNTERMEDIA; CONCEPTOS Y APLICACIONES
Sangre ffK:olectada (1 medicKin)
Para medir la variabi!idad denlro de individuos
------------ _. _.......................»-
Alicuota >.2 Alicuota 1.3
Sangre
recolectada (medJda repetida)
Para medir \'ariabilklad intra laboraloria Envier Alicuota 1.2 al mi,;mo lab. 1 semana despuils
Alicuota 1.2: Determinaci6n del lab. hecha por el mismo lab.
2 semanas despuils
Para Ill".... · ~ .."r Variab Td I, ad entre /abo E'lViar AUcu Iatorios a un iaboraror 010:'11.3 10
AliclJota 1.1 Determinaci6n dellaboratorio en la misma semana
dO'erama
Alicuota 1.3: DeterminacKin hecha por un lab.difarenta
------------------------------------
~
Tiempo
Figura 8.3. Disciio de UII cstudio para evaluar la variabilidad entre individuos y entre laboralorios, y denlro de ellos Fuente: LE Chambles et al., Short·Term Intraindividual Variability in Lipoprotein Measurements: The Atherosclerosis Risk in Communities (ARIC) Study, American Journal of Epidemiology, Vol 136, 1069- 1081, @1992, The Johns Hopkins University School 01 Hygiene & Public Health.
AI igual q ue para las determinaciones de laboratorio. los esmdios de fiab ilidad para otros tipos de mediciones (por ejemplo, rayos X) pueden concretarse por medio de examenes 0 lectura.,> repetidas. La variabilidad dentro de individuos para muchos de estos examenes es limitada 0 nula (por ejemplo, la variabilidad a conn plazo de la imagen radio l6gica de un tumor). Las fuentes de variabilidad que deberian evaluarse incluyen la forma en la q ue se realizo e l examen (por ejemplo, la posicion del participante en e l equipo) y la lect ura (0 interpretacion) . (Vea.'>e ejemplos en la Seccion 8.4.2 que ilustran la evaluacion de la fiabilidad de los lectores de esmdios polisomnograficos para determinar la presencia de des6rdenes respiratorios relacionados con e l suefio). Evaluar la fi abilidad de cada tipo de medicion tiene sus propias singu laridades y retos . L.1 S determinaciones antropometrica.'>. tales como talla de un aduito, tienen poca (si es q ue tienen alguna) variabilidad intraindividuo (por 10 menos a corto plazo); la evaluacion de la variabilidad entre observadores es bastante sencilla. Por Olro lado. la evaluaci6n de la fiab ilidad dentro de observadores de tales mediciones puede ser un reto porque es diffc il «cegar» allector. ya que d 0 ella puede reconocer al partic ipante como algu ien a q uien ya ha medido (y por tanto recordar la lectura anterior y/o hacer un esfuerzo para ser mas prec iso que 10 usual). S imilarmente, est udiar la fiab ilidad de respuesta.,> a cuestionarios es dificiL ya que el rec uerdo del 0 la partic ipante sobre su respuesta anterior inll uira en las respuestas que de al cuest ionario en una segunda ocasi6n (tanto si 10 apl ica diferente como si 10 hace el mismo encuestador). Al igual q ue con los estudios de validez. es importante evaluar si los estimados de fiabilidad obtenidos para la muestra de los part icipantes del estudio difieren en de pendencia de caracterfsticas relevantes. 10 que puede dar lugar a tasas dife rencia-
AS EGURAMIENTO Y CONTROL DE LA CAUDA D
313
les de errores de clasificaci6n. Por ejemplo. la fiabilidad del cuest ionario de frec uencia alimentaria de Willett en el Estudio de Salud de Enfermeras se compar6 entre subgmpos de part icipantes, definidos en funci6n de la edad, el habito de fumar, el consumo de alcohol y de los terciles de peso corporal relat ivd 24l . En este estudio, no se observaron diferencias imponantes en la reproducibilidad de los estimados del consumo de nutrientes entre las diferentes categorlas, 10 que sugiere que los errores de medic ion resu ltantes de la fiabilidad imperfecta de la informacion sobre consumo de nlllrientes era probablemente no diferencia l (vease Capftu lo 4, Secci6n 4.3.3). Finalmente . como en el caso de los estudios de validez. es importante ser cauteloso cuando se generalizan resultados de un esmdio de fiab ilidad para un instrumento dado de una poblacion a otra: igual que la validez, la fiab ilidad puede ser una funcion de las caracterlsticas de la poblaci6n que se estudia. Aun siendo apropiado utilizar estimados de fiabilidad y validez ya publicados, se recomienda que en las etapas de planificacion de un estudio, siempre que sea posible, se evaluen la validez y fi abilidad de los instmmentos fundamentales, particulannente de los cuestionarios . Es ademas importante evaluar la variabilidad imraindividuo, ya que puede tambitn diferir de acuerdo a ciertas caracterlsticas de la poblaci6n, y afccta por tanto la generalizacion de los resu ltados de fiabilidad . Por ejemplo, la variabilidad diaria en los niveles sericos de las hormonas gonadales (por ejemplo, estr6genos) es mucho mayor en las mujeres premenopausicas que en las postmenopausicas; por tanto, independientemente de la pmeba diagn6stica Ulilizada, la fiab ilidad de los niveles de honnonas gonadales para mujeres mas j6venes no es extrapolable a mujeres de mas edad.
SA. INDICES DE VALlDEZ Y FlABILlDAD
En esta secci6n se describen brevemente algunos de los Indices de validez y fiabili dad mas frecuentememe utilizados y se c han ejemplos de estudios publicados . Algunos de estos fndices, tales como la sensibi lidad y la especificidad, se relacionan con la evaluacion de la validez, mientras que otros, tales como kuppa 0 el coeficiente de correlaci6n intraclasico, se aplican tfpicamente en la evaluacion de la fi abilidad (Tabla 8.3). Sin embargo, algunos de estos Indices se utilizan indistintamente para evaluar validez y fiabilidad. Por ejemplo. Indices que, por 10 general , se usan como indicadores de fiabilidad, tales como el porcentaje de concordancia 0 el coeficiente de correlaci6n intraclase, se ut ilizan a veces para valorar la validez . En la vida real. puede no disponerse de una verdadera «prueba de oro»: por tanto , a veces resulta diffc il distingu ir entre las medidas de validez y las de fiabilidad. Cuando no se identifica claramente una «pmeba de oro», los resultados de la «valideb) se cons ideran a menudo como estimados de fiabilidad illfermetodo.
SA.I. Indices de valldezlnabllldad para datos categ6rlcos
Sensibilidad y especificidad
La sensibilidad y la espec ificidad son los dos Indices tradicionales de validez cuando las definiciones de la exposicion y eI desenlace son ambas dicot6micas . La exposicion
314
EPIDEMIOLOGiA lNTERMEDIA ; CONCEPTOS Y APLICACIONES
Tabla 8.3 Resumen de indices 0 Cllfoqucs graficos mas rrccucntcmcnte cmplcados para cvaiuar 13 validcz y 13 fiabilidad En mayor medlda usada para el/alnar •.• Tlpo de variable
Calegorica
Continua
indlce 0 tecnlca
Flabilidad
Valldez
$ensibilidadfespecificidad Estadfstico J de Youdeo
H
•
H
Porr:flnt;ljA rlA r:onr:orrl;lIlr:i~ Porcentaje de concordancia posiliva Estadfstico kappa Diagrama de d ispersi6n (graficos de correlaci6n) Coo/ieiente de correlaci6n ineal (Pearson) Coo/ieionte de correlaci6n ordinal (Spearman) Coo/ieiente de correlaci6n intraclase Diferencia media denlro de pares Coo/ieionte de variaci6n GraJico de Bland-Altman
•
H
• • • • • • •
H H H
• • H H H
H
H
Nota ; ++ , el ind ioo as apropiado para medir la magnitud de la validez 0 la fiab ilidad , .;. SU iooicacion es en algu· na me
bajo estudio 0 la categorizaci6n del desenlace se contrasta con un metodo mas exacto (la «pmeba de oro», que se supone representa el verdadero valor y, por tanto, esta libre de errores). La sensibilidad y la especi ficidad son medidas tambitn frecuentemente utilizadas en el contexto de la evaluaci6n de herramientas para diagn6stico y cribados; en ese contexto. los libros de epidemiologfa basica usualmente las describen en relaci6n con la evaluaci6n de la condici6n moroosa (el «desenlace») . Como medidas de control de la calidad en un estudio epidemiol6gico analftico, sin embargo, estos Indices se aplican a la evaluaci6n de ambos: las variables de exposici6n y las de desenlace . Las definic iones de los {enninos .wmsihilidad y eJpecijicidad se presentaron en el Capitulo 4, Cuadro 4 .1. De nuevo, el d lculo de la sens ibilidad y la especi ficidad para una variable binaria se muestra esquematicamente en la Tabla 8.4 . (EI Apendice A, Secci6n A.iO. muestra el metodo para el dlculo del intervalo de confianza para los estimados de la sensibilidad y la especific idad). Tabla 8.4 Rcprcsentacion esqucmatica del calculo de la scnsibilidad y la espccificidad para una variable binaria Resultados de la Prueba de Oro Resultados del estudlo Positivos Negativos
Positivos
Negativos
, ,
d
,
Total
Total
N
Sensib lidad '" a I (a.;. c) Especilicidad d I (b .;. d)
315
AS EGURAMIENTO Y CONTROL DE LA CAUDA D
En la Tabla 8.5,se muestra un ejemplo, basado en un est udio realizado en el Condado de Washington , Maryland , y discutido previamente en las Secci6n 8.3 .2, en el cuallas pmebas realizadas por puncion del dedo se comparaban con med idas estandar del laboratorio (<, fue pobre (63% de los «nonnales» eran fal sos positivos). Tabla 8.5 Comparacion de valores de cribado de colesterol scrico en condiciones de terreno y valores registrados en un laboratorio estandar Vatores estandar del taborato rlo Va tores del crlbado Positivos Negativos
Total
Anonnal'
Normal
Total
"
19
37
11
12
19
30
49
'Anormal: colesterol serico ~ 200 mgldl para el cribado y £II esttm·d ar de laboratorKl, res pectivamente. Fuente: Datos no publicados tom ados de GW Comstock, 1991 .
En e l
e~lllfiio
fi e Ia valioe7. oe Ia infonnacion com tl nicaoa por los propios
~ tljetos
sobre peso y talla entre los part icipantes en el Estudio de Familia LRC mencionado previamente(19J, los individuos se clasificaban en cuatro categorfas de acuerdo a su 2 indice de Masa Corporal (IMC, medido en kglm ): •• bajo peso» (IMC < 20), «peso nonnal>' (IM C = 20-24 ,9), «sobrepeso» (IMC = 25-29,9), Y «obeSO» (IMC O!: 30). EI IMC se calculaba sobre la base de «infonnacion dada por el propio individuo» y tambien mediante la medici6n del peso y la lalla . La tabu laci6n cmzada entre medidas comunicadas por los propios part icipantes y mediciones objetivas de las categorfas deliMC se presenta en la Tabla 8.6. A partir de estos datos se puede evaluar la validez de una definicion binaria de sobrepeso y obesidad basada en infonnacion comunicada por los propios partic ipantes construyendo las tablas dos por dos (2 x 2) que rccoge la Tabla 8.7 . N6tese que los estimados de validez difieren seglin el punto de corte adoptado. Por ejemplo, para la defin ic i6n A, sobrepe.l"o se define como IMC O!: 25 kglm!, 10 que produce una sensibilidad de 3 .2 34/3.74 1 = 0,86 Y una especificidad de 3.580/3 .7 14 = 0,96 . Para la definicion 8 (lado derecho de la Tabla 8.7), la «obesidad>, se definio como IMC O!: 30 kglm\ con los respectivos estimados de sensibilidad y especificidad de 0,74 y 0 ,99 . Adviertase que en este ejemplo, la sensibilidad es menor '1lle Ia
e~ pecificioao :
negativos~),
ha y llna me nm pmporcion oe
«fa l so~
posil ivos>, '1lle oe «falsos
probablemente como conscc uencia del estigma asoc iado con la obesidad en nuestra sociedad , 10 que resulta en una mayor proporcion de individuos que subestiman que los que sobrestiman su peso . Glros aspectos relacionados con la sensibilidad y la especi ficidad que deberfan ser subrayados incluyen los sig uientes. Primero, la dependencia de los estimados de
316
EPIDEMIOLOGiA lNTERMEDIA; CONCEPTOS Y APLICACIONES
Tabla 8.6 Tabulaci{1II cru zada de las categorias a pa rtir de cOlllullicacioncs del propio illdividuo y la mcdicion objctiva de cuatro indices de masa corpor a l. 7.455 pa rticipa ntes a dultos del Estudio Familiar de Llpidos, 1975·1978 Categ orra de IMe basada en med lclones IMe basa do en autorreportes Flajo
pA~O
Normal $obl-epasD Obeso Total
BaJo peso
", 72
0 0 534
No rm al
Sobrepeso
'"
2.868 134 0 3.180
Obeso
Total
0
0
MO
505 2.086 59 2.650
2 280 809 1.091
3.447 2.500 868 7.455
Nora: bajo peso IMe < 20 K!}Im' , peso normal lMC = 20-24,9, sobrepeso IMe = 25-29,9, Y obeso IMe ~ 30 K!)Im' Fuente; FJ Nieto-Garcia, TL Bush. 300 PM Keli , Body Mass Definitions of Obes ity: Sens itivity and Specificity Using Se~·lnfo,med and He;ght. Epidemiology, Vol 1, 146-152,1tI1990.
sensibilidad y especificidad del punto de corte ut ilizado demuestra que hay derta arbitrariedad al evaluar y comunicar la validez de definic iones binarias de variables cominuas de exposic i6n y de desenlace . Este problema no debe confundirse, sin embargo, con la dependencia que tienen los «valores predictivos» de la prevalencia de la condic i6n". A di fe rencia de 10 que ocurre con los valores predictivos positivo y negativo, la sensibilidad y la especificidad estan condicionadas por los tmales en la ultima fila de la tabla (los «verd adero s~) numeros de positivos y negativos) y, por tanto, son te6ricamente independientes de la prevalenda de la dolencia . Sin embargo, la creencia comun de que la sensibilidad y la especificidad son propiedades inherentes (fijas) a la prueba (0 criterio diagn6stico 0 procedimiento) en sf misma, independiemememe de las caracterfsticas de la poblaci6n bajo estudio, puede ser resu ltado de un pensamiento excesivamente simplista . Esto es particu larmeme derto con rela-
, Los valores prcdicli vos positivos y negJtivos son medidas utilizadas en el conlexlo de la evaluaci6n de procedimientos pard diagn6slico} para cribado. ademas de la sensibilidad y la espccificidad. El \"alar prediClh'o posifil"O (VPP) es la pmporci6n de verdadems posilivos entre los individuos para los que la prueba da positivo (porejemplo. en la Tabla 8.7.la definici6n A. 3.234/(3.234 + 134) '" 0.96. EI \"alar prediclh'o lIegmil"O (VPN) es la pmporci6n de verdadems negativos rcspecto del total de resultados negativos. Una caraclerislica importanle de estos indices es que. ademas de su dependencia de la sensibilidad y la especificidad de la prueba en cuesli6n, son una funci6n de la prevalencia de la condici6n. Por ejemplo, en la Tabla 8.7. la prevalencia de sobrcpcso (definici6n A) es 50.2% (3.74In .455): si la pre valencia hubiefd sido 10% . aun con los mismos niveles de sensibilidad y especificidad pard el peso y la lalla comunicados por los pmpios participanles que los del esludio familiar LRC, el VPP hubierd sido solamente 0,71. (Eslo puede demostrarse como sigue: utili zando la notaci6n de la Tabla 8.4. y suponiendo el mismo total N '" 7.455. el valor espcrddo de la celda a ",ria M 1.1 (7 .4~~ " 0 .10 " O.)/'/l) Y d d" b
c~lda
h
s"Tf~
2/l)/. .4 [7.4<;<; " (1 _0 .10) " (1 _0 ,Q/l)I : por
' ;In _
to. VPP '" 641.1 1(641 J + 268.4) '" 0,70). Eslos indices tienen rclevancia limilada en el conlexlo de evaluar la influencia de la validez sobrc los estimados de las medidas de asociaci6n y, por tanto. no se disculen aqui. Una exposici6n delallada acerca de su uso e interpretaci6n. asi como una discusi6n sobrc la raz6 n de vemsimili lud y otros elementos de la validez mas rclevanles para el cribado y las decisiones clinicas. puede enCOnlrdThe en libms de texto basicos de Epidemiologia Clfnica("· ' '').
317
AS EGURAMIENTO Y CONTROL DE LA CAUDA D
Tabla 8.7 Tabulacion cruzada de las categorias basadas en informacioncs dadas por cl propio individuo y en medicion bin aria del fndice de masa corporal (IMC). 7.455 participan. tes adultos del Estudio Familiar de L1pidos, 1975·1978 (vease Tabla 8.6) Definicion A: Sobrepeso
Definicion B: Obeso Categorra de IMC basada en medlclon
Categoria de IMC basada en mediclon IMC basado en autorreporte
Sobrepeso No sobrepeso Total
Sobrepeso
3.234 507 3.741
No
sobrepeso 134 3 .580 3 .714
IMC basa do en autorreporte
0"'00 No obeso Total
Obeso
No obeso
809 282 1.091
59 6.305 6.364
Nota: sobrepeso IMe = 25·29.9 kgl.rr. y ot-eso IMe '" 30 kglm' Fuente: FJ Nieto-Garcia. TL Bush, and PM Keli, Body Mass Definitions of Obesity : Sensitivity and Spec~ic~y Us ing Self·lnformed ar.d Height, Epidemiology, Vo l 1, 146-152, <1:>1990.
cion a dolencias basadas en una escala continua que se ha convertido mas 0 menos arbitrariamente en una escala binaria (por ejemplo, obesidad, hipertensionyn. 2~ ) . Para una variable continua. la probabilidad de clasificar err6neamente a un verdadero positivo como negativo (es decir, I-sensibilidad , 0 celda c en la Tabla 8.4) tiende a ser mayor para los individuos cuyos valores verdaderos eSlan cerca del valor escogido como punto de corte, tal como los hipertensos con valores de presi6n arterial sist61ica cercanos al tradicionalmente definido como punto de corte para defin ir valores «altos>)- (por ejemplo . 140 mm Hg) . Por tanto. aun para la misma prueba (0 proced imiento diagnostico) y el mismo punto de corte, el nivel de c1asificaciones err6neas sera mayor si la distribuci6n de los valores (es decir, el «espectro de gravedad>, de la dolencia) esta mas cercana a la de los verdaderos negat ivos, como se ilustra en la Figura 8.4. Por lanto, la sensibilidad y la especifiddad de una definidon dada de una enfennedad (es decir, basada en un punto de corte de una distribud6n continua) sf depende de la distribud6n de la gravedad de la dolencia. La validez de una pmeba tambien puede variar de una pobladon a otra cuando la prueb..1 no es un marcador directo de la enfermedad. Por ejemplo, la especificidad de una pmeba de sangre oculta en heces para el diagn6J' fico de cancer de colon varia en dependenda de la prevalencia de otras enfennedades que tambien causen sangramiento gastrointestinal, tales como la ulcera peptica 0 el p..1rasitismo. Similarmente, la capacidad de la prueba de denvado proteico purificado (DPP) para el diagnostico exacto de la tubercu losis humana es una fundon de la prevalenda de las infecciones por mycobacterias atfp icas en la pobladon a que se aplica. Como se discutio anteriormente, otra limitacion de la generalizaci6n de los est imados de sensibilidad y especificidad obtenidos en estudios de validacion , especialmente cuando la in formacion se obtiene a traves de un cuestionario . es que esas medidas pueden variar segun las caracterfsticas de los individuos en cuest i6n. Algunos ejemplos se muestran en la Tabla 8.8. En el estudio de Nieto-Garda et al.('9) , la validez de la definicion de obesidad (IMC C!: 30 kg/m2) basada en informacion de peso y talla comunicada por los propios participantes variaba sustancialmente en dependencia de la edad y del sexo. Los est imados de sensibi lidad ut ilizando ellMC
318
EPIDEMIOLOGiA lNTERMEDIA; CONCEPTOS Y APLICACIONES
Punta de corte
Verdaderos
Verdade ros
Espectro amplio en la gravedad de los ve rdaderos positivos
!
Pocos - - - , - - ' " Alta Gravedad
,
sensibilidad
-,, Espectro estrecho en la g ravedad de los verdade ros posilivos
,
, ,
falsos negativos
, Muchos Gravedad
faJsos negativos
, Baja
sensibilidad
Figura 8.4. Dos situaciones hipotCticas que cOllduccn a estimacioncs dircrclltes de 13 scnsibilidad dcpcndiclldo del cspcctro de gravcdad de una condicioll dada (par cjcmplo, tension arterial sist61ica en la abscisa) induso annque sc cmplc£n la misma prucba y cI mismo punta de corte (]>or ejcmplo, tension arterial sist61ica ~ 140 mm Hg para la definicion de hipcrtcnsi{m) en ambas situacioncs
«medido~) como prueba de oro (74% en total) variaron desde mas del 80% en adul{Os j6venes de ambos sexos a menos del 40% en hombres de mayor edad. La Tabla 8.8 tambien muestra las marcadas di ferencias que se observan en la sensibilidad correspondiente al diagn6stico basado en la infonnacion comunicada por los propios participantes en dependencia del gmpo emico y de la utilizaci6n que hicieran de la atenci6n sanitaria (indicada por la visita a un medico en el ano anterior) en la encuesta NHANES III. Sobre la base de eS{Qs datos, los autores concluyeron que «el uso de informacion comunicada por los propios participantes como aproximacion para la prevalencia de hipertensi6n ... es apropiada entre blancos no hispanos y mujeres negras no hispanas y en personas que tu vieron un contacto medico en los 12 meses anteriores. Sin embargo, la hipertensi6n comunicada por los propios participantes no es apropiada .. entre mexicano-americanos ni en individuos sin acceso a atenci6n medica regulaf»(18. pag.684). Estos ejemplos ilustran la influencia de variables soc iodemogrMicas cruciales sobre los estimados de validez, y sirven como una demostraci6n empfrica de los problemas relacionadm con la extrapolacion de estimados de validez a poblaciones con caraclerfsticas diferentes a aquellas en las c uales se evaluo originalmente. Ademas .la gran variabilidad de los esti mados de validez de acuerdo a variables demograficas, tales como las mostradas en la Tabla 8.8, sugiere que si estas variables representan las exposic iones de interes (0 estan correlacionadas con elias), pueden surgir errores de clasificaci6n diferencial (vease Capitulo 4, Seccion 4.3 .3). Finalmente, es importante hacer enfasis en que, como se discutio previamente en la Seccion 8.3 .2 , la validez de algunos items de infonnacion que son ampliamente miliza-
319
AS EGURAMIENTO Y CONTROL DE LA CAUDA D
Tabla 8.8 Ejemplos de rcsultados en subgrupos de la scnsibilidad dc la informacion obtenida mcdiante comunicacion brindada por los propios sujetos cn dos estudios epidcmiologicos Hombres Estudlo Nielo-Ga,cia el a,' OI «Obesidad» basada en peso y talla autorreportadas'
Vargas et af 'WI «Hipertensi6n» basada en autorreportel
Sensibllidad (%)
Categorfa Edad ,:aflos)
20-29 30-39 40-49 SO-59 60-69 70-79
Blancos Visila al medico el ano anterior Negros Visila al medico el ano anterior Mexicano-americanos Visila al medico el ano anterior
Mujeres
"73
"85
69 65 46 38
"81
N9
71 43
73 57
Sf
80
N9
36
74 73
Sf
61 21
65 65
Sf
N9
75 68
'Basado en datos tomado del Estudio Fam;/iar de LipidDs (vease el texto); •• obesid ad ~ verdadera delinida como Indice de Masa Corporal igual 0 superior a 30 kglm ' . 'Basado en datos del NHANES III (ver texto); «h ipertensi6n. verdadera definida como tensi6n arterial sist61ica medida ., 140 mmHg. tensi6n arterial d iast6lica ., 90 mmHg. 0 uso de me
dos en los ambientes clfnicos 0 en esmdios epidemiol6gicos no pueden tomarse como ciertos. La Tabla 8.2 muestra algunos ejemplos de resultados de estudios de validacion de diversos datos clfnicos 0 de historias clfnicas, tal como se resumen en una revision hecha por Copeland ef aUm). N6tese que algunas de las pmebas incluidos en la Tabla 8.2 tienen escasa sensibilidad pero exhiben aceptable especificidad , tal como la ulcera peptica comunicada por los propios part icipantes y la definic i6n de angina del c uestionario de Rose. t>;tos no deteclan el 50% 0 mas de los casos identificados por rayos X 0 por entrevista clfnica. respectivamente , mientras que clasifican correctameme a casi todos los «no casos». Por otro lado,otras pruebas tales como la infonnacion sobre si el individuo fue objeto 0 no de circuncisi6n, sufren del problema opuesto, que tiende a identificar a mas del 80% de los casos verdaderos positivos (de acuerdo a un examen ffsico), mientras que a la vez clasifican a una gran proporcion de verdaderos negativos como (falsos) positivos ( l-esp = 56 %) . La pobre espec ificidad de la circuncisi6n a partir de 10 comunicado por los propios participantes subraya el hecho de que incluso Items de informacion que podrian considerarse altamente validos debido a su naturaleza «objetiv3», estan sujetos a errores. Gtro ejemplo viene dado por los hallazgos de un estudio realizado por Fikree ef al.(2'j) sobre la validez del infonne de los esposos sobre los resultados del embarazo de sus esposas . En este estudio, lIevado a cabo en una muestra de 857 parejas seleccionadas de una poblaci6n trabajadora en Burlington, Vermont, los informes de las esposas fueron utilizados como estandar contra eI que se eva-
320
EPIDEMIOLOGiA lNTERMEDIA ; CONCEPTOS Y APLICACIONES
luaban los infonnes de los esposos . La sensibilidad de los infonnes de los hombres sabre embarazos con niftos de bajo peso al nacer fue del 74%, la de aborto espontaneo fue del 7 1,2% y la de aborto inducido del 35, 1%. La validez era mas pobre entre los individuos mas j6venes y con menor nivel de educaci6n. Los autores de este eSUldio conduyeron que «serfa pmdente evitarel uso de los esposos como infonnantes alterna£ivas sabre de las historias reproduclivas de SlIS esposas)P
El estad{slico J de Youdell Descriw por Youden(30) en 1950, eI estadfstico J es un Indice resumen de la validez que combina la sensibilidad y la espedficidad . Se calcula como: J = sensibilidad + especificidad - 1.0
Po r ejemplo, para los datos que se muestran en la Tabla 8.5: J = ( 18/ 19) + (1 1/30) - 1,0 = 0947 + 0,367 - 1,0 = 0,3 14 (0 3 1,4%)
EI valo r 1.0 se sustrae de la suma de la sensibilidad y la especificidad, de manera que el valor maximo del fndice sea 1,0 cuando haya concordancia perfecta. Aunque, teoricameme, e l valor de J puede ser negativo, hasta - 1,0 (es decir, en presencia de discrepancia perfec ta , cuando la prueba siempre discrepa de la «prueba de oro~), un minimo mas realista para el recorrido de J en la vida real es J = 0, que se obtiene c uando la prueba funciona igual q ue el simple azar (es decir, sensibilidad yespecificidad = 0,5). Notese que este fndice otorga igual peso a la sensibilidad que a la especificidad ; por tanto, supone que ambos son componemes igualmeme imponantes de la validez . Po r ejemplo, para los datos de la Tabla 8.7, los valores de J para la informaci6n comunicada por los propios panic ipantes son 82% y 73 % para los «sobrepesos» y los «obesos» respectivamente. (N6tese que el ultimo es casi identico a la sensibilidad estimada de la obesid1d basada en la comunicacion brindada por los propios sujetos 174%J debido ala especificidad casi perfec ta 199%J en este caso, un valor que practicamente desaparece al sustraerse I en el dlc ulo). Las formu las para e l dlculo del imervalo de confianza para e l estimado del estadistico J se proveen en el Apendice A, Secc ion A .11 . Debido a que e l estadistico J Ie asigna igual peso a la sensibilidad q ue a la especificidad , se necesita utilizar indices alternativos c uando estos componemes de la validez no se consideran igualmente importantes en una situaci6n dada .
Porcelltaje de cOllcordallcia EI porcemaje de concordancia emre dos conj umos de observaciones se obt iene al rl ivirlir e l nllmem rle ohservaciones empareja rlas '1lJe se ha llan en las ce1rlas en las '1lJe
hay concordancia , entre el numero total de observaciones emparejadas (Figura 8.5). Como ejemplo del dlculo del porcentaje de concordancia, la Tabla 8.9 muestra los resu ltados de lectu ras re petidas de imagenes de Ultrason ido modo B de la bifurcacion de la carotida izq uierda , realizad1s para exam inar la fiabi lidad de la idemificacion de placas ateroescler6ticas en e l estudio ARICO!). Cuando se utiliza una defini -
321
ASEGURAMIENTO Y CONTROL DE LA CAUDAD
Observaci6n n,· 1 Prueba .;.
[J
,
Prueba .;.
N
Prueba -
0
0 0
,0 0
•>
•
n
0
Prueba -
[J
d
") Observaciones concordantes
Porcenlaje de concordancia.
(a + d)
(a+b+c+d)
x 100
Figura 8.5. Porcentaje de concordancia para resultados de una prueba emparejada binaria (positivo frente a negativo: por ejemplo, aquellos obtenidos por dos observadores 0 metooos diferentes 0 por el mismo observador en dos momentos diferentes): proporci6n de resultados concordantes entre todos los evaluados. cion binaria de la variable (presencia de placa 0 normal) , como en e l ejemplo mostrado en la tabla. el porcentaje de concordancia puede calc ularse simplemente como: . , 140+725 8 PorcentaJe de concordancta = x 100 = 7,7 %
986
El porcentaje de concordancia no solamente es el mCiodo mas simple de resumir e l concordancia para variables categ6ricas, sino que riene la ventaja adic ional de que puede computarse para cualquier nlimero de categorfas, no solamente para dos como en el ejemplo precedente . Por tanto, en el estud io de fiab ilidad de las lect uras del ultrasonido carotfdeo(l ,), a los lectores que detectaban una placa se les pedfa tambien Tabla 8.9 Concordancia entre la primera y la segunda Iccturas para identificar placa de arteriosclerosis en la birurcaci{m carotidea izquierda mediante examen de ultrusonido modo B en cI cstudio de riesgo de Ateroesclerosis en Comunidades ARIC Primera lectura
Segundn lectum
Placas
Normal
Total
Plncns
'"
"
Hl2
Normal
69
725
794
209
777
986
Total
Fuente: R U al ai" Reproducibility el Exlracranial Carotid Atheroscleros is Lesions Assessed by B·Mode Ultra· soooo: The Atheroscleros is Risk in Communities Study, Ultrasound Moo Bioi, ve l 22. 79 1·799. ot>l 996,
322
EPIDEMIOLOGiA lNTERMEDIA ; CONCEPTOS Y APLICACIONES
que evaluaran 1a presencia de sombras acusticas (una atenuaci6n de los ecos detras de las placas q ue a menudo reflejan 1a presencia de calcificaci6n de las placas: por ejemplo , lIna placa ateroesc ler6tica avanzada) . Los resu ltados de las lecturas de rcproducibi lidad de 1a bifurcaci6n carotfdea izquierda en este estudio cuando se utiliza la definicion mas fina de la placa se muestran en la Tabla 8.10: e l porcentaje de concordancia en este caso puede calcularse como: Porcentaje de concordancia =
17 + 104+725
986
x 100
= 85,8%
Tabla 8.10 Concordancia entre la primera y scgunda Icctura para idcnlificar placas de arteriosclerosis COli 0 sin sombra acustica en la bifurcacion carlltida izquicrda Primera lectura
Segunda lectura
p"," S'
Sdo Placas
Normal
Total
P"," S'
17
14
6
37
Solo Placas
5
104
46
155
Normal
5
64
725
794
Total
27
162
777
986
'Placa"," som bra (acustica), FUMre: R li or ai" Rep roducibi lity of Extracranial Ca rotid Athe rosclerosis les ions Assessed by B·Mode Ultra· sound: The Atheroscle rosis Risk in Commun ities Study. Ulrrasound Moo BiO/, Vol 22, 791 · 799 , ClI996.
Los res ult ados de otra eva luacion de fiabilidad. basados en los datos de un esw dio de la relaci6n entre la superex presion de la pro te fna p53 y e l perfil de facto res de riesgo de cancer de mama. se muestran en la Tabla 8. 11 (32) . Como parte de los procedimientos de control de la calidad en este estudio. 49 secciones de tumores de mama se tifieron 2 veces y la tabla c ruzada resu ltante de los datos despues de las prime ras dos tinciones muestra que e l porcentaje de concordancia es de 100 x ( 14 + 7 + 2 1)/49 = 85.7 % . Aunque e l porcentaje de concordancia es e l parad igma de los indices de fiabilidad para variables categ6ricas. tambien puede ut ilizarse para evaluar la validez: esto es, puede milizarse para exam inar el concordancia entre los resultados de la prueba y una presunta «prueba de oro». En tal caso, el calculo se realiza obviamente sin condicionamientos sobre este ultimo (como es el caso de los calculos de sensibi lidad y especificidad). Por ejemplo, en la Tabla 8.5, el porcentaje de concordancia es meramente e l porcentaje de las observaciones que caen en las celdas de concordancia entre el total , 0 100 x ( 18 + II ) I 49 = 59,2%. De forma parecida , en los resultados del estudio de validez mostrados en la Tabla 8.6, e l porcentaje de concordancia entre las categorfas del peso basadas en la c,omun icac ion brindada por los propios sltjetos y las med idas de peso y talla es 100 x (462 + 2.868 + 2.086 + 809)17.455 = 83,5 % . Una limitacion del enfoque con el porcentaje de concordancia es que sus valores tienden a ser altos siempre que la proporci6n de resultados negativo-negativo es alIa (resu llante de una baja prevalencia de positividad en la poblacion de estudio), parlkularmente c uando la especificidad es alta. Por ejemplo, en la Tabla 8.7, el porcentaje de
323
AS EGURAMIENTO Y CONTROL DE LA CAUDA D
Tabla8.ll Reproducibilidad del proccdimiento para sobre exprcsion de p53 en 49 scccioncs cancer de mama: cstudio de Los Pafscs Hajos sobre contraceptiYos oralcs. Primera linci6n Total
1'53,
Segunda linci6n
14
1
15
p53.
7
2
9
p53·
4
21
25
12
23
49
Total
14
Fuente; K van der Kooy el a/.. p53 Protein Overexpression in Relation to Risk Factors lor Breast Cancer. Ameri· can Journal of Epidemiology, Vol 144, 924-933, 1996, The Johns Hopki ns University School of Hygiene & Public
Health
eoncordancia es mayor para la definic i6n 8 (95,4%) que para la A (9 1,4%), aun euando la sensibilidad fue 12 puntos mas baja en 8 q ue en A (74% Y 86% respeetivamenIe); esto puede explicarse en parte ror el heeho de que la prevalencia de la eondic i6n es menor en 8 que en A, 10 que inlla la eelda negativo-negativo, y en parte por el hecho de que la espec ificidad es mayor en 8 q ue en A (esta cereana al 100% para el primero). Como una ilustraci6n mas, la Tabla 8 .1 2 muestra la situaci6n hipolelica de una poblaci6n en la c ualla prevalencia de obesidad fue 20 veces menor que la observada en la poblaci6n LRC, pero los niveles de sensibilidad y especificidad eran {o.\· lIIislIIOS q ue los observados en la Tabla 8.7, definic i6n 8 (exeepto por redondeo) . En esta situaci6n, e l porcentaje de eoncordancia aumentara del 95,4% a eerca del 99%; esto es, sera casi Tabla 8.12 Resultados hipotCticos basados ell tl ejemplo de la Tabla 8.7 (definicion H) suponiendo los mismos valorcs de validez pero prevalencia aproximadamente 20 vcces menor que la hallada en el estudio Calegoria segun IMC basado en medici6n IMC basado en la comunicaci6n de los propios participantes
Obesos
Obesos
41
69
110
No obesos
14
7.331
7 .345
Total
55
7.400
7 .455
Porcentaje de concordancia : PCP'
'='
2
(41 + 7.331)
~ ~1
(55 + ItO)
7.455 ~
><
Total
100", 9B,9%
100", 49,7%
Porcentaje de concordancia posili·.. a de Chamberlain: 'Porcentaje de concordaocia pos~iva
No obesos
'=' -;;-c"4~ . ., ' CCC;C x 100 '" 33,1% (4 1 +69+ 14)
324
EPIDEMIOLOGiA lNTERMEDIA; CONCEPTOS Y APLICACIONES
perfecto solo como res ultado de la disminuci6n de la prevalencia . Notese que, de forma anaJoga, e l porcentaje de concordancia tambien tiende a ser alto c lIando la prevalcnda de la condici6n es mlly alta (10 que da lugar a una abu ltada proporcion de observaciones positivo-positivo), particularmente clIando la sensibilidad es alta. Al igual que con la sensibilidad y la especificidad , los errores estandar y los ]fmiICS de confianza para e l porcemaje de concordancia se calculan como para cualquier proporc ion (vease Apendice A, Secc ion A. IO).
Porcelltaje de cOllcordancia positivas
En parte para superar las li mitaciones del porcentaje de concordancia como Indice de fiabilidad clIando la prevalencia de la condici6n es muy baja (0 muy alta), se han propuesto por 10 menos dos medidas de concordallcia positiva(3l) : I. Porcentaje de cOllcordallcia posifiva: numero de unidades para las que ambos observadores comunican un resultado positivo, entre el nlimero promedio de positivos dados por ambos observadores . Utilizando la notaci6n de la Tabla 8.4, esto se formu la como sigue:
a
2a
PCP= - - - - - - " - - - x I00 = -,-----='------,-,- x I 00 = [(a + c) + «(1 + b)] ( (a + c) ~ «(1 + b) )
2a (2a + h+c)
-;::---;---:- x 100
2. Porcentaje de cOllcordallcia pOJ'itiva lie Chamberlain: nlimero de unidades para las que ambos observadores comunican resultados positivos entre e l nlimero de observaciones para las que al menos un observador 10 hace(34). a
pc p de Chamberlain = -,----';--,-,- x 100 (a+h+c) EI dlcu lo de estos dos Indices se ilu stra en e l ejemplo de la Tabla 8.12. Notese que los dos indices estan algebraicamente relacionados: PAP
PCP de Chamberlain = -:::-'-''':-=(2 - PAP)
Estad{stico kappa Las medidas de concordancia anteriormente expuestas tienen una limituc i6n import ante . No tienen en cuenta la concordancia que puede ocu rrir solo po r azar: esto es, no toman en consideraci6n e l hecho de que aunque ambas leclllras no tlIv ieran ninguna relaci6n (por ejemplo, ambos observadores clasifican al azar), ex ist ira algun grado de concordancia debido solamente al azar. Una medida que corri ge e l resu ltado teniendo en cuenta esta realidad es el estad istico kappa (6) (K),
ASEGURAMIENTO Y CONTROL DE LA CAUDAD
325
definido como la fraccion de la concordancia observada que no es debido a l azar con relacion a la concordancia maxima posible no debida al azar c uando se utiliza una clasificacion categ6rica de una variableo5.l7). Esta definicion se entiende f:kilmente si se cons idera la formula para el calculo de K : K=
_P "o_-", , P,,-1,0 - p.
donde Po es la proporci6n de concordancias observadas y P, es la concordancia debida al azar; eslO es, la proporcion de concordancias que se espera ocurran solo por obra del azar. El K se cabl la a partir de las celdas mostradas en la diagonal de una tabla cruzada, que representa concordancia completa entre dos conjuntos de observaciones. La concordancia por azar es el que se esperarfa si ambos observadores clasificaran las respuestas al azar. La concordancia total por azar es la suma de la concordancia por azar para cada celda en la diagonal. El numero esperado solo por este concepto en cada celda es e l producto de los IOtales marginales correspondientes dividido por e l gran total. (N6tese que este es e l mismo metodo empleado para calcu lar los valores esperados bajo la hip6tesis nula para una pmeba de Ji-cuadrado en una tabla de contingencia). Por ejemplo. la concordancia atribuible al azar para la celda «placa-placa» en la Tabla 8.9 es (209 x 192)/986040.7. Y el de la celda «normal-normal» es (777 x 794)/986 0 625,7. La concordancia total esperada por azar es por tanto (40,7 + 625,7)/986 = 0,676. (Una via rapida para el dlculo de la proporci6n de concordancia por azar para cada celda consiste en dividir los productos de los margenes por el cuadrado del total: esto es, combinar ambos pasos - el dlcu lo del mimero esperado y el de la pIVI'orci6n esperada - en uno. Por ejemplo, para los datos de la Tabla 8.9, la proporci6n esperada para la celda «placa-placa» es [209 x 192[1986 2 , Ye l 1 de la celda «normal-norma1» es 1777 x 794J/986 . La concordancia total por azar es 2 por 10 tanto [209 x 192 + 777 x 794J/986 = 0,676). Puesto que la concordancia observada para esta tabla fue 0,877 (vease anterionnente), se tiene K = 0,877 - 0,676 = 0 62 1,0 - 0,676 ' Las f6nnulas para el error estandar y el intervalo de confianza para kappa se dan en el Apendice A, Secci6n A. 12. Los valores posibles de kaplJa oscilan entre - I y I , aunque los valores por debajo de 0 no son muy realistas en la practica (la concordancia observada seria peor que e l que producirfa solamente e l azar). Para la interpretacion de un valo r dado de kappa se han propuesto diferentes clasificacionesoll .38 .-W) (Figura 8.6). De estas, la mas ampliamente utilizada probablemente sea la de Landis y Koch(38) . Es importante tener en c uenta, s in embargo, que estas clasificaciones son arbitrarias(~l); para c ualquier valor dado de kappa, e l g rado de sesgo po r error de clasificaci6n que resultaria de aplicar e l instrumento/lector correspondiente dependera de otras circunstancias, tales como la prcvalencia dc la condici6n y la distribuci6n dc los margenes (vease mas adelante). AI igual que el porcentaje de concordancia, kappa puede estimarse a partir de tablas 3 x 3,4 x 4 0 k x k. Por ejemplo, eI valor de kappa para las lect uras repetidas de los examenes ultrasonograficos de la bifurcaci6n carotfdea en e l est udio ARIC mostradas en la Tabla 8.10 pueden calcularse como sigue:
326
EPIDEMIOLOGiA lNTERMEDIA ; CONCEPTOS Y APLICACIONES
Landis Koch {1977}
Altman {1991 }
Fleiss (1981 )
Byrl (1996)
1,0 Casi perfecta
buena
Notable
Buena
"oy
Excelenle
Excelenle
0,8
Muy buena
1 - - - - - 1(0,75 )
I0,92)
Buena
D,
aceptable
0,6 Moderada
Moderada
Aceplable
Aceptalje
Aceptable
buena
0,< Reducida
0,2
"'""
Reducida
0,0
"'""
Pobre
- 1,0 -
,
Pobre
Concor· dancia I Inexislente I
______ 1
------
Figura 8.6. Clasificacioncs propucstas pa ra
18
interpreta cion de
UII
valor de kappa.
Acuerdo observado (vease antes) = 0,858 Acuerdo por azar =
1(27 x 37) + ( 182 x 155) + (777 x 794)]
(986)' (0,858 - 0,665)
= 0,665
0,576
(I - 0,665)
Tambien igual que e l porcentaje de concordancia, kappa se miliza principal menIe para 1a evaluaci6n de la fiab ilidad: esto es, cuando no hay un estandar claro y resu lta apropiado darle igual peso a ambos conjuntos de lecturas . Sin embargo, tambien se ut iliza ocasionalmente para la evaluaci6n de la validez, en la comparacion de los resu ltados de una prueba con los de una «prueba de orO» . En la Tabla 8.6 la concordancia observada entre categorias de lMC basado en la comunicaci6n brindada por los prop ios sujetos y las de la «prueba de oro» (lMC basado en med iciones) es 0,835 (vease texto anterior). La concordancia esperada por azar serfa: [(534 x 640) + (3 .180 x 3.447) + (2.650 x 2 .5(0) + ( 1.09 1 x 868)[ 7.455
2
= 0,340
Po r tanto, K
= (0 ,835 - 0,340) = 0 75 (I - 0~40)
,
Kappa tambien se ut iliza frecuentemente en situaciones en las cuales, aunque exisle una «prueba de oro», esla esta sujeta a errores no despreciables y, por tanto, eI
ASEGURAMIENTO Y CONTROL DE LA CAUDAD
327
invest igador es reticente con res pecto a tomarlo tal como se observa (como se supone cuando se calculan la sensibilidad y la especific idad de la «prueba»). (Como se menciono previamente. en esta silUaci6n, puede ser preferible referirse a la comparacion entre la «prueba de oro» y la prueba exam inada como una evaluaci6n de la «fiabilidad imermetodos» y no de la validez) . Un ejemplo es un estud io que utiliza niveles sericos de cotinina como «prueba de oro» para evaluar la «va lidez» de l habito de fumar reportado por mujeres embarazadas (~2) ; en este ejemplo la «prueba de oro» tambien esta sujeta a errores que vienen del laboratorio y tambien de la variabilidad intra-ind ividual. y el calculo de kappa que resulto ser de 0.83. Ademas. para evaluar ind irectamente que metodo (comunicaci6n brindada por los propios sujetos 0 nivel de cotinina serica) tenfa mayor validez predictiva (y fiabilidad), los autores compararon la magn itud de su correlaci6n con un resultado que, como es bien conoc ido, esta fuertemente relacionado con el habito de fumar de la madre: el peso del nino al nacer. La correlaci6n entre la cotinina serica y el peso al nacer (r = 0.246) fue solo ligeramente mayor que la observada entre el habito de fumar com unicado por los propios participames y el peso al nacer (r = 0,20), 10 que sugiere que, en esta poblacion, la cotinina serica y la comunicacion brindada por los propios sujetos son similarmente adecuadas como marcadores de exposici6n actual al habito de fumar. (Las li mitaciones de las inferencias basadas en el valor de l coeficiente de corre lacion se discuten mas adcl ame; vease Seccion 8 .4 .2). Otro ejemplo de la aplicacion de kappa para evaluar la fiabi lidad intermetodos 10 tenemos en un eSlUdio que compara la capacidad funciona l basada en el desempeno y la que resu lta de una autoevaluaci6n en una poblaci6n anciana de Barcelona, Espana(~3) . Algunos resu ltados seleccionados de este est udio se muestran en la Tabla 8 .1 3. Notese que los autores comunican medidas de validez (sensibilidad y especificidad) y fiab ilidad (porcentaje de concordanc ia y kappa); por tanto, dejan a cargo del lector la elaboraci6n del juic io acerca de sf la evaluaci6n de desempeno en un momenta dado constituyo 0 no una «prueba de oro» apropiada. Se dispone de extensiones del estadfstico kappa para la evaluaci6n de clasificaciones multiples (0 medidas repetidas m(iJtiplesYJt.). Un ejemplo de esta aplicaci6n de kap/Ja puede encomrarse en un eSllldio que evalua la fi abilidad de la clasificacion diagn6stica de visitas de emergencia y sus implicaciones para estudios de poluci6n del ambientd+l). L.1 concordancia (kappa) entre el diagnOstico obtenido a partir de la base de datos del hospital y la realizada por seis clasificadores extemos (medicos de emergencia a tiempo completo) de concordancia a la categoria diagnostica y el nivel de polucion del dfa se presenta eficientemente por los autores (como se muestra en la Figura 8.7) .
Kappa pOllderado
Cuando los desenlaces del est udio pueden expresarse con mas de dos categorfas, unos desacuerdos pueden ser mas marcados que otros; en esta silUacion, debe considerarse el uso del kappa ponderado. Una ejemplo de su apl icaci6n es la comparaci6n entre ellMC comunicado por los propios partic ipantes y el que se basa en med iciones, discUlido anterionnente (vease Tabla 8.6) . Cuando el estad fstico kappa se caic u16 para estos datos (K = 0,75), se supuso que solo valla la pena considerar el concordancia total (la diagonal en la Tabla 8.6): esto es, cualquier tipo de desacuerdo, independientemente de su magninld, se tomaba como tal. Un enfoque alternativo
W N
00
Tabla 8. 13 Concordancia entre invalidez comunicada), desempelio obsen 'ado en una muestra de 626 indh'iduos de 72 alios 0 mas de edad , en Barcelona , Espaiia. Desempeno al caminar 4 metros
"Necesidad de ayuda" para caminar comunicada
~DificuHad"
Incapaz
Capaz
Sensibiliclad'
Especificidad'
Si
15
0,98
11
12 571
0,58
No
% de concordancia Kappa 96
0.55
~~--~~~~~~~~~~~~--
No
8;;z
al caminar comunicada Oesempefio al caminar 4 metros
Si
~
5
Despaclo t
Rapldo t
Senslbilldad
Especlflcidad
% de concordancla
Kappa
85 56
75
O,6()
0.83
78
0.41
367
«DificuHad" allevantarse de una silla comunicad aDesempeno al levantarse 5 veces de una silia Incapaz
Capaz
Sensibiliclad
Especificidad
Si
71
No
"
" "5
0.63 (0.54 - 0.72)1
0.92 (0.89 - 0.94)1
% de concordancia Kappa 86 (83 - 89)1
0.55 (0.47 - 0.63)1
'La soos ibifidad y fa especificidad se caiccja ron considerando e l examen de desempeno fisico como op rue!la de O rO ~. '. Des pae;o.. y . rn p ido~ se de~nie ron de aeue rdo a si e l s~to eamin6 4 metros en mas 0 00 mooos de 7.5 segundos respectivamoote . 'Los inte.vakl, de COnlMz.a para estos estimados y una ilustrad6n de su eatrulo pueden verse 00 e l Apendice A, Secckl ne s A .l0 y A.12 . Fuentu. M FM e r el al. , Corll'a nson of PeriOfmance·Based and Se~·Re lated Functklna l Ca pacity in SpM ish Eiderly, AmericM JO
I 8 Ii
~
< >
~
n
~
~ rn
AS EGURAMIENTO Y CONTROL DE LA CAUDA D
329
,,0 - , - - - - - - - - - _
0,9
0,8
,
IT
0,7
~
"-
•
~
~
~
0,6
0,5
0,4
O,3~-------------'
TOOos loS avaluadores F igura 8.7. Fiabilidad dc la dasificadon diagnostica dc las visitas dc cllIcl"gcnda scgun catcgorfa diagn6stica: la clasificaci6n se hacfa segun la base de datos del hospital y seis evaluadores externos. Base de datos del departamento de emergencia del Hospital Regional «Saint John». Saint John. New Brunswick. Canada. 1994. Los sfmbolos oscuros representan dfas de alta poluci6n y los claros representan dfas de baja poluci6n. *. P (dfas de baja poluci6n vs dfas de alta poluci6n) = 0.002 . • . asma: • . enfennedad pulmonar obstruct iva cr6nica: ... infecci6n respiratoria: ... enfemledades cardiacas: • . otras. Fuente: OM Stieb el a/.. Assessing Diagnostic Classification in an Emergency Department: Implications for Daily Time Series Studies of Air Pollution, American Journal of Epidemiology, Vol 148, 666-670, © 1998, The Johns Hopkins Uni\'ersity School of Hygiene & Public Health.
cuando se calcula e l valor de kappa es asignar pesos distintos a diferentes niveles de desacuerdo . Por ejemplo, la Tabla 8.14 muestra los mismos datos q ue la Tabla 8.6, pero tam bien indica que e l peso total (1,0) se Ie asign6 a las celdas de la diagonal q ue re presentan e l acuerdo perfecto, un peso de 0,75 se les asign6 a los desacuerdos entre categorfas adyacentes, uno de 0,5 a los desac ue rdos correspondientes a una distancia de dos categorfas, y un peso de a los desacuerdos de 3 categorfas. EI d lculo de l amado ob.\·ervado en la Tabla 8.1 4 es anaJogo al de una media ponderada en el sent ido de q ue consiste meramente en multiplicar el nu mero en cada celda por e l peso correspond iente, sumar todos los prod uctos y di vidir la suma por e l gran total. Comenzando en la primera fila con la celda que denota «bajo peso» para ambos ensayos y procediendo de izquierda a derecha en cada fila, el ac ue rdo obser-
°
330
EPIDEMIOLOGiA lNTERMEDIA ; CONCEPTOS Y APLICACIONES
Tabla 8.14 Calculo de kappa pondcrado: tabulacion cruzada de cuatro catcgorfas de iudice de masa corporal comunicada por los propios participantcs y basada en mcdiciones. 7.455 participantcs adultos del Estudio Familiar de Clfnicas de luvcstigacioll de Lipidos, 1975·1978. (VCase Tabla 8.6) Categorfa segun IMe medido IMe basado en aulorreporte Bajo peso Normal Sobrepeso OOOso
Sajo peso
Normal
Sohrepeso
OOOso
Total
462 (1 ,0)"
178 (0,75) 2.868 (1,0) 134 (0,75) o (D,S) 3 .1 80
0(0,5) 505 (O.7S)
0(0) 2 (0,5) 280 (0,75) 809 (1,0) 1.091
640 3 .447 2 .500 868 7 .455
72 (0,75) o (0,5) 0(0) 534
Total
2.086 (1 ,0)
59 (0,75) 2 .650
, N.' obselVado (peso para el calculo de kawa).
vado (POf' en el que las letras 0 YI' denotan «observado» y «ponderado» respectivamente) es
°
P"p= (462 x 1 + 178x O,75 +0+0+ 72xO,75 + 2.868x I + 505 x O,75+2x0.5+ + 134 x 0,75 + 2.086 x I + 280 x 0,75 + 0 + 0 + 59 x 0,75 + 809 x
1)17.455 =0,959
EI crilcu lo de Pop puede simplificarse reorganizando esta ec uaci6n, agmpando las celdas con pesos iguales (y omitiendo las que tienen ceros): P"p = 1(462 + 2.868 + 2.086 + 809) x 1 + (178 + 72 + 505 + 134 + 280 + 59) x
0,75 + (2) x 0.5117 .455 = 0959 EI dlcu lo del (lel/erdo 1'0" aza ,. (Pop' en el que la letra e denota «esperado» sOlo por el azar) en este ejemplo, se realiza como sigue: I) multiplique los to(ales marg inales correspond ientes a las celdas con un peso de 1,0; entonces sume estos produc(Os y mu ltiplique esta suma por el peso de 1,0; 2) haga 10 mismo con las celdas con pesos igual a 0,75 asf como para las celdas con pesos de 0,5 (es decir, incluyendo aquellas con valores observados iguales a cero); y 3) sume (Odos los resultados anteriores y divida la suma por el cuadrado del gran total como sigue: Pop = 1(534 x 640 + 3.1 80 x 3.447 + .. .) x I + (534 x 3.447 + .. .) x
0,75 + (2.650 x 640 + 1.09 1 )( 3.447 + 534 x 2.500 + 3. 180 x 868) x 0,5JI7.455 2 = 0,776 Una vez que se obtienen los valores ponderados de acuerdos observados y por azar, la formu la para el kappa ponderado es identica a la del no ponderado: Pov,.- P,w I ,O - P,w
331
ASEGURAMIENTO Y CONTROL DE LA CAUDAD
Utilizando esta f6 rmula para calcu lar el kappa ponderado de la Tabla 8.4 se tiene: Kw =
0,959 - 0,776 = 0,82 1,0 - 0,776
Notese que en eI ejemplo anterior, el peso de 0,5 asignado a un desacuerdo de dos categorfas se miliz6 solo como ejemplo hipotetico para el calcu lo del kappa ponderado; en la realidad, uno estarfa poco incl inado a darle peso alguno a desacuerdos entre tales categorfas extremas como «obeso» versus «normal» 0 «sobrepeso» versus «bajo peso». En general los pesos asignados a las celdas, aunque algo arbitrarios, deberian ser seleccionados sobre la base de la percepc i6n del invest igador acerca de c uan serios son los desacuerdos para el confexfO ell que seran utilizados. Por ejemplo, en un ambiente clfnico donde un diagn6stico confirmatorio de cancer de mama a partir de biopsias puede ser segu ido de una mastectomfa, no es aceptable nada fuera de un acuerdo perfecto. (En la pr:ktica, en esta situacion el desacuerdo entre dos observadores se juzga y dirime por un observador u observadores adidonales). Un ejemplo de naturaleza diferente es la inclusion de casos de infarto del miocardio «definitivos» 0 «probables>, en el numerador de tasas de inddenda para analizar asociaciones con factores de riesgo en un est udio de cohortes (vease, por ejemplo, White et al.(S)); esto puede ser aceptable, 10 que just ifica el uso de un fnd ice ponderado similar al mostrado en la Tabla 8.15 para el calculo de kap!)(l entre dos evaluadores. N6tese que en este ejemplo, el esquema de ponderaciones se determino reconociendo que el desacuerdo entre «probable» 0 «definitivo» por un lado y «ausente» por otro, parece ser mas serio que el que existe entre «definit ivo» y «probable» . Obviamente, el investigador deberfa asignar mas peso a los desacuerdos menos extremos que a los mas extremos . En eI ejemplo hipotet ico de la Tabla 8. 15, al acuerdo perfecto en el diagn6stico de infarto de miocardio entre dos observadores se Ie asign6 un peso de 1,0 (como en el calculo del kappa no ponderado); al desacuerdo «definit ivo» versus «probable» se Ie asigno arbitrariamente un peso de «acuerdo» de 0,75, 10 que reconoce la seriedad menor con relaci6n al peso de asignado al desacuerdo entre «ausente» y las otras categorfas. Si se utilizara una categorfa diagn6stica adic ional y aun mas «suave», «posible», al desacuerdo entre , por ejemplo, «definitivo» y « posibl e~) podrfa darsele un peso mas pequefio (ej, 0,5) que el que se asigno a las celdas «definitivo-probable». Un enfoq ue similar podrfa milizarse para los datos mostrados en la Tabla 8. 10, en la cual el desacuerdo entre las lecturas «placa + sombra~) y « placa~) podrfa no considerarse tan notable como el que existe entre cualquiera de las dos y la «normal».
°
Tabla 8.15 Ponderaciones de acuerdo pa ra el cilculo de kappa: un cjcmplo hipotCtico de dasificacion del inrarto de miocardio mediante ccrteza de diag nostico Observador N." 1 o
Observador N. 2 Definilivo Probable Ausente
Definitivo
Probable
Ausenle
1,0 0,75 0
0,75 1,0 0
0 0 1,0
332
EPIDEM IOLOGiA lNTERMEDIA; CONCEPTOS Y APLICACIONES
En c ualquier caso, el valor del kappa ponderado depended obviamente del esquema de ponderaciones elegido. Esta arbitrariedad ha sido cdtkarla y es una de las debilidades de l kappa ponderado' ~S) , particularmente cuanda se agrupan variables cont inuas en multiples categorfas ord ina les (por ejemplo, las categorfas de l IMe en la Tabla 8.6) . En este ultimo caso, sera mejor utilizar ciertos esq uemas de ponderaciones para kal'l'a* que son equivalentes al coeficiente de correlaci6n intraclase descrito en la Secci6n 8.4 .2. Depellde llcia de kappa de fa pre valencia Una li mitaci6n importante de kuppa cuando se campara la fiab ilidad de un proced imiento d iagn6stico en poblaciones diferentes es su dependencia de la prevalencia de verdaderos «positivos» en la poblaci6n(37). A cont inuaci6n se muestra un ejemplo q ue ilu stra como las dife rencias en las prevalencias afecta a los valores de kappa . Considere una cond icion dada Y, que sera buscada por cribado inde pendientemente por dos observadores (A y B) en dos poblaciones d ife rentes I y II , cada una con un tamano de 1.000 individuos . Las tasas de prevalencia en estas poblaciones son, respectivamente, 5% y 30% como las q ue podrian obtenerse para h ipertensi6n en poblaciones de mayor edad y poblaciones mas jovenes . Por tanto, los numeros de verdaderos positivos son 50 para la poblacion I y 300 para la poblacion II. La sensibil idad y la especificidad de cada observador (que supuestamente no varian con la prevalencia de Y) son, para el observador A, SO% Y 90% respectivamente, y para e l observador B 90% y 96% respectivamente . Estos niveles de sensibilidad pueden aplicarse a los verdaderos positivos en las poblaciones I y II para obtener los resultados mostrados en la Tabla S.16. Por ejemplo, para la poblaci6n I, como se ve en el total de la fila, skndo la sensibilidad del observador A igual a 0,80,40 de los 50 sujetos verdaderos positivos se clasifican correctameme por el 0 e lla, mientras que 10 se clasifkan erroneamente como (falsos) negat ivos. Para el observador B, q ue tiene una sensibilidad de 0,90, estos numeros son, respect ivamente , 45 y 5 . N6tese q ue la celda de concordancia - esto eS,el numero de personas clasiflcadas como «pos i tiva s~~ por ambos observadores A y B - es meramente la sensibilidad conjunta aplicada al gmpo total de casos positivos: por ejemplo, para la poblaci6n I, (O,SO x 0,90) x 50 = 0,72 x 50 = 36 . Con Ires de estos numeros; esto es, los clasificados como «positivos» por A, los clasificados como «pos i t i vos~) por B, y los d asificados conjuntamente como «positivos>, - es posible calcular las otras celdas de la Tabla S.16. En la Tabla S.17 se hacen dlc ulos similares para los verdaderos negalivos, uti lizando los valores de especificidad para los observadores A y B. De nuevo, el ntl mero de verdaderos negat ivos clasifi cados como tales por ambos observadores se obtiene apl icando la probabilidad conjunta q ue tienen ambos observadores de detectar un
• S" h" d"m'Htr;ujo (por FI"iss(36I) 'I"" p:lr" v:.r;"hl", ordin"I",
w,' (i:
1 Wi) :
m"ltin;v.,J,,~
"""ndo los p,,,o, .
I. ,."k: j : I . .. "k). se definen como -
(i - })' (k - l)'
donde k es e l numem de categorfas en la tabla de contingencia el valor del kappa pondcr.ldo es idCntico al del coeficiente de corrclaci6n intraclase (vcase Secci6n 8.4.2).
333
AS EGURAMIENTO Y CONTROL DE LA CAUDA D
Tabla 8.16 Resultados de las mediciones realizadas por los observadores A y B en poblaciones de verdaderos positiYOS con difertntes tasas de prtvalencia de la condicion medida , cada una con una poblacion de tamano 1.000 Poblacl6n I (prevalencla ,,0,05)
Poblacl6n II (prevalencla ,,0,30)
Observador A
Observador A
Observador B
p"
N..
Total
p"
Po.
N.,
36""
,
9
'5'
Total
40'
10
216"" 24 2401
5 50'
N., 54
6 60
Total 2701 30 300'
'Numero de verdaderos pos~ivos obtenido medianle la mu~ip l icaci 6n de la prevalencia por £II tamar'Kl de la poIl laci6n tOlal: por ejemplo, pa ra la poblaci6n I, 0.05 • 1.000. "Obtenido mediante aplicaci6n de la sens Dilidad conjunta de los observadores A y B al numero lotal de verda· deros pos il ivos: por ejemplo, para la poIllacion I, (O,SO . 0,90) • 50 . ' Obtenido medianle la ap licaci6n de l nivel de sensibilidad del observador B al numero tOlal de verdaderos posi· tivos en las pobIaciones I y II : por ejemplo. para la poblaci6n I. 0,90 . 0.50. ' Obtenido mediante la aplicaci6n del nivel de sensiDilidad del ooservador A al numero total de ve rdaderos posi· tivos en las pobIaciones I y II : por ejemplo. para la poblaci6n I. O,SO. 0.50.
verdadero negativo (0,90 para A por 0 ,96 para 8 ) al numero total de verdaderos negativos en cada poblacion: porejcmplo, en la poblaci6n I, (0 ,9() x 0,96) x 950 = 82 1. Los resul tados totales mostrados en la Tabla S. IS se obtienen sumando los datos de las Tablas 8.1 6 Y 8. 17. Los calculos de kappa para las poblaciones I y II, utilizando los datos mostrados en la Tabla S.I S, arrojan los siguiemes valores:
Tabla 8.17 Resultados de las mediciones realizadas por los observadores A y B en poblaciones de verdaderos positiYOS con difertntes tasas de prtvalencia de la condicion medida , cada una con una poblacion de tamano 1.000 Poblaci6n I (prevalencia ,,5%)
Poblacl6n II (prellalencla ,,30%)
Observador A
Observador A
p"
Total
p"
N.,
Total
p"
,
N..
Total
91 95
34 821" 855'
38 9121 950'
3 67 70
25 60S"' 630'
28 6721 700'
Observador B
N.,
'Num",o "" v",dad",o. r><>gativo. OOI"niolo . al ' u.l,a" , "I num",o d" v",da
334
EPIDEMIOLOGiA lNTERMEDIA ; CONCEPTOS Y APLICACIONES
Tabla 8. 18 Resultados de las mcdiciones hcchas por los obscrvadores A y 8 para poblacioncs totales I y II obtcllidos mediante combillacioll de los resultados de las Tablas 8.16y8.17. Poblacl6n I (prevalencla :: 5%)
Poblaci6n II (preva lencia " 30%)
Observador A
Observador A
Obscrv:ldor B
P••
N.,
P••
40 95 135
43 822 865
N" Total
Tol:!1
P••
N.,
83 917
219 91 310
79 611 690
1 ,000
Poblaci6n I K = 0,862 - 0,804
1,0 - 0,804
Tol;:,1 298 702 1 ,000
Poblaci6n II
= 0,296
K=
0,830 - 0,577 = 0,598 1,0 - 0,577
Po r tanto, para la misma sensibilidad y especificidad de los observadores, e l valor de kuppa es mayor (alrededor del doble en este ejemplo) en 1a poblaci6n en 1a ellal la prevalencia de positividad es mayor (Poblaci6n II) que en 1a que es menor (Poblaci6n I) . Se ha desarrollado una formu la que expresa e l valor de kappa como funci6n de la prevalenc ia y la sensibilidad/espec ific idad de ambos observadores(17) , y se demuestra que. para niveles de sensibilidad y especificidad fijos . kappa tiende a 0 a medida que la prevalencia se acerca a 0 0 a I. Un problema ad icional es que, parad6jicamente, se pueden obtener valores altos de kappa cuando los margenes de la tabla de contingencia no estan balanceados(6 47 ); Por tanto, kappa tiende a ser mayor cuando la prevalencia de positividad es diferen(e entre los observadores A y 8 que cuando ambos observadores comunican prevalencias similares. Consecuentemente, kappa «prem ia» indebidamente una evaluacion diferente de positividad entre observadores. La discusi6n anterior sug iere que las comparaciones entre poblaciones 0 entre di ferentes man ifeslaciones de una condic ion (por ejemplo, sfntomas) pueden ser improcedentes; se deriva de aquf q ue milizar un valor espedfico de kappa obtenido en una poblaci6n objeto dada para predecir el valor en otra poblacion solo se justifica si las {asas de prevalencia de la condici6n, 0 condiciones, de interes son similares en ambas poblaciones y si jueces dife renles (0 lec(uras diferentes) proveen estimados de prevalencia de positividad razonablemente similares . Por ejemplo, en e l estudio de fiabilidad del ultrasonido carotfdeo AR IOJ'J, los autores evaluaron la fiab ilidad de la identificaci6n de las placas (con 0 sin sombreado) no solamente en la bifurcaci6n carotfdea (vease Tabla 8.10) sino lambitn en la car6{ida comlin y en la car6tida interna. Los resultados del kappa ponderado para los {res segmentos arteriales se muestran en la Tabla 8 .1 9 . Notese que ambas leclllras dieron lugar a porcentajes razonablemente similares de prevalencia de placas para todos los sitios de la arteria car6tida . S in embargo, ha de advertirse que para cada lectura hay diferencias imponantes en las prevalencias de placas entre silios. Por tanto, al comparar estos
335
AS EGURAMIENTO Y CONTROL DE LA CAUDA D
Tabla 8.19 Kappa ponderado y prevalencia de placas (con 0 sin sombreado) en dos lecturas de l examen de ultrasonido mooo 8 en tres segmentos de la arteria carotldea, Estudio de Riesgo de Arteriosclerosis en Comuuidades (ARIC) Segmento de la carotlda
Prlmera leetura % de Preva lencla de placas
Segunda lectura % de Prevalencla de placas
Kappa ponderado
Car6tida comun Bifurcad6n de la car6~da' Car6tida interna
5,0
6,0
0,47
21.2
19,5
7 ,7
0,60
7,3
0,69
'Veanse datos en la Tabla S.10. N61ese q~e este valor de kappa ponderado es lig eramente mayo< que el valo< no ponderado de 0,576 (vease tedo). Fuente: R li £II a/.• ReprodlJCibil ity of E><1racran iaf Carotid Atherosclerosis lesions Assessed by B-Mode UHrasound : The Atherosclerosis Risk in Commun itieS StLJCfy, Ulrrasound Moo BioI. Vof 22 , 791·799, ClI996.
valores de kappa entre los segmemos arteriales, los autores correctamente hicieron notar que ••el bajo va lor del coeficiente de kappa ponderado ... en la arteria car6tida comtin puede deberse parcialmente a la baja prevalencia de lesiones en este segmento»(li p"~. 7% .7')7) . (Por otro lado , aunque la prevalencia es casi tan baja en la car6tida interna como en la car6t ida comun. el va lor mas alto de kappa se encuentra en la primera, probablemente debido a que las imagenes reales de la car6t ida interna eran de mejor calidad que las de otros s ilios) . A pesar de estas limitaciones, kappa provee un estimado uti! del grado de concordancia entre dos observadores 0 pruebas eliminando el efecto que se espera que ocurra puramente por azar. 10 que explica su popularidad . Aun mas. bajo ciertas condiciones, y en pane debido a su dependencia de la prevalencia. kappa puede ser util como un fndice para predecir eI grado en que se atenua el odds ratio por errores de c1asificad6n no dife rendales( 7) : esto es, puede ut ilizarse para evaluar la validez del valor que alcance la medida de asoc iacion basada en datos obtenidos con un instrumento 0 prueba dados. En resumen, aunque claramente se trata de una medida uti! de fiabilidad para variables categoricas, kappa deberfa utilizarse e interpretarse con cautela. La mayorfa de los expertos estan de acuerdo en recomendar su uso conjunto con otras medidas de concordancia, tales como los indices de porcentajes de concordancia ya descritos . Cuando se utiliza , sin embargo, es importante tomar en considerad6n su variabilidad como una funcion de la prevalencia de la condid6n y del grado de similitud entre observadores con respecto a la prevalenda de posit ividadOU 3.4 1.47) .
8A.2. Indices de validez y fiabilidlld parll dlltos continuos Esta secd6n describe algunos de los metodos disponibles p..1ra aqu ilatar la validez 0 la fiabilidad de una medida continua dada . En la Tabla 8.3 se enumeran y se descnben brevemente los indices que se utilizan mas frecuentemente con ese fin . Como se aprecia allf, algunos de estos indices pueden utilizarse para evaluar la validez (por ejemplo, cuando medic iones de muestras de suero realizadas en deno laboratorio se comparan con medidones de las mismas muestras pero obtenidas en un laboratorio de referenda;
336
EPIDEM IOLOGiA lNTERM EDIA; CONCEPTOS Y APLICACIONES
vease Secci6n 8.3 .2), mientras que otras se milizan mas frecuemememe en est udios de fiabilidad (por ejemplo, para evaluar medidas repetidas de un paramctro continuo denlro de observadores, entre observadores 0 entre individuos; vease Secci6n 8.3.3). Los datos que se muestran en la Tabla 8.20 se utilizaran para ilustrar las medidas de fiabi lidad discutidas en esta secci6n . En esta tabla se exhiben datos parciales obtenidos durante un estudio de fiab ilidad de la evaluaci6n de resu ltados de la polisomnograffa (PSG) para el proyecto del Estudio de la Salud del Coraz6n y el Sucno (Sleep Heart Health Study, SHHS), est udio poblacional sobre las consecuencias cardiovasculares de des6rdenes respiratorios durante eI sueno (por ejemplo. la apnea del sueno)(4~ ) . En el SHHS, los registros del PSG obtenidos de 6 .440 pal1icipantes en seis centros se enviaron a un local central de lectura para clasificacion (estado del sueno y dlcu lo de Indices de des6rdenes respiratorios durante eI sueno). EI diseno y los resu ltados del estudio de fiab ilidad que se desarroll6 para eI SHHS fueron detalladamente descritos(49) e incluyeron ambos aspectos: la fiabilidad dentro y entre clasificadores de las variables relacionadas con los des6rdenes respiratorios durante e l sueno y el estadlo del sueno . Para los prop6sitos de este ejemplo, la Tabla 8.20 muestra s610 datos de dos medidas de des6rdenes respiratorios durante e l sueno (lndice apnea-hipoapnea, IAH, y el Indice de despertares, 10) para 30 registros de PSG que fueron lefdos por dos de los clasificadores (clasificadores A y 8 ) para evaluar la fiab ilidad entre clasificadores, aSI como 10 registros que fueron examinados dos veces por uno de los clasificadores (clasi ficador A) como parte del esmdio de fiabilidad dentro de clasificadores. Las medidas de validez y fiabilidad descritas en los parrafos sigu ientes son de dos tipos . EI primero consiste en Indices basados en la evaluad6n de la «correlac i6n» entre dos conjuntos de valores que se comparan (grafico de correlaci6n, coefidentes de correlaci6n) . EI segundo consiste en medidas basadas en la cOII/paracia/l emparejada de las dos medidas consideradas (d iferenda media, coefidente de variad6n y grafico de Bland-Altman).
Grafteo de eorrelaci6n (Diagrama de dispersion) La manera mas simple de comparar dos conj untos de observaciones consiste simplemente en situar en un sistema de ejes los valores para cada metodo y examinar c uidadosamente los patrones observados en el diagrama de dispersi6n. Por ejemplo. las Figuras 8 .8A y 8.88 m uestran la correlad6n entre los valores de IAH e 10 obtenidos por los evaluadores A y B. Las Figuras 8.8C y 8 .80 se corresponden con la fiabi lidad dentro de evaluadores: esto es, estos graficos muestran los valores de IAH e 10 resu ltantes de las 10 observadones rcpet idas realizadas por el evaluador A . Mues(ran que las observadones de IAH (Fig uras 8 .8A y 8.8C) estan fuertemente correladonadas (como se expresa por estar casi perfectamente superpuestas a las Iineas de 45 0 que se corresponden con el acuerdo perfecto) . Para el 10, aunque parece haber una correlacion. se observa una dispersion importante alrededor de las Ifneas ideales de 45 0 . ILas diagonales, 0 Iineas de identidad en la Figura 8.8 pasan a (raVeS del origen con una pendiente de 45 0 ; son equ ivalentes a Ifneas de regresi6n (vease Capitulo 7, Secci6n 7.4. 1) con intercepto = 0 y coeficiente de regresi6n = 1,0 unidad. 1 Aunque los graficos de correlad6n simple son uti les para dar una idea del grado de acuerdo entre dos med idas. no son tan sensibles como otras tecnicas graficas
337
AS EGURAMIENTO Y CONTROL DE LA CAUDA D
Tabla 8.20 Datos para un estudio de fiabilidad de la medicion de desardenes respiratorios durante el sueiio, variables obtenidas de un registro polisomnografico domestico fndice de despertaresl
Indice de Apnea-Hipoapnea' Evaiuador A Estudio N,"
2 3 4 5 6 7 8 9 10 11
12 13 14 15 16 17 18 19 20
"22 23 24 25 26 27 28 29 30
Primera medici6n
Segunda medici6n
1.25 1.61 5.64 0,0 12.51 22.13 2.68 2.19 8.52 0.33 0,00 2.70 3,03 3,49 1.12 4,94 9.52 27,90 5.58 6,59
0.99 1,57 5.60 0,32 11.84 21.64 1.77 2.18 8.67 0,16
Evaiuador B
Prlmera medlcl6n
Segunda medicl6n
7,08 18,60 20,39 16,39 27,95 29,57 13,50 24 ,50 14,63 11 ,15 19,52 18,91 17,98 15,78
7,65 23,72 39, 18 26,77 22,64 34,20 14,31 21,35 13,42 13,12
Evaluador B
8,15 20,36 36,62 18,3 1 17,56
8,56 19,91 25,17 22,68 17,2 1 27, 15 18,66 20,58 15,6 1 13, 10 19,05 18,59 10,78 12,64 7,04 10,75 20,61 34 ,90 20,84 24 ,28
1 ,:i
8,14
5.46 5,16 0.00 0,00 2.32 1,64 1.93 1,38 17,68 18,74 2.54 1,70 6,50 6,34 2.09 2,35 11.09 9,25 L Oenlro de evaluador J L ______ Entre evaluado· ________ J
17,30 16,39 29,29 18,80 10,92 12,53
19,38 22,68 65,09 18,75 20,97 13,38 43,92 18,02 23,25
I .U8
1,38 2,05 5,50
Evaluador A
0.00 11,03 21,34 2,39 2,04 8,64 0,16 0,00 2," 2.1 1 3,3
0.00
24 ,94
18,66 12,50 l Oenlro de evaluador.J L ______ Entre evaluadores. _______ J
Nora: los datos parciales fueron obtenido, como parte de un estudiD formal de fiabilidad en el Estudio de la Salud del Coraz6n y el Sueoo (Sleep Hearl Hea/rh Study, SHHS)I.....,. Estos datos. amablemente pmveioos por investigado ,es del SHHS. se presentan con pr0p6sitos didacHcos. los indices derivaoos de la validezlliabi lidad no deben interpretaroo como una rep,esen1aci6n precisa y completa de la fiabilidad de kls proced imientos de puntaje en el SHHS; para conocerla. kls iectores deben dirig i,se al iniorme orOg inall"l. 'EI indice de Apnea·Hipoapnea ; nume ,o promedio de episodios de apnea e hipoapnea PO ' ])oras de suel'io (apnea, cesaci6n del flujo de aire por 10 segu'ldos 0 mas; hipoapnea, disminuci6n en e i liujo de ai,e 0 excursi6n loracico-atxiominal '" 30% por 10 segundos 0 mas acom par'iada de una dism inuci6n '" 4% en la sa1uraci6n de o xigeno). I Indiee de desperta,es ; nume,o medio de veees que se produce una 1,ans ici6n del estado de sueoo al de vigilia duran1e cada hora de sueoo.
338
EPIDEMIOLOGiA lNTERMEDIA ; CONCEPTOS Y APLICACIONES
•
A IAH. entre evaluadores
10, entre evaluadores
30
70 •
25
50
m 20
0
~
• •> w ~
•
60
•
40 15
30
•• •
10
20 10
5 10 15 20 Evaluador A
25
O ~~-r~~--~~~
o
30
10
20
30 40 50 Evaluador A
60
70
C
o
IAH, Denlro de evaluadores (evaluador A) 25
10. Denim de evaluadores (evaluador A)
50 0
•
40
'" 30
• •• ••
.2
~
~
• ,
~
0
20
•
~
JI O ~~---r--~~--~
o
5
10
15
f'rimera medici6n
20
25
10 0 0
10
20
30
40
50
Primcrn mcdici6n
Figura 8.8. Diagrama de dispersion para los datos de fiabilidad entre y dcntro de evaluadorcs cOlltcllidos en la Tabla 8.10. A: valores de IAH entre evaluadores (evaluadores A y B): B: valores de ID entre evaluadores (evaluadores A y B): C: valores de IAH dentro de evaluadores para mediciones repetidas del evaluador A: 0 : valores de [D dentro de evalua-
dores para mediciones repetidas del evaluador A. Las [incas rectas diagonales en estos gnHicos representan las lfneas de identidad. esto es. rectas sobre las que estarfan los puntos si el acuerdo fuese perfecto. IAH e 10 se expresan como los nlimeros medios de episodios por hora de sueiio. alternativas (vease grMico de Bland-A ltman mas adelante) para la detecci6n de algunos patrones en los datos.
Coeficiente de Correlaci6n Lineal, Co"elacioll de Rallgos, Regresioll Lilleal EI coeficiente de correlaci6n de Pearson (usualmente denotado por r) es una medida del grado en que un conj unto de puntos en un diagrama de dispersion se acerca a la situaci6n en la cHal (odos estan exactamente sobre una linea recta(l950) . El recorrido de posibles valores de,. va desde - I (cHando hay una correlaci6n nega!iva perfecta entre los dos observadores) a I (cHando hay una corre laci6n positiva perfecta). Mientras mas cerca de 0 esten los valores de ,.. mas debil es la correlaci6n (sea nega!iva 0 posi{iva) entre dos conjuntos de valores . Por ejemplo, los valores de r para los d iagramas de d ispersi6n en la Figura 8.8 son :
339
AS EGURAMIENTO Y CONTROL DE LA CAUDA D
IAH: Entre evaluador (A), n = 30:r = 0,995 Oentro de evaluador (C), n = 10:r = 0,999 10: Entre evaluador (B), n = 30:r = 0,655 Oentro de evaluador (0), n = lO:r = 0,710 EI dlcu lo del coeficiente de correlaci6n de Pearson es bastante senci llo y puede hacerse con la mayorfa de los paquetes estadisticos e, incluso, con la mayorfa de las calculadoras de bolsillo que incluyen funciones avanzadas. Aunque la r de Pearson es probablemente una de las medidas de acuerdo para variables cuantitativas mas ut ilizadas en la literatura medica (en ambos tipos de estudios, de validez y de fiabilidad) tambien es una de las menos apropiadas(SI .S4). Sus principales limitaciones pueden resumirse como sigue . Primero, la r de Pearson es un indice de asociaci6n lineal, pero no necesariamenIe una buena medida de concordancia. No es sensible a di ferencias sistematicas (sesgos) entre dos observadores, como se ilustra en la Figura 8.9. Los valores de los coeficientes de correlaci6n (r = 1,0) en esta fi g ura indican corre laci6n lineal perfecta entre los dos observadores en los tres paneles . Sin embargo, la concordancia perfecta de valo res ocurre solo en la Figura 8.9A, en la cual todas las observaciones estan sobre la linea de identidad (es decir, para cada par de observaciones, el valor de l observador 8 = valor del observador A). En la Fig ura 8.98 los puntos estan sobre una Ifnea recta perfecta pero la pend iente de la Ifnea es diferente de 1,0: esto es, comparado con e l observador A, el observador 8 tiende a leer los valores mas altos a niveles mas bajos. La situaci6n que se il ustra en la Figura 8.9C tambien muestra una fa lta de concordancia debido a observaciones sistematicas de l observador 8 a niveles mas altos a 10 largo de todo e l recorrido de valo res (10 que resu lta en una linea de regresi6n con un intercepto diferente de cero). La ultima silUaci6n (Figura 8.9C) es particu larmente posible en presencia de diferencias sistematicas entre lectores, cambios en el tiempo en la capacidad del lector para aplicar los criterios del estud io, uso de reactivos vencidos en ciertas tecnicas de laboratorio. y aSI sucesivamente . En estas situaciones, e l uso exclusivo de la r de Pearson puede provocar una evaluaci6n incorrecta de la concordancia. Un ejemplo de la vida real relacionado con datos del LRC (veanse Tabla.>; 8.6 y 8.7) en el c ual eI coeficiente de correlaci6n de Pearson entre IMC «comunicado por los propios part iA
B r"I,O
r '" 1.0
m
j
n
o
• Observador A
• ."
C r ::: 1.0
• ".
Observador A
••
•
.
•"
• •"
Observador A
Figura 8.9. Los cocficientes de corrdacion son igualmente a ltos cua ndo am bos obser vadores !ce n el mismo valor (A) que cua ndo hay una diferencia sistematica e nt re los o bscr vado res pero las lecturas va r ian simulta neamente (8 y C)
340
EPIDEM IOLOGiA lNTERMEDIA; CONCEPTOS Y APLICACIONES
cipantes» y «basado en medic i6n objet iva>, fue de 0,96 . Olros est udios han mostrado correlaciones fuertes similares entre e~tos enfoq ucs para medir IMe, 10 q ue ha llevado a algunos autores a cond uir que «los pesos comunicados por los propios partic ipames eran extraord inariamente exactos a traves de estas variables .. . y puede obviarse la medici6n real del peso en investigaciones epidemioI6gicas»(SS). Sin embargo, es!a concl usion puede ser eq uivocada, porque aun cuando 1a correlaci6n sea alta, existe lIna tcndencia sistematica de los ind ividuos a subest imar sus pesos (usualmcnIe concomitante con lIna sobreestimaci6n de sus tallas). Como resu ltado, en la Tabla 8.6 hay un mayor numero de individuos por arriba (y a la derecha) de la diagonal de concordancia perfecta que por debajo de esta. De aqu i se obt iene que si ellMC basado en infonnaci6n dada por el propio ind ividuo se empleara para definir variables categ6ricas para obesidad 0 peso relativo, este error sistematico resu ltara en una concordancia menos que perfecta (y, por tanto, en errores de clasificacion), como indican los valores de sensibil idad y de kaplJa calculados de los datos del estudio de LRC en la Tabla 8.6. Seg undo , el valor de r es muy sensible al recorrido de valores . La influencia de l recorrido de valores sobre la r de Pearson se il ustra en las Fi guras 8. IOA y 8.108 . En este ejemplo hipotetico, ambos lcctores se suponen similannente fi ables . Pero, debido a que los valores muestrales tienen una distribucion mas amplia en la Figura 8.108 que en la Figura 8. IOA, los coeficientes de correlaci6n seran mas altos en la pri mera. Esto tambien puede ilustrarse ut il izando los datos reales de la Figura 8.88 . Como se menc iono antes, la r de Pearson para el conjunto total de 30 observaciones repet idas de 10 por los evaluadores A y B fue de 0,655 . Sin embargo, si este conjunto sc divide en dos subconjuntos, uno que incluye los estudios en los cuales el evaluador B lee valores de 10 < 15 (n = 8) y otro en el cual el evaluador B lee los valores de ID > 15 (n = 22). los coeticientes de correlacion estimados son: 0.59 y 0,5 I , respectivamente: Esto es, ambos coeficientes son menores que el r basado en el conjunto completo de tres observaciones, 10 que int uitivamente no tiene mucho scnlido . Como corolario de esta dependencia del recorrido de valores, el coeficiente de correlaci6n de Pearson es indebidamente sensible a valores extremos (los IIamados olllliers, en ing les). Por ejemplo, la Figura 8.IOC es una repetic ion de la Figu ra 8.1 08 pero con una observacion adicional con un valor extremo; este valor «aberrante» tiene una enonne influencia en la defin ici6n de la linea de regresion y del valor del coefic iente de correlacion, que aumenta de 0,8 en la Figura 8.I OB a 0,95 en la Figura 8.1 0-C. A pesar de sus propiedades indeseables, el coeficiente de correlaci6n de Pearson se utiliza a men udo como la princi pal, y a veces como la unica, medida de fi abilidad consignada en est udios biomedicos 0 epidem iol6gicos. Esto puede tener que ver con la trad ici6n, el reconocimiento de patrones y la imitaci6n (<
341
AS EGURAMIENTO Y CONTROL DE LA CAUDA D
A
B r:o 0.6
r '" 0.4
C r '= 0,95
m
m
m
0 ~
0 ~
~
• 0
~ 0 0
.. .. • •••• ••• ~
•••• • .-.:•..... •• • •
Observador A
~
0
0
•
0
0
•••• •
ObservadOf A
•••• • .-.:•..... •• • • 0
~ 0 0
•••••
Observador A
Figura 8.10. EI coeficiente de corrclacion de Pearson es muy sensible al recorrido de valores y la presencia de valores extremos. Ejemplos hipotcticos
estan exactamente en orden inverso. y un valor de 0 cuando no hay correlaci6n entre el orden de los dos conjuntos de valores emparejados . Por ejemplo, los valores de r, para los diagramas de dispersi6n de la Figura 8.8 son 0,984 (IAH, entre), 0,58 (10 entre), 0,976 (IAH, dentro) y 0,757 (10, dentro), Aunque mas congruente con el objelivo de evaluar la consistencia de los rangos y menos dependiente de valores aberrantes, el coeficiente de correlacion de Spearman no resuelve la olra lim itaci6n del r de Pearson ya disc utida: su insensibilidad a la falta de concordancia debido a diferencias sistematicas en los valores entre observadores . Final mente, debido a su aparici6n re lativamente frecuente en la literatura biomedica, merece atencion el uso de las pruebas de sign ificacion estadfstica para evaluar el coeficiente de correlacion (de Pearson 0 de Spearman) en el contexto de los estudios de validez y fiab ilidad, EI dlculo de un valor de P para un coeficiente de correlaci6n (es decir, e\'aluar la hip6tesis nul a Ho: r = 0,0) no es ut il en este contexto por razones tanto teoricas como practicas: I) la hip6tesis nula de que no hay re/acion ente dos pruebas (0 entre dos observadores) que miden supuestamente la misma variable 0 constructo, es il6gica . Demostrar que puede ser rechazada no es muy informativo; 2) aun cuando la fiabilidad sea bast ante pobre (por ejemplo, r s 0,3 0 0,4), el valor correspondiente de P puede ser «sign ificalivo» si el tamafio de muestra es razonablemente grande . Por tanto, un valor de P altamente sign ificativo puede imerpretarse err6neamente como evidencia de «alta fiab ilidad>, c uando de hecho su unica interpretacion es que es casi seg uro que se rechazarala hip6tesis nula (sin sentido de cualquier manera), Se ha propuesto como una alternativa y como un enfoque mas (itWSlj que 10 que se ponga a prueba sea la hip6tesis de correlaci6n virt ualmente perfecta (por ejemplo, Ho: r = 0,95), Otra alternativa 16gica , mejor que el usar el valor P asoc iado, es calcular los Ifmites de confianza para el coefici ente de correlacion, La disc usi6n precedente sugiere que el coeficiente de correlacion debe uti lizarse juiciosamente, Mas especfficamente , su interpretacion se mejora sensiblemente con la consideracion de posibles diferencias sistemat icas entre las mediciones, EI uso de un diagrama de dispersi6n ayuda a detectar estas diferencias sistematicas, la presencia de datos aberrantes y diferencias entre variables con respecto al recorrido de sus valores . A continuaci6n se disc uten otros fndices de fiabilidad que evilan algunas de las desventajas inherentes a la r de Pearson .
342
EPIDEMIOLOGiA lNTERMEDIA; CONCEPTOS Y APLICACIONES
Una aitcrnat iva a la r de Pearson es fa regresi6n lineal, q ue provee una medida de la pendiente y del intercepto de la fllnd6n de regresion (vease Capitulo 7, Secci6n 7.4 .1), Y permite por tanto la evaluaci6n de sil uaciones tales como las ilustradas en 1a Figura 8.9, en la ellal el intercepto no es nu lo 0 en la ellal existe una diferencia sistematica entre observadores . La reg resi6n lineal, sin embargo, no esla libre de problemas cuando se utiliza para analizar datos de fiabilidad: uno imponante, por ejemplo, es q ue no contempla el hecho de que los errores de medici6n ocurren en este caso para ambas variables, la dependiente y la independiente(SI). lEn la regresion lineal ordinal, 1a lIamarla vanahle «inrlepenrl ienre» , x , se ~lJ r(me lihre cie error, y ~o lo se consiclenm los errores (variabi lidad estadistica) en la variable «dependieme» ; vease Capitulo 7, Secci6n 7.4 .11 . La regresion lineal es mas utH para prop6silOs de «calibraci6n» q ue para evaluar fiabilidad: esto es, es mas util para predecir resu ltados u obtener valores «corregidos» una vez q ue una d iferenda sistematica se identifica y se c uant ifica .
Coeficiente de correlacion illlerclase EI coeficiente de correlacion intercla~e (CCI) 0 coeficiente de fiab ilidad (R) es un estimado de la fraccion de la variabilidad total que se debe a la variacion entre ind ivid uosObj.t) . Idealmente, un estudio epidemiol6g ico debe ria utilizar procedim ientos altamente estandarizados y mCiodos de recolecci6n de datos certificadamente validos y fiab les. Bajo estas circunstancias optimas la mayor parte de la variabilidad puede alribuirse a dife rencias entre los participantes en el estudio (variabilidad entre ind ividuos) (vease Seccion 8.3.3) . La formu la general del CCI es por tanto:
Vb Vb = --;-;-'~ V, Vb + V. En ella Vb = varianza entre individuos, V, = varianza total, que incluye a ambas (Vb y V.) y V, = varianza no deseada «
CCI = -
343
ASEGURAMIENTO Y CONTROL DE LA CAUDAD
ficiente de fiabilidad bajo resu ltante de una pequena variabilidad de los niveles de exposicion puede influir negat ivaJrente sobre la potencia de un estudio epidemiologico y dificultar, por tanto, la evaluaci6n de una asoc iacion . Obviamente, CCI tambien sera bajo cuando exista una variabilidad intraindividual sustancial del factor de interes, como en el caso de niveles honnonales gonadales en mujeres pre-menopausicas . EI CCI puede calcu larse a partir de una tabla de Analisis de Varianza (ANOVA), aunque se ha propuesto una f6rmu la mas simple, basada en las desviaciones estandar de los dos conjuntos de observaciones y la suma y desviacion estandar de las diferencias emparejadas(S-I) (vease Apendice E). Por ejemplo. aplicando esta f6rm ula , el CCI para los datos del estud io de fiabilidad entre lectores incluidos en la Tabla 8.20 puede estimarse como 0,99 para IAH y como 0,58 para el lO. Como ocurre con kappa, e l CC I tambien puede extenderse al dlculo de la fiabi lidad entre mas de dos observadores . Por ejemplo. en e l estudio real (completo) de fi abilidad de la escala del sueno en el SHHS (Sleep Heart Health Studyy~9) , e l CCI comun icado para los tres evaluadores fue de 0,99 para ellAH y 0,54 para e llO. Como ejemplo adic ional, la Tabla 8.2 1 muestra e l CCI para tres medidas de Ifpidos en una muestra del examen inicial del Estud io de Riesgo de Arterioesclerosis en Comunidades (Atherosclerosis Risk in Communities , ARI C)(23). EI alto CCI obtenido para e l colesterol total y la HDL-colesterol total en este est udio sug iere que la proporci6n de la varianza debida a la variabilidad dentro de individuos 0 a problemas dellaboratorio para estos analitos es pequena; por otro lado, se encontr6 que e l CCI para una fracci6n de HDL (HDL2) era mucho menOL
Diferellcia media y prueba t pareada El promedio de las dife rencias entre los dos valores de los pares de observaciones es una medida del grado de diferencias sisfell/(itica.~· entre los dos conjuntos de lect uras. Una pmeba con el estadfstico: f pareada' puede realizarse para calcular la signifi cacion estadfstica de la diferencia obten ida . Tabla 8.21 Cocficicntcs dc oorrclacion intcrdasc (CCI) y eocficientcs dc va riacion (CV) para analitos sclcccionados cn cl Estudio dc Ricsgo dc Artcriosclerosis cn Comunidadcs (ARIC) Anatlto
CCI
CV(%)"
Cole sterol total Cole sterol HDL HDL2
0,94 0,94 0,77
5,1 6,8 24,8
• Incluye la variabilklad dentro de indivkluos y la dellabo ratorio. Fuen!e: LE Chambless e! al., Short-Term Irtraindivklual in Lipoprotein Measu rements: The Atheroscle rosis Risk in Commun~ies (AR IC) Study, American Joumal 01 Epidemiology, Vol 136. 1069'1081 , 1992, The Johns Hopkins Univers~y Schoo l 01 Hygiene & Pubi;c Health
• Una prucba r parcada puede calcularse simplemente dividiendo el valor medio de todas las difc rcncias emparejadas por su error csloindar (cs decir.la dcsviaci6n estandar sobre la rdlz cuadrdda del lamano de la muestrd): prucha I =
.l,_, s,_'/\fn
344
EPIDEM IOLOGiA lNTERMEDIA; CONCEPTOS Y APLICACIONES
Este Indice se utiliza tfpicamente para evaluar validez, ya que constituye un estimado directo del grado de se.~'80 para uno de los conjuntos de medidas cuando se justifica utilizar el otro conjun to como estandar de oro. Por otro iado, puede (ambitn utilizarse en el contexto de estudios de fiabilidad emparejada , como cuando se evaluan las diferencias sistematicas entre lectores de una prucba. Por ejemplo. para el estudio de fiabilidad entre evaluadores de la Tabla 8.20, la diferencia media entre las primeras observadones hechas por el evaluador A y eI evaluador B fue 0,367 (DS = 0,703) para IAH y -3,327 (DS = 8,66 1) p..1fa ID. Aunque SlI magnitud es bastante pequcfia, particulannente para el IAH, ambas diferencias son estadfsticamente significativas al nivel convencional (P < 0,05),10 que sugiere la existenda de una variabilidad sistematica entre evaluadores . En el infonne de Whitney et al.(49), este fndice se utiliz6 para evaluar fiabilidad dentm de evaluadores. Oeberfa tenerse precaud6n c uando se utiliza la diferencia media como una medida de validez 0 fiabilidad sin un examen cuidadoso de los datos (por ejemplo, mirar un diagrama de dispersion 0 un graftco de Bland-Altman; ver mas adelante), ya que su magnitud puede depender fuertemente de valores extremos.
Coeficiente de variabilidad
Otro Indice de fiabilidad a menudo empleado en estudios epidemiol6gicos es el Coefidente de Variabilidad (CV), que es la desviadon estandar ex presada como porcentaje del valor medio de dos conjuntos de observaciones emparejadas. En un analisis de datos de ftabilidad se calcula para cada par de observaciones y luego se promedia para todos los pares de las medidas originales y replicadas. Su est imaci6n es muy sencilla. La varianza de cada par de medic iones es:
,
V; = I (x;j _ X;)2 j - I
en la c ual i es un par dado de medidas repetidas (indexadas por i) en la misma muestra 0 individuo, Xi! y X;2 son los va lore~ de estas dos medidas y Xi es su media. La desviacion estandar (OS) para cada par de observaciones es la rafz c uadrada de Vi de manera que para cada par de medidas, el CV (ex presado como porcentaje) es: OS ; CV;= -_- x 100
x,
Por ejemplo , para el ultimo par (el n.o 30) de lectu ras entre evaluadores de IAH en la Tabla 8.20 ( II ,09 Y 925, media 10, 17) este calculo es como sigue: VJ() = ( 11.09 - 10, 17)2 + (9,25 - 10,17)2 = 1,693
de modo que el coefici ente de variabilidad resu ltante para esc par, CV.lO=
Y I,693 x 100= 12,8% 10,17
Este calculo tendrla que repetirse para todos los pares de medidas y el coeficiente de variaci6n global serfa el promedio de todos los CV de los pares. Mientras mas
AS EGURAMIENTO Y CONTROL DE LA CAUDA D
345
pequeno sea el CV, menor variaci6n habra entre las medidas replicadas . Obviamente, si no hubiera diferencia alguna entre los valores emparejados (concordancia perfecta), el valor del CV serfa cero. Por ejemplo, los valores del CV global entre evaluadores para las 30 observac iones emparejadas de la Tabla 8.20 son 10,1 % para el IAH y 22,8% para el 10. Ademas de los eCI previamente discutidos, la Tabla 8.2 1 muestra los CV para el colesterol serico total, eI HOL colesterol y el HOL 2 en el estudio de fiab ilidad de cohorte AR ion). Consistentemente con los CCI, los CV son bastante bajos para el colesterol total y para el HOL total, pero altos para la fracci6n HO ~, 10 que indica una imprecision sustandal en la med ici6n de esta ulti ma fraccion .
GraJieo de Blalld·Altmall
Esta es una tecnica grafica muy uti l que complementa eficientemente al diagrama de dispersi6n comun (vease explicaci6n anterior) para el examen de los patrones de disc repancia entre medidas repetidas (0 entre una medida dada y la «pmeba de oro») . No es mas que un grafico de dispersion donde la diferencia entre las medidas emparejadas (A· B en la ordenada) se asocia con su valor medio L(A+B)I2, en la abscisaJ . A partir de este grafico es mas fac il que en un diagrama de dispersi6n corriente, evaluar la magnitud de discrepancia (incluyendo diferencias sistematicas), detectar valores ex tremos y observar si ex iste alguna tendencia(SI.S2). Por ejemplo, las Figuras 8.II A y 8.1 1B muestran los graficos de Bland·A ltman para las medidas entre evaluadores de los datos de IA H e 10 de la Tabla 8.20. N6tese que, comparados con los diagramas de dispersion correspondientes (Figu ras 8.8 A Y 8.8B), estos cuadros revelan mas claramente algunos patrones interesantes de los datos: • Hay una ligera diferencia sistematica entre las dos medidas, representada por la desviaci6n de cero de la Ifnea horizontal que se corresponde con la di ferencia media. • Pueden estar presentes valores aberrantes: en la Figura 8. 11 hay una med ida con media IA H mayor que 25 y una con media ID mayor que 40, claramente fuera del recorrido de la diferencia media ± 20S . • Los graficos proveen una idea mas clara de la magnitud de la discrepancia en comparacion con la medida real. En la Figura 8.11 A, por ejemplo, todas menos una (0 quizas dos 0 tres) de las dife rencias medias de IAH estan dentro del recorrido (media ± 20S), que se extiende aproximadamente tres unidades de IAH: el ultimo es un valor relativamente pequeno en el recorrido de los valores de IAH en la absc isa . En contraste, el recorrido (diferencia media ± 20S) para el 10 (Figura 8.11 B), a la vez que contiene todas las observaciones excepto una, se ex tiende casi 35 unidades de 10, que es practicamente el recorrido completo de los valores de 10 observados en estos individuos. • EI grafico de IAH en la Figura 8. II A sugiere que la discrepancia entre evaluadores aumenta a med ida que crece el valor real deliA H. Sin embargo, este patron no es evidente para ei lO (Figura 8,I IB). N6tese que si se utiliza este enfoque grafico cuando una de las medidas puede considerarse la «prueba de oro», uno podrfa estar inclinado a representar esta ultima en la abscisa en lugar de ubicar alii la media de ambas medidas. En este caso, la des-
346
EPIDEM IOLOGiA lNTERMEDIA; CONCEPTOS Y APLICACIONES
A
B 10
IAH
•
3
-. ,. • • .-••- . • •
•
I '~ 2 ~. .~
~.
.
g~ -0
0
~
E-l 0. ~
"
•
+2D5
••
. .••.
20
Cl '~
-
.~
~.
10 0
Media
.-g~
- 2D5
~E 0 . - 30
-0 ~
-2
0 5 10 15 20 25 30 Media de IAH denlro de las parejas
- 10 - 20
-<0
+2D5
• • • • ..~. • • •••
.
Media
- 2D5
• 0 10 20 30 40 50 Media de 10 dentro de las parejas
Figura 8.11. Graficos de Bland-Altman para los IAH y los ID pa ra los estudios de fi abiIida d cntre cvaluadorcs de la Tabla 8.20. Las [fncas horizontales representan la diferencia media denlro de pares (0.367 y -3.327. para IAH e ID . respectivamente) y la media ± 2 desviaciones estandar (I OS = 0.703 para IAH y 8.661 para JD). Los IAH Y los ID se expresan como el mlmero medio de episodios por hora de sueiio.
viaci6n vertical respecto al cero representara. 1a magn itud del sesgo del valor examinado con respecto al valor de la prueba de oro.
85. REGRESION A LA MEDIA El fenomeno conociflo como n'gr(',~in" n In IIwrlin aparece en m llcho~ fie los prohlemas y enfoques anaifticos descritos en las secciones previas y merece una breve discusi6n. Este es un fenomeno bien conocido, ampliamente discutido por Oldham en I962{Sej) , que expresa la tendencia de los valores altos de las variables continua<; (por ejemplo, presion arterial) medidos en cualq uier momento, a descender, y de los valores bajos a aumentar, cuando se hacen medida<; repet idas. Esta tendencia puede ser un efecto de la variabilidad intraindividual (como se ilustra en la Figura 8.2) 0 de errores de medicion aleatorios. Como ejemplo. cuando se repiten medic iones de los niveles de tension arterial en un grupo de individllOS, muchos valores convergen (regre.wm) hacia la media. Un corolario de este hecho es que se ha de actuar con cautela cuando se analizan datos con medidas repelidas en eI tiempo y cuando se analizan datos de correlaci6n con valores ba<;ales(S7). En adici6n , la regresion a la media subraya la conveniencia de ut ilizar la media de medidas repetida<; mejor q ue la<; medida<; simples para parametros fis iol6gicos que flucul an (como es e l caso de la tension arterial, entre otros muchos ejemplos) . Esto es particularmente importante en los est udios en los q ue se utiliza un punto de corte como criterio de inclusion en e l estudio, tal como e l punto de corte para diagnosticar hipertension en algunos ensayos clfnicos. Muchos individuos seleccionables sobre 1a base de una medida no serfan inclu idos si se IItilizara la media de mediciones repetidas de la tensi6n arterial sistolica en lugar de una sola medida . L1 regresion a la media tambien puede oc llrrir en otras situaciones, como en un est udio de ca<;os y controles en eI cuallos casas son individuos cla<;ificados como hipertensos y los controles son los clasificados como nonnotensas . 5i la clasificacion de casas y controles se basa en una sola medida de la presi6n arterial para cada individuo, los
ASEGURAMIENTO Y CONTROL DE LA CAUDAD
347
errores de clasificaci6n debidos al fen6meno de regresi6n a la media pueden provocar ei llamado se.~'80 de diluci6n I'or regresi6n (vease Capit ulo 4, Secci6n 4.3.3).
BlBLiOGRAFIA I. Kahn HA. Sempos CT. Slalislicalmelhoils in epidemiology. New York. Oxford University Press. 1989. 2. Whitney CWo Lind BK. Wahl PW. Quality assurance and quality control in longitudinal studies. Epidemiol Rev 1998: 20: 71-80. 3. ARIC Investigators. The Atherosclerosis Risk in Communities (ARIC) study: design and objectives. Am J Epidemiol 1989: 129: 687-702. 4. Prineas RJ . Crow RS. Blackbum H. Th e Minnesola Code Manual of eleclrowrdiograp. hii-' findings. Littleton. 10hn Wrig ht PSG. 1982. 5. White AD. Folsom AR. Chambless LE e/ al. Community survei llance of coronary heart disease in the Atherosclerosis Ri.ik in Communities (ARIC) study: methods and initial two years' experience. J Clin Epidemiol 1996: 49: 223-233. 6. Sudman S, Bradburn NM. Asking queslions. San Francisco . l ossey-Bass Publishers. 1982. 7. Converse 1M, Presser S. SlIrl'ey liues/iom: Handcrafting Ihe Standardized Questionnai. re. Newbury Park, Calif: Sage Publications, 1986. 8. Rose GA. Chest pain questionnaire. Milbank Mem Fllnd Q 1965: 43: 32-39. 9. Comstock GW. Tockman MS. Helsing KJ et al. Standardized respiratory questionnaires: comparison of the old with the new. Am Rev Respir Dis 1979: 119: 45-53. 10. Burt VL. Culter JA. Higgins M el al. Trends in the prevalence, awareness. treatment. and control of hypertension in the adult US population: data from the health examination surveys. 1960 to 1991. Hypertension 1995: 26: 60-69. II. Block G. Hartman AM. Dresser eM et al. A data· based approach to diet questionnaire design and testing. Am J Epidemiol1986: 124: 453-469. 12. Willett WC. Sampson L . Stampfer Ml et al. Reproducibility and validity of a semiquantitative food frequency questionnaire. Am J Epidemiol 1985: 122: 51-65. 13. Dickersin K. Berlin lA. Meta-analysis: state·of-the-science. Epidemiol ReI' 1992: 14: 154- 176. 14. Gordis L. Epidemiology. Philadelphia, WB Saunders, 1996. 15. Lippel K. Ahmed S. Albers JJ e / al. External quality-control of cholesterol analyses perfonned by 12 lipid research clinics. Clin Chem 1978: 24: 1477- 1484. 16. Burke GL. Sprafka 1M . Folsom AR el al. Trends in serum cholesterol levels from 1980 to 1987: the Minnesota Heart Survey. New Engl J Med 1991 :324:941-946. 17. Brinton LA . Hoover RN . Szklo M et al. Menopausal estrogen use and risk of breast cancer. Cancer 1981: 47: 2517-2522. 18. Vargas CM. Burt VL . Gillum RF. Pamuk ER . Validity of self-reported hypertension in the National Health and Nutrition Survey 1Il. 1988·91. Prel' Med 1997: 26: 678-685. 19. Nieto-Garda FJ . Bush TL , Keyl PM. Body mass definitions of obesity: sensitivity and specificity using self-reported weight and height. Epidemiology 1990: I: 146-152. 20. Copeland KT, Checkoway H. McMichae l AJ e / al. Bias due to misclassification in the t:slimaliulL uf rdalivt: ri s k. Am J E"idemiul 1977 : 105: 488-495. 21. Block G. A review of validation of dietary assessment methods. Am J Epidemiol 1982: 115: 492-505. 22. Martin- Moreno 1M. Boyle P. Gorgojo L. Maisonneuve P. Fernandez-Rodriguez JC . Salvini S. Willett We. Development and validation of a food frequency questionnaire in Spain. Int J Epidemiol 1993: 22: 5 12-519.
348
EPIDEMIOLOGiA lNTERMEDIA ; CONCEPTOS Y APLICACIONES
23. Chambless LE. McMahon RP. Brown SA. Patsch W. Heiss G, Shell Y-L. Short-tenn intraindividual variability in lipoprotein measurements: the Atherosclerosis Risk in Communities (ARIC) study. Alii J Epidemio/ 1992: 136: 1069-1081. 24. Colditz G A, Willet We. Stampfer ML Sampson L . Rosner B. Hennekens CH, Speizer FE . The influence of age. relative weight. smoking, and alcohol intake on the reproducibility of a dietary questionnaire. 111/ J Epidell/iv/ 1987: 16: 392-398. 25. Sackett DL. C/iniw/ epidemiology: A muic scienu for ciiniml medicine. Boston. Little. 8 rown.I991. 26. Fletcher RH . Fletcher SW. Wagner EH. Cliniml epidemiology: The e.uel1lia/.t. 2.' ed. Baltimore, Williams & Wilkins, 1988.
27. Ransohoff OF. Feinstein AR . Problems of spectrum and bias in evaluating the efficacy of diagnostic tests. N Engl J Med 1978: 299: 926-930. 28. Brenner H. Gefeller O. Variation of sensitivity. specificity. likelihood ratios and predictive values with disease prevalence. Sial Med 1997: 16: 981-991 . 29. Fikree FF, Gray RH . Shah F, Can men be trusted? A comparison of pregnancy histories reported by husbands and wives. Am } Epidemio/1993: 138: 237-242. 30. Youden WJ. lndex for rating diagnostic tests. Canar 1950: 3: 32-35. 31. Li R. Cai J . Tegeler C el al. Reproducibility of extracranial carotid atherosclerosis lesions assessed by B-mode ultrasound: the Atherosclerosis Risk in Communities study. Ullrasollnd Med 8io11996: 22: 791-799. 32. van der Kooy K. Rookus MA. Peterse HL. van Leeuwen FE. p53 protein overexpression in relation to risk factors for breast canceL Am J Epidemio/ 1996: 144: 924-933. 33. Cicchetti OV. Feinstein AR . High agreement but low kappa: II. Resolving the paradoxes. J Clin Epidemiol 1990: 43: 551-558. 34. Chamberlain 1. Ginks S, Rogers P e/ al. Validity of clinical examinations in mammography as screening tests for breast canceL Lance11975: 2: 1026-1030. 35. Cohen JA. A coefficient of agreement for nominal scales. Edllc Psychol Meas 1960: 20: 37-46. 36. Fleiss JL. SlalislicallllelllOdsfor rales and proportions. 2: ed. New York, John Wiley and Sons. 1981. 37. Thompson WO, Walter SO. A reappraisal of the kappa coefficient. J Clin Epidemiol 1988: 41: 949-958. 38. Landis JR, Koch GG . TIle measurement of observer agreement for categorical data. 8iometrics 1977: 33: 159-174. 39. Altman 00 . Praclical slalislics for medical researd1. London. Chapman and Hall: 1991. 40. Byrt T. How good is agreement. Epidemiology 1996: 7: 561. 41. Siegel OG. Podgor MJ , Remaley NA. Acceptable values of kappa for comparison of two groups. Am J Epic/emiol. 1992: 135:571 -578. 42. Klebanoff MA. Levine RJ , Clemens JO el al. Serum cotinine concentration and reported smoking among pregnant women. Am J Epidemiol 1998: 148: 259-262. 43. Ferrer M , Lamarca R. Orfila F, Alonso J . Comparison of perfonnance-based and selfrated functional capacity in Spanish elderly. Alii J Epidemiol 1999: 149: 228-235. 44. Stieb OM , Beveridge RC, Rowe BH ('I al. Assessing diagnostic classification in an emergency department: implications for daily time series studies of air pollution. Am J EpidelIIio11998: 148: 666-670. 45. Maclure M, Willett WC. Misinterpretation and misuse of the kappa statistic. Alii J EpidelII;uI1987: 26: 161-169.
46. Feinstein AR, Cicchetti OY. High agreement but low kappa: I. The problems of two paradoxes. J Clin Epidemiol 1990: 43: 543-549. 47. Byrt T. Bishop J . Carlin lB . Bias, prevalence and kappa. J Clin Epidemio/1993: 46: 423-429. 48. Q uan SF, Howard BY, lber C el al. TIle Sleep Heart Health Study: design, rationale and
ASEGURAMIENTO Y CONTROL DE LA CAUDAD
349
methods. Sleep 1997: 20: 1077-1085. 49. Whitney CWo Gottlieb D1. Redline S et al. Reliability of scoring disturbance indices and sleep staging. Sleep 1998: 21: 749-757. 50. Amlitage P. Berry G. Statistical methods in medical research. 3.' ed. London: Blackwell. 1994. 51. Altman DG. Bland 1M. Measurement in medicine: the analysis of method comparison studies. Statistician 1983: 32: 307-3 17. 52. Bland JM. Altman DG. Statistical methods for assessing agreement between two methCKis of clinical measurement. umcel 1986: I: 307-310. 53. Hebert JR. Miller DR. The inappropriateness of conventional use of the correlation coef_ ficient in assessing validity and reliability of dietary assessment methods. Ellr J EpidelI1io11991: 7: 339-343. 54. Deyo RA, Diehr P, Patrick DL. Reproducibility and responsiveness of health statistics measures: statistics and strategies for evaluation. Controlled Clin Trials 1991: 12: 142S-158S. 55. Sakkinen PA. Macy EM. Callas Pel al. Analytical and biologic variability in measures of hemostasis. fibrinolysis. and inflammation: assessment and implications for epidemiology. Am J Epidell1iol 1999: 149: 261- 267. 56. Oldham PE. A note on the analysis of repeated measurements of the same subjects. J Chron Dis 1962: 15: 969-977. 57. Nieto-Garda FJ . Edwards LA. On the spurious correlation between changes in blood pressure and initial values. J Clin Epidell1iol 1990: 43: 727-728.
PARTE
V
COMUNICACION DE RESULTADOS
CAPITULO 9 La comunicacion de los resultados de la investigacion epidemiologica
9.1. INTRODUCCION La comunicaci6n oral y escrita de los resultados de la investigaci6n no solo suele estar llena de jerga especializada sino que a menudo se caracteriza por errores sistcmaticos que podrfan clasificarse propiamente como sesgos. EI presente capftu lo revisa algunos conceptos y enfoques basicos relevantes para la comunicaci6n de resu ltados epidemio16gicos y d iscute errores comunes que se cometen cuanda se comunican resu ltados empfricos. Aunque algunos de estos crrores pueden depender de fallas cometidas durante el disefio y la conducci6n del estudio y son, por tamo, difkiles, si no imposibles, de rectificar, muchos pueden prevenirse durante la preparaci6n de la comunicaci6n de los resu ltados. Este capitulo no esta concebido para hacer prescripciones sino mas b ien para discutir algunos aspectos que vale la pena {ener en c uenta cuando se prepara un infonne sobre hallazgos epidemiol6gicos.
9.2. QUE COMUN ICAR A pesar de la flexibilidad necesaria en el estilo y el contenido de los infonnes acerca de estudios epidemiol6gicos, el Esquema 9. 1 resume algunos de los aspectos medu lares que deben considerarse cuando se prep.."\ran tales infonnes. Obviameme, no todos los items que se Hstan en este esquema son relevantes para {odos los informes de hallazgos empfricos . En los pan-afos sigu ient e~ se discUlen brevemente aspectos seleccionados, de entre aquellos que se resumen en el E.,>quema 9. 1, que a menudo se olvidan cuando se describe la justificaci6n del estudio, su disefio y se discuten sus resultados.
9.2.1. Objetivos del estudio y/o hipotesis que se desarrollan durante su concepcion Los objetivos del estudio y las h ip6tesis que gufan su desarrollo han de en unciarse explkitamente, por 10 general al final de la introducci6n. Una fonna frecuente de estructurar la introducci6n del trabajo es vincu lando la ev idencia previa sobre la materia (de est udios epidemio l6gicos y otros, como experimentos con ani males) con las preguntas especfficas que justifican el est udio actual.
354
EPIDEMIOLOGiA lNTERMEDIA ; CONCEPTOS Y APLICACIONES
Esquema 9.1 Aspectos que dcbcn scr considcrados cualldo se prcparan informes epidcmioJogicos 1. Inlroducci6n a. Revisi6n $ucinla de la fundamentaci6n del estudio: • plausibilidad biol6gica * • 10 que resuna novedoso en asle estudio b. Enuncie una 0 mas hip6tesis (especifique las interacciones si son parte de la hip6tesis).
2. Metooos a. Describa las caracterfsticas de la poblaci6n bajo estudio (pof ejemplo: edad, saxo), el ambito (por ejemplo: pacientes hospitalarios. muestra basada en la poblaci6n) y marco temporal del esludio. b. Describa los criterios de inclusi6n y de exclusi6n. c. Describa los procedimientos de recolecci6n de los datos; b rinde cifras de dad de los pmcedimientos, si las conoce .
exact~ud
y tiabili-
d. Especilique el 0 los criterios para la identificaci6n de variables conlusoras. e. Describa los metodos esladisticos; explique el 0 los crilerios para la categorizaci6n de las va riables de estudio. I . Fundamente por que cree que las sLPOsiciones que subyacen en el modelo seleccionado son razonables (por ejemplo, para ell'so del Modelo de Cox, que la raz6n de riesgos instan· taneos es constante a 10 largo del tiempo de seguimiento) .
3. Resultados a. Presente los datos con el minimo de modelaci6n (distribuciones de frecuencia, medianas, medias, diferencias no ajustadas). b. Presente los datos estratilicados. c. Prasanta los dolo::; utilizondo modalo~ mlls complajo::; para utilicc al modalo mll::; pomimo nioso que se ajuste a los datos (por ejemplo, odds ratio ajustado por el metoda de Mantel· Haenszel si solo necesitan ajustarse una 0 dos varia~es). d. Cuando se postulen interacciones a priori (0 se exploren a posteriori), considere la evaluaci6n de las aditivas y las multiplicativas.
4 . Discusi6n a. Revise los resultados principales del estudio y haga enfasis en las similitudes y dife rencias con la literatura. b. Revise las fortalezas y las limitaciones del estudio. Considere los sesgos y los electos de confusi6n como explicaciones alternativas a sus resultados . Comente sobre posibles erro· res en la clasificaci6n de los datos en el contexto de la validez y la liabilidad conocidas del instrumento utilizado para la recolecci~n de los datos. c. Sugiera maneras especilicas de rectif'car algunas de las desventajas de las investigaciones p revias y del presente estudio, de manera que sirva de ayuda para que investigaciones lutu· ras aborden el mismo 0 los mismos problemas. d. Si es apropiado y esta respaldado por los datos, discuta las implicaciones de los resultados del estudio para la practica medica a Ia politica de salud .
• «Biol6g i co~ si al procaso patol6gico qua se investiga es biol6gico 0 fisiol6gk:o par naturalaza. Para los astu· dios apidemiol6gicos que tratan aspectos psicosocialas, por ajam plo, los aspectos ralavantas astarlm basados an al modelo te6rico psicosocial que subyace bajo el lan6mano qua se asta eSILJdiando. Fuente; Datos de HA Kahn y CT Sampos, Statistical methods in epidemiology. 1t11989. Oxford Unive rsity Prass.
LA CO\\uNICACION DE LOS RESULTADOS DE LA INVESTIGACION EPIDEMIOL6GICA
355
Si e l est udio no tiene hipritesis especfficas - esto es, cuando se trata de un est udio exploratorio de reladones mUlt iples entre exposic iones y desenlaces (es decir, una «expedic ion a pescar», como se Ie conoce en la jerga epidem io I6gica) - ello debe enunciarse claramente en la Introducci6n. En muchas encuestas y est udios epidemiologicos grandes, docenas 0 dentos de variables pueden cmzarse en la busqueda de posibles asociaciones. Por ejemplo, hasta 1.000 tab las de 2 x 2 que muestren datos combinados pueden generarse de una encuesta con informacion de 100 variables de exposic ion con dos categonas y 10 resu ltados binarios posibles (por ejemplo, la prevalencia de 10 enfermedades diferentes) . Teoricamente. aun cuando ninguna de estas variables de exposic i6n estuviera verdaderamente asoc iada con los resultados, el azar solamente, determinara que en aprox imadamente 50 de los 1.000 cmces se encuentre una asociadon estad fst ica sign ificativa al nivel de p.s 0,05 . La publicadon selectiva drcunscrita a estos hallazgos «sign ificativos>, supone un sesgo de publicadon (vease Capitulo 4, Secci6n 4.5). Por ejemplo, Friedman et al. OJ publicaron un trabajo que comunica por primera vez una relaci6n gradual fuerte entre el conteo le ucocitario y e l riesgo de infarto del miocardio . En la discusi6n de eSlOS res ultados, entonces inesperados, los autores abrieron, como era debido, la seccion de discusion de su articulo con el sig uiente en unciado: «N uestro hallazgo de que el conteo leucocitario es un predictor de infarto del m iocardio debe observarse en el contexto del estudio exploratorio que hemos venido realizando . AI buscar en aprox imadamente 750 variables recogidas para evaluar nuevos predictores del infarto del miocardio ...»(' p(278) De hecho, estos resultados fueron replicados mas adelante en un numero importante de otros estud ios; a pesar de esto, la naturaleza causal de la asociaci6n es aun motivo de controversia(!I. Por otro lado, (,cuantos otros resultados de la literatura medica y epidem iol6gica que son justamente el producto de un hallazgo casual en una «ex pedici6n a pescar», dan lugar a un «m gido» en los medios masivos (Fig ura 9. 1) pero no son nunca replicados en 10 sucesivo? EI argumento anterior tambicn se aplica a los infonnes sobre interacdones. Debido a que la modificaci6n de efectos puede ocurrir por azar (vease Capitu lo 6, Secdon 6 .10), e llector necesita considerar si una interacdon comunicada fue mas bien un evento casual resu ltante de cru zam ientos estratifi cados multiples entre las variables de estudio en lugar de un hal lazgo esperado, basado en una hipotesis plausible previamente establec ida.
9.2.2. Descripci6n de la validez y la fiabilidad de los instrumentos para la recolecci6n de datos Cuando se describen los procedimientos para la recolecdon de datos, es importante infonnar, siempre que sea posible, acerca de las medidas correspond ientes de validez y fiabilidad (vease Capitu lo 8). Deben evitarse en unciados como este .>, ya que tales palabras no son informativas para el lector sin tiempo 0 sin posibilidades de acceso al articulo fuente. Aun mas, e l resultado anterior puede interpretarse como que e l instmmento es «valido» y «confiabl e». cuando realmente con frecuencia se refiere a items de c uestionarios que tienen una validez 0 fiabi lidad de pobre a moderada (por ejemplo, coeficientes kappa 0 coefidentes de correlaci6n intraclase con
356
EPIDEMIOLOGiA lNTERMEDIA ; CONCEPTOS Y APLICACIONES
Figura 9.1. La puhlicacion acritica de halJazgos basados ell «cxpedicioncs a pescar» cnvian mClIsajcs confusos y a vcccs contradictorios a la poblaci6n y dan Ingar a ulla dllica vision de la im'cstigacioll medica y cpidcmiologica .
Fuente: Jim Borgman. The Cincinnati Enquirer, King Features Syndicate. Impreso con permiso de King Features Syndicate.
valores entre 0,20 y 0,40, como se ha vista, por ejemplo, en estudios de validaci6n de datos sabre la dicta). En el caso de cuestionarios. un problema especial es que SII validez y fiabilidad pueden ser LIlia fllnci6n de las caracterfsticas de la poblaci6n de estudio (por ejemplo, nivel educacional): es decir, puede ocurrir que la validez 0 1a fiabilidad de los numeros obtenidos de una poblad6n dada no sean extensibles a otra pobladon (veanse Capitulo 8, Secdones 8.3 .2 y 8.3.3). De fonna similar, como se discute en el Capitulo 8, la validez 0 fiabilidad de cicrtos instmmentos 0 pmebas puede ser diferente entre pobladones como fundon de la distribud6n subyacente de la caracterlstica evaluada. Por tanto, es imponante que sean comunicados no solamente los resultados de los estudios de validez y fiabilidad, sino tambien que se afiada un resumen de las caracterfsticas de los individuos que partidparon en estos esmdios . Obviamente, los informes sobre hallazgos del estudio tambien deben incluir res ultados de los subestudios internos para el control de calidad, si estan disponibles (vease Capftulo 8).
9.2.3. Razonamiento para la selecd6n de las variables confusoras Los infonnes de los estudios epidem iol6gicos observadonales frec uentemente om iten la descripci6n de los criterios de sclecd6n de las variables confusoras . Por ejemplo , (,estuvo la selecci6n de las variables potencialmente confu soras basada inicialmente en la li teratura y fue verificada subsecuentemente con los datos del estud io? (,Se explo r6 en el estud io la presencia de nuevos confusores que no hubieran sido considerados en estudios anteriores? Yen tal caso, (,que enfoques analfticos se utilizaron para examinar la confusion? (vease Capftu lo 5, Secci6n 5.3) .
LA CO\\uNICACION DE LOS RESULTADOS DE LA INVESTIGACION EPIDEMIOL6GICA
357
9.2A. Criterios para la selecci6n de puntos de corte cuando se establecen categorias para variables continuas
U
ordinales
Los enfoques comunes para la calegorizadon de variables continuas u ordinales incluyen el usn, bien de estandares estableddos (por ejemplo, elevadones «anonnales» del segmento ST-T observadas en e l trazado electrocardiogra.fico para definir isquemia miocardica),o bien de distribuciones de los datos del estud io (por ejemplo, uso de los percentiles como puntos de corte). En ocasiones, los investigadores selecdonan puntos de corte q ue han sido ampliamente utilizados con prop6sitos clfnicos 0 en investigadan epidemiol6gica previa (ej ., definir la hipertension como nivel de la tensi6n arterial sist6lica O!: 140 mm Hg 0 nivel de la tensi6n arterial diast61ica O!: 90 mm Hg; 0 definir la hipercolesterolemia como nivel de colesterol serico O!: 240 mgldL) . Cuando no existen tales puntos de corte, particularmente c uando se investigan asociaciones novedosas entre un factor de riesgo y una enfennedad, e l investigador puede estar interesado en el uso de tecnicas exploratorias para optimizar y explorar las consecuendas del empleo de diferentes puntos de corte para analisis de regresion categoricos(3) u ordinales(4). En c ualq uier caso, la comunicaci6n deberfa describir explfcitamente el metodo utilizado para este proposito; omitir la definicion clara de los criterios para la selecd6n de categorfas para las variables de interes puede sugerir que los datos fueron reagrupados una y otra vez hasta conseguir resu ltados agradables para e l investigador (por ejemplo, hasta que se alcanzo sign ificad6n estadfstica) .
9.25. Datos no modelados y parsimoniosamente modelados rrente a completamente modelados Para proveer informacion previa adec uada que coloque los hallazgos del estudio en la perspect iva apropiada, deberfan presentarse resultados no modelados y parsimoniosamente modelados, incluyendo las caracterfsticas de la poblaci6n de est udio y las distribudones un ivariadas y estratificadas de las variables de eSllldio claves. Los autores deben evitar la tentacion de comunicar solamente los resul tados de la modeladon estadfstica completa, ya que los resultados no ajustados pasan por una modeladon mfnima y por tanto son mas re presentativos de la pobladon en est udio; podrfa incluso argumentarse q ue, si los resultados aj ustados y no aj ustados son similares, solo deberfan presentarse los liltimos . En cualqu ier caso, es ventajoso presentar los resultados no aj ustados j unto con los ajustados (vease tambien el Capitulo 5, Secdon 5.3); esta estrategia no solo permite una visi6n adic ional sobre la fuerza del efecto de confusion, sino que tambien ayuda a eluddar mecanismos subyacentes. Una ilustraci6n de la ventaja de mostrar medidas ajustadas y no ajustadas de asodadon la ofrece un est udio sobre la relaci6n de la clase soc ial con la enfennedad carotfdea arterioesclerotica(S). El debilitamiento de la reladon resultante del ajuste por los factore s de riesgo cardiovasculares mayores (por ejemplo. hipertensi6n, habito de fumar e hipercolesterolemia) da una medida de la importanda de estos fac tores como mediadores . Debido a q ue la reladon puede ser, sin d udas, explicada por estos factore s (por 10 menos pardalmente), es inapropiado mostrar solamente los res ul tados ajustados . Otro ejemplo 10 tenemos en e l hecho siguiente: suponiendo que no hay errores de medic ion, la diferenda en la magnitud de las asoc iadones ajustadas y no ajustadas,
358
EPIDEM IOLOGiA lNTERMEDIA; CONCEPTOS Y APLICACIONES
por el peso al nacer entre el habito de fuma r de la madre y la mortalidad perinatal, relleja la importancia del bajo peso al nacer como mecanismo que explica la asodadon (Capitulo 5, Figuras 5.4 Y 5.5). Idealmente, el papel de cada confusor potencial individual deberfa evaluarse de maDera que se identifiq ue el origen exacto de la confusion ylo del mecanismo que relaciona al fac!Qr de riesgo de interes con el desenlace . Las fannulas para evaluar la influencia de una variable dada que relleje un mecan ismo que relacione al factor de inten!s con el desenlace 0 con el grado de confusi6n positiva se dan en el Capitulo 5, Secci6n 5 .2.3 .
9.2.6. Evaluaci6n de la interacci6n Muy a menudo. el extendido cmpleo de la regresi6n logfstica, la regresion de Cox y otros modelos similares, da como resultado que se aborde casi exclusivameme la interacd6n mu ltiplicativa. Sin embargo, como se discuti6 en el Capft ulo 6, la evaluaci6n de la interacci6n aditiva es de gran importancia para los profesionales de la salud pliblica(6.7) y deberfa Ilevarse a cabo independiemememe del modelo utilizado para analizar datos epidemiol6gicos . Es importame recordar que el uso de la regresi6n logfstica u otros modelos «mu ltiplicativos>, no impide la evaluacion de la interacci6n aditiva(8).
93 . COMO COMUNICAR 9.3.1. Evitar la arrogancia cientffica Cuando se com unican los resultados de estudios individuales, particularmente los de estudios observadonales, los epidemiologos con frecuenda no reconocen sufidentememe que ninglin estudio puede bastar por sf solo para sacar conclusiones y que se necesita de la replicad6n para minimizar los efectos del azar 0 los problemas de disefio. Un est udio individual brinda, en el mejor de los casos, solamente una pieza de un enonne rompecabezas, casi ilimitado. Por tanto, en general, es aconsejable evitar enunciados «definitivos>, tales como «este esmdio dem uestra inequ fvocamente que ...» cuando se interpretan los resultados de solo un est udio observacional. En general, se hace una Ilamada a la precaud6n cuando se interpretan los resultados de la invest igaci6n observadonal.
9.3.2. Evitar la verbosidad Como en toda comunicaci6n cientffica, es importante ser tan conciso como sea posible cuando se comunican los resultados de estudios epidemiol6gicos . En un editorial escrito hace pocos anos, Fried man!9l subraya la posibilidad de transmitir las mismas ideas de forma abreviada sin perdida de claridad ni significado. Considerese el sigu iente parrafo de 77 palabras; tornado de un trabajo enviado a una revista epidemioI6gica(9): Otras investigaciones que exploran la asociaci6n entre multiparidad y esclerodermia han obtenido informaci6n sobre la multiparidad utilizando medidas sucedaneas. La
LA CO\\uNICACION DE LOS RESULTADOS DE LA INVESTIGACION EPIDEMIOL6GICA
359
cantidad de dinero gastado en paiiales. sin considerar la inflaci6n. se ha utilizado como aproximaci6n por parte de varios grupos de investigadores y todos han comunicado que no se observaron diferencias significativas una vez que los datos se estratificaron por edad en el ultimo embarazoa termino. En el anal isis que aquf realizamos se encontraron resultados similares. Una red ucci6n signifi cat iva de su largo (hasta unas 45 palabras) recomendada por Friedman('}) no solamente preserva el signifi cado del parrafo, sino que mejoro su claridad: Qtros investigadores han utilizado medidas sucedaneas de multiparidad. tales como la cantidad de dinero gastado en panales. sin considerar la inflaci6n. AI igual que nuestro estudio. ninglin otro revel6 diferencias significativas una vez que los datos se estratificaron por edad en el ultimo embarazo a termino.
933. Facilitar la lectura Qtra manera de hacer q ue la comunicaci6n de los hallazgos epidemiol6gicos sea mas eficiente, panicu lannente cuando se cree que algunos de los lectores pudiera no estar fam iliarizado con algunos de los terminos utilizados en el articu lo, es apelar a un lenguaje tan simple como sea posible . Se dispone de varias fonnas para estimar e l nivel educacional que han de tener los lectores a los que va dirigido eI trabajo para poder comprender adec uadamente la redacci6n empleada(Hl.l l) . Considerese, por ejemplo, la formu la SMOG, util para establecer dicho nivel con e l fin de ada ptar un texto escrito en ing les al de los lectores a quienes va dirigido(12), un enfoque que nos recuerda la necesidad de mantener simplicidad max ima del lenguaje cuando nos comunicamos con el publico en general. La f6rm ula es faei l de aplicar: I) seleceione 30 oraciones del texto del trabajo, 10 del princi pio del texto, 10 del med io y 10 cercanas al final; 2) c uente las palabras con 30 mas sflabas; 3) obtenga la raiz cuadrada de este numero; y 4) anada 3 a esta raiz cuadrada para obtener e l n ivel escolar, equivalente en los EE UU, necesario para entender el informe . Por ejemplo, si hay 100 de tales palabras, e l nivel necesario sera , indice SMOG =
V100 + 3 = 13
es decir, se necesitarfa un nivel de educaci6n sec undaria superior (high school) . AI aplicar esta formu la , Freimuth(IO) concl uyo que los paeientes que rec il)Cn panfletos ed ucaeionales sobre la mamograffa, del Centro de Deteceion de Cancer de Fox (Fox Chase Cancer Center), necesitarfan tener por 10 menos dos anos de educaeion secundaria superior para ser capaces de entenderlos . Aunque existe una diferencia obvia entre los lectores de literatura ciemffica y los lectores usuales de panfletos educaeionales, la f6nn ula SMOG y otras anaJogas pueden ser utiles para los epidemiologos que necesiran inreraclllar con el pllhlico lego pm ejemplo, para comun icarse con la prensa 0 hacer que sean comprensibles sus puntos de vista en una corte j ud icial. En vista de su especificidad cultural y suponiendo que la literatura epidemiologica se lee en todo el mundo, deberfan evitarse la jerga y las abreviaturas, 0 ut ilizarlas de fonna esporadica solameme cuando han alcanzado una aceptaci6n universal, como ocurre con tenn inos como ADN 0 IgG, abreviaturas uti lizadas ampliameme
360
EPIDEM IOLOGiA lNTERMEDIA; CONCEPTOS Y APLICACIONES
como EC (para enfennedad coronaria), SE (para sit uaci6n socioecon6mico) 0 VIH (para el virus de la inmunodeficiencia hu mana) pueden ser aceptables si se escriben apropiadamente cuando aparecen por primera vez en el articu lo . Sin embargo, incl uso el amplio uso de estas abreviat uras com linmente reconocidas puede lIevar a alguna confusion: por ejemplo, en los palses de habla hispana, 1a abreviatura AIDS (acquired immunodeficiency syndrome) se conviene en SIDA (.\I"drome de inlllunOliejiciellcia adquirida), que a su vez puede verse por los lectores angloparlantes como un error de la abreviat ura SIDS. que denota sudden infant liearh syndrome (sfndrome de mucne slibita infamil) . En c ualquier caso, deberfa recordarseles a los autores que el abuso de abreviat uras. aunque abrevia el manuscrito, tiende a disminuir la faci lidad con que se lee , particu larmente para lectores no enterameme fami liarizados con el tema especffico de investigaci6n . Considerese el sigu ieme parrafo. tomado del resumen (estmct urado) de un trabajo publicado en una revista medica importameC "), donde el uso de abreviat uras hace que el texto resulte virt ualmente incomprensible para ellector medio' : M etodos y resultados: Relative LV myocardial MMP activ ity was determined in the nonnal (n = 8) and idiopathic DCM (n = 7) human LV myocard ium by substrate zymography. Relative LV myocardial abundance of intestinal collagenase (MM P- l ), stromelysin (MMP-3), 72 KD gelat inase (MMP-2), 92 KD gelat inase (MM P-9), TI MP-9, and TIMP-2 were measured with quamitive immunoblotting. LV myocard ial MMP zymographic activity increased with DCM compared with nonnal (984 ± 149 versus 4 13 ± 64 pixels, P < .05) . With DCM, LV myocardial abundance of MMP- l decreased to 16 ± 6 % (P < ,05), MMP-3 increased to 563 ± 2 12% (P < ,05), MMP-9 increased to 422 ± 64% (P < ,05), and MMP-2 was unchanged when compared with normal. LV myocardial abundance of TIME- l and TIME-2 increased by > 500 % with DCM. A high-molecular-weight immunocreative band for both TI ME- I and TIME-2, suggesting a TIMElMMP complex, was increased> 600% with DCM .
9.3.4. ReaIizar inferencias apropiadas Entre los mas comunes errores inferenciales en los informes epidemiol6gicos se incluyen: que se de por sentado que una asociaci6n estadfstica puede automaticamente interpretarse como causal, eluso de la significaci6n estadfstica como el criterio principal para juzgar si existe 0 no asociaci6n, y la comparaci6n de la «hlerza>, de las asociaciones para diferemes fac{Qres de riesgo ut ilizando la magnit ud de los coeficientes de regres i6n 0 las estimaciones de riesgo derivadas. La presen cia de una asociacion (aul/que sea estad{sticam ente significativa) n o relleia n ecesariam ente causalidad
El hecho de que las asociaciones estad fsticas no son necesariamente causales se discute extensamente en los libros de texto basicos de epidemiologfa y estadfstica (por
* El siguie nte parrdfo no se ha Irdducido pard conservar el senlido con que fue insertado en el texlo por los aulores. (Nola de los traductore s).
LA CO\\uNICACION DE LOS RESULTADOS DE LA INVESTIGACION EPIDEMIOL6GICA
361
ejemplo, Gord i s(l~) , Armitage y Berry ('S)) y en los Capftulos 4 y 5 de este libro . Sin embargo, los epidem i61ogos uti lizan a menudo e l tenn ino eJecto (0 sugieren la noci6n de causalidad a partir de asociaciones estadfsticas: por ejemplo, «Una dismin uci6n de X condujo a una disminuci6n en Y »), aunque ello no este demostrado, dado que la mayorfa de los estudios etiol6gicos son observacionales por naturaleza(l 6). Aun mas preocu pante, por su frec uente ocurrencia, es la suposici6n impl kita de que un est imado ajustado esta libre de confusi6n . La precauci6n de no dar por sentado que la confusi6n ha sido eliminada es crucial. pues incluso cuando se milizan modelos multivariantes como una vfa para ajuslar por todas las variables confusoras conocidas, la posibi lidad de confusi6n residual debe considerarse casi siempre ex plfcitamente (como se discule en e l Capitulo 7, Secci6n 7.5).
La significadon estad{stica no es una lIledida de la Ju ena de tllla asodadon Es error comun q ue se descri ba una asociaci6n q ue no es estad fsticamente significa!iva como no existente . Por ejemplo, puede comunicarse correctamente en el resumen de un trabajo que no se ha encontrado una asociaci6n estadiJ'ficulllenfe significativa entre la depresi6n y el desarrollo subsiguiente de cancer de mama, ya q ue e l riesgo relativo estimado fue de 1,5, con un Ifmite inferior del intervalo de confianza al 95% que sobrepasa escasamente e l valor para la hip6tesis nula . Pero serfa err6neo si este hallazgo se interpretara subsecuentemente por otros amores como pmeba de que no hay asociaci6n . Similarmente, sobre la base de los resultados hipoteticos q ue se muestran en la Tabla 9 .1 , particularmente debido a la sugerenc ia de que hay una relaci6n dosis-respuesta para todos los resu ltados examinados, serfa un error cond uir q ue e l habito de fumar esta relacionado con la mortalidad debida a cancer del pulm6n y a enfermedad coronaria pero 110 a la lIIortalidad I'0r accidellfe cerebrovascular (ACV), Es importante recordar que la significaci6n estadfstica y el ancho del intervalo de confianza dependen fuertemente del tamano de la muestra; un numero menor de muertes por ACV comparado con m uertes por enfermedad coronaria, podrfa explicar por que la ult ima y no la primera asociaci6n se encontr6 estadfsticamente sign ificativa en una sit uaci6n como la mostrada en el ejemplo hipolet icode la Tabla 9 .1. La inferencia de que no hay asoc iaci6n cuando la asociaci6n no es estadfsticamenIe significativa (0 cuando e l intervalo de confianza induye al valor de la hip6tesis nu la)
Tabla 9.1 Razones de tasas de mortalidad ajustadas por eda d pa r a fumadores actuales y ex fum adores frente a no fum adores, segun causa de muerte , ejemplo hipotctico Aaz6n de tasas de mo rt alidad (Inlerval o de co nflanza aI 95%) Cau sa de muerte
Fumadores
Exfumadores
No lumadores
Cancer de pulm6n
8.0 (3.0-21 ,3)
2.5 (0,9-6,9)
1.0
2,3 (1,6-3.3) 2,2, (0,9-4,9)
1.5 (1.1 -2,0)
1.0
1.4 (0.8-2,5)
1.0
Enfermedad coronaria Accidente cerebro-vascular
362
EPIDEMIOLOGiA lNTERMEDIA ; CONCEPTOS Y APLICACIONES
no considera el hecho importante de que la verosimilimd de los valores denIm del imervala de confianza es maxima para el estimador pumua!(Ii). N uestra impresion es que muchos autores que publican en las revistas mooicas (e incluso en las epidemio16gicas) yen al intervalo de confianza al 95 % como un tipo de recorrido plano (y cerrado) de posibles valores para el parametro de interes. En alras palabras, IOOos estos «valores pos i b les~) induidos en el intervalo se suponen igualmente probabJes (Figura 9.2A). Por tanto, en el ejemplo hipotetico anterior (riesgo relarivo estimado IRRJ para habito de fumar actual y AVE 2. 1: intervalo de confianza al 95%: 0.9-4.9). debido a que el intcrvalo de confianza del 95% incluye al valor de la hip6rcsis nula (Le ., el valor RR = 1,0 es «posible»), este res ultado puede interpretarse erroneamente como rellejode que no hay asociac i6n . E.<;ta es una interpretacion erronea, porque la verosimilitud de cualqu ier valor dado del verdadero parametro que se estima no es uniforme a traves del recorrido de valores contenidos en el intervalo. E.<; I/uiximo en eI valor lie la estimaci6n puntual (porejemplo, RR = 2,1) Y decrece a medida que los valores se alejan de el (Figura 9.28). El valor RR = 0,9 (ellfmite inferior del intervalo de
A
Interpretaci6n err6nea
B
Interpretaci6n correcta
estimaci6n puntual 95%IC
estimaci6n puntual 95%IC
Figura Y.2. Interpretacion corrccta e incorrecta de los intervakls de cont"ianza (Ie): la veroslmllitud de cualquier valor dado dentm de l recorrido no es unifonne (como se muestra en A): es maxima en el estimado puntual del par:'imetro que se mide y decrece a lnedida que los valores se alejan de el (B). (La verosimilitud es una medida de l apoyo que ofrece un grupo de datos a un valor particular de l panimetro de un mooelo probabilfstico). Para mas deta lles de este concepto estadfstico fundamental. el lector deberfa remitirse a textos mas especializados (por ejemplo. Clayton and Hills<18I).
LA CO\\uNICACI6N DE LOS RESULTADOS DE LA INVESTIGACI6N EPIDEMIOL6GICA
363
confianza) es muy improbable (al igual q ue el valor superior, RR = 4.9). Aun mas, los valoresfuera de los Ifmites de confianza tambien son posibles (pero menos pmbables). Si e l tamano de la muestra del estudio hubiera sido mayor, el mismo estimado del RR = 2,1 podrfa haber estado asoc iado con un intervalo de confianza del 95% que no incluyera el valor de la hipritesis nu la (por ejemplo, 1,1-2,7). EI intervalo de confianza meramente expres..1 la incertidumbre estadfstica de la estimadon puntual y no deberfa interpretarse mecanica y erroneamente como un recorrido de valores igualmente posibles .
La magllillld de los estimadores de la asociacioll de las distilltas variables pllede 110 ser directamellte comparable La comparacion de diferentes variables con respecto a la fuerza de su asociaci6n con un resultado dado se introd ujo en el Capitu lo 3, Secci6n 3.5, a la cual se remite al lector. A contin uad6n se brinda una extension de esa disc usion. Para tener un ejemplo de una situad6n donde es inapro piado comparar los valores de una med ida de asodacion entre variables, considerense los resultados del analisis de regresion log fstica incluidos en el Capitulo 7. Tabla 7.17: la inferencia de que la asociacion para eI sexo es mas fuerte que para la edad, basada en eI hecho de que e l odd.\· ratio es mayor para la primera (3,70) que para la segunda variable (1,0 I I ) es daramente errado en vista de la impactante diferencia en la nat uraleza y la magnit ud de las un idades utilizadas (en e l ejemplo que se muestra en esa tabla, masc ulino/femenino frente a un ano de edad). Mientras q ue eSle ejemplo subraya las dificu llades en la comparacion de variables discretas con variables cont inuas, tam bien la comparad6n entre variables continuas es una fund6n de la magnitud de las unidades utilizadas para cada variable: por tanto. en la Tabla 7.17. serfa inapropiado comparar el aumento en el odd.\· de la enfermedad coronaria re lacionado con un cambio en e l nivel de colesterol total de I mg/dL (odd,\' ratio = 1,007) con e l correspondiente a un cambio de I kg /m 2 en el Indice de masa corporal (odds ratio = 1,024) ya que estas «unidades» (la «anchura» a 10 largo del eje de la x para la cual se calcula el odd.\· ratio en este caso) son mas bien arbitrarias . Por ejemplo. si en lugar de I mgld L se adoptara I cg/m L (es decir, 10 mg/d L) como unidad para medir el colesterol serico, e l Olid.! ratio correspond iente (basado en los resultados de la Tabla 7.17) serfa e(lO x 0.0074) = 1,08: esto es, mayor que e l odds ratio para I kglm2 de fndice de masa corporaL En algunas ocasiones los autores intentan eludir este problema calcu lando los Ilamados coefidentes de regresi6n «estandarizados» p..1ra las variables continuas. Estos se obtienen utilizando una desviad6n estandar como unidad para cada variable (0 simplemente mu ltiplicando cada coefidente de regresi6n por la desviadon estandar de la variable): se argumenta que esta estrategia permite comparar diferentes variables denIm de un estudio 0 la misma variable entre esmdios(i
364
EPIDEMIOLOGiA lNTERMEDIA ; CONCEPTOS Y APLICACIONES
Un problema adicional y fundamental es que estas comparaciones no toman en consideraci6n la nat uraleza biol6gica de cada fac(Qri 21 ) . Como se discute en e l Capitulo 3, Secci6n 3.5, la Indole biol6gica unica de cada variable haec diffci l comparar la fue rza de su asoc iaci6n con la de alras variables . Cons iderese, por ejemplo, un estud io en e l ella ] un cambia de I mgJdL en e l colesterol serico total se campara con un cambia en la presion sangu fnea de I mm Hg a los efectos del riesgo de enfermedad coronaria; debido a que los mecanismos mediante los cuales estas variables producen e l proceso pato16gico subyaceme (arterioesc lerosis) y sus manifes taciones clfnicas (por ejempio, infano de miocardia) pueden ser muy diferentes . esta comparadon serfa di fkil , si no imposible, de j ustificar. En e l Capft ulo 3, $ecci6n 3.5, se sugiri6 un mNodo para comparar diferentes variables, consistente en estimar la intensidad de la exposici6n necesaria para que cada factor de riesgo de inten!s produjera una asociadon de la misma magnitud q ue la de factores de riesgo bien esta blecidos . Ademas, Greenland et UI .(22 ) sugieren un procedimiento segun e l c ual se compara el aumento en el nivel de cada factor necesario para cambiar e l riesgo del resu ltado en una cantidad fija, tal como + 50%.
9.35. Tablas y tiguras No existe una manera estandar de comunicar los hallazgos en e l texto y en tablas; y la necesidad de dirigirse a di ferentes audiencias (por ejemplo, expertos frente a publico en general) y ut ilizar diferentes vehfculos (por ejemplo, revistas cientfficas frente a revistas de nmicias) llama a la flexibilidad . Sin embargo, parece haber algunas reglas sencillas que, si bien no se siguen siempre, deberfan considerarse sistematicamente .
Tab/as A continuaci6n se presentan g ufas generales q ue condernen a la presentaci6n de las tablas. • Titulos y encabezamientos. Las tablas deben estar claramente tilUladas, con {{tu los autoex plicativos. 6pt imamente, los lectores deberfan ser capaces de entender las tablas aunque las examinen aisladamente . Desafortunadamente , para comprender e interpretar las tab las publicadas en la literatura , a men udo debe leerse el trabajo complelO 0 al menos la secci6n de Metodos (por ejemplo, los subgru pos relevantes no estan bien definidos 0 e l resultado no se espedfica ni define en la tabla). $e recomienda eI uso generoso de notas al pie de las tablas para conseguir que sean autoex plicat ivas . • Unidades . Deben espedficarse las categorfas para las variables discretas y las unidades para las continua.>; . Por ejemplo, un OR allado de la variable «edad» no tiene sentido a menos que se enunde tambien si la unidad es un ano de edad 0 algun otro agrupamiento. Igualmente, un OR al lado de la variable « raza~) no es muy informativo a menos q ue se espedfiquen la.~ categorfas q ue se comparan. • Comparubililiad con otras reportes. A menudo es uti I presentar los resultados de una manera que permita la comparadon con la mayor parte de infonnes previos . Porejemplo, puede ser mas util presentar la edad utilizando agmpamientos convendonales (por ejemplo, 25-34. 35-44. etc.) que no convendonales (por ejemplo, 23-32, 33-42, etc.) .
LA CO\\uNICACI6N DE LOS RESULTADOS DE LA INVESTIGACI6N EPIDEMIOL6GICA
•
365
COIIIl'arando datos esfadfsfico.~· entre grlll'0'~·' Olra estrategia ut il , que facilita
la comprensi6n del signifi cado de los resu ltados, es presentar los datos estadfsticos que proveen la comparaci6n de imen!s principal uno al lado del otro. Por ejemplo, c uando se preseman los resultados de un estudio de cohorte, la faci lidad de comparar tasalanos-persona una allado de la otra permite que la tabla (en blanco) A que se muestra debajo, sea mas «amistosa para leer» que la Tabla B. Tabla A Presentaci6n preferible N. de aiios-persona
Tasa I aiio-persona
O
Expuesw$
No Expuesws
Expuestos
No Expuestos
Tabla B Presentaci6n menos deseable Expuestos
No Expuesws
Tasa I aiio-persona
aiios-persona
anos-persona
Tasa I ano-persona
EI mismo principio se apl ica a las distri buciones de frec uencia . Los datos sobre diabetes de acuerdo al habito de fumar(21) pueden presentarse como se m uestra en e llado derecho de la Tabla 9.2 0, con un fo rmato menos deseable, en ellado izq uierdo. • Evita ,. redundancias . Aunque hay alguna comroversia en cuamo a las ventajas de comunicar los resu ltados de las pruebas estadfsticas 0 los estimados de precision (es decir, imervalos de confianza)(24), que se evite la redundancia no es
Tabla 9.2 Numero y distribucioncs porcelltuaies de illdividuos con y s in diabetcs mellitus, de acuerdo COil el habito de fumar ell cI mome nto inicial del cstudio Presentaclon menos deseable Diabete s
Presentaclon preferlble
N."
No Diabetes
%
No Diabete s Diabetes
No Diabete s
N."
%
N."
%
Diabetes
Actuales
90
t9.6
2.307
t6,2
90
2.307
t9.6
18,2
Anteriores Nunc...
70
12.7 27,0
1.136 2.553
9,1 20,4
70
1.136 2.553
12,7 27,0
9,1
20,4
40.7
6.566
52,3
6.566
40,7
52,3
Fumadores
Oesconocido
'"
287
'"
287
Fuente: ES Fo rd and F De Stefano. Ris k Facto rs for MOrlafity from Al l Causes and from Coronary Hearl Disease among with Diabetes . Find ings from the Nationa l Health and Nutrition Examination Survey I, American Journal of Epidemiology, vo l 133, 1220-1230, 11:11991. The Johns Hopkins University School of Hygiene &. Pub lic Health.
366
EPIDEMIOLOGiA lNTERMEDIA; CONCEPTOS Y APLICACIONES
objeto de d iscusi6n; por tanto, es por 10 general indeseable, por ejcmplo, que aparezcan en la misma tabla los valores para Ji-c uadrado, el error estandar y los valores de p. Olro tipo de red undancia procede de la repetici6n en e l tcxto de todos 0 casi todos los res ultados de las tablas, a menudo incluso los valores de P o los Ilmites del intervalo de confianza . Mientras q ue alg una repet ici6n de este tipo puede ser litH , el texto debe hacer enfasis principalmente en los patrones de asociaci6n y no re petir 10 q ue las tablas exhiben claramentc . • EI cambia de denoll/il/adores . En la mayorfa de los esmdios, el nli mero de indiv iduos para los q ue fa lta alguna infonnaci6n d ifiere de una variable a alra. Cuanda oc llrrc esta situaci6n, [os totales deben darse para cada variable de manera que el lector pueda juzgar si la magnitud de [as perdidas es tal q ue introduce d udas sobre la precisi6n y la exact itud de la infonnaci6n . Una estrategia ut i[ consiste en afiad ir una categorfa de «desconocido» 0 «no res puesta>, para cada variable; alternativamente, las aparentes inconsistencias en [os denominadores pueden ex pl icarse en notas al pie . • Presellfar los datos parsimoniosGmente. A menudo debe seleccionarse entre dar una infonnaci6n estadfstica ." este es d iffci l de interpretar fuera del contexto predictivo de la f6nn ula de regresi6n y que puede implicar que existen «efectos principales~) aun en la presencia de interacci6n (Tabla 9.3A). Usualmente es mas litH mostrar resultados estratificados (Tabla 9.38). Algunos de los princi pios que acaban de discmirse se ilustran en el ejemplo hipotetico de la Tabla 9.4A y [a Tabla 9 .48 (preferible) . En la Tabla 9.4A, se dan los coeficienles beta y no los riesgos relat ivos, no se muestran unidades p..1ra las variables y se dan Ires estadfsticos (error estandar, Ji cuadrado y valores de P). En la Tabla 9 .48 , en cambio, se dan las unidades q ue corresponden a los riesgos relativos y,en lugar de tres (algo red undantes) estadfsticos, solo se muestran los intervalos de confianza del 95%.
Figllras Las reglas que gufan la presentaci6n de datos en forma tabular generalmente se aplican tambien a las fi guras. Algunos de los aspectos q ue debfan considerarse, espedficamente cuando se pre paran las fig uras, se d isc uten a continuacion . • Uso del !ormaro de figllm.\·. Evitar el abuso de graficos y fig uras: esto qu iere decir que no se han de mostrar los datos en fig uras c uando podrfan ser faci lmente comunicados en e l texto . Un ejemplo de este tipo de graficos superfluos se ilustra en la Figura 9.3 . La informacion en esta fig ura, obviamente , podrfa ser sucintamente descrita en el texto. La Figu ra 9.3 ejemplifica 10 q ue Tufte(25) ha Ilamado una «baja raz6n datos-tinta>, (low dara-ink rario): mucha tinta para muy pocos datos .
LA CO\\uNICACI6N DE LOS RESULTADOS DE LA INVESTIGACI6N EPIDEMIOL6GICA
367
Tabla 9.3 Tasas de incidcncia de cancer dc colon por 1.000 habitantcs, por cinco afios entrc los participantcs del ccnso dc 1963 con 45·64 afios de cdad en cl momento inicial, por sexo y residencia, Condado dc Washington, Maryland, 1963·1975 A tncldencla de cancer de colon Tasa/1.000 Caracterlstlca
N."
Crudas
Ajustadas
17.968
6,5
6,5
Sexo Hombres Mujeres
8 .674 9 .294
5,5 7,3
5,2 5,6
Residencia Rural Urbana
8 .702 9 .266
7,6 5,4
9,7 4,5
Total
Termino de interacci6n (sexo x residencia)
-4,6
•
Incldencla de cancer de coton Tasa/1 .00n
Crudas
S",o
Ajustadas
N."
Rural
Urbana
Hombres
8.674
5,5
5,6
5,9
5,6
Mujeres
9.294
9,7
5,2
10,1
5,2
Rural
Urbana
F"""/fJ. UnpulJlisllt«J oJdt" fro, n GW O.""st<>C~
•
Tilll/o.\· y r6lulos. Al igual que las tablas, los tftulos deberfa n ser tan autoexpli· cativos como sea posible. Las ordenadas y las abscisas deberfa n rotularse con sus unidades . Cuando el grafico incluye varias ifneas, es uti! organ izar y colo· car las leyendas tan cerca como sea posible del orden y lugar de las categorfas correspondientes en la fig ura real. Por ejemplo, en la Figu ra 9 .4A, la leyenda
Prevalencia de diabetes
10%
(%J
Mujeres
Hombres
Figura 9.3. Ejemplo dc uso supcrnuo dc una figura. Los nnicos dos datos (prc\'alcncia en hombres y mujercs) podrian dcscribirsc racilmcntc en eI tcxto
368
EPIDEMIOLOGiA lNTERM EDIA ; CONCEPTOS Y APLICACIONES
Tabla 9.4 Ecuacion de ricsgos multiples para la enfcrmcdad coronaria: modclo de rcgresi6n de Cox que rclaciona la presencia de los factores de ricsgo ell el momento illicial COli la illcidcllcia de ellfermcdad coronaria A Coeflclente II
Error estandar
JI'
Valor de P
Edad
0,149
0,027
29,97
0,0000
Coleslerol
0,013 0,380
0,003 0.125
15,36 9.28
0,0001
0,152
0.392
0,15
0.7000
Variable
Habilo de 'umar Historia de enfermedad corona ria en los padres
0,0020
B Variable
de riesgos
Raz6n de rlesgos
Intervalo de confianza a195 %
ComparaclOn
10 anos de diferenda
4,5
2,6 - 7,6
Colaslaro]
40 mg/dL de difarencia
1,7
1,3 - 2,2
Habilo de 'umar
20 cigarrillos par d ia Irente a no fumadores
2,1
1,3-3,5
Presenle vs ausente
1,2
0,5·2,5
Edad
Historia de en!erm edad corona ria en los pad res
para cada una de las eurvas esta debajo de la fi gura y el lee{Or tiene que moverse de arriba hacia abajo del grMico a la leyenda para haeer corresponder cada eurva con el gmpo correspondiente , Por otro lado, en la Figura 9.4B , la leyenda esta all ado de las curvas, pero el orden en el que aparecen las curvas y el orden para las leyendas raza!sexo esta en posic ion opuesta. Colocando la identifieacion raza-sexo allado de las curvas reales, la Figura 9.4C parece mas facilmeme eomprensible . • Escala ell las ordenada.\·. La eseala en el eje de ordenadas deberfa ser eonsistente con la medida que se esta representando en el grafieo . Por ejemplo, c uando se representan graficamente med idas relativas de asociacion (por ejemplo, riesgos relat ivos u odd,\· ratios) en grafieos de barras deberfa ut ilizarse un valor base de 1,0 Y una escala logarftmica. Un ejemplo se muestra en la Figura 9 .5, en la eual se comparan tres maneras alternativas de represemar graficamente los riesgos relat ivos correspondientes ados niveles diferentes asociados con cierta variable (RR = 0,5 Y RR = 2.0). En la Figura 9.5A en la c ual el valor de part ida es (un valor <
°
LA CO\\uNICACION DE LOS RESULTADOS DE LA INVESTIGACION EPIDEMIOL6GICA
369
A
Tasa
.........
.......... .......
-- - ••••• ..........
.. ....
Edad Hombres negros Mujeres negras Hombres b1ancos Mujeres b1ancas B
Tasa
,--'
... ...... ......... '
.........
~
..
- - Mujeres blancas - - - Hombres blancos Mujeres negras .. ........ Hombres negros
Edad
C
TU(lU
Hombres negros
~' MUjereSnegras ......... . ......... Hombres blancos ,--~
................... .. ~
Mujeres blancas
Edad
Figura 9.4. Ejemplos de maneras de rotular curvas en una figura
ordenadas. La altura de la barra correspondiente al riesgo relativo de 2,0 es dos veces mayor que la correspondieme al riesgo relat ivo de 0,5, cuando de heeho ,
amho ~ ri e~go~ relal i vo~ ~on
cie la
m i ~m a
magn illlri , a ll n'1 l1e
e~l;'in
en
direeciones eontrarias. La representaci6n correela se exhibe en la Figura 9.5C, la eual uti liza una escala logarftmica en el eje de ordenadas. Aun euando todos los riesgos relat ivos esten en la misma direcci6n, el usa de una eseala aritmet i· ca en las ordenadas es inapropiado euando el objet ivo principal es la evalua· cion de tendencias lineales de diferencias relativas (razones) . La Figura 9.6A
370
EPIDEMIOLOGiA lNTERMEDIA ; CONCEPTOS Y APLICACIONES
A
c
B
RR
RR
RR
2,0
2,0
2,0
l,Of-- +-I-
1,0 h--,-LJL
1,0 h--,--L-'--:-- Nivel del factor de riesgo
0,5
0,5
o \-'--'--'-'--'' Nivel del factor de riesgo Escala aritmelica
Escala aritmelica
Escala logar ilmica
Figura 9.5. Rcprescntacion gr a lica de los ricsgos rclativos con escalas aritmcticas (A, origclI e n 0; 8 origcn ell 1,0) Y COli escala logaritmica (C)
muestra un ejemplo: en ella se utiliza una escala aritmetica y la impresi6n visual es que el riesgo relat ivo aumema mas ra.pidamente en los niveles altos de la variable X. Cuando, en lugar de esto, se utiliza LI lia escala logarft mica (Figura 9.6 B), se obtiene la impresi6n correcla: el aumento del riesgo relativo es lineal. La ClIfvatura en 1a Figura 9.6A es producto de 1a nat uraleza exponencial de todas las medidas relat ivas de efecto. Aunque un observador entrenado puede inferir correctamente que el patron de la Figura 9.6A es lineal en una escala exponenciaL e l uso de una escala logarft mica en el eje de ordenadas, como se observa en la Figura 9 .68 , es menos propiciatorio de malas interpretaciones. (Una excepci6n posible de la regia de que los riesgos relativos 0 los odd.\· ratios se comunican mejor ut ilizando una escala logarftmica en una fi gura se prod uce , q uizas, c uando se evalua una interacci6n aditiva en fonna grafica, como se ilusIra en la Figura 6.2 del Capitulo 6 . En esta situacion , los riesgos relativos 0 los odds ratios se utilizan como aproximaciones a los riesgos atribui bles, y por tanto, el objetivo esta en los excesos absolutos mas que en los relativos) En ocasiones, el uso de una escala logarftmica en el eje de ordenadas puede ser pragmaticamente necesario para incluir (odos los datos en e l grafico, como se i1ustra en la Figura 1.7 . Capitu lo I . Eluso de una escala logarftmica y no de una aritmetica en e1 eje de ordenadas pennite representar grMicamente e1 am plio recorrido de rasas inclu idas en el analisis de los efectos de la edad , la cohorte y e l periodo (de 2-3 por 100.000 en los que rienen entre 40 y 44 afios de edad de las cohortes de nacimiento de 1920 a 1930, a 200-500 por 100 .000 en los de 80 atlOS o mas de las cohones de nacimiento de 1905 a 19 10). Debe hacerse hincapie en
LA CO\\uNICACION DE LOS RESULTADOS DE LA INVESTIGACION EPIDEMIOL6GICA
A
B
RR, escala aritmelica
RR, escala Iogarilmica
371
16,0 16,0
8,0/
4,0/
2
Nivel del factor de riesgo
3
4
5
Nivel del factor de riesgo
Figura 9.6, Compa racio n dc una tendcncia lineal en cI ricsgo rclati vo (RR) utilizando una cscala aritmctica (A) y una escala loga ritmica (8 )
que cuando se utiliza una escala logarftmica, una diferencia dada debe imerpretarse como una diferencia relaliva (raz6n) entre las tasas; en el ejemplo de la Figura 1,7, el hecho de que la pendiente de cada lfnea tienda a ser mas incl inada para los gmpos de edad mas viejos que para los masj6venes en los hombres (con la excepc i6n del gmpo de 40-44 anos de edad) significa que e l incremento relalivo (raz6n de tasas, vease e l Capitu lo 3) de las cohOl1es de nacimiento mas viejas a las mas j6venes tiende a ser mayor en los hombres mas viejos que en los mas jovenes (entre las mujeres parece ser que 10 contrario es cierto),
9A, CONCLUSIONES Los epidemiologos deben comunicar los resu ltados de la invest igaci6n empfrica no solamente a sus colegas sino tambien a olros consumidores de datos epidemiol6gicos, incluyendo los medicos clinicos, el personal de salud publica, abogados y e l publico en generaL Las revistas cientfficas, con lectores tradicionalmente conformados por clfnicos, tales como el New England Journal of Medicine y el Journal of the American Medical Association Ie estan dedicando mas y mas paginas a los estudios epidemiol6gicos, Eluso de datos epidemiol6gicos por las profesiones j urfdicas tambien tiende a incrementarse , Christoffel y Terel(26) . por ejemplo. encontraron que e l numero de veces que se enc uentra una palabra que comience por «el'idemiol" ,» en las cortes federa les 0 estatales aument6 desde ser virtualmente nu lo hacia 1970 hasta aparecer mas de 80 en 1990, Es un hecho cierto que tal tendencia a crecer ha continuado desde entonces , Por tanto, los epidemiologos deberian preocuparse no solamente por el hecho de que sus estudios sean cientfficamente validos, sino tambien
372
EPIDEM IOLOGiA lNTERMEDIA; CONCEPTOS Y APLICACIONES
por ex presar claramente sus resu ltados a audiencias cuyos grados de refinamiemo cientffico varian. Los artku los epidem io16gicos que utilizan un lenguaje senci llo y no ambiguo son probablemente mas fkilmente comprendidos por individuos denlro y fuera de la disciplina, y por tanto, con mayor probabilidad cumpliran S lI cometido principal: ser milizados.
BlBLiOGRAFIA I. Friedman GD. Kl atsky AL, Siegelaub AB. The leukocyte count as a predictor of myocardial infarction. N Eng/ J Med 1974: 290: 1275- 1278. 2. Nieto FJ, Szklo M. Folsom AR el al. Leukocyte count correlates in middle.aged adults: the Atherosclerosis Risk in Communities (ARIC ) Study. Am J £pidemiol 1992: 36: 525-537. 3. Wartenberg D. Northridge M. Defining exposure in case-control studies: a new approach. Alii } Epidemiol 1991: 133: 1058·1071. 4. Pastor R. Guallar E. Use of two-segmented logistic regression to estimate changepoints in epidemiologic studies. Alii) Epidellliol 1998: 148: 631-642. 5. Oiez-Roux AV, Nieto FL Tyroler HA el al. Social inequalities and atherosclerosis: the Atherosclerosis Risk in Communities Study. Am} Epidellliol 1995: 141: 960-972. 6. Saracci R .lnteraction and synergism . Am) Epidemio/1980: 112: 465-466. 7. Rothman KJ, Greenland S, Walker AM. Concepts of interaction. Am} Epidemiol 1980: 112: 467-470. 8. Thompson WO. Statistical analysis in case-control studies. Epidemiol Rev 1994: 33-50. 9. Friedman GO. Be kind to your reader. Am} Epidemio/ 1990: 132: 591-593. 10. Freimuth VS. Assessing the readability of health education messages. Public Heallh Rep 1979: 94: 568-570. II. Johnson ME , Mailloux SL . Fisher DG. The readability of HI V/AIDS educational materials targeted to drug users. Am) Pllblic Heallh 1997: 87: 112-113. 12. McLaughlin GH. SMOG grading: a new readability fomlUla } Reading 1969: 12: 639·646. 13. Thomas CV, Coker ML . Zellner JL el al. Increased matrix metalloproteinase activity and selective upregulation in LV myocardium from patients with end-stage dilated cardiomyopathy. Circlilation 1998: 97: 1708-1715. 14. Gordis L. Epidemiology. Philadelphia, W.B. Saunders, 1996. 15. Armitage p, Berry G. Slatislicalmelhods inmedh·al research. 3.' ed. London, England: Blackwell. 1994. 16. Pettiti DB. Associations are not effects. Alii } Epidemiol 1991: 133: 101-102. 17. Rothman KJ , Lanes S. Robins J . Causal inference. Epidemiology 1993: 4: 555-556. 18. Clayton O. Hills M . Slalislim/lllodeis in epidemiology. New York. NY: Oxford University Press. 1993. 19. Newman TB. Browner WS. In defense of standardized regression coefficients. Epide. miology 1991: 2: 383-386. 20. Greenland S, Maclure M. Schlesselman JJ el al. Standardized regression coefficients: a further critique and review of some alternatives. Epidemiology 1991 : 2: 387-392. 21. Criqui MH. On the use of standardized regression coefficients. Epidemiology 1991: 2: 393. 22. Greenland S, Schlesselman JJ. Criqui MH. The fallacy of employing standardized regression coefficients and correlations as measures of effect. Am) Epidellliol 1986: 123: 203-208.
LA CO\\uNICACI6N DE LOS RESULTADOS DE LA INVESTIGACI6N EPIDEMIOL6GICA
373
23. Ford ES. DeStefano F. Risk factors for mortality from all causes and from coronary heart
disease among persons with diabetes: findings from the National Health and Nutrition Examination Survey I. Am 1 Epidemiol 1991: 133: 1220-1230. 24. Savitz DA. Tolo KA. Poole C. Statistical significance testing in the AmaiL'an l ournal of Epidemiology, 1970-1990.Aml Epidemiol1994: 139: 1047-1052. 25. Tufte ER . Tile visual display oj quanlilalive inforll1alion. Cheshire. Graphics Press . 1983. 26. Christoffel T. Teret SP. Epidemiology and the law: courts and confidence intervals. Am 1 Pl/bUcHeall1l 1991: 81: 1662.
APENDICE A
Errores estandar, intervalos de confianza, y pruebas de hipotesis para medidas seleccionadas de riesgo y de asociacion
CONTENlDOS Introd ucci6n .... ... . .... .... ... ... ... .... ... ... ... .... ... ... ... .... ... . .... .... ... ... ... .. A . 1 Estimaci6n de la supe rvivencia acum ul ada . ..... ... ... ... ..
.... .... ... ... ... 375 ..... ... ... ... ... 377
A. 2 Tasas de incidencia (por persona tiempo) . A. 3 Riesgo relativo y raz6n de riesgo ... ... .. A . 4 O R (cmparejada y no emparejada) ... .... ... .
..... ... ... ... ... 378 .... .... ... ... ... 379
A. 5 A. 6 A. 7 A. 8 A. 9 A .I O A .II A .1 2
..... ... ... ... .. ..... ... ... ... ... ..
..... ... ... ... .... . ..... ... ... ... ... Riesgo atribuible .. ... .... ... ... ... .... ... ... ... .... ... . ..... ... ... ... ... .. .... .... ... ... ... Ojfcrencia entre dos tasas aj ustadas 0 dos prob..1hilidades (metodo directo) .. Tasa de monalidad estandarizadas .... .... ... ... . ..... ... ... ... .... ... ... . ..... ... ... ... ... OR de Mantel-Haenszel (y rawn de tasas) .... ... ... .... ... ... ... ... .. .... ... ... ... .... Coeficieme de regresi6n ... ... .... ... ... ... .... ... ... ... .... ... ... ... .... ... . ..... ... ... ... ... Sensibilidad, especificidad y porcentaje de concordanc ia .. .... ... .... ... ESlaufstku J ut: Yu uut:1l ..... ... ... ... .... . ..... ... ... ... ... .... . ..... ... ... ... Kappa ... ... ... . ..... ... ... ... .... ... ... ... .... ... ... ... .... ... ... ... .... ... ... ... ... .. .... .... ... ...
383 386 388 390
39 1 393 395 397 397
INTRODUCC ION En este apendice, se describen los mNodos de dlc ulo de intervalos de confianza para varias medidas seleccionadas, tanto de riesgo como de asociaci6n , presentadas en este libro . Para algunas de dic has medidas, tambien se exponen metodos com unes para pruebas de h ip6tesis . Este apendice no pretende abarcar una rev ision exhau stiva de todos los mewdos estadfsticos inferenciales empleados en la epidemiolog fa . Se presentan tales mewdos solo para alg unos de los parametros epidemiol6gicos, y en cada caso, unicamenIe se describe un metodo habitualmente empleado para el dlc ulo de errores estandar algunas veces e legido de entre varias allernalivas. Ademas. no es nuestra intenci6n disc lllir las limitaciones metodologicas y concept uales de estos procedimiemos, q ue han sido detenidamente d iscutidos en otro lugari l1 ). Nuestra intenci6n es pragmatica: ofrecer una breve desc ripc i6n de los melodos eSladfstic.o inferenciales que a ju icio nuestro son los mas usados en relaci6n con los parametros epidemio l6gicos considerados en este !ibro. Se asume que el lector de este apendice esta fam iliarizado con conceptos bioestad fsticos basicos, tales como la d istribuci6n normal estandar (puntaje z), la pmeba t, la desviacion estandar, el error estandar, los intervalos de confianza, las pmebas de hip6-
376
EPIDEMIOLOGiA lNTERMEDIA; CONCEPTOS Y APLICACIONES
{esis, y los valores p . (Para una revision de estos conceptos basicos, e l lector debe acudir a tex(Os de bioestadfstica, tales como el Armitage y Berry(l) 0 e l de A ltman(4)). El prop6sito general del d.lcu lo de imervalos de confianza y para la realizaci6n de pmcbas de hipotesis es el de est imar la incertidumbre estadfstica en lorno a la medida del riesgo 0 asociaci6n estimada en el estudio (la asf Hamada estimado/l pl/nfllal en relaci6n al verdadero valor, (desconocido), del p(mimeflv en la poblaci6n de referenda). Aunquc se induyen procedimientos cipidos en algunos casos espedficos, la estruct ura general de la presemaci6n para la mayorfa de estas medidas es como sigue: 1. Para la mayor(a de los ejemplos se presenta el metodo para caicu lar la estimaci6n de la varianza, 0 de su ralz cuadrada, el error esllindar, S in embargo, cuando el error estandar es mafematicamente mas complicado (por ejemplo, para coeficientes de regresion), se supone que este habra de ser obtenido mediante analisis estadfstico asistido por Ia computadora, de modo que este paso se omite. 2 . A part ir de la est imaci6n punt ual del parametro en cuest i6n y de su error estandar (EE), se expone la formu la para e l intervalo de confianza al 95%. La estructura general de esta f6 rm ula es como sigue: Est imaci6n puntual ± LI ,96 x EE (estimacion)l Notese que 1,96 es el puntaje z (puntaje nonnal estandar) correspondiente al nivel del 95% de confianza (es decir, un error alfa de 5 %). Los intervalos de confianza para otros niveles del error alfa pueden ser obtenidos mediante el simple reemplazo de este valor por el correspondiente puntaje z (por ejemplo, 1,64 para intervalos de confianza al 90%,2,58 para intervalos de confianza al 99%, etc.). 3. Para algunos de los Indices se presenta la pmeba de la hipotesis nula (depend iendo de nuestra valoraci6n acerca de su relevancia en cada caso particu lar y dc la frec ucncia conque se cmplca cn la litcratura) . La 16g ica y la estmctura de estas pmebas de hi p6tesis son tambien bastante homogeneas para las diferentes mediciones . La pmeba estandar de hip6tesis se disefia para valorar la hil'6tesis IIIlla, esto, es la ausencia de una d iferencia (absoluta 0 relativa) 0 una correlaci6n . As!, para medidas abso/utas de asociaci6n (por ejemplo, una d iferencia entre dos medias 0 dos tasas) la hip6tesis nu la se fonnula como sigue: Ho: Verdadero parametro = 0 Para medidas relarivas de asociaci6n (por ejemplo, un riesgo relativo, una razon de tasas, 0 un odds ratio) la hi p6tesis nu la se fonnula del modo siguiente: Ho: Verdadero parametro = I Solo en unos pocos casos se presentan formu laciones especfficas para la realizaci6n de pmebas estadfsticas . En otros, e l rec urso general eleg ido para una prueba de hiporesis ha sido e l de calcular un puntaje z mediante la d iv ision de la esri macion puntual por su error estandar: Est imaci6n p untual EE (estimacion)
,
= puntaJe z
0, equ ivalentemente, usar el cuadrado del puntaje z, que tiene una dist ri bucion ii-cuadrado con un grado de libertad . 4. En la mayorfa de los casos se presenta un ejemplo de cada uno de estos dlc ulos (usual mente basado en uno de los ejemplos dell ibro) .
ERRORES ESTANDAR.INTERVALOS DE CONFIANZA. Y PRUEBAS DE HIP6TESIS..
377
Finalmente, consignamos un detalle de da notaci6m) utilizado a 10 largo de este apendice: el simbolo dog X), se re fiere allogantmo natural de x. es decir. ellogaritmo en base e . EI correspondiente antilogaritmo es la funci6n exponencial. la cual se denota por medio exp (x) u, ocasionalmente, mediante e' .
A.!, ESTIMACION DE SUI'ERVIVENCIA ACUMULADA Como se describe en e l Capitulo 2, Secci6n 2 .2 .1 , la estimac i6n de la supervivencia acumulada es e l prod ucto de las probabilidades condicionales de sobrevivir para todos los intervalos precedentes (en el caso de la tabla de vida c hisica actuarial) 0 para {odos los eventos precedente~ (si se trata del metodo de Kaplan-Meier; vease Capitulo 2, Tabla 2.3) .
Varianza y error estandar (formula de Greenwood) En 1926, GreenwcxKi(s) describi6 la sigu iente formu la, con la cual se obtiene un valor aproximado de la vananza del estimado de supervivencia acumulada en e l momento i: V", (5,) • (5,)' x
±(
J~ I
j
d
)
(ij ) donde j indica todos los eventos previos en el tiempo (0 intervalos) hasta el momento i incl usive, d es el numero de muertes en cada momento (tfpicamente I en e l metodo de Kaplan-Meier, cualquier n umero en el metoda de tabla de vida clasica) , y fI es e l denominudor -eslO es, el ndmero de individuos en riesgo en cada momenta (0 el denominador «corregido~) en la tabla de vida - vease Ecuaci6n 2.1 en e l Capitulo 2, Seccion 2.2. 1). EI error estandar (EE) puede ser obtenido como la raiz c uadrada de la varianza: II) (II) -
EE (5;)-5; x
Intervalo de confianza al 95 % Este puede ser obtenido a partir de la estimacion puntual (5;) y la EE (5;) como sigue. 5; ± I I ,96 x EE(5;)]
Ejemplo Para calcular el error estandar de la estimacion q ue se hizo en la Tabla 2.3 de la supervivencia acumulada a los 9 meses se necesita la estimacion de 5~ registrada en la tabla (U,675) y e l nlimero de eventos e individuos en riesgo en todos los momentos previos al noveno mes (es decir, 1,3 Y 9 meses): EE 59 ... 0,675 x ( )
j(
1 1 1 ) = 0, 155 + + 10(10 - 1) 8(8 - 1) 7(7 - 1)
378
EPIDEMIOLOGiA lNTERMEDIA ; CONCEPTOS Y APLICACIONES
As!, el intervalo de confianza al 95% puede obtenerse como sigue :
0,675 ± ( 1,96 x 0, 155) = 0,675 ± 0,304 00,37 1 hasta 0,979.
A.2. TASA DE INCIDENCIA (l'OK PERSONA TlEMPO) Una tasa de incidencia por persona-tiempo se obtiene d ividiendo eI nlimero de eventos por la suma de las contribuciones en tenninas de personas-tiempo debidas a todos los individuos en la poblad6n que se estudia a 10 largo del intervalo de tiempo que interesa. Pucsto que lIsualmente las tasas son calculadas para eventos raros (es decir: el numerador es por 10 general un numero pequeno comparado con el denominador), puede suponerse que el nlimero de eventos sigue una distribud6n Poisson(3). Los procedimientos para calcular la varianza y e l error estandar de la tasa se basan en este supuesto.
Interva lo de confianza al 95 % Una manera simple de calcular los Ifmites del intervalo de confianza para una tasa se basa en la tabla provefda por Haenszel et al. (6) (vease tambien Breslow y Day (7 1'olg 70) : Valores tabulados de los ractores a empiear para calcular Ifmites de confianza a195 % para una variable que sigue una distribucion de Poisson NUmero ob.erv.do duventos en los cualH se basa II Htmacion I
7 3
•5
• 7
8 9
W H
" " "" " "" " ro
Foctor
Faolor
~I
"
limite intl!fior
0,0253 0.121 0,206 0.272 0.324 0.367 0.401 0.431 0.458 0,080 0.499 0,517 0.532 0,546 0,560 0,572 0,", 0.593 0.002 0,611
l im~e
superior
5,57 3,61 2,92 7, • 7," 2, 18 7,00 1,97 ' ,00
',. '," 1,75
1,71 ' ,M ' ,~ 1,62
' ,W
',. ',. ',-
Ninnero ob.e..""" de eventOi en los cuales Ie basa 10 estimaciilrl
Fac:tOf d,l limile inferiOf
21
0,619 0,627 0,'" 0,641 0,647 0,653 0,659 0,865 0,670 0,675 0,697 0,714 0,729 0,742 0,770 0,785
" " 23 25 26 27
" ~ ~
35 <0 05
•
W 70 W
O,7!l8
00
0,809 0,818
""
FactOf ~I
limite IUperiOf I ," 1,51 ' ,OO 1,49 1,48 1,47 1,46 1,45
',« 1,43 1,39 ' ,~ ' ,~ 1,32 ' ,~ 1,27 1,25 1,24 1,22
Nilmer<> ab..,r....da de eventOi en los cuote! de baSI II estimacion
,ro
'"
'W ' 00 200 250 300
3. 800 ,OO 500 600 700 800 900
'''''
Factor limite interior
Fa
0,833 0,8« 0.854 0.862 0,"" 0.882 0.892 0,899 0,,," 0,9 11 0.915 0.922 0.928 0.932 0.936 0.939
' ,200 1,184 1,171 1,1SO 1,151 1,134 1,121 1,112 1,104 1,098 1,093 l .oa4 1,078 1,072 ' ,068 ' ,06<
~I
FuerHe; W Haenszel, DB Loveland, and MG Sirken , Lung Cancer Mortal ~y as Related to Resideoce and Smo· ki ng Histories, I. WMe Males. Journal 01 lhe NariDl121 Cancer Inslilule, Vo l 28. !W7· 1001. 1962.
ERRORES ESTANDAR.INTERVALOS DE CONFIANZA. Y PRUEBAS DE HIP6TESIS..
379
EI proceso involucra dos pasos : I. Est imar un intervalo de confianza para el numero de eventos (el numerador de la tasa): multiplicar el numero de evemos observados por los Ifmites inferior y superior mostrados en la tabla. (N6tese que, para numeros grandes, puede realizarse una interpolaci6n aproximada por ejemplo, si el numero de evemos es 95, los factores Ifmites serfan, aproximadamente, 0,8 13 y 1,23) . 2. Usar estos Ifmites inferior y superior del numero de eventos para calcular los Ifmites de confi anza de la tasa empleando el numero de unidades persona-tiempo como denom inador. Ejemplo En el ejemplo hipotetico citado en el Capitulo 2, al comienzo de la Secci6n 2.2, dos eventos fueron observados para un total de 500 dfas de seg uimiemo . La tasa de incidencia es 12/500 = 0,024 por personas dfas, 0 2,4 por 100 personas-dfa. Los Ifmites de confianza al 95 % para este comeo, suponiendo una distribuci6n de Poisson, son inferior = 12 x 0,517 = 6,2 superior = 12x 1,75=2 1,0 As!, los Ifmites de confi anza a195% para esta tasa son: inferior = 6,2/500 = 0,0 124 por personas-dfa superior = 2 1/500 = 0,042 por personas-dfa Esto es, el intervalo de confianza al 95% para la tasa observada (2,4 por 100 personas-d fa) va de 1,24 a 4,2 por 100 personas-dfa.
A3. RIESGO RELATIVO Y RAZON DE TASAS Riesgo relativo (razon de probabilidades) EI riesgo relativo es la raz6n de dos probabilidades que representan respectivas incidencias acumuladas: la raz6n de la proporci6n de individuos expueslOs con el evemo de interes respeclO del total de expueslOs, dividida por la proporci6n de individuos no ex puestos, con el evento, respecto del numero total de sujetos no expueslOs (vease Capitulo 3, Tabla 3.2, Ec uaci6n 3.1 ). Considerese la siguiente notaci6n:
Expuestos No expuestos Total
Enfennos
No enfermos
Total
a
b
a+b
d
c+d
h+d
T
,
a +c
380
EPIDEMIOLOGiA lNTERMEDIA ; CONCEPTOS Y APLICACIONES
EI riesgo relativo (RR) (a partir de la Ecuaci6n 3 .1 ) es :
a a+b c c+d
Error estandar Puesto que el riesgo relativo es una med ida multiplicativa y resu lta por tanto asimetricameme distribuida , su error estandar (EE) necesita ser calculado en escala log ar{tmica . De este modo. el error estandar dellogaritmo del riesgo relat ivo es (~ ) :
EE(log RR) =
j
d
b
+ ---:--=---0a(a + b) c(c + (1)
Jntervalo de confianza af 95%
El imervalo de confianza al 95 % debe (ambien calcu larse en escala logarftmica: 95% IC(log RR) = log RR ± 1,96 x EE(log RR)
= log RR± ( ' ,96 x
J
a(a
b
+ b)
+
d ) c(c + cD
EI intervalo de confianza para el riesgo relativo se calcula aplicando e l anti log afirma (exponenciacion) de estos n limeros
95% IqRR) = exp { log RR ± [ 1,96 x
J
b + d ]} a(a+b) c(c + cD
Nota: Una manera ra pida de realizar este calculo es como sigue : LImite inferior LImite superior
RR RR
x e -i I.%,EE( log RR JI x e jl .%.E£( logRR)i
Prueba de /tipotesis La hi p6tesis nu la es: Ho :RR = 1
Se emplea ei Ji cuadrado usual 0 ia prueba exacta de Fisher para tabias de contingencia de dos por dos.
ERRORES ESTANDAR.INTERVALOS DE CONFIANZA. Y PRUEBAS DE HIP6TESIS..
381
Ejemplo Con los datos del Capitulo 3, Tabla 3.3, el riesgo relativo de infarto del miocardio se estima como: RR = 0,0 18 =60 0,003 ' el error estandar del logaritmo de esta estimacion es EE(log RR) =
°
-:-;cc::9", .8::.20:::-:,c- + 9 .970 = 197 180( 10.000) 30( 10.000) ,
ASI el intervalo de confianza al 95 % puede obtenerse como sigue:
95% IqRR) = exp Hog (6,0) ± (1 ,96 x 0,197)1 = exp LI ,792 ± 0,386J LImite Inferior = exp I I ,406J = 4,08 exp 12,178J = 8,83 LImite Superior Nota: La via ra.pida alternativa es: LImite Inferior 95% IC (RR) = 6,0 x e - (I.96,OI97( = 4 ,08 6,0 x ei1.96x01 97 ) = 8,83 LImite Superior 95% IC (RR) Razon de tasas (razon de densidades de incidencias) Ederer y Mantel(9) propusieron procedimientos aproximados para calcular el interva10 de confianza de una razon de tasas . Las definiciones para las notaciones que seran empleadas son:
0, = 0, =
L, L, R, R,
= = = =
RR =
Eventos observado en el gmpo I Eventos observado en el gmpo 2 Personas tiempo observadas en el gmpo I Personas tiempo observadas en el gmpo 2 o !iL l = Tasa del evento en el grupo 1 021L2 = Tasa del evento en el grupo 2 RIIR2
Jntervalo de cOlljianza al 95%
Realizar los sigu ientes dos pasos: I. Fijar Ifmites de la razon de eventos observados en un grupo (por ejemplo, gmpo I) res pecto del nlimero total de eventos observados: p=
--=-0,-,,-::0 1 +0 2
382
EPIDEMIOLOGiA lNTERMEDIA ; CONCEPTOS Y APLICACIONES
Emplcando la f6nn ula general para el error estandar de una proporci6n p binomial , el limite inferior (PI) y superior (P,) al 95 % de confianza para esta raz6n son:
2 . Convertir eS(Qs Ifmites en una raz6n de {asas: RR ,-
P,]L, [ I - PI x -L I''
Pruebas de Ilipotesis Para evaluar Ho: RR= I , puede lIsarse una prucba de ji-cuadrado aproximada con un
grado de libertad: l _
X1 -
(0 1 - E d EI
2
" ",:-,.:£",,),-' + -'. -(0 £2
donde
Ejemplo 0 1 = 60, L I = 35.000, Rl = 0,00 171 O 2 = 45 , L,. = 30.000, R2 = 0,00 15
RR =0,0017 1/0,00 15 = 1,14
•
60
p= - 105
Los Ifmites de confianza al 95% son :
PI=~ - ( 1 ,96 X 105
- - x - - x - - =0,4768 105 105 105
p.= -60- + ( 1,96 x
- - x - - x - - =0666 1
105
60
45
60
45
lOS
105
I)
I)
105
'
ERRORES ESTANDAR.INTERVALOS DE CONFIANZA. Y PRUEBAS DE HIP6TESIS...
RR 1 = RR, =
0,4768 O~232
x
30 .000 35 .000
0,666 1
x
0,3339
30 .000
35 .000
383
= 0,78 = 1,7 1
La prueba de hip6tesis se !leva adelante del modo sigu iente: E\ = (60 + 45) x
E2 = (60 + 45) x X~=
35 .000 = 56,54 65 .000 30 .000
65 .000
= 48,46
(60 - 56,54)' (45 - 48 ,46), + =0,46; P >O,5 56,54 48,46
A.4, ODDS RATIO (EMPAREJADOS Y NO EMPAREJADOS) Estudio de casos y controles no emparejados Basados en la notaci6n del Capft ulo 3, Tabla 3.6 (0 a pan ir de la tabla en la Secci6n A.3, su poniendo un esquema de muestreo que opera con casos y controles) en el cllal los controles (celdas b y d) son una muestra de no casos, el odd.\· ratio puede cakularse como la razon de productos cruzados:
axd OR = - bxc Error estalldar
Como con el riesgo relativo (vease Seccion A .3), en vinud de su naturaleza m ulti pi icativa, el error estandar para el OR se cakula en escala antilogarftm ica, como describio WOOlfl lO): EE(log OR) =
JI I I 1 - + - + - +abc
d
Jntervalo de cOlljiallZQ al 95%
El intervalo de confianza al 95% tambien se calcula en escala logarftmica: 95 % lC(log OR) = log OR ± LI ,96 x EE(log OR)I
= log OR ± (,96 x
~ + _I + ~ + _l ) abc
d
384
EPIDEMIOLOGiA lNTERMEDIA; CONCEPTOS Y APLICACIONES
Los Ifmites de confianza para e l odds ratio pueden ser obten idos tomando e l antilogaritmo de estos numeros (exponenciando):
95% IC(OR)=eX P [IOgOR±(1,96X
j -'
+~+ _d' )]
+ -' abc Nota: Una manera rapida para estos casas es la sigu iente: Limite Inferior del Ie 95 %
OR x e-1L96,EE(logORJI OR x e[l.96 .EEi log O R))
Limite Superior del le 95%
Prueba de hipotesis Para valorar Ho: OR = 1, puede lIsarse la pmcba lIsual de Ji-Cuadrado 0 la prucba exacta de Fisher para tablas de contingencia de 2 x 2.
Ejemplo Con los datos del Capitulo 3, Tabla 3.6: OR= 180x997 =609
982 x 3 0 ' EI error estandar dellogaritmo de esta estimaci6n es: EE(log OR) =
1
1
I
1
-- + -- ++ - - =0202 180 982 30 997 '
EI intervalo de confianza al 95% se puede obtener de la siguiente forma:
= ex p Dog 6,09 ± ( 1,96 x 0,202)1 = exp LI ,807 ± 0,3961 LImite inferior = ex p 11,4 111= 4, 10 LImite superior = exp 12,203 J = 9,05
95%IC(OR)
Nota: La alternativa mas rapida es :
°
LImite inferior = 6,09 x e-l l 96 , 02021 = 4, I LImite superior = 6,09 x elL96 , 0 2 0 21 = 9,05
Estudio de casos y controles emparejados En los estudios de casos y controles en los cuales los casos y los controles se emparejan individualmente, el odds ratio, se est ima como el ntlmero de pares en los cuales e l caso es expuesto y el control no. dividido por el numero de pares en los c uales
ERRORES ESTANDAR.INTERVALOS DE CONFIANZA. Y PRUEBAS DE HIP6TESIS..
385
el caso no esta expues(O y el control sf 10 esta. ASI, basandonos en la notaci6n del Capitulo 7 de la Tabla 7.1 2, tenemQs: b
OR = -
c
Error estalldar EI error esrandar del logarirmo de los OR emparejados es : EE(log OR) =
JP: - +b
I
c
Jntervalo de cOllfianza al 95%
EI intervalo de confianza al 95% {ambien se calcu la en escala logarltmica: IC 95 % (log OR) = log OR ± 11,96 x EE(log OR)!
= IOg OR±(1 ,96 X
J~
+ :)
Los Ifmites de confianza para el olids ratio pueden obtenerse (Omando los antilogaritmos de dichos nlimero (exponenc iando):
IC95 % (IOgOR)=«P[ IOgOR±( 1,96 X
J~
+ :. )]
La misma via rapida que para los odds ratio no emparejados puede emplearse aqui
Prueba de hipotesis Para evaluar la Ho: OR = I, usar la prueba de ii-cuadrado de McNemar (correg ida por continuidad) con 1 grado de libertad. -,(I:b:.-,--:::. cl _-", I ),-' h+c
X~=bJemplo
Con los datos en la Tabla 7. 12, Capitulo 7, tenemos :
65 OR= = 1,55 42 EI error estandar dellogaritmo de la estimaci6n es: EE(log OR) =
I
~ -
65
+-
42
=0, 198
386
EPIDEMIOLOGiA lNTERMEDIA; CONCEPTOS Y APLICACIONES
Los Ifmites de confianza se obt ienen del modo sig uiente: Ie 95 % (OR) = ex p lIog 1,55 ± ( 1,96 x 0, 198)1 = exp [0,438 ± 0,388[ LImite inferior = ex p 10,0501 = 1,05 LImite superior = exp 10,826J = 2,28 Nota: La via ra pida alternat iva es: LImite inferior = 155 x e - 11.%.O.l
', = -,(::: 16,,: 5 -c;-" 42::-1-;c-'-' I )_' = 4,52, P < 0,05 X 65 + 42
AS. RIESGO ATRIBUIBLE Riesgo atribuible en explicstos Para la fracci6n simple de exceso atribuible - cs(o es, la diferencia en la incidencia entre expuestos y no expucs(Os (Capitulo 3, Ecuaci6n 4.3) - la varianza p uede est imarse como la suma de las varianzas de carla uno de los estimados de incidencias. Por ejemplo, si los est imados de incidencia se basan en la supervivencia ac umu lada, la varianza del riesgo atri bu ible sera la su ma de las varianzas indiv iduales obtenidas con e l empleo de la f6nn ula de Greenwood (vease Secci6n A .I ). El error estandar es entonces la rafz cuadrada de la varianza, a part ir del cual se pueden obtener est imaciones de los Ifmites de confianza al 95 % aSI como evaluar h ip6tesis . Para ello, puede usarse el enfoq ue general bosquejado en la introd ucci6n de este apendice. Riesgo atribuible porcentual en los expuestos
( % R ~xp)
Puesto que el % RA",p (Capitulo 3, Ecuaci6n 3.5) se red uce a la sigu iente ecuaci6n (Ecuaci6n 3 .6): m ·,0
RA u p __ q+- qq+
100- RR - l x 100 RR
x_
esta medida es una funci6n de un solo parametro (el riesgo relativo, R R) . Asf, una estimaci6n del intervalo de confianza para el % RAexp puede basarse en el intervalo de confianza para el RR (vease Secci6n A.3) . Riesgo atribuible porcentual en la poblaci6n ( O/O RA poII) La f6nnula de Levin para e l d lculo de % RApoII basada en los datos de un eSllldio de cohorte (Capflll io 3, Ec uaci6n 3 .1 0), es:
ERRORES ESTANDAR.INTERVALOS DE CONFIANZA. Y PRUEBAS DE HIP6TESIS..
% RAPob =
387
po (RR - I) x 100 p. (RR - I)+l
donde RR es el riesgo relativo estimado y p. es la proporci6n de indi viduos expues{Os en la poblaci6n les decir, basado en la notacion de la tabla de la Secci6n A.3, p. = (u + b) I TJ. En un estudio de casos controles, supon iendo que la enfermedad es de baja prevalencia y que los controles son razonablemente representativos del total de la poblaci6n de referencia, el RR en la formu la de Levin puede ser reemplazado por eJ odds ratio (vease Capitulo';, Secci6n 3.3.2), y po puede estimarse a partir de la prevalencia entre los controles .
Error estiilldar
Las siguientes formulas, expuestas por Walter(ll) se basan en la anotacion de la tabla de la Seccion A.3. Para el % RAf>OI: calculado con los datos de la cohone: EE %RA pob=
cTlad(T - c)+bc 2J --;---'-:-;-:--'----;:-:--"- x I 00 (a + (Y (c + (1) 3
Para %RA pob calculado con datos procedentes de un estudio de casos y controles: EE %RA pob =
+
+
b ) x 100 d(b + d)
JIItervalo de cOlljiallZU al 95%
EI intervalo de confianza al 95 % puede calcu larse empleando las estimaciones puntuales y los errores estandar arriba cons ignados : IC 95%(%RA Pob) = %RAPob ± 1,96 x SE(%RApob) Prueba de hipotesis
Para evaluar Ho: %RAPob = 0, se obtiene el puntaje z del modo siguiente:
Rjemp/n
De acuerdo con los datos del estudio de cohone hipotCiico del Capitu lo 3, Tabla 3.3, el RR de infarto de miocardio es 6.0, con el cual se comparan hipenensos graves con no hipertensos;la prevalencia de ex posici6n (hipertension sistolica grave) es 50 %. As!, el riesgo atribuible poblacional es:
388
EPIDEMIOLOGiA lNTERMEDIA ; CONCEPTOS Y APLICACIONES
% RA pob
(0,,,6:...-__1,,-)-,- x I 00 = 7 1,4% = -::--,0""5.0: O~(O,6 - 1) + 1
EI error estandar de esta estimaci6n es: SE(%RA poo ) =
03:. ° -'-,:::2:::°.::.00 = °-"'-1"1:.8°-'--'-,,:9:..9,,7.::°,:.'.,.:-19,,.:. 97,,°'-+ :...09:::.8:::2:. 0-,-,:::3,,0--, 21
x
100
2 103 X I 0 J)OOJ
= 4,82
%
EI intervalo de confianza al 95% se obtiene del modo sigu ieme: Ie 95%(%RA l'ob)
= 7 1,4 ± (I ,96 x 4,82) = 7 1,4 ± 9,4
= 62,0 % LImite superior = 80,8 % LImite inferior
La prucba de hip6tesis se Jleva adelante como sigue : 7 1,4 - = 14,8 , P
4,82
A.6. DIFERENCIA ENTRE DOS TASAS AJUSTADAS o I'ROBABILIDADES (METODO D1RECTO) $e define d = l' A - r s; esto es, la diferencia de dos probabilidades ajustadas (vease Capitulo 7, Secci6n 7.3. 1, Tabla 7.3)
Error esttilldar Un error estandar aprox imado para d (d es una diferencia estimada ajustada , por ejemplo, exceso de incidencia), basada en i = 1 ... k estratos) se obtiene empleando la f6nnula (2) :
± W? Pi EE(d) =
j-
I
( I _ p,)
(_1_+ _1_) n iA
/liB
donde los Pi son las tasas globales espedficas por estratos (ambos gru pos de estudio combinados): Pi = II jA +ni B
ERRORES ESTANDAR.INTERVALOS DE CONFIANZA. Y PRUEBAS DE HIP6TESIS..
389
y las 11'; son las ponderaciones de la poblaci6n estandar empleadas para ajustar las {asas de los grupos de eswdio. N6tese que si se emplea e l metodo de minima varianza (es decir, si estos pesos se calc ulan como sigue; vease; Capitulo 7, Secci6n 7.3 .1 ):
la f6rmula anterior es sus{ancialmcnte mas simple:
•
I
II'; I'; ( I - Pi)
;_ I
EE(d ,"";anz.
minim.)
= -'-----------
• Wi
I
;_ 1
Jntervalo de cOllfianza al 95%
EI intervalo de confianza al 95% puede obrenerse usando el planteamiento general que se expuso en la introd ucci6n de este apendice: d ± LI ,96 x EE(d)J
Prueba de hipotesis
La evaluaci6n de la hipotesis tambien emplea eI enfoq ue general (vease arriba): d
.
-;::c;:-;- - puntaJe Z
EE(lJ)
Ejemplo
Los datos para este ejemplo provienen de l esrudio de Pandey ef at. m ) donde se compara la mortalidad para diferentes nive les de consumo de vitamina en la dieta en e l estudio de cohorte de la Western Electric Company. Estos datos fueron empleados como un ejemplo para ilustrar las tecnicas de evaluaci6n de la confusi6n en e l Capitu lo 5 (Tab las 5.1 )' 5.5) . A los efeclOs del ejemplo actual la categoria «mode rada ~) se ignora y el prop6sito es calcu lar la diferencia ajustada segun habito de fumar en tasas de mortalidad entre caregorias de consumo vitamfnico atfo y bajo, asi como e l correspondiente interva lo de confianza para la diferencia ajustada . Sobre la base de los numeros present ados en las {ablas arriba mencionadas, se constmye la sigu iente tabla de trabajo para el dlcu lo de las diferencias ajustadas (usando aju ste directo con e l metodo de minima varianza) y su error estandar:
390
EPIDEMIOLOGiA lNTERMEDIA ; CONCEPTOS Y APLICACIONES
Hiiblto
••
fumar No Sf
BaJo
Alto
consumo de vltamlnas'
conSlimo
Minima varlanza estandar Total
de vltamlnas'
Tasa N
Tasa
4.260 6.447
N
N (WI)t
N." esperado N." esperado de muertes de muertes (Bajo)!
w,p; (1- p ;)t
N
Tasa
0,0134
5.143
0,0103
9.403 0,0117
2330,020
31,1763
24,0115
26,9386
0,0214
6.233
0,0178 12.680 0,0196
3169.097
67,8355
56,4367
61,0102
5499,117
99,0118
80,4482
87,9488
Suma
(P,)
(Alto)1
- vease latlla 5.4, t.:apilukl 5 • Los numeros esperados que aparocen en la labia son exactos y pueden d ilen. ligeramente de aquellos oIllenioos usando las lasas mostradas para aHo y bajo consumos pues\o que la "Rima ha sido redondeada.
As!, las tasas ajustadas son : • para el grupo de bajo conslimo vitamfnieo: 99,01 18/5499, 11 7 = 0,0 1080 • para el gru po de alto consumo vitamfnico: 80,4482/54992, 11 7 = 0,0146. La diferencia ajustada entre los gmpos de alto y bajo consumo vitamlnico es por 10 tanto: (f = 0,0 146-0,0 18 = -0,0034, 0 -3,4 por 1.000 . EI error estandar de esta estimaci6n puede calcu larse como: 87,9488 = 0,0017 5.499,1 17 EI intervalo de confianza al 95% se calcu la como sigue: -0,0034 ± 1,96 x 0,0017 LImite inferior = 0,0034 - 0,0033 = -0,0067 LImite superior = 0,0034 + 0,0033 = -0,000 I
A.7. RAZON ESTANDARIZADA DE MORTALIDAD La tasa de monalidad estandarizada (REM) y las medidas relacionadas tales como la raz6n eSlandarizada de incidencia (REI) se definen como el nlimero de evenlos observados (por ejemplo, muenes, casas incidentes) en una poblaci6n dada (0 ) por e l nlimero esperado de eventos (E) si la poblaci6n que se estudia luviera las mismas tasas que la de referencia (vease Capitulo 7, Secci6n 7.3 .2) . REM
=!!... E
Jntervalo de cOllfianza af 95%
Suponiendo que el nlimero de eventos esperados no esla sujeto a variabi lidad alealoria, una manera simple de oblener el inlervalo de confianza al 95% para una REM es
ERRORES ESTANDAR.INTERVALOS DE CONFIANZA. Y PRUEBAS DE HIP6TESIS..
391
calc ular los Ifmites inferior y superior para el ntlmero observado de eventos, 0 (vease Secci6n A.2), y entonces sustitllirlos en la f6rmula de la REM. (Para conocer de metodos alternativos, acudase a Breslow y Day (7).) Ejemplo A partir de los datos hipoteticos de la Tabla 7.8, Capitu lo 7, se observaron 70 muertes en el grupo, B. EI numero de eventos esperados obtenidos al aplicar las tasas de una poblaci6n de referencia es 110. As!, la REM est imada para el gmpo B de estudio es 70/ 110 = 0,64 . De acuerdo con la tabla de la Secci6n A.2, los factores para los Ifmites inferior y superior para una tasa basada en 70 eventos observados (0), respectivamente son: 0,785 y 1;27. As!, los Ifmites de confianza al 95% para 0 son o =70x7,85=54.95,yO =70x 1,27=88,9 . Loslfmitesdeconfianzaal 95 % resultantes para el REM son entonces:
,
,
54,95
REM, =
=O~O
110
88,9 REMs= - = 08 , I . 11 0
A.8. ODDS RATIOS DE MANTEL-HAENSZEL (Y RAZON DE TASAS) Error eslalldar Para una tabla de contingencia de 2 x 2 estratificada en k estratos (i = I, ... , k), una f6rmu la aproximada para el error estandar (EE) del estimador de Mantel-Haenszel para ellog OR ajustado, basado en la notaci6n del Capitu lo 7, Tabla 7.9, es debida a Robins et al (14):
EE(log OR MH) =
j.1
+
Pj=
Q,= R= Wj =
a, +tii N, hi
+ Ci N,
a, x eli N, hi X
N,
Cj
i.1
+
(Q,w,)
{.l:,. , Ro)' 2(± Ro) (±,.1 wo) 2( ,.1:, wo)' ,. j
Donde
2:
L (PiWj + QiR,)
~ (P.Ri)
j. 1
392
EPIDEMIOLOG iA lNTERMEDIA ; CONCEPTOS Y APLICACIONES
(Nota: Greenland y Robins (IS) dedujeron lIna eC lIaci6n an:lloga para e l calculo del EE del estimador de Mantel-Haenszel de la raz6n de tasas aj ustadas para datos estradficados de una cahone - (vease Capitulo 7, Secci6n 7.3.3) .
Jntervalo de cOllfiam.a af 95%
El mismo recurso descrito para odds ratio no aju stado en la Secci6n A.4 debe ser empleado aquf; esto es, e l d .lculo de los !fmilcs de confianza en una escala logarft -
mica y la exponenciaci6n de los resultados para obtener el intervalo de confianza para e l OR~1Il .
Prueba de liipolesis Nucvamente , sigu iendo la notaci6n del Capitulo 7, Tabla 7.9, puede calcularse lIna prucba de ii-cuadrado aproximada con un grado de libenad (independieme del nli mero de estratos involucrados) del modo sigu iente(161:
xi=
donde Ei es el valor esperado en la celda «a» en cada estrato, calculada a partir de los valores de los margenes como en cualquier prueba de Ji Cl/adrado (es decir, nil x lIl idN i).
Ejemplo A part ir de los resultados estratificados del CapItu lo 7, Tabla 7.1, la estimaci6n de ORMH fue de I ,0 I. La siguiente tabla de trabajo fue establecida para aplicar la formu la del EE: Sexo Caso Control
N
OR
P
0
R
w
PR
Pw+QR
Ow
81
1,00
0,691
0,309
1,963
1,852
1,357
1,886
0.572
219
1,00
0,521 0.479
12,626 12.584
6,572
"604
6,034
14.589 t4 ,436 7,929
14.490
6,605
EstralO 1
H
53
15
M
10
3
EstralO 2
H
35
53
M
52
79
Suma :
ERRORES ESTANDAR.INTERVALOS DE CONFIANZA. Y PRUEBAS DE HIP6TESIS..
393
Como se ve, EE(log ORMH) =
7,929 14,490 6,605 , + + -::--"":'-':= 2 x 14,5892 x 14,589 x 14,436 2 x 14,436 2
J
-:----,-:-e==-,--=
= 0,262 EI intervalo de confian za al 95% se obtiene del modo siguiente Ie 95%(OR) = exp Ilog 1,0 1 ± ( 1,96 x 0,262)J Inferior exp L-0504 1= 0,60 Superior = exp LO,525] = 1,69 (Nota: puede emplearse el mismo procedimiento rapido para el dJculo de los Ifmites de confianza del odds ratio que el que ~e mostro p..1fa el odds ratio cmdo, Secci6n A.4). La prueba de hip6tesis se desarrolla como sig ue:
63x 18x68x l 3
81'(81 - 1)
+
87x 132x88 x 13 1
2 19'(2 19 - 1)
Como se ve, el OR.\IH no es estadisticamente sign ificat ivo en este ejemplo .
A.9. COEFICIENTE DE REGRESION En e l Capitu lo 7, Seccion 7.4, se describen varios modelos de regresion para analisis mu ltivariado de datos epidemiologicos (lineal, log fstico, de Cox, de Poisson). Estos analisis de regresion son tfpicamente cond ucidos con ayuda de computadoras y paquetes estadisticos, estos penniten computar estimaciones de los coeficientes de regresion (b) y de sus errores estandar (EE (b)). Sobre la base de estas estimaciones, y sigu iendo el planteamiemo general descrito en la introduccion de este apendice, es posible obtener Ifmites de confianza y Ilevar ade lante pruebas de hip6tesis . Jntervalo de cOlljianza al 95%
EI imervalo de confianza al 95% para un coeficiente de regresion puede obtenerse con la form ula siguieme: b ± II ,96 x EE(b)J
Prueba de Ilipotesis
La hipotesis nu la se fonnu la como sigue: H o: ~=O
394
EPIDEMIOLOGiA lNTERMEDIA; CONCEPTOS Y APLICACIONES
donde
~
denota e l verdadero valor del para.metro en la poblaci6n de referenda .
La prucba estadfstica. en este contexto , se conace como estad istico de Wald:
b -==c'" puntaje Z EE(b) Ej emplos
Regresiotl lineal A partir del valor del coeficiente de regresi6n y de su error estandar para la tensi6n arterial sist6lica ( 10 mm Hg de incremento) en eI Capitulo 7, Tabla 7.16, el intervalo de confianza al 95 % puede calcu larse del modo siguiente: O,040± ( 1,96 x O,oI I )
Esto es, el imervalo de confianza estimado al 95% para el incremento en e l conteo de leucoc itos por 10 mm Hg de incremento en la tensi6n arterial sist61ica va de 0,018 hasta 0,62 miles x mm 3 • EI estad istico de Wald, se aproxima a (raves de un puntaje z. y se calcul a como:
z ... 0 ,040 = 3,64 0,0 11 Este valor se asoc ia con una P < 0,00 1, 10 c ual permite rechazar la hip6tesis nula con una probabilidad de error alfa inferior q ue 111 .000.
Regresiolllog{s/ica En e l Capftu lo 7, Tabla 7.18 e l eoefidente de regresi6n logfstica estimado asoc iado con la hipertensi6n es 0,5103, e l cual se trad uce en estimadones del oddJ· ratio de enfermedad coronaria ascendente a r!>~IOl = 1,67, 10 que pennite comparar a los hipenensos con los que no 10 son (aj ustado por todas las otras variables contenidas en la Tabla 7 .18). EI error estandar correspondiente al eoefidente de regresi6n est imado es 0,1844 (no mostrado en la Tabla 7.18). Asf, el intervalo al 95% de eonfianza para el coefidente de regresion se calcu la como sigue: 0,5103 ± (I ,96 x 0,1844) 00, 1489 (limite inferio r) y 0,8717 (lfmite superior) . EI intervalo de eonfianza correspondiente al odds ratio (OR) est imado puede ser obtenido mediante exponenciaci6n de estos Ifmites de eonfianza, 10 eual se puede concretar en solo un paso del modo q ue sigue: LImite inferior = exp lO,5 103- ( 1,96 x 0,1844)J = 1,16 LImite superior = exp 10,5 103+ (1 ,96 x 0,1844)1 = 2,39
ERRORES ESTANDAR.INTERVALOS DE CONFIANZA. Y PRUEBAS DE HIP6TESIS..
395
EI correspondieme estadfstico de Wald para el coeficiente de regresi6n estimado es:
z'"
0,5 103 2 6 = ,7 7 0, 1844
EI valor asociado de P para este puntaje Z es 0,006 . N6tese q ue este estadistico pennite valorar la hi p6tesis nu la (Ho: b = 0, 0 equivalentemente Ho: OR = I). EI mismo enfoque puede emplearse para ob{ener Ifmites de confi anza y apl icar pruebas de hi p6tesis para coeficientes de regresi6n y medidas de asociacion de rivadas dc los modclos dc rcgrcsi6n de Cox y Poisson.
Estadistico de Wald para la interacci6n Si e l modelo comiene un tennino de interacci6n (por ejemplo, el producto de dos variables x; vease Capitu lo 7, Seccion 7.4 .2, Ecuacion 7.4), la significaci6n estadfstica de la estimaci6n del coeficiente de reg resion, correspondiente (estadfstico de Wald) es una pmeba fonnal p..1fa la interaccion entre 2 variables. En e l ejemplo de la Ecuaci6n 7.4, el c ual es una variacion del modelo 2 de la Tabla 7 .1 5, q ue pennite una interaccion entre edad y tension arterial sistolica, el h3 estimado es 0,OCOO503 , con un error estandar de 0,OCOO570, al cual corresponde un estadfstico de Wald de 0,0082 (no estadfsticamente significativo). As!, estos datos no apoyan la hi p6tesis de que hay una interaccion entre edad y tension arterial sistolica en relacion con e l grosor de la car6tida .
A.IO. SENS lBILlDAD, ESI'ECIFIClDAD Y PORCENTAJE DE CONCORDANCIA Los proced imiemos de estadistica inferencial, para estas (res medidas son los mismos que aq ue llos q ue se emplean para cualq uier otra proporci6n simple.
Error esttilldar, intervalo de cOllftan za a195% Puede emplearse la formu lacion convencional para calcular e l error estandar (b) calculada en una muestra de N individuos: EE(P)
=
J
P( I;P)
Una vez q ue se calcula el error estandar, ya se p uede emplear la formula general para obtener Ifmites de confianza que se expuso en la introducci6n del apendice . Ejemplos Los siguiemes ejemplos se basan (odos en los datos de un estudio de validaci6n del autoinfonne de la «di fi cu ltad para ponerse de pie desde una silla»(17) (Capitulo 8, Tabla 8.13) .
396
EPIDEMIOLOGiA lNTERMEDIA ; CONCEPTOS Y APLICACIONES
Sensibilidad La sensib ilidad estimada es 71/(7 1 + 42) = 0,628. Para calcular el error estandar, ha de lIsarse como N e l numero total de verdaderos positivos (N = 11 3, e l denominador para la sensib ilidad):
EE(sensibi lidad) =
J
O,628( 1 - 0,628) 11 3
= 0,0455
As!, los !fmilcs de confianza al 95% son : Limite inferior = 0,628 - ( I ,96 x 0,0455) = 0 ,539 LImite superior = 0 ,628 + ( I ,96 x 0,0455) = 0,717
E specificidad La especificidad est imada es 455/(455 + 41) = 0,9 17 . Para calcular e l error estandar, debe emplazarse como N el numero total de verdaderos negativos (N = 496, e l denominador para la especificidad): rc-c~~-
(.]~-~0~,9~1~7~) EE(especl'nIdad) = JcO~ - ~~1~7~ 496
=0,0 124
As!, los !fmilcs de confianza al 95% son : LImite inferior = 0,917 + (1,96 x 0,0 124) = 0,893 LImite superior = 0,917 + ( 1,96 x 0,0 124) = 0,94 1
Porcelltaje de cOllcordancia EI porcemaje de acuerdo est imado es [(7 1 + 455)1/(609) = 8,64 . Para calcu lar el error estandar, ha de tomarse como N e l numero total de sujetos en la tabla (N = 609):
,
EE(% concordancla) =
JO,864( I - O,864) 609
= 0 ,0 139
As!, los Ifmites de confianza al 95% (usando valores porcemuales) son : LImite inferior = 86,4 - (I ,96 x 1,39) = 83,7% LImite superior = 86,4 + ( I ,96 x 1,39) = 89, I %
ERRORES ESTANDAR.INTERVALOS DE CONFIANZA. Y PRUEBAS DE HIP6TESIS..
397
A.H. ESTADiSTlCOJ DE YOUDEN Error estandar, intervalo de confianza EI estadist ico J de Youden se basa en la suma de dos proporciones (sensibilidad y especificidad) (vease Capitulo 8, Seeci6n 8.4.1) Suponiendo que ellos son independientes, el error estandar (EE) puede ealcularse del modo sigu iente:
EE(1)
Sens( I - Sens) + cE=.,~·pec..:.'(~I~---=E='p~,=,,,)
=
N ,·erd.
N ,·erd_
Una vez que se ealcu la el error estandar, puede emplearse eI enfoque general para obtener Ifmites de eonfianza que se bosquejo en la introduecion de este apendice.
Ejemplos EI ejemplo sigu iente se basa en los datos de la Tabla 8.5 del Capitu lo 8. EI estadfstico J de Youden estimado es ( 18/ 19) + ( 11 /30) - I = 0,3 14. Usando la f6rmu la anterior, el error estandar es :
EE(1) =
18 I x 19 19 19
II 19 -- x -+ 30 30 = 0, 102 30
Los Ifmites de confianza al 95% son : Limite inferior = 0,3 14 - ( 1,96 x 0, 102) = 0, 11 4 Ifmite superior = 0,3 14 + ( 1.96 x 0, 102) = 0.5 14
A. 12. KAPPA
EI estadfstico kappa es una medida ut il para la evaluaci6n de la fiabilidad de variables categ6ricas (vease Capitulo 8. Seeci6n 8.4.1) . La formu la para el dlculo del error estandar y el intervalo de eonfianza al 95% para kappa 110 pOllderado se estima como se muestra a contin uaci6n: Error estandar e intervalo de confianza a195 % Las fonnu las para el dlculo del error estandar de kappa pueden hallarse en la literatura(I ~). Consideremos una situaci6n en la eual se cuenta con dos leeturas replicadas (por ejemplo, lecturas heehas por dos sujetos , A y B) para un conjunto dado de valores
398
EPIDEMIOLOGiA lNTERMEDIA ; CONCEPTOS Y APLICACIONES
correspondientes a dena.~ pmebas . El resultado de la prucba tiene k valores posibles . La sigu iente tabla define la notaci6n para las proporc iones observadas (p) en carla celda y en cada marginal de la tabla de contingencia que res ulta de ambos conjuntos de iecturas. CLASIFI CADOR B
2
k
Total
p"
P I!
I'lk
1'1"
2
P21
P22
I'll<
1'2"
k
pu
I'V!.
Pu
Pk"
Total
1'"1
1'"2
p.,
'"
0
'" Ii:
« U Vi
...l U
Basado en esta notaci6n, el EE del kappa estimado puede obtenerse como sigue . ,
1
,
) ~ x p. +p-.- P o x vn
EE (K ) = ( I
donde poes la concordancia esperada por azar, que se calcula a traves del produc(O de las proporciones marginales simetricas (vease Capit ulo 8, Secci6n 8 .4 .1 ):
,
p<= I 1 PiP "i i~
Nota: Las f6rm ulas para e l error estandar del kappa ponderado pueden ig ualmente hallarse en textos especializados; vease, por ejemplo, Fleiss (1 8 ) .
Ejemplo EI siguiente ejemplo se basa en los datos de un estudio de autoinforme de «dificultad para ponerse de pie desde una silla,,(17) (Capitulo 8, Tabla 8.13) (vease Secci6n A.I O): Se observ6 que tenfa dlflcultades Comunlc6 que tenfa dlflcultades
s;
No
Total
s;
71
41
112
No
42
455
497
Total
113
496
609
FU"f)(
Ekler~,
M F""", "I ifl. , Cornpd riso" of P",fo·",anuo·Bas.,.j arl
Ametican Joumalof Epidemiology, Vol 149, 228· 235 , 001999, The Johns Hopkins Univers ity School or Hygie·
ne & Pu bl;,: Health.
Dividiendo los nlimeros de la labia por el tolal (N = 609), la siguienle labIa mues(ra las proporciones empleando la nolaci6n de la tabla previamente conformada .
ERRORES ESTANDAR.INTERVALOS DE CONFIANZA. Y PRUEBAS DE HIP6TESIS..
399
Se observ6 que tenia dilicultades Comunlc6 que tenia dilicultades
SI
SI
0.1166
No
No
0,1839 0,7471
Total
0,1856
Total
0,8161
0,81 44
Nora: las proporciones en las celdas discordantes no se mueSlran pueslO que eli as no se usan en £II cak:ulo. Fuenre: Datos tornaoos de M Ferrer er al., Comparison 01 Performance-Based and Self·Rated Fuoctional Capa· c ity in Spani.h Elderly, Americ
La concordancia observada es :
,
Po = I
PH = 0, 11 66 + 0,7471 = 0,8637
; ~
I
La concordancia esperada (por azar) es:
,
p. = LP;'IJ-; = (0, 1865 x 0,1839) + (0,8 144 x 0,8 161) = 0,6989
,.
As!, el kappa estimado a partir de estos datos es : K = po- I', I - I"
-,0.::,8", 6:.. 37,,-..,0:.:,6:.:9.::89 :.. = 0,547 1 - 0,6989
Usando la f6rmula de arriba, eI error estandar es como sigue:
(I
1 0.6989 + 0.6989' _ (OJ 839 x OJ 856 x (0.1839 + OJ 856)+) '" 0.041 0.6989) \1609 \ 0.8161 x O.8144 x (0.8161 + 0.8144)
As!, los Ifmites del intervalo de confianza al 95 % son: Inferior Superior
= 0 ,547 - (1 ,96 x 0,041) = 0,467 = 0,547 + (1 ,96 x 0,04 1) = 0,627
BlBLlOGRAFiA I. GOCKi man SN. P values, hypothesis test, and likelihood: implications for epidemiology of a neglected historical debate. Alii J Epidemiot 1993: 137: 48.'5-496 2. Royal R. Slatislical evidenu: A likelihood primer. Lo ndon: Chapman and Hall. 1997. 3. Amlitage P, Berry G. Slalis/ical melhods il1l11e(/iml resean·h. 3," ed. London. Blackwell. 1994.
4. Altman DG. PracliL'al slatis/ical for mediml sluden/s. London. Chapman and Hall. 1991.
400
EPIDEMIOLOGiA lNTERMEDIA; CONCEPTOS Y APLICACIONES
5. Greenwood M. A report on the natural duration of cancer. Rep PI/blic Hea/lh Med SlIb· jects 1926: 33: 1-26. 6. Haenszel W. Loveland DB, Sirken MG . Lung cancer mortality as related to residence and smoking histories.l White Males.} NaIl Callcer "lSI 1962: 28: 947-1001. 7. Breslow NE. Day NE. Slmislimlmnhods ill cancer researdl. Vol 2. The design and analysis of cohorl sllidies. Lyon, IARC Scientific Publications. 1987, 8. Katz D. Baptista L Azen SP el al. Obtaining confidence intervals for the risk ratio in cohort studies. Biome/ric 1978: 34: 469-474. 9. Ederer F, Mantel N. Confidence limiB on the ratio of two Poisson variables. Alii J Epide, m;0/1974: 100: 165,167.
10. Woolf B. On estimating the relation between blood group and disease. Ann Hum Genel 1955: 10: 251-253. II. Walter SO. Calculation of attributable risks from epidemiological data.lnl J Epidemiol. 1978: 7: 175-182. 12. Kahn HA. Sempos cr. Slalisliwi mt/hods in epidemiology. New York. Oxford University Press. 1989. 13. Pandey OK, Shekelle R, Selwyn BJ , n al. Oieatary vitamin C and l3-carotene and risk of death in middle-aged men: the Western Electric study. Am J Epidemiol 1995: 142: 12691278. 14. Robins J . Greenland S. Breslow NE. A general estimator for the variance of the MantelHaenszel odds ratio. Am J Epidemio/1986: 124: 719-723 15. Greenland S. Robins 1M. Estimation of a common effect parameter from sparse followup death. Biomelrics 1985: 41: 55-68. 16. Mantel N. Haenszel W. Statistical aspects of the analysis of data from retrospective studies of disease. J NaIl Cancer Insl 1959: 22: 719-748. 17. Ferrer M. Lamarca R. Orfila E Alfonso J . Comparison of perfommnce-based and selfrated functional capacity in Spanish elderly. Am J Epidemiol 1999: 149: 228-235. 18. Fleiss JL. Slalislicalmelhodsfor rales and proponiollS. 2." ed. New York. John Wiley and Sons. l'JgI.
APENDICE B Pruebas de tendencia (dosis-respuesta)
Cuando la exposic i6n es categorizada en mult iples categorfas ordinaleJ", puede ser de intcres evaluar si la reladan observada entre el incremento (0 disminuci6n) de los niveles de exposici6n y el riesgo (0 e l odtis) de enfennar siguen un patr6n lineal de dosis respuesta. Un ejemplo aparece en el Capitulo 3 al final de la Secci6n 3.4.1 , Tabla 3 .11 , en el e llal el odds ratio de craneosinostosis parec fa incrementarse c lIando aumentaba la edad materna atend iendo a una reladan dosis-respucsta(l). Una prucba para evaluar si la tcndencia observada es estadfsticamente significativa (es decir, si la hip6tesis nli ia de que no hay tcndcncia lineal puede ser rcchazada) fue desarrollada por Mantel(2). La formulaci6n que sigue se basa en la sigu iente notaci6n:
Estrato
PuntaJe
(~
('I
N.O de casos N.Ode controtes (a ,) (0 1
,
, Total
Total (n ,)
'"
"A
.. B
", N
EJ estadfstico siguiente sigue una distribuci6n ii·cuadrado con un grado de libertad:
Donde los puntajes (Xi) son vaJores que representan el niveJ de exposici6n en cada categorfa ord inal subsecuente (vease debajo).
402
EPIDEMIOLOGiA lNTERMEDIA ; CONCEPTOS Y APLICACIONES
EJ EMI'LO Para ilustrar la aplicacion de la prueba de tcndencia de Mantel, se emplean los datos del ejemploen e l Capitulo 3, Tabla 3. 11 . Con la finalidad de hacer mas simples estos dlc uios, los datos se han reorganizado en la siguiente tabla de trabajo : Edad (anos)
"
<20
n ,x,A a,x' - - N -
"
b,
n,
12
89
101
--6,748
n,x,
n,x,'
101
101
20 · 24
2
2
47
242
289
- 13,290
578
1.156
25 - 29
3
3
56
255
311
- 5,186
933
2 .799
>29
4
4
58
173
231
60.485
924
3 .696
173
759
932
35,262
2 .536
7 .752
Total
FuerHe: BW Alderman 61 al., An Epidemiolog ic Study of Craniosynostosis: Risk Indicators lor the Occurrence 01 Craniosynostosis in Colorado, American Journal of Epidemioiogy, Vol 128,431-438, ClI988, The Johns Hopkins Univers~y Schoo l 01 Hygiene & Public Health.
As!, aplicando la f6rm ul a anterior: [35,2621'
xi= -------'=='-------,,--- = 9,65 (
173 x 759 x [(932 x 7.752) - 2 .536 2J ) 932' (932 - 1)
al q ue corresponde un valor de P igual a 0,00 19.
NOTAS La hip6tesis nula correspondiente a esta prueba de tendenda es que no hay asodad6n lineal, 0, en otras palabras, que la I'entiiellfe de la asodadon en la medida que se incrememan los niveles de exposic ion es nula (plana) . As!, un valor de P significativo de eSla prueba viene a dedr que los datos no apoyan la hip6tesis que afirma q ue la pendiente es nula . Tal resullado no deberfa reemplazar el examen de los verdaderos estimados de los OR con la fina lidad de j uzgar si, efectivamente, existe una tendenda lineal. Como con cualquier otra prueba estadfstica, el valor P depende fue rtemente del tamano muestral; aSI, si e l tamano de m uestra es grande, una asodad6n de tipo J 0 de tipo umbral puede condudr a que declaremos la existenda de una tendenda significativa, incluso aunque la asodad6n no sea lineal. Por ejemplo, SlJ Pongamos flil e los OR eSfi mafios para c inco categorfas oni ina les rlc incremento rle una exposic ion dada (por ejemplo, qui miles de una variable cont inua) son 1,0 (referenda), 0,9, 1,1, 1,0, Y 3,0. Si el tamano muestral es sufidentemente grande , emonces la prueba de tendenda produdrfa un resul tado altameme significativo, 10 cual simplemente indica que la hip6tesis nula «
41)3
PRUEBAS DE lENDENCIA (DOS IS-RES PUESTA)
asociaci6n es practicamente plano, excepto por el abultado odd.\"ratio presente en el ult imo quint il , que produce un incremento en el odds correspondiente a los individuos de la ultima qu inta parte de la distribuci6n. Este fen6meno es anaJogo al que se discuti6 en el Capitulo 7 sobre el uso de modelos lineales para analizar patrones no lineales (Seccion 7.4.7) . La prueba de tendencia anteriormente considerada es analoga a la prueba de Wald para un coeficiente de regresi6n lineal (vease Secci6n 7.4 .8), salvo por el hecho de que este se basa en un pequeno numero de datos punt uales (cuatro en el ejemplo anterior). los c uales son I'0nderados con ac uerdo al numero de sujetos incluidos en las correspondientes categorfas . Asf, las mismas li mitaciones y precauciones que debfan tomarse cuando se usaba la regresion lineal valen cuando se estan interpretando los resultados de una prueba de tendencia . Se han propuesto fonn ul aciones alternativas a la prueba de tendencia anteriormente descrita, las cuales se basan en la evaluaci6n de tendencias lineales en proporciones (vease, por ejemplo, Cochran(l»). Dada la equ ivalencia aritmetica entre las proporciones y los odds, todas estas pruebas alternat ivas cond ucen a resu ltados similares: para consultar referencias adic ionales y una disc usion, veanse Fl eiss(~) 0 Schlesselman(s). En el ejemplo que nos ocupa, los puntajes fueron arbitrariamente fijados como I, 2, 3 Y 4 . N6tese que se obtendrfa exactamente el mismo valor de ii-cuadrado si se emplearan los puntajes - 1,0, I Y 2, en c uyo caso los d lculos (si fueran realizados a mano) serfan considerablemente mas simples . En el caso de categorizaciones ord inales basadas en variables cont inlL.1S (tales como la edad en el ejemplo) en lugar de estos puntajes completamente arbitrarios, puede ser mas adecuado seleccionar como puntajes los puntos medios de las variables que definen cada categorfa. Por ejemplo, suponiendo que los recorridos para las categorfas superior e inferior fueran de 10 a 19 afios y de 30 a 39 anos, respectivamente, los puntajes serfan 15,22 .5,27 .5 Y 35 con el sigu iente resultado:
Edad (ai'io s)
< 20
x,
"
b,
0'
12
89
47
101 289 311 231 932
20 - 24
2
15 22.5
25 - 29
3
27,5
56
242 255
>29
4
35
58
173
173
759
Totat
n,x,A a,x' - - N - 101 ,22 - 149,51
n,x, 1515
n,x,' 22.725
6502,5
146.306.3
--47,535
8552,5
235.193,8
529,244
8085
282.975
230,982
24.655
687.200
Fuenre: BW Alderman er a/.. An Epidemiologic Study of Craniosynostos is: Risk Indicators for the Occurrence of Craniosynostosis in COlo rado , American Joumr.! of Epidemiology, Vol 128. 43 1·438. 1t11988, The Johns Hop ki ns University Schoo l of Hygiene & Pubik: Health.
En este ejempl o , el ii-cuadrado resul tante es 10,08 , P = 0,00 15 . (A lternat ivamente, el puntaje para cada categorfa pudiera ser la media 0 la med iana para la variable en cuesti6n y para todos los individ uos incluidos en cada categorfa respectiva) .
404
EPIDEMIOLOGiA lNTERMEDIA; CONCEPTOS Y APLICACIONES
PRUEBA MULTI VARIADA DE T ENDENCIA Como se sefia16 prev iamente, la prucba estadfstica para tcndencias es la anaJoga a la prucba de Wald que valora la sign ificacion estadfstica de un coeficiente de reg resi6n lineal (vease Capitulo 7, Secci6n 7.4 .8 Y Apendice A.9). En efecto, un enfoque de regresi6n puede emplearse para evaluar la significaci6n estadfstica de una tcndencia lineal de dosis respuesta (empleando oddJ' ratio u alra med iada de asociacion, dependiendo del modelo estadfstico a mana; vease CapItu lo 7, Tabla 7.14) correspondieme a una variable ordinal mienfras se ajusrfl par covariableJ' adicionaleJ' incluidas en el modelo . Por ejemplo, puede ser de interes evaluar si el riesgo de craneosinostosis se incremema linealmente con la edad (categorizada como se h izo amerionnente) mientras se aj usta por covariables adicionales (por ejemplo. situaci6n soc ioeconomica, his(Qria fam iliar). En aq uella sit uacion, para lIevar adelante un procedimiento mu ltivariado analogo a la prueba de tendencia ameriormente expuesta, puede emplearse un modelo de regresion logfslica introduciendo la variable AGEGROUP como un simple termino ordinal (con valores 1,2, 3 Y 4, 0, c ualq uier otra alternativa q ue tenga sent ido, tal como se d iscmi6 amerionnente), jumo con cualq uier olra variable en el modelo que deba ser controlada. EI estadfstico de Wald para eI coeficiente de regresi6n correspondiente a esta variable puede ser interpretado como una prueba estadistica para evaluar la relaci6n dosis res puesta lineal para datos aj ustados . A I igual que para la prueba de tendencia para da(Qs no ajuslados, es import ante examinar si hay una verdadera tendencia dosis res puesta mediante inspecci6n de los est imados especfficos por estra(Qs (por ejemplo, mediante examen de los estimados basados en un modelo que milice variables Dummy) antes de interpretar esta prueba de tendencia estad lstica sobre la base de la regresi6n (vease CapItu lo 7. Seccion 7 .4 .7).
BlBLIOGRAFiA I. Aldennan BW, Lammer EJ . Joshua SC el al. An epidemiologic study of craniosynostosis: risk indicators for the occurrence of craniosynostosis in Colorado. Alii J Epidemiol 1998: 128: 431-438. 2. Mantel N. Chi-square tests with one degree of freedom: extensions of the Mantel-Haenszel procedure. J Alii SIal Auoc 1963: 58: 690-700. 3. Cochran WG. Some methoos for strengthening the common chi-square test. Biomelrics 1954: 10: 417-451. 4. Fleiss JL. Slalisliw/melhods for rales and proponiollS. 2 .· ed. New York. John Wiley and Sons. 198 1. 5. Schlesselman JJ . Case £'Ol1lro/ stlldies. New York. Oxford University Press. 1982.
APENDICE C Prueba de homogeneidad de estimados estratificados (prueba de interaccion)
Como se discmi6 en e l Capitulo 6, la interacci6n 0 la modificaci6n de cfcctos se prescnla cuando la asociaci6n entre una exposici6n dada y un desenlace se modi fica como resultado de la presencia (0 la magnitud) de una tercera variable (ellllodificador de efecto.\) Los diferentes aspectos q ue deben ser considerados cuando juzgamos si la heterogeneidad observada de la asociaci6n es efectivamente interacci6n 0 es debida a variabi lidad aleatoria de los est imados especfficos por estratos fueron discutidos en el Capit ulo 6 (Secc iones 6.9 y 6.10 .1 ). En este Apendice, se describe un procedimiento general para evaluar la hip6tesis de homogeneidad (es decir, fa lta de interacci6n) . Como con cualquier pmcba de hip6tesis, e l valor P resul tame de esta prueba de homogeneidad depende fuenememe del tamano m uestral. Este problema es especialmeme imponame cuando se trata de evaluar datos estratificados. Los estud ios epidemiol6gicos se disefian tfpicamente para optim izar la potencia estadfs{ica q ue penn i!a detectar asociaciones basadas en datos combinados procedentes de la muestra total. S in embargo, la potencia para detectar interacci6n esla frec uentemente limitada por lamafios de muestras insuficienles dentro de los estralos(l). Consideremos una situaci6n en la c ual se estima una medida especificada de asociaci6n R entre exposici6n y desenlace a 10 largo de k eslratos para un presunto modificador de efecto . La forma general de una pmeba estadlstica para una hip61esis de homogeneidad (es decir, Ho: la fuerza de la asociaci6n es homogenea a 10 largo de (odos los eSlralos) es analoga a un li po fam iliar de pruebas eSladfsticas para comparar dalos de supervivencia eSlratificados (la pmeba de log rank) y adopla la siguien(e forma general( '):
x,
k_I
=
,-,
!.. i. I
donde Ri es la medida de asociacion espedfica por estratos (para i = I hasta k) Vi es la correspondienle varianza, y R es el valor subyacente «comLln» estimado de la medida de asociacion bajo la hip6lesis nula. t>;la es usualmenle eSlimada empleando uno de los enfoques para oblener promedios ponderados de esl imaciones de asociaci6n espedficas por estratos descrilOs en la Secci6n 7.3 del CapItulo 7 (por ejemplo, ajus!e d ireclo. ajusle indireclo. Mantel-Haenszel). Esta pmeba estadfslica liene una d istribuci6n ii-Cuadrado con tanlos grados de libenad como el numero de eslralos menos I . Una imponanle consideracion es que para medidas de asociacion multiplical ivas (por ejemplo. riesgo relalivo. odds ratio, razon de lasas), el logaritmo de la razon (no la raz6n propiamenle dicha) se emplea en la ec uaci6n anterior para Ri y k; consecuentemenle, la correspondiente varianza, Vi, es la varianza dellogaritmo de la rawn .
406
EPIDEMIOLOGiA lNTERMEDIA ; CONCEPTOS Y APLICACIONES
EJEMI'LO, PRUEBA DE HOMOGENEIDAD DE OR ESTRATlFlCADOS Esta prucba utiliza la f6rmu la sigu iente:
x LI
=± (log OR,- Iog OR) 2 var(log ORi)
i. I
EI sigu iente ejemplo de la aplicad6n de esla prucba emplea los datos de la Tabla 7.2; este muestra la asociaci6n entre e l usa de anticonceptivos orales e infarto de miocardia estratificada por edad ( 2) . El estimador de Mantel-Haenszel de l OR global para eS(Qs datos es ORMH = 3.97 (Seccion 7.3.3) . La tabla siguiente se organiza para facilitar los dlculos de la prucba estadfstica de homogeneidad :
Estrato N.O (Edad, anos) 1 {25 - 29} 2 (30 - 34) 3 (35· 39) 4 (40· 44) 5 (45 - 49)
N." de
.0 Sf No Sf No Sf No Sf No
Sf No
casos
N.o de controles
(~ + ~ + 2- + ~).
7,226
1,978
0,77 1
33 390
8,864
2,182
0,227
26 330
1,538
0,431
0,322
9
3,713
1,312
0,296
5 30 1
3,884
1,357
0,38 1
I·) Id)
4 2
62 224
9 12
4 33 6
"6 93
Var( logOA) log(OR)
I')
la)
OR
36'
(a (b
~ ~
dj c)
abc
d
Nora; AO; uso de anHoon ceptivos orales • Vease Ap
Volt , 743· 747, 1979.
As\, aplicando la f6rmula anterior: () ,357 - (log (3,97))' x~= ( 1,978 - log(3,97))2 + (2,182 - log(3,97))2 + ... + 0,771 0,227 0,381
= 0,4655 + 2,8382 + 2,7925 + 0,0151 + 0,00 13 = 6,113 Este valor de ii-cuadrado con 4 grados de libertad se asoc ia con una P > 0,10, de modo que no Ilega a ser significativa a los niveles convencionales.
PRUEBA DE HOMOGENEIDAD DE ESTIMADOS ESTRATlFlCADOS
4D7
BlBLlOGRAFiA I. Roth man KJ . Greenland S. Modern epidemiology. 2.' ed. Philadelphia. Li ppincott-Raven. 1998. 2. Shapiro S. Slone D. Rosenberg L el al. Oral-contraceptive use in relation to myocardial infarction. ulI1 Cel 1979: I: 743_74 7 .
APENDICE D Manual de procedimientos para el aseguramiento de la ca/idad y control de la ca/idad de las mediciones de presion arterial y la recoleccion de orina y sangre en el estudio ARIC'
Lo que sigue es una transcri pcion tex tual de dos secciones del manual de operaciones del aseguramiento de la calidad/control de calidad del Estud io de Riesgo de Arteriosc lerosis en las comunidades (AR IC). $e transcriben por su valor como ejemplos para algunos de los procedimientos incluidos en e l Capitulo 8. Para mas detalies sobre el protocolo y el disefio del estudio ARIC (incluyendo el manual completo del control de calidad y olros manuales citados en el sigu iente tcxto), vease la pag ina WEB del estudio ARIC (http://www.bios.unc.edu/cscc!ARIC).
TENSION ARTERIAL SENTADO 1. Breve descripcion de los procedimientos para la medici6n de tension arterial sentado y medidas relacionadas para el aseguramiento de la calidad y control de calidad. Para medir la tension arterial a un sujeto que se halla sentado, se emplea el sig uiente eq uipamiento: un estetoscopio estandar Littman con campana; un instrumento Hawksley con cero aleatorio estandarizado; un man6metro estandar 8aum para determinar e l nivel de innaci6n pico; c uatro manguitos estandarizados (de 8aum). Despucs de explicar eI procedimiento al partic ipante, el tccnico mide la circunferencia del brazo y envuel ve el brazo con e l manguito correcto; e l participante se sienta y permanece tranquilo durante cinco minutos. Entonces e l tecnico realiza dos lecturas, dejando que transcurran por 10 menos 30 seg undos entre la terminaci6n de la primera lect ura y el comienzo de la siguiente. EI promedio de las dos lecturas se comunica al part icipante .
• Fuente: Atherosclerosis Risk in Communities (ARIC) Study. coordinado por la University of North Carolina at Chapel Hill para el National Heart. Lung and Blood Institute. National Institutes of Health.
410
EPIDEMIOLOGiA lNTERMEDIA; CONCEPTOS Y APLICACIONES
A panir del protocolo detallado para la wma de tension arterial sentado q ue se halla en el Manual 11 de ARI C, donde se han considerado los varios pumas de transferenda de datos y otras fuentes posibles de error, se han derivado las medidas necesarias de aseguramiento y control de la calidad . Elementos importantes en el aseguramiento de la calidad son los programas de entrenamiento y de certificaci6n, la observaci6n de la recolecci6n de los datos por parte de supervisores, las mediciones simu ltaneas bian uales de tens ion arterial realizadas por dos tecnicos utilizando lubos-Y y los procedimientos estandar de mantenimiento realizados en los equ ipos, e introducidos en los registros.
2. Mantenimiento del equipo I) DiJPonibilidad de manguito.\· de todM los famat/os : EI superv isor del centro cifnico para la tension arterial aseg ura que e l centro siempre tenga dispon ible el espectro completo de manguitos para la medic ion de tension arterial en cada estaci6n de medic ion. EI eq uipo de trabajo del centro cifnico comunica inmediatamente al supervisor de tension arterial en caso de que no disponga de todos los tamafios de manguitos en la eSlacion. 2) E.g;.gmoman6metros : En e l Manual II de AR IC, Seccion 1.1 3.1 y los Apendices I, II Y V se descri ben las inspecciones regu lares que han de hacerse a los esfigmoman6metros estandar de cero aleatorio. EI supervisor del centro c1fnico de tension arterial lleva una hoja del registro q ue recoge e l desarrollo de estos controles y comenta c ualqu ier problema encontrado (vease la copia de la hoja del regislro en e l Manual II ,Apendice IV) . Al fina l de enero y ju lio de cada ano debe llenarse e l formu lario resumen de la !ista de control y enviarse por correo al centro coordinador. 3) Cada semana, el supervisor de la tension arterial controla la cond icion de la cinta para la medic ion de la circunferencia del brazo en las eSlaciones de tension arterial, y repone las q ue se hayan deteriorado . Los resul tados de este control se recogen en e l registro semanal de antropometrfa. (Vease la Seccion de antropometrfa para conocer detalles).
3. Control del desempeiio del tecnico por parte del centro clinico I) E.\·teto.\·copioJ· dobleJ': Para ayudar a evaluar la exactitud y la precisi6n de las mediciones de tension arterial, una vez en enero y j ulio de cada ano, cada tecnieo q ue mide tension arterial loma parte en la med ici6n de esta simultaneamente con Olro tecnieo, ut ilizando un tubo- Y. Este procClfimiento debe lIevarse a cabo utilizando volunfario.\· de otros equipo.\· de trabajo del centro clinico, que 110 sean participante.\· (Jel estudio ARIC. Los dos tecnicos tambien realizan mediciones independientes de la circunferencia del brazo. que se recogen en los formu larios. Si las med iciones de los dos tecnicos discrepan en cuanto a q ue mangu ito milizar, entonces ambos vuelven a medir e l brazo juntos y ut ilizan e l tamano del manguito determinado por esa medici6n . Cada uno recoge esta discrepancia en el formu lario de tensi6n arterial sentado. Cada tecnieo separadamente recoge todas las medic iones de tension arterial
MANUAL DE PROCEDIM1ENfOS PARA EL ASEGURAM1E.'ITO DE LA CAUDAD ...
411
en un form ulario estandar de tension arterial sentado . Los dos fonn ularios de papel se entregan al supervisor del centro clfnico para tensi6n arterial, quien compara los resu ltados . EI supervisor de tensi6n arterial del centro clfnico revisa los resultados de estos examenes duplicados, calcula las discrepancias entre tecnicos en las mediciones de tension arterial y las reg istra en el form ul ario . Los dos tecnicos deberan concordar, tanto para la presion diast61ica como para la sist6lica, en no menos de 4 mm y su promedio debe concordar en no menos de 3 mm Hg, como se requ iere por los estandares para la certifi caci6n . Si no coinciden. se toman mas lecturas duplicadas para determinar si unos 0 ambos tecnicos requ ieren recert ificacion. Estas medic iones adic ionales deberan ser registradas de nuevo como se describe en el parrafo anterior. Los nlimeros de ident ificacion de cada conj unto de tecnicos emparejados para las medic iones simultaneas de tension arterial, se recogen en el «Infonne sobre el uso de la lisla de control para la observacion y el equ ipam iento», esle se envfa por correo al centro coordinador al fina l de cada enero y j ulio . 2) Observaci611 biallua/: Una vez en enero y julio de cada ano, el supervisor de tensi6n arterial del centro cI fnico observa a cada tecnico realizando el procedimiento completo de medici6n de la tension arterial con un partic ipante en el est udio . EI supervisor del centro cl fnico anota cualquier problema con la tecnica y 10 discute con el tecnico una vez que el examen haya sido completado. Ademas, otro tecnico observa al superv isor realizar el proceso completo de medici6n . Despues del examen, ambos discuten cualqu ier dific ultad que aparezca en el cu rso de esta observaci6n . AI realizar estas observaciones. el supervisor y los tecnicos utilizan la lista de control (check liJ·t) que se incl uye en el Apendice III del Man ual II de ARI C. Para cada tecnico. se anota la fec ha en que fue observado y el nlimero de identificaci6n del observador y ambos datos se recogen en el .
4. Recogida de los datos de identificacion del participante Para ev itar e rrores de ident ificaci6n, al lIenar el modelo de tension arterial sentado, el tecnico verifica que el nombre y el nlimero de ident ificaci6n que aparecen en la pantalla DES que acompafia al partic ipante coincida con el que real mente corresponde a este ultimo. Si el ordenador esta fuera de servicio y se utiliza un formu lario de papel, el tecnico veri fica el nombre en la hoja que acompana al partic ipante antes de utilizar las eliquetas de identifi caci6n en la hoja de los formularios.
5. Medicion de la circunferencia del brazo y seleccion del manguito de tension arterial Como ya se describio, una vez cada seis meses se realizan mediciones duplicadas de tension arterial en un voluntario 0 miembro del eq uipo del centro clfnico (no participante del ARI C) . Durante el curso de este procedimiento, ambos tecn icos miden la circunferencia del brazo y recogen su resultado . EI supervisor de tension arterial del
412
EPIDEMIOLOGiA lNTERMEDIA; CONCEPTOS Y APLICACIONES
centro clfnico campara estos resultados, y si difieren en mas de 1 em, la tecnica de medici6n se revisa con ambos tecnicos. Tanto la medida del brazo como el tamafio del manguito seleccionado se recogen en el formu lario (S8P) TAS. EI sistema de entrada de datos controla la consistencia del tamafto del mangu ito y de la circunferencia del brazo. 6. Postura del participante y descanso antes de la medici6n de tension arterial El supervisor de tension arterial del centro clfnico corrobora que la(s) estaci6n(es) uti lizada(s) para la medici6n de tensi6n arterial continua(n) tcniendo las condiciones especificadas en el protocolo, por ejemplo, que las mediciones de tension arterial se haecn en una habitaci6n tranqu ila ajena a otras actividades del centro clfnico. EI equipo del centro coordinador, cuandQ realiza las visitas, tambien IOma nota acerca de si se mamiene esta condic ion. EI superv isor de tensi6n arterial del centro clfnico es responsable de vigilar que se siguc el protocolo programando las medic iones de tension arterial temprano durame la \' isita, antes de la extraccion de sangre u otras aClividades estresantes . Cada mes el supervisor del centro clfnico revisa una muestra de los formu larios de itinerario del participante para el mes amerior con el fin de confinna r que esto efectivamente se cumple. Para contribuir a juzgar si se permite un descanso de cinco minutos completos antes de tomar la primera medic ion de tensi6n arterial, el tecnico de tension arterial ut iliza un cronometro de mano u otro medio para comrolar con exactit ud el pericKlo de descanso. Bianualmeme, el supervisor de tension arterial del centro clfnico observa a cada tecnico realizar el procedimiento completo de tension arterial y anota si se esta permitiendo el periodo de descanso correcto. 7. Amilisis del control de calidad del centro coordinador El cemro coordinador analiza los datos de cada tecnico respecto a la preferenda de algunos dfgitos al leer la tensi6n arterial sist6lica 0 diastolica. Este control se revisa anualmeme, a menos que la detecdon de problemas haga necesario un seguimiemo mas 0 menos imenso. El centro coordinador comuniea estos resultados al cemro clfnieo, y el supervisor de tension arterial del cemro clfnico rev isa dichos resu ltados con cada tecnieo. EI cemro coord inador comrola que se estan utilizando los procedimiemos correclOS para la entrada y registro de los datos faltames. EI centro coordinador se comun ica con los centros clfnicos de campo cuando se identifican problemas .
RECOLECCION Y I'ROCESAMIENTO DE SANGRE Y ORINA 1. Breve descripci6n de la recolecci6n y procesamiento de sangre y las medidas relacionadas con el aseguramiento de la calidad y control de la calidad
En el momento en que se produce el contacto telefonico con los part idpames, se les indica hacer un ayuno de doce horas ames de la visita al centro clfnico, a menos que
MANUAL DE PROCEDIM1ENfOS PARA ELASEGURAM1E.'ITO DE LA CAUDAD ...
413
sean diabCticos que se inyecten in.~u li na 0 tengan otras razones medicas que hagan no aconsejable el ayuno. Se ha desarrollado un protocolo detallado, incluido en el Manual 7 del ARIC (Recolecci6n J plVcesamiento de la sangre), que describe la preparadon de los tubos para la sangre, los anticoagulantes que van a ser uti lizados para las muestras de cada laboratorio y los pasos especfficos que deben darse en la extracdon de sangre y su procesamiento . Despues de la extracci6n de la sangre, los tubos de muestra redben un procesamiento en el centro clfnico. Las muestras de sangre utilizadas para el analisis de Ifpidos y hemostasia se congelan a menos 70°C para un embarque semanal hacia los laboratorios centrales del ARIC. Las muestras para analisis hematologicos se env fan a los laboratorios locales. Todos los embarques hada los laboratorios centrales se hacen mediante servic ios de entrega que demoran un dfa (overnight services). Todos estos pasos son realizados por tecnicos entrenados en el protocolo de ARIC y con cert ificado de que conocen bien sus detalies. EI primer paso en el aseguramiento de la calidad de las extracciones de sangre consiste en este entrenamiento y proceso de certificaci6n . Otros pasos incluyen el mantenimiento de registros de los controles de los equ ipos; la observadon de los tecnicos (por otros tecnicos y por los monitores en las visitas) a medida que se va produdendo la secuencia de pasos en la extracci6n de sangre y su procesamiento; la revisi6n de la condidon de las muestras redbidas en los laboratorios centrales en reladon con problemas en el embarque; y el analisis peri6dico de los datos del estudio con respecto a la adhesi6n de los participantes al ayuno y a alguna sefial de problemas en la extracdon 0 procesamiento tales como hemolisis 0 demoras en el completam iento del proceso .
2. Mantenimiento del equipo Cada centro cifnico realiza diariamente controles de temperatura de los refrigeradores, los congeladores, la centrffuga refrigerada , y el bloque de calentamiento (vease Manual 7 de ARIC). La veloddad real de la centrffuga se control a y se registra mensualmente con un tacometro. Los resultados de estos controles se recogen en una hoja que se mantiene en la estaci6n de procesamiento de sangre y se resume en el «Informe sobre el uso de la lista de control para la observadon y el equipamientm> al final de los meses de enero y julio. Una copia del informe se envfa al centro coordinador en ese momento.
3. Adhesion de los participantes al protocolo En contraste con visitas previas, la venipuntura se realiza sobre todos los miembros de la cohorte, independientemente de su estado en reladon con el ayuno (Manual 2, Secdon 3.9.2). e incluye la toma de tres muestras de plasma para los laboratorios de Ifpidos y hemostasia: dos muestras de suero para el laboratorio de hemostasia y el laboratorio dental; y una muestra opdonal para un laboratorio local de hematologfa. Ademas, se realiza una segunda venipuntura a los participantes elegibles para la PTG (Prueba de tolerancia a la glucosa, Oral Glucose Tolerance Test, en ingles). La extracdon de sangre postbebida de glucosa debe OC LIrrir dos horas despues (mas 0
414
EPIDEMIOLOGiA lNTERMEDIA; CONCEPTOS Y APLICACIONES
menos 10 min utos) de la administraci6n de la bebida de glucosa . EI incumplimiento de estos criterios puede afectar los valores de vadas medic iones (por ejemplo. Ifpidos, glucemia) y comprometer S lI valor para e l est udio . Los partic ipantes del ARIC deben (ambitn abstenerse de fumar y de realizar esfucrzos ffsicos vigorosos antes de la visita al centro clfnico . Ella se debe a que fumar pucde afeclar los eiectrocard iogramas 0 la presion arterial y a q ue la act ividad vigorosa p ucde acrivar la fibri n6lisis y alterar los niveles sang ulneos de IPA y FPB 8 . Los entrevistadores se entrenan para ex pl icar la importancia de la adhesi6n a estas restricciones. Cuando los centros clfn icos coniacian con los part id pantes antes de su dla para recordarles sobre la visita ya prog ramada, les repiten estas instmcciones . EI centro coordinador analiza los datos del estud io con reladon a la infonnad6n sobre el tiempo de ayuno y e l tiempo transc urrido desde que fumo y realiz6 ejercicios fuertes, descom part imentados por el centro clfnico, para ob{ener cada mes e l nli mero y porcentaje de panic ipantes en cada centro cl fnico que no cumplen con estas restricdones.
4. M antenimiento de la suficiencia Para mantener su suficiencia. se pide a los tecnicos que realicen eXlracciones de sangre y las procesen por 10 menos una vez cada semana (u ocho veces cada dos meses). EI centro coordinador analiza los datos del est ud io para comunicar sobre el numero de veces q ue los tecnicos recolectan y procesan sangre en los centros clfnicos de campo.
5. Observaci6n peri6dica Pericldicamente (al pri ncipio de cada mes) se observa como realiza todo el proced imiento cada uno de los tecnicos del centro clfnico q ue hace estas {areas. La observacion es realizada por otro tecnico entrenado 0 por un supervisor, qu ien ut iliza una !isla de control delallada para verificar que e l tecnico cont inua respetando todas las partes del protocolo de ARIC. AI Ilevar a cabo esta observad6n, tambicn se realiza una revisi6n del protocolo para las personas que hacen la observaci6n. (Vease e l Manual 7 de AR IC para mas detalles, y una copia de la «Lista de control para la cerdficad6n del proced imiento de ven ipuntura y su procesam iento»). ESla !ista de control tambien se utiliza por los moni(Qres del centro coordinador al hacer las observaciones de control. La identidad del observador y del observado se reg istran en la «Lista de control para la certificad6n del proced imiento de ven ipuntura y su procesamiento» de ARI C. Tambien se registran en el <
6. EI formulario de laboratorio Para evitar errores de ident ificacion consistentes en q ue la informacion correspond iente a las muestras de un panidpante dado se escriben de manera incorrecta, e l (ecnico debe lIenar cada «Fonnu lario de labora(Qrio» (LAB B) a med ida que se
MANUAL DE PROCEDIM1 ENfOS PARA EL ASEGURAM1E.'ITO DE LA CAUDAD ...
415
eXlrae la sangre, verifi cando e l numero de identifi caci6n de la hoja q ue acompafia al part icipante .
7. Datos replicados de control de calidad EI sistema de extraer tubos adicionales de sangre para el analisis de control de calidad (CC) replicado se explica claramente en eI Manual 7 de AR IC . En esre sistema se obt ienen tubos de sangre adic ionales espec ificados para cieno numero de part icipantes q ue se emparejan con un «partic ipante fantasma>, por semana . La muestra de sangre post-bebida de glucosa se designa como el tubo numero 6 en el fonnu lario de identi fi caci6n del panicipante fantasma y del no part ici pante . Vease lambien en e l Capitulo 2 del Manual 12 para acceder a una ex pl icaci6n de este sistema fanta sma de control de calidad . Las personas que no estan en ayunas y solicitan ser reprogramados para olra eXlraccion de sangre nunca deberfan usarse como «fantasmas de sangre» para e l control de calidad . La estaci6n de extracci6n de sangre del centro cl fnico mantiene un programa sobre que tubos deberfan extraerse para operar como fanta smas cada dfa (vease e l Manual 7 de AR IC) para ayudar a q ue encajen los conjuntos fanta smas del CC denlro del flujo de Irabajo y lograr que sea faci l mantener un segu imiento de 10 q ue se req uiere. EI centro coordinador revisa cada mes, descompart imentado por el centro cl fnico , el numero de formu larios de CC fantasmas para los cuales se indica extraccion de sangre . Si los centros cl fnicos de campo fa llan en proveer conjuntos suficientes de sangre fantasma para CC , eI centro coordinador contacta con esos centros para discutir eI problema . Con e l fi n de reducir e l riesgo de rotu lar un tubo fanta sma de sangre para CC con el numero de identi ficaci6n incorrecto 0 registrar el pareamiento incorrecto entre un numero de identifi caci6n fantasma y el de un panicipante en los •• Formularios del panic ipante fantasma para el CC», la sangre para e l CC se obt iene de no mas de un miembro de cada par de part ici pantes para los cuales la sangre se procesa en conj unto . Para ayudar a asegurar q ue se ha registrado e l pareamiento correcto entre e l numero de identificaci6n del panic ipante real y e l numero de identifi caci6n fantasma para e l CC , en cuanto se ha completado una extracci6n de sangre se Ie afiade una eriquela de ident ificacion para e l panici pante real al espacio apropiado en el form ulario de identi ficacion del panic ipante fantasma y el no part icipante en la hoja fantasma para e l Cc.
8. Amllisis de los datos de venipuntura y procesamiento para control de calidad EI centro coordinador analiza los datos del esrudio anualmente para determinar las frecuencias de tiempo de llenado. e l numero de intentos de pinchado y la presencia comunicada de hem6lisis, y los marcadores seleccionados de fa lta de adhesion al protocolo durante la flebotom fa y/o el procesamiento de especfmenes en ellaboratorio del centro clfnico . Estos analisis incl uyen tablas del centro cl fnico segu n e l numero de identifi caci6n del tecnico que realiza las exlracciones de sangre 0 su procesamiento . (Los estandares del tiempo necesario para varios pasos del procesa-
416
EPIDEMIOLOGiA lNTERMEDIA; CONCEPTOS Y APLICACIONES
miento se dan en e l Man ual 7 de AR IC). La adhesi6n a la ventana de la extracci6n de sangre de dos horas postbebida de g lucosa se eva!lia carla cuatro meses y se comun ica a los centros cifnicos de campo.
9. Muestras de paquetes para el embarque a los laboratorios Todos los viales de mucstras de sangre, as! como las bolsas de phistico en las que las muestras de un part icipame dado se empacan para embarquc a los varios laboratorios, se rOlulan con la identificaci6n del partic ipante. Una !isla de embarq uc se adjunta a cada embarque para los laboratorios centrales en la eual se consigna la identificaci6n para {Odos los conjuntos de muestras que se adj untan. La persona que desempaca estas muestras en los laboratorios cent rales veri fica que los nllmeros de identificaci6n en los via les concuerden con el numero de identificaci6n en las bolsas de plastico y controla ambas comparando con la li sta de embarq ue. Si se detecta c ualquier d iscrepancia, e l laboratorio central contacta al centro clfnico para resolver e l problema. Los viales de sangre embarcados hacia los laboratorios centrales deben ser empacados seguramente para evitar e l calentamiento y la rotura . Instrucciones completas para e l empacamiento de las muestras se especifican en e l Manual 7 de ARIC, secciones 5 .1 -5.3 . Los laboratorios vigi lan la condic i6n de arribo de las muestras enviadas de cada centro clfnieo . S i se encuentran problemas, los laboratorios notifican a los centros clfnieos de campo involucrados. Si cierto patr6n de dana de las muestras se hace aparente, 10 q ue sugiere la necesidad de modificar los materiales utilizados para embarcar las muestras 0 para empacarlas (por ejemplo, filtraci6n excesiva de un c ierto tipo de vial) . e l subcom ite del laboratorio adopta la accion apro piada. Las muestras de sangre de AR IC se envfan por correo ra pidamente a los laboratorios centrales al inic io de la semana des pues de q ue son extrafdas. Los laboratorios Bevan el control de las fechas de la extracci6n de sangre en las muestras que reciben y not ifican al centro clfnico y al centro coordinador si reciben muestras que fueron embarcadas en una fec ha mas tard fa de la que debfa hacerse en este programa. (Nora: los tubos fantasma de sangre para e l CC se envfan una semana antes del embarque, pero la fecha de la extracci6n de estas muestras que se comunica al laboratorio se altera para enmascarar su ident idad como control de caUdad). Los centros clfnicos de campo deberan telefonear a los labora{Qrios centrales para notificarles si hay un embarque en un d fa que no sea e llunes. Para evitar demoras en e l transi{Q hacia los laboratorios q ue podrfan causar que las muestras se recalienten 0 deshielen d urante el embarque, todas las muestras se embarcan por un servicio que demora un d fa. Para evitar demoras en los fines de semana 0 los d fas feriados al entregar las muestras 0 al moverlas al congelador del laboratorio central, una vez q ue han sido entregadas al area de recepcion, todas las muestras se embarcan al principio de la semana de trabajo, lunes 0 martes. Los laboratorios notifican al centro coordinador y al centro clfnico si un embarq ue de los que se recibe fue embarcado un d fa despues en la semana, y eI centro clfnieo comunica al centro coord inador las razones para esta desviaci6n del protocolo. Los labora{Qrios not ifican a los centros clfnieos de campo si reciben tardiamente los conjuntos de muestras. Si se encuentra un patr6n de demoras con eI servicio de entregas utilizado por un centro cl fnieo, el centro clfnieo debe cambiar a un servic io de entrega alternat ivo.
MANUAL DE PROCEDIM1ENfOS PARA EL ASEGURAM1E.'ITO DE LA CAUDAD ...
417
10. Descripci6n de la recolecci6n y del procesamiento de orina y medidas relacionadas para el aseguramiento de la calidad y el control de la calidad Oespues que un part icipante es recibido en la clfnica, se Ie pide que provea un especimen de orina a conveniencia del part ici pante (por ejemplo, cuando el participante expresa la necesidad de orinar) . Cuando el part ici pante esta listo para orinar, se Ie provee de una taza para especimen (et iquetada con la ident ificaci6n del participante y el tiempo de orinar), y se Ie instruye que ha de lIenar la taza si es posible . Si la muestra es insuficiente para complerar el procesam iento se Ie pide al panic ipante que orine de nuevo en un contenedor limpio antes de dejar el centro clfnico . Antes del procesamiento, eI tecnico recoge, en el formulario de laboratorio del panic ipante, si se obt uvo una muestra de orina, el tiempo de recolecci6n de la muestra de orina inicial (si hay mas de una), y cU:ln adecuado es el volumen de orina recogido .
11. I'reparaci6n de las muestras para control de calidad Las instmcciones sigu ientes describen las adic iones espedficas a los protocolos de recolecci6n y procesamiento de orina para que cumplan con los requerimientos del control de calidad . Estas instmcciones su ponen que se eslan siguiendo los proced imientos normales para recoger, procesar y embarcar las muestras de creatinina y albumina (vease Manual 7, Secci6n 6.0-6.3) .
12. I'rograma del control de calidad de la orina EI programa de visita 4 para las muestras del control de calidad para orina es parale10 al protocolo de muestreo para eI control de calidad de sangre: un mfnimo de una muestra se requiere cada semana . Los especfmenes deberan tomarse del primer partic ipante que provee orina suficiente 0 bien manes 0 bien jueves . Si ningun panic ipante ni el martes ni el j ueves provee una cantidad sufic iente, debera selecc ionarse el primer part icipante que haga esto el miercoles 0 el viernes. La recolecci6n de muestras de orina para control de calidad ha de anadirse a la lista de control semanal mantenido por los tecnicos de venipunt ura del centro clfnico. Tal como con las muestras de sangre para CC, debe revisarse cada muestra de orina a medida que se prepara . Por la manana, el miercoles 0 el viernes, se consulta la lista de control para determinar si todavfa se necesita una muestra adicional de orina .
13. Requerimientos de control de calidad de la muestra EI especimen de orina de cada panicipante se divide en tres tubos de muestras separados y se congela en los centros c1 fnicos de campo hasta el embarque. Las alfcuotas para creat inina y album ina de cada partic ipante (3,5 mL cada una) se embarcan al centro clfnico de Minneapolis de AR IC. EI mho c6nico de 50 mL ( I por panic ipan-
418
EPIDEMIOLOGiA lNTERMEDIA; CONCEPTOS Y APLICACIONES
Ie) para los metabolitos de la hemostasis, se embarca hacia e llaboratorio de hemostasis de ARI C; este tubo ha de contener un minima de 40 m l. Cuando el programa avisa para la recolecci6n de muestras de control de calidad (fantasma) para creatin ina y alblimina, la taza del especimen del participante debe contener por 10 menos 54 ml (14 ml para un total de 4 viales de 3,5 ml y una muestra de hemostasia de 40 ml). Para un fantasma del laboratorio de hemostasia se necesitan 87 ml (7 ml para dos viales de 3,5 ml y dos mucstras de 40 ml para hemostasia) .
14. Formularios de lahoratorio y fantasma Para asegurar q ue el apareamiento correcto se registra entre la identificaci6n de un partic ipante real y la ident ificacion del fantasma del CC, tan pronto como pueda evaluarse q ue se ha provefdo de suficiente orina para una muestra del control de calidad, se Ie aftade una etiq ueta de identifi caci6n a la ident ificacion real del part icipante en e l espacio apropiado del form ul ario del partic ipante fantasma y del formu lario de identificaci6n del no panic ipante . Para evitar errores en la identifi caci6n en los cuales la informaci6n con relacion a la muestra de orina de un part icipante se introduce en e l form ul ario incorrecto, e l lecnico debera comenzar llenando la Seccion M UESTRA DE ORINA del formu lario del laboratorio para e l nlimero de identificaci6n del fantasma en el mismo momenta que se complela la Secci6n lI.1UESTRA DE ORINA del panic ipante en este form ulario .
15. I'reparaci6n de la muestra Cuando los espedmenes de orina fantasma para creatinina y alblimina se van a preparar, se requ ieren un lotal de 4 viales de a](cuotas de 3.5 ml. Dos viales se rot ulan con la identificaci6n del partici panle y los dos restantes con la identificacion del fantasma. Los dos viales espedmenes de CREATININA y los dos de ALB Oll.llNA se distinguen por e l color de las tapas: AMARILLO para CREAT1N1NA, y AZU L para ALB OMINA . Los crioviales de creatinina para el participante y e l fantasma se llenan primero por e l tecnico de laboralOrio. Entonces se ejecllla el procedimiento para e l balanceo del pH de la muestra para alblimina (Manual 7. Seccion 6.1.2), y se pipelea el espec imen de pH balanceado dentro del criovial del participante y del fantasma. El especimen de orina fanta.>;ma para hemostasia se prepara en el mismo momento y de la misma manera que la muestra de orina para hemostasia del panicipante .
16. I'rocedimiento para muestras pequefias Para prop6sitos de control de calidad el par de mueslra.>; de orina para creat inina. albumina y hemosta.>;ia del fanta.>;ma y participante, deben provenir del mismo conjunto de muestras . Si un solo conj unto es inadecuado para las muestras del participante y del fantasma, entonces los espedmenes deberan combinarse antes de extraer las muestras.
MANUAL DE PROCEDIM1 ENfOS PARA EL ASEGURAM1E.'ITO DE LA CAUDAD ...
419
17. lnstrucciones de almacenamiento Las instrucciones de almacenamiento (Manual 7, Secci6n 6.2) estipulan que las muestras deben empacarse en el orden de la fecha de extracci6n, poniendole a cada participante dos especfmenes (CREATININA Y ALBUMtNA) uno al lado del otro en la fila . Como los especfmenes del fantasma y el participante se extraen en la misma fecha, probablemente estara.n en la misma fila , posiblemente al lado uno del otro . Registre el numero de la casilla y de su posic ion en el fonnulario de laboratorio del participante. y asegurese de hacer 10 mismo para el fantasma . Finalmente registre los numeros de ident ificacion de todos los participantes y los fantasmas en cada casilla de un formulario de reg istro para las casillas.
18. Aseguramiento de la calidad y control de calidad Ademas de una recertificaci6n anual autorizada por el laboratorio de hemostasis, la adhesion al protocolo en la realizaci6n de cada proced imiento se realiza por 10 menos dos veces por ano por el tecnico jefe, y anualmente por los monitores de centros clfnicos de campo del centro coordinador. Las desviaciones del protocolo y las posibles acciones rect ificadoras se discuten con los coordinadores del estudio y con el equipo de trabajo en ese momento. Las grandes desviaciones se Bevan al comite de operacion de la cohorte . EI centro coordinador producid reportes basados en datos replicados de los laboratorios. Los resultados de estos reportes se examinaran por el comite de control de calidad y se implementaran las acdones correctivas recomendadas . EI centro coordinador proveera al comite de control de calidad y a los centros clfnicos de campo un infonne basado en los datos del procedimiento recogidos en el formu lario de laboraIOrio . Este informe evaluara los datos con respecto a su consistencia y para valores fa ltantes y fuera de rango.
APENDICE E Calculo del coeficiente de correlaci6n intraclase
El coeficiente de correlaci6n intraclase (eel) es la fracci6n de la variabilidad exhi bida por el factor medido que se debe a las diferencias entre individuos (vease Capftu108, Secci6n 8.4.2). En este apendice se describen dos alternativas para el c6mpulo de l CCI: la primera se basa en el analisis de la varianza (ANOVA)(l) y la otra en lIna f6rm ula simpli ficada expucsta por Deyo et ul .(2). Ambas tecnicas se ilustran empleando como ejemplo la fiab ilidad entre puntajes procedentes del control de caUdad del Estudio de la Salud del Coraz6n y e l S uefio (Sleep Heart Health Stutiy. SHH S) (vease Capitulo 8, Tabla 8.20).
ANALlSIS DE LA VARIANZA Para aplicar un ANOVA a un conjunto de observaciones re plicadas (por ejemplo, los datos correspondientes al estudio de fiabilidad del Indice a Apnea Hipoapnea. IAH. de la Tabla 8.20) los datos necesarios deben ser organizados de modo que lotios los valores del iAH (de ambos conjuntos de observaciones replicadas) esten contenidos en una unica variable. Las variables indicadoras ad icionales denotan e l ident ificador para el n umero de l estudio y e l evaluador. As!. en este ejemplo, los datos p ueden arreglarse para un wtal de 60 observaciones, como sigue : Estud lo N."
Eva tuad or
IAH 1,25
2 2
A B A B A B
3 3
29 29
30 30
A B A B
1,38 1,6 1 2,05 5,64 5,50
2,09 2,35 11,09 9,25
422
EPIDEMIOLOGiA lNTERMEDIA ; CONCEPTOS Y APLICACIONES
Un enfoque similar se emplea para organizar el Indice de Despertares (10), tambien mostrado en la Tabla 8.20 . Un analisis de la varianza de estos datos puede concretarse empleando cualquier paquete estadfstico estandar. Cuanda se emplea SAS, Versi6n 6 .1 2 (SAS Institute, Cary, NC), se obtiene la siguiente tabla: Para IAH: Cuadrado medlo Fuente de va r laclon Observador
ESludio Error
Suma de cuad rados (Sel
Grados de libertad (gl)"
2,023
SC/gi
Rotulo
2,023
eMO
2.477,991
29
85,448
CMEst
7,169
29
0,247
eME
'Grados de li bertad: Para obs9rvador, h·1. donde k as 91 numero de voces que se hace cada o bservacoo; pa ra estudio, n - I, doooe n as el numero de ooservadones; Para el error, (k - 1) ~ {n - 1}.
Para 10 : Cuadrado medlo Fuente de varlaclon ObseNador
Sumade cuadrados (SC)
Grados de IIbertad (gl)'
SC/gi
Aotulo
166.010
eMO
Estudio
4.436.759
29
152.992
CMEst
Error
1.087.749
29
37.509
eME
166,010
'G rades de libertad: Para observador. Jr. 1, donde Jr es el numero de veces que se hace cada observaci6n; para esrudio. n - 1. donde n es e l nume ro de observaciones; Para el error. (I< - 1) • (n - 1).
En estas tab las, «observador» alude a la variabil idad debida a la persona que mide en eSle ejemplo (0 al conjunto especffico de lec{uras repetidas en un es{udio de fiabi lidad del observador) y ••estudio», se refiere a la variabilidad relacionada con e l partic ipante , estudio , 0 especimen que esta siendo repetidamente estudiado, lefdo, 0 detenninado . La f6rm ula para el dlculo del CCI es(I ): CME,,- CME
CC I = ~~~~~~~~~~=c
CME" + CME (k - 1) + (CMO - CME)/n
donde k es el numero de lecturas re petidas (por ejemplo, 2 en el ejemplo) y /I es e l ntl mero de estudios individuales 0 especfmenes examinados (por ejemplo, 30 en e l ejemplo). Aplicando esta form ula a los datos, se obtienen los siguientes resultados:
423
CALC ULO DEL COERCIENTE DE CORRELACION INTRACLAslCO
Para IAH: 85,448 - 0,247 CCI1AH = -,.,--,-,-,----,-c-e"",c..c'---=:':':'-co----c-cc,,---co- = 0,993 85,448 + 0,247(2 - I) + 2(2,023 - 0,247)/30 Para ID: CCI w =
;c---,,:===
-:-::=;::---::::-::",15,::2",9,,9-c2_--,3:-7C'~~0,, 9
152,992 + 37,509(2 - I) + 2( 166,0 1 - 37,509)/30
= 0,5 80
METODO DE DEYO Una f6nn ul a equivalente descrita por Deyo et a1 J2) puede ser aplicada f:k il mente usando una calculadora de boisilio 0 una hoja de dlculo estandar. El marco de trabajo para este c6mputo requ iere la obtenci6n de diferencias entre los valores (por ejemplo, puntajes) para cada par de observaciones, como se muestra en la siguiente tabla tanto para IAH como para ID a part ir de la Tabla 8.20 . IAH ESludio N.
O
Eva luador A
10
Evaluador B Dlferencia
Eva luador A Evaluador B
Diferencla
1.25
1,38
-0,13
7,08
8,>6
- 1,48
,
1.61
2,05
-0,44
18,60
19,91
- 1.31
',M
',,,"
0,14
20,39
25,17
--4,78
29
2.09
2,35
-0,26
18,66
18,02
0.64 - 10,74
2
11.09 " 5,748 , 6.702 44,918 " s: desviaci6n estaooa, Media
9,25
1,84
12,50
23,25
5,381
0,367
17,306
20,632
6,386
0,703
7,682
11 ,467
8.661
4o,n7
0,494
59,017
131 ,483
75,017
-3, 327
La formula de Deyo emplea los numeros mostrados en negntas en la tabla ; vale decir, la diferencia media (x dif), las varianzas (desviaciones estandar al cuadrado) para las mediciones de cada evaluador ( .1 A2 Y S 8 2), Y la varianza de las diferencias (S 2dif) :
,
,
,
CCI = _,_SA'i-+_'~\'H::,-_""'O;',; s~ + s1 + x 2dif - .\·~iJn donde /I es e l nlimero total de sujetos estudiados (observaciones pareadas) .
424
EPIDEMIOLOGiA lNTERMEDIA ; CONCEPTOS Y APLICACIONES
Para los datos del ejemplo:
44,918 + 40,777 - 0,494 CCl lAlf = --:-::-::-:,,---'-::==--'::-=::;--'::-==::= 0,993 2 44,918 + 40,777 + 0,367 - 0,494/30 59,0 17 + 13 1,483 - 75,017
CCi ID = -",-,-,c:..:=-'--'c"'-'..C""==:':":,,,,= = 0,580 2 59,0 17 + 13 1,483 + 3,327 - 75,0 17/30 Como puede apreciarse, estos resultados son identicos a los obtenidos lIsando e l ANOYA.
BlBLlOGRAFiA 1. Amlitage P. Berry G. SlaliSlimlmelhods in /IIcdkal researrh. 3.' ed. London: Blackwell. 1994. 2. Deyo RA. Diehr P, Patrick DL. Reproducibility and responsiveness of health statistics measures: statistics and strategies for evaluation. COli/rolled Clin Trials 1991: 12: 142S· 158S.
INDICE
Ajuste basado en estratificacion, 224-242
confusion residual. 285-287 ffietodos de regresi6n multiple. 244-284 significado de, 223 sobreajuste , 288 Ajuste basado en la estratificaci6n ejemplos de, 224-228 directo.229-235 indirecto.235-237 limitaciones de, 242-243 ffietodo de Mantel-Haenszel. 238-242 supuestos basicos en. 228-229 y confusion residual. 228. 243 Ajuste directo. 229-235 ejemplos de, 232 poblaci6n estandar en. 233-234 procedimiemos en. 229-231 usos de, 229-235 Ajuste indirecio. 235-237 pobJaci6n estandar en. 236-237 uso de, 235 AmHisis de cohone de nacimientos. 3.4 AmHisis de cohone edad-periodo, 10-15 AmHisis de sensibilidad. 293 AmHisis de supervivencia tasa de riesgos instantaneos en. 71. Vease Incidencia aL'wlllI/ada AmHisis de varianza, 421-423 AmHisis multinivel. pmp6sito de. 16-17 AmHisis multivariante para estudios de casos cohorte, 274275 para estudios de casos y controles anidados.273-275 regresi6n logfstica condicional. 271, 273·274 u~os de. 223 usos deIU\rmino, 229 y ajuste estadfstico, 223 y eSlUdios de casos y controles emparejados.271-273 y me!(xios de regresi6n multiple. 244-245
Aseguramiento de la calidad. 299-303 componentes de investigaci6n. 298-299, 300 definici6n de. 299 entrenamiento del equipo, 30 1-302 estudio piloto, 302·303 instrumentos para la recolecci6n de datos, 301 manuales operativos, 300 pasos en. 303 pmtocolo de estudio. 300 prueba previa. 302 Asociaciones exposici6n/enfemledad en estudios de casos y controles. 25-33 Vease Medidas de asochlciol1 Asociaciones no causales. Vease Confusion
Causalidad inversa. significado de, 140 Coeficiente de correlaci6n de Speannan. 330-341 intraclase.342·343 lineal de Pearson. 246. 338-342 Coeficiente de correlaci6n intraclase calculo de, 421-424 Coeficiente de correlaci6n lineal de Pearson, 246, 338-342 limitaciones de, 339-341 medida de validezlfiabilidad, 338-341 Coeficiente de regresi6n estimaci6n del error estandar. 393-395 interpretaci6n de la~ unidades de. 256-257 intervalo de confianza. 284, 393 de Cox. 267 de Poisson. 270 lineal mUltiple. 253-256 lineaL 249-251 logfstica.259-262 Coeficiente de variabilidad. medida de validezlfiabilidad.344-345 Cohortes abiertas. 60. 63. 64 Cohortes de nacimientos en eSlUdios de casos y controles, 15
426
fNDICE
significado de, 5 ubicaci6n gn'ifica de datos de las. 5~7
efectos de cohone. 8- 15 Veanse EfeclOs de col/one: Amilisis de cohorte edad.periodo Cohortes dimimicas. 60. 63, 64 Colinealidad. ejemplo de. 164-165 Comparaci6n pareada. 336 Comunicaci6n escrita. Vease Informes
epidemiolJgicos Concordancia debida at azar. 330 Confusi6n comparada con el sesgo. 153. 176-178 condicionaL 178 cualitativa.176 definici6n de, 155 efectos parciales de. 173-174 en estudios de cohone. 155. 157 en estudios observacionales. 156 evaluaci6n de efectos de, 166-173 heterogeneidad basada en. 212-213 negativa, 175-177 positiva, 175-177 regia general de causalidad. 157-161 residua1.36.41. 163.174. 193. 285-287 significaci6n cstadfstica y cvuluaci6n dc.
177-178 y emparejamiento. 35 y prevenci6n.180-181 y sesgo de error de clasificaci6n. 132 Confusi6n residual. 36.41. 163. 174. 193. 285-287 causas de. 285-287 exploraci6n de trayectos causales. 163-164 y estratificaci6n. 228. 243 Y heterogeneidad de efectos. 193 Confusores. en informes epidemiol6gicos, 356 Control de calidad coeficiente de correlaci6n intraclasica. 342-343 coeficiente de variabilidad. 344-345 componentes de investigaci6n. 298-299 diferencia media. 343-344 estadfstico kappa. 324-335 grafico de Bland-Altman, 345-346 regresi6n lineal. 342 significado de. 297
Control de la calidad. manual de aseguramiento.300 para la medici6n de la tensi6n arterial. 409-412 para la recolecci6n y procesamiento de sangre y orina, 412-419 Covariables dependientes del tiempo, 69-71 Cuestionario de Rose, 301
Datos emparejados de casos y controles, metodo de ajuste de Mantel- Haenszel. 240-242 Densidad de incidencia en base a los individuos. 59-61 muestreo, uso de, 31 significado de, 58 Desarrollo de hip6tesis, en infomles epidemioI6gicos,353-355 Desenlace categ6rico dicot6mico variables. definici6n de. 47 Desenlace, definici6n de, 47 Diagrama de Lexis. 68 dos 0 mas escalas de tiempo, 67-69 una escala de tiempo, 66-67 Diagramas de dispersi6n como medida de validezlfiabilidad. 336 para relaciones no lineales, 281-283 Diferencia media. medida de validezlfiabilidad,343-344 Diferencias absolutas interacci6n aditiva. 186-188, 189-192 situaciones en que se usa. 79 Diferencias relativas interacci6n multiplicativa. 184. 188-189. 192 situaciones en que se usa. 79 Discusi6n en infonnes epidemiol6gicos. secci6n de, 354 Diseiio cruzado de casos. elementos de, 35 Diseiio mix to. estudios de cohorte. 25 Diseiios bidireccionales. Vease ESllldios Caso-cohorle
Ecuaci6n de riesgo logfstico multiple de Framingham. 263 Efecto de periodo, 9-15 ejemplo de. 9 significado de, 9 y tasas de incidencia, 12 y tasas de prevalencia. 9-10
fNDICE
Efectos de Cohorte. 8-15 interacci6n edadl tiempo calendario. 10 definici6n de. 9 amHisis de cohorte edad-perfodo. 10- 12 Efectos de la edad. 4-15 definici6n de. 9 importancia de. 4 y tasas de prevalencia. 4-8 Efectos, medici6n de, 184 Emparejamiento individual, uso dc, 36-37 Emparejamiento por grupos. uso de. 37. 271-273 Emparejamiento.35-42 desventajas del. 39-41 estudios de casos y controles. 36 estudios de cohorte. 36 individual. 36-37 metodo de la mfnima distancia euclideana.37 necesidad de. 35 por grupos, 37 sobremparejamiento.41 ventajas y desventajas de. 39-41 Encuestas de morbilidad. eSlUdios transversales.34 Enfoque de Kaplan- Meier. 50 analogfa con tasa de riesgos instantaneos.73 funci6n de supervivencia. 54 incidencia acumulada basada en. 53-54 probabilidades condicionales en. 53-54 procedimiento en. 53-54 Enfoque de probabilidades condicionales en el metodo de Kaplan-Meier. 53-54 en tablas de vida. 52 Enfoque de tiempos exactos hasta el evento. Vease Enfoqlle de KaplanMeier Entrenamiento del equipo. aseguramiento de la calidad. 301-302 Epidemiologfa analftica.3 definici6n de, 3 descriptiva.3 observacional. 4 Epidemiologfa analftica. naturaleza de. 3 Epidemiologfa descriptiva. naturaleza de. 3 Epidemiologfa observacional. naturaleza de.4 Error de clasificaci6n diferencial. 129- 132 causas de. 129 ejemplos de. 129-132
427
Error de clasificaci6n no diferencial. 123- 128 con dos categorfas. 124-126 con multiples categorfas. 126- 127 Escala aritmetica. 369-371 Escala del eje de orden ad as. 368-371 Escala logarftmica en el eje de ordenadas. 12.368-371 Escalas de tiempo covariables fijas y dependientes del tiempo.39-71 Especificidad definici6n de. 118 fndice de validez. 313-335 Estadfsticas vitales y tasas de incidencia. 34,72 Estadfstico de Wald. 284. 395 Estadfstico J de Youden estimaci6n del error estandar. 397 medida de validezlfiabilidad. 320 Estadfstico kappa aplicaciones de, 325-327 estimaci6n del error estandar. 397-399 interpretaci6n de los valores kappa. 326 kappa ponderado. 327-332 medida de validezlfiabilidad. 324-335 para multiples criterios, 327 prevalencia. dependencia de. 332-335 Estimaci6n del error estandar. 375-377 coeficiente de regresi6n. 250. 393-395 estadfstico J de Youden. 397 estadfstico kappa, 397-399 estimaci6n acumulada de supervivencia. 377-378 odds ralio de Mantel- Haenszel. 391-393 probabilidades ajustadas. 388-390 raz6n de mortalidad estandarizada. 390-391 raz6n de odds. 393-385 riesgo atribuible, 386-388 relativo.379-381 tasas de incidencia. 378-379 Estimaci6n del tiempo de anticipaci6n. 145- 149 Estimacion puntual. 362-363. 376 Estratificaci6n. utilidad de la. 173.223 Estudio piloto, aseguramiento de la calidad.302-303 Estudios Concurrentes. estudios de cohorte.25
428
fNDICE
Estudios de casos y controles anidados. 29-33. Vease ESllldios mso-L"ollOrle amHisis multivariante. 274-275 muestreo basado en densidad de incidencias, 101-102 Estudios de casos y controles bas ado en los casos,26-29 amHisis multivariante, 274-275 controles. selecci6n de, 30-31. 100-101 estrategia de casos y no casos, 99- 100
estudios de casos-cohone. 29-33 odds ratio. 97-102 rasgos de, 26-27 selecci6n de 1a poblaci6n, 27-28 sesgo de selecci6n, 28 situaciones para el uso, 32-33 transversalidad de, 26-27 ventajas de, 98·99 Estudios de casos y controles emparejados, anal isis multivariante. 271-273 Estudios de casos y controies, 25-33 comparaci6n de efectos conjuntos observados.198-203 comparado con los estudios de cohone. 25-26 disefio de casos y controles anidado. 101
emparejamiento.36 estudios de caso-cohorte. 29-33 estudios de casos y controles basado en los casos. 26-29 f6mlUla del riesgo atribuible de Levin, 91
homogeneidad de efectos. 196-197 interacci6n. evaluaci6n de. 195-203 odd.. ratio. 25. 26. 92-102 rasgos de. 25-26 regresi6n logistica multiple. 264-265 riesgo atribuible. 102-103 sesgo de recuerdo. 119-120 de selecci6n, 112-117 de vigilancia medica. 110, 134-136 del entrevistador. 120- 122 del observador. 122 Estudios de cohorte, 2 1-25 comparado con los estudios de casos y o,;ulLlrult:s.25-26 disefio mixto. 25 emparejamiento.36 eSlUdios concurrentes, 25 estudios no concurrentes, 25 interacci6n. evaluaci6n de. 193-194
medidas de asociaci6n en. 79-92 regresi6n logfstica multiple, 259-263 selecci6n de la poblaci6n. 79-82 sesgo de selecci6n, 112-117 de vigilancia medica, 134-136 del observador, 122 del que responde. 123 tabulaci6n cruzada de la exposici6n. 80-81 Estudios de fiabilidad, 307-313 limitaciones de, 312 para actividades de recolecci6n de datos, 311
para determinaciones de laboratorio. 312
y fuentes de variabilidad. 310-311 Estudios de validez. 304-309 auto-informes de, 307 como estudios previos, 307 imponancia de. 307-309 limitaciones de, 308-309 mezclas estandarizadas para mediciones de laboratorio, 303 procedimientos que son estandar de oro. 305,306,307.309 solo para respuestas positivas, 306 Estudios ecol6gicos, 4, 15-20 analisis multiniveL 17 como estudios preliminares, 18 ejemplos de, 17- 18 inferencia a traves de niveles, 18-19 medidas agregadas. 15 ambientales,16 globales,16 procedimientos en. 15-20 regresi6n lineal. 251 Estudios no concurrentes, estudios de cohorte,25 Estudios observacionales. confusi6n en. 155-156 Estudios transversales, 33-34 asociaciones medidas en. 92 encuestas de morbilidad. 34 rasgos de los, 33-34 raz6n de tasas de prevalencias punlllales.
92 sesgo de incidencia - prevalencia, 136-139 temporal. 139- 141 y asociaciones con la edad. 4 Evaluaci6n de la interacci6n comparaci6n de efectos conjuntos observados. 189-192
429
fNDICE
e n eSludios de caws y contmles. 195203 decohone.193-194 homogeneidlld dc efeclos. 184- 189 interacci6n adili va. 184. 186. 189- 192. 198-200 interacci6n multiplicativa. 184. 188. 192. 20 1-202 sc lecci6n de modelos para. 204-206 E" cnlo definici6n de. 48 e incidencia. 48 ejcmplos dc. 49 probabihdad de. oosado en intervalo. 51-52 y preva lencia. 48 Exposici6 n. y confusi6n . 160- 166 Faclores de riesgo exploraci6n con interacci6n. 216-2 18 e nfoque reduccio nista . 19 Faclo res de ricsgo emerge nles. interacci6n y busqueda de. 216-218 Faclorcs del hucspcd. e interprclaci6n de la interacci6n,2 15-2 16 Falacia ccol6gica. dcfinici6n de. 17 Falsos positivoslfal sos ncgalivos. 3 15 Fe n6mcno de um bral. 277 Fiabilidad definici6n de . 118 significado de. 297 variabi lidad . fuente.~ de. 309-311 F6mlU ia de Greenwood . 377.386 Fracci6n de exceso. como riesgo atribuible,
85 Fracci6n eliol6gica . como riesgo alribuible.85 Frecucncia de desenlace. Vease OClirrellcia de enjerllle(/ad
Fuer.la de morbilid,ld y de mortalidad . Yease rasa de riesgos in Slan/(j/leo.~ Funci6 n de supervi ve ncia . yea.'iC SlIlJefvi \'encia (lellllllllada
enfoque de Kaplan-Meier. 54 Funci6n lineal. elementos de. 246
Gr:i.fico de Bhmd-Ahman. Medida de valide71fi nbilidad.345-346 Gr:i.fico de correlaci6 n, Vease Diagramas lie llislJersitm
Grupo control estudios de caso-cohorte, 30-32, 97-99 selecci6n de controles basada en los casos. 115-1 16 Heterogeneidad de efeclos interacci6n basada en, 183- 184 significado de, 183- 184 Hip6tesis nu la, prueba de. 376 Homogeneidad de estimados estrmificados. pmeba de. 406 Incidencia definici6n de. 47 y odds. 82-83
y prevalencia. 73-75 Incidencia acumulada. 49-58 ausencia de le nde ncia secular. 57 censura y supervive ncia. supuesto de indepcndencia.55-58 para el en foque Kaplan- Meier. 53-54 pard tablas de vida. 5 1-53 probabi lidad acumulada de supcrvivencia.52-54 probabilidad acumulada del evento. 5 1-52,54 probabilidad conjunla de supcrv ivcncia. 52 unifonnidad de cvcntos y pCrdi(h~ en. 55 Independencia enlre ccnsura y supeTYivencia.55-57 Indi viduos e n riesgo, incidencia basada en. 49-58 Indi viduos,esludios de. bas ado en densidad de incidencia. 60-61 diseiio de caso cruzado . 35 emparejamienlo, 35-42 esludios de casos y conlroles. 25-33 esludios de cohortc . 2 1-25 estudios transversalcs . 33-34 Inferencias. e n informcs epidemiol6gicos. 360-364 Inronnes epidemiol6gicos categorizaci6n de variables continuasiordinales.357 confusorcs. ra zones para elecci6n dc. 356 datos no modeladosJparsimoniosamcntc modcladosltolalmc nlc modclados. 357-358
430
fNDI CE
estudios objetivos, 353·355 evaluaci6n de interacci6n. 358 hip6tesis. desarrollo de, 353-355 inferencias presentadas en. 360-364 introducci6n.354 legihilidad de, 359-360 presentaci6n concisa en. 358-359 procedimientos de recolecci6n y validez de datos. 355-356 secci6n de discusi6n. 354
secci6n de resultados. 354 tablas.364-366 Interacci6n antagonista, 183 cualitativa.207 cuantitativa, 207 condiciones para la ocurrencia de, 183 definiciones de, 183-184 falacia de interacci6n. 196 homogeneidad de efectos. 184 intercambiabilidad de las definiciones. 203-204 medici6n de efecto. 184 para hallar nuevos factores de riesgo, 216-218 prueba estadfstica para, 211 pruebas de homogeneidad. 405406 reciprocidad de, 208-209 sinergica.183 y confusi6n. 209-210 y representatividad de las asociaciones. 218 Interacci6n aditiva, 184. 186.190,192 detecci6n de. 186. 190-192. 198-200 presencia de, 186 y emparejamiento. 39-40 Interacci6n antag6nica. significado de, 183 Interacci6n cualitativa207 Interacci6n cuantitativa. 207 asociaciones aleatorias. variabilidad aleatoria y confusi6n. 161 y heterogeneidad. 211-2 12 Interacci6n multiplicativa. 184. 188. 192
ut:lt:(;d(m ut:.l88-189. 192. 20 1-202 Interacci6n negativa y asociaci6n debil, 216-2 t 7 Vease II1 /eracciol1 af1lagonista Interacci6n sinergica. significado de. 183
Intercepto regresi6n lineal. 247-249 logistica,262 utilidad del, 249 Interpretaci6n de la interacci6n, 211-216 heterogeneidad procedente de intensidad diferencial de la exposici6n. 2 14,215 heterogeneidad procedente de la confusi6n. 212-213 heterogeneidad procedenle de la variabilidad aleatoria. 212 heterogeneidad procedente de sesgo. 214 y factore s del huesped. 213-214 Intervalo de confianza, estimaciones de. 284.375-377 Introducci6n. informes epidemiol6gicos. 354
Kappa ponderado. 327-332
Legibilidad. de informes epidemiol6gicos. 359-360 Log odds, 259, 265 Logit.259 Medidas agregadas. estudios ecol6gicos. 15 Medidas ambientales. estudios ecol6gicos. 16
Medidas de asociaci6n diferencias absolUlas, 79 relativas,79 en eSlUdios de casos y controles. 92-103. 102,103 en eSlUdios de cohorte. 79,92 en eSlUdios transversales. 92 fuerza de las asociaciones. evaluaci6n de. 103,105 odds ratio. 81,85. 92- 102 raz6n de riesgos. 80,81 riesgo atribuible, 85-92 relativo.81 Medidas globales. eSlUdios ecol6gicos. 16 Metodo de ajuste de Mantel, Haenszel. 204.238-242 dikulu dod odd.\' ((1I;u.238-239
odds ratio. estimaci6n del error estandar. 391-393 para datos emparejados en estudios de casos y contmles. 240-242 raz6n de tasas ajustadas. 240
fNDICE
Metodo de Deyo, 423-424 Metodo de la mfnima distancia euclideana, uso de. 37 Metodo de maxima verosimilitud. 284 Metodo de mfnimos cuadrados. 247 Metodo ordinario de mfnimos cuadrados. 284 Vease Metodo de mil1imos cuadrados Metodos de regresi6n multiple metodo ordinario de mfnimos cuadmdos, 284 regresi6n de Poisson, 269-270 lineal, 244-257 logfstica multiple, 258-265 usos de. 244, 263, 292-293 Mezclas estandarizadas. estudio de validez. 305 Modelo de riesgos proporcionales de Cox. 265-269 raz6n de riesgos instantaneos. 268 supueslOs basicos en, 265-266 usos de. 265, 268-269 Modelo lineal general, 244 Modelo log-lineal, 269 Modelos estadfsticos conceplO.288-291 selecci6n del modelo. 292-293 tipos de. 228-229 Modelos Jer:\rqulcos, 2U Vease Antilisis Mli/linive/ Modelos. Vease Mode/os eSladislicOJ Modificaci6n de efeclOs, uso del tennino. 183.184,185. Vease Inlera£·cion Modificador de efectos. 183. 184, 185 razones para usarlo. 184-186 Muestreo a !raves de conjuntos de riesgo, usode.31.273 Muestreo basado en densidad de incidencia, diseiio de casos y comroles anidado. 101
Niveles de exposici6n, heterogeneidad basada en, 2 14-215
Observaci6n. vigilancia del control de calidad.3303,304 Observaciones multiples observadores. 122. 327 observaciones censuradas. 49,53
431
Observaciones censuradas en incidencia acumulada. 49-53. 55 razones para la censura. 55-57 Ocurrencia de enfennedad odds. 75,76 tasas de incidencia. 49-73 tasas de prevalencia, 73-76 Odds. 75-76 definici6n de. 75 odds basados en prevalencias, 75_76 represemaciones numericas para, 76 y calculo de probabilidad. 75 y odds ratio. 93 Odds absolutos. 93 Odds basados en prevalencias. 75 Odds ralio de probabilidades. Vease Odds ralio Odds ralio emparejados. 96. 240-242, 271-273 Odds ralio. 81-85. 92-102 como aproximaci6n del relativo riesgo. 83-85 e incidencia. 82 en estudios emparejados de casos y controles, 96. 236,242. 271-273 estimaci6n del error estandar. 383-386 estimaci6n del riesgo relativo, 83-85. '}6-IUU
estimaciones con regresi6n logfstica. 259,261 estudios de casos y controles, 25, 26. 92-102 exposici6n multiple. 102 odds absolutos, 93 odds ralio ajustado de Mantel-Haenszel. 238,242 probabilidades y. 81-82 sesgo inherente, 84 ventajas de. 84 y raz6n de produclOs cruzados. 81 . 93
Patr6n dosis respuesta. prueba para. 401-403 Pendiente. coeficieme de regresi6n. 247-251 Perdidas administrativas. 57 Perdidas del seguimiento supuestos relacionados con. 55,57 tipos de. 55,57 y sesgo de selecci6n. 57, 117
432
fNDI CE
Perdidas diferenciales en el seg uimiento, 117 Poblaci6n estandar. 233-234. 236-237 se lecci6n en estudios de cohorte. 79-80 Poblaci6n estandar de minima varianza. 234 Poblaci6n estandar de minima varianza. 234
y ajllste directo, 233-234 indirecto.236-237 Porcentaje de concordancia limitaciones de, 322-323 medida de validez lfiabilidad. 320-324 posit iva. 324 positiva de Chamberlain. 324 procedimiemos de estadfstica inferencial.395-396 Predicci6n, y metodos de regresi6n multiple, 244. 262-263 Prevalencia.48 definici6n de, 48 efectos sobre kappa, 332·335 evento en. 48 Prevalencia acumulada a 10 largo de la vida . si);:nificado de, 74 Prevalencia de perfodo prevalencia acumulada a 10 largo de la vida.74 significado de, 73-74 Prevalencia puntual. 73-75 significado de. 73 Prevenci6n necesidad de evidencias. 180-181 primaria. 181 secundaria . 181 Prevenci6n primaria necesidad de evidencias. 180, 181 significado de. 181 Prevenci6n secundaria necesidad de evidencias. 180-181 significado de. 181 Probabilidad de evento basado en intervalo. 51-52 Probabilidad. V~anse Odds: Odds rwio; In cidencia ael/lIIl1lada; 511pervi vencia aL'unllllada
diferencia ajustada. estimaci6n del error estandar.388-390 yodds,81-82
Procedimientos de recolecci6n de datos aseguramiento de la calidad. 301 validez y fiabilidad. 355-356 Procedimientos que son estandar de oro, estudios de validez. 305. 306, 307, 309 Protocolo del estudio, aseguramiento de la calidad.300 Prueba de raz6n de verosimilitudes. 284 Prueba de tendencias multivariante, 404 Prueba previa, aseguramiento de la calidad, 302 Prueba t pareada. 343-344 Publicaciones, supuestos de validez de. 149 Raz6n de densidades de incidencia. Vease R{Jz()n de /{fsas
Raz6n de prevalencia estandarizada. 235 Raz6n de probabilidades. Vease Riesgo re/alivo
Raz6n de productos cruzados y odds ralio. 8!, 92 Raz6n de riesgos, 81. Vease Riesgo re/alivo
Raz6n de riesgos instantaneos, modelo de riesgos proporcionales de Cox , 268 Raz6n de tasas estimaci6n del error estandar. 381-383 regresi6n de Poisson, 270 Raz6n de tasas puntuales de prevalencia, estudios transversales, 92 Raz6n estandarizada de incidencia, calculo de,236 Raz6n estandarizada de mortalidad calculo de, 236-237 estimaci6n del error estandar. 390-391 Reduccionismo, 19 Regresi6n a la media, efectos de, 346-347 Regresi6n de Poisson, 269-270 coeficientes de regresi6n, 270 ecuaci6n para, 269-270 modelo log-lineal, 269 raz6n de tasas. 270 usos de. 269 Regresi6n lineal binaria, 257 Regresi6n lineal multiple, 252-257 coeficiente de regresi6n. 253-256 usos de. 252 Regresi6n lineal. 245-257 coeficiente de correlaci6n lineal de Pearson. 246
fNDICE
coeficiente de regresion, 249-251 conceptos basicos, 245-248 intercepto, 247-249 medidas de validez lfiabilidad, 342 metodo de maxima verosimilitud, 234 metodo de mfnimos cuadrados. 247.284 para relaciones no lineales. 275-281 prueba estadfstica, 284 regresi6n lineal multiple, 252-257 Regresion logfstica condicional, usos de. 271.274 Regresion logfstica multiple. 258-265 estudios emparejados por grupos. 273 para estudios de casos y controles, 264-265 para estudios de cohone. 259-264 usos de. 258, 264 Y predicci6n de probabilidades, 262-264 Regresion Logfstica. Vease Regresion log(slica I1lIilliple Relaciones no lineales diagramas de dispersi6n para, 281-283 regresion lineal para. 275-281 relaci6n en fonna de L 275-276 variables dummy, uso de, 277-281 Representatividad de asociaciones. e interaccion.218 Riesgo atribuible. 85-92 como fracci6n etiol6gica. 85 definici6n de, 85 en individuos expuestos, 86-88 estimaci6n del error estandar, 386-388 estudios de casos y comroles. 102-103 expresado en porcemaje. 86-88 interacci6n aditiva. 184, 186 riesgo atribuible poblacional de Levin, 88-92 Riesgo atribuible poblacional. Vease Cdlclilo del riesgo atribuible pobladonal de Lel,in Riesgos instamaneos. Vease Tasa de Riesgos Inslantdm'os Riesgo relativo, 80-85 aproximacion a traves del odds ratio, 82-85 estimaci6n del error estandar. 379-381 odds ratio para estimaci6n. 96-100
433
Secci6n de resultados. informes epidemiol6gicos, 354 Seguimiento por observaci6n, 303-304 Sensibilidad y especificidad definicion de. 118 fndice de validez, 313-320 Iimitaciones de, 317-320 pmcedimientos de estadfstica inferenciaL 395-396 Sesgo comparado con confusion. 155- 156. 178- 181 compensatorio, 116 de amicipaci6n en el diagnostico, 144- 149 definicion de. 109-110 heterogeneidad debida a. 214 prevencion de. 110 de diluci6n de la regresion. 347 de informaci6n, 111-112, 117- 134 de longitud, 142-144 de publicaci6n. 149-151 de razon de complemento de prevalencia puntual. 137 de recuerdo, 119-120 de seleccion. 110, 112-117 de vigilancia medica. 110. 134- 136 del entrevistador. 120-122 del observador. 122 del que responde. 137 de la raz6n de la duraci6n. 139-141 temporal,159-161 Sesgo Compensatorio, significado de. 116 Sesgo de agregacion. Vease Falada ecolOgica Sesgo de anticipacion en el diagn6stico. 144- 149 causa de. 144- 145 Sesgo de Berkson. Vease Sesgo de seiElxion Sesgo de detecci6n. Vease Sesgo de vigi/aflda midiL'a Sesgo de error de clasificaci6n, 123-134 error de clasificacion diferenciaL 129-131 error de clasificacion no diferenciaL 123- 127 prevencion de. 133-134 y variables de confusion. 132 Sesgo de identificaci6n de la exposicion de recuerdo, 111,119-120 del entrevistador. 120-122
434
fNDI CE
Sesgo de identificaci6n del desenlace. Vease Se.tgo de vigilaflcia medica Sesgode idioma.151 Sesgo de incidencia.prevalencia. 136-139 causas de. 136 de [ongitud.l142. 144 de la raz6n de la duraci6n. 137 ejemplos de, 137-138 para la evaluaci6n de tamizaje. 142-144
prevenci6n de, 139 de la rawn complemento de la prevalencia puntuaL 137 Sesgode informaci6n.117-134 de error de clasificaci6n. 123-134 derecuerdo.l11.119- 120 temporal. 139- 141 significado de, 110 Sesgo de la raz6n de los complementos de las prevalencias.l37 Sesgode longitud,142-144 causa de 142-143 prevenci6n de, 142- 143 Sesgo de puhlicaci6n. 149-151 causasde.150-ISI de idioma. lSI prevenci6n de, 151
Sesgo del observador .122 causa de, 122 prevenci6n de. 122 Sesgo del que responde, 123 causa de, 123 prevenci6n de. 123 Sesgo inherente. odds ralio. 84 Sesgo temporal. 139-141 callsade,139-140 ejemplos de. 140 prevenci6n de. 140-141 Significaci6n estadfstica de los coeficientes de regresi6n. 284 e interacci6n. 211 errores comllnes relacionados con. 360-363 evaluaci6n de la confusi6n. 177-178 evaluaci6n del coeficiente de correlaci6n,339-341 Sobreajuste,288 ejemplo de. 288 significado de. 165-166.288 Sobremparejamiento, 41,288 Sllbcohones,274 Supervivencia acumulada. 49-50, 52-54 estimaci6n del error estandar. 377-378
Scsgo de ruz6n de durnci6n, 137
Sesgo de recuerdo. 111. 119-120 causa de, 119 prevenci6n de, 119-120 Sesgo de selecci6n. 112-137 causa de, 112 compensatorio. 116 de incidencia-prevalencia, 136,139 de vigilancia medica. 110. 134-136 ejemplosde.112-115 en evaluaci6n de tamizajes. 141 estudios de casos y controles basados en los casos, 28 igualamiento de, 115 prevenci6n de. 110 significado de. 137 Sesgo de supervivencia, 156 Sesgo de vigilancia medica. 110. 134_136 causasde.134- 135 prevenci6n de, 135-136 Sesgo del entrevistador. 120-122 causa de, 120-121 prevenci6n de. 121-122
Tabla de vida actuarial. Vease Tabla de vida Tabla de vida. 49-53 duraci6n de intervalos. 52,53 incidencia acumulada basada en. 5 1,53 tenninos relacionados con. 49-50 Tabla de vida clasica. Vease Tabla de vida. Tabla dos por dos. 80 Tablas.364-366 altemar denominadores. 366 comparabilidad con otros infonnes. 364 comparaci6n de datos estadfsticos entre grupos,365 evitar redundancias. 365-366 presentaci6n de datos. 366 r6tulos/encabezamientos.364 unidades.364 Tabulacion cruzada de exposici6n y enfennedad. Vease Tabla dos por dos Tasa de riesgos instantaneos. 73 analogfa con enfCKJ.ue de Kaplan-Meier, 73 definici6n de. 73
fNDICE
en amHisis de supervivencia, 73 funci6n de riesgos instantaneos, estimaci6n de la, 73 Tasa, uso del tennino, 4 Tasas anuales promedio, 72 Tasas de incidencia, 47,49-73 Vease Incidencia aeu/lllliada comparaci6n de medidas, 71-73 estimaci6n del error estandar. 378-379 cvento en Ins, 48 para individuos en riesgo. 49-58 para unidades personas-tiempo. 58-71 tasa de riesgos instantaneos. 73 tasas anuales promedio. 72 y efectos de periodo. 12 Tasas de prevalencia, 73-75 e incidencia, 74-75 prevalencia de periodo. 73-74 prevalencia puntual, 73-74 y efectos de la edad. 4-8 y efectos de periodo. 9-10 Tendencias patr6n dosis respuesta, 401-404 prueba multivariante de, 404 Tendencias seculares, ausencia en estudios, 57-58
Una escala de tiempo. 66-67 Unidades personas-tiempo, tasas de incidencia, 58-71 covariables dependientes del tiempo. 69-71 datos agregados. 59-60 datos individuales. 59-60 densidad de incidencia, 59 ejemplo de eSlUdios. 59 escalas multiples de tiempo. 67-69 estratificaci6n de personas-tiempo) tasas .65-71 razones para su uso, 58-59 relaci6n densidad/tasa. 63-65 supuestos basicos en, 62-63 Uniformidad de eventos/perdidas. 55
435
Validez definici6n de. 118,297 estudios de validez, elementos de. 118 sensibilidadlespecificidad, como fndices de 313-320 validez de constructo. 286 Validez de constructo. s ignificado de. 286
Valor predictivo negativo. 316 Valor predictivo positivo. 316 Valores predictivos. positivos y negativos, 316 Variabilidad coeficiente de, 344-345 fuentes de, 310-311 Variabilidad inter-observador. 310 Variabilidad intra-observadores, 310 Variable binaria. Veanse Variables dh·olomicas. Variables dllmmy Variable Dicot6mica. 47 Variables confusoras,37 continuas.47 de desenlace dicot6mico. 47 Variables categ6ricas ordinales, 281 Variables cominuas usos de. 47 y emparejamiemo. 41 y estratillcaclon, 242 y regresi6n lineal. 245, 261,267 Variables confusoras e interacci6n. 209-210 efectos de, 35,155-157 error de clasificaci6n de. 286-287 excesiva correlaci6n con exposici6n, 164-166 y asociaciones aleatorias. 161 y asociaciones exposici6n-desenlace, 159-161. 166-172 Y confusi6n residuaL 285-286. 286-287 Y emparejamiemo. 35 y trayecto causal de exposici6n/desenlace. 162-164 Variables Dummy. para relaciones no lineales,277-281
Epidemiologfa interme
ISBN 8 4 · 7978 · 595 · 0
E-mail: [email protected] www.diazdesantos .es/ediciones