Cómo tomar decisiones en medicina clínica
Nociones de análisis de decisiones aplicadas a ejemplos en América Latina 2a edición 2008 Jef Van den Ende Departamento de Ciencias Clínicas Instituto de Medicina Tropical de Amberes, Bélgica Juan Moreira Centro de Epidemiología Comunitaria y Medicina Tropical Esmeraldas, Ecuador Zeno Bisoffi Centro para las Enfermedades Tropicales, Hospital Sacrocuore Negrar,Verona, Italia
Una publicación de:
Proyecto de Fortalecimiento de los Servicios Públicos de Atención de Salud en el Distrito Metropolitano de Quito
Cómo tomar decisiones en medicina clínica: Nociones de análisis de decisiones aplicadas a ejemplos en América Latina Autores: Jef Van den Ende Juan Moreira Zeno Bisoffi Primera edición. Quito 1998, 95 páginas Segunda edición. Quito 2008, 132 páginas
ISBN: 978-9978-92-653-6 Nº de ejemplares: 2000 Ilustración de portada:Tomás Eskola Diseño e impresión: Imprenta Activa 2557 458 Disponible en:
www.saluddealtura.com Se autoriza la reproducción parcial, para fines no comerciales, citando la fuente. En caso de reproducción total o adaptaciones, se requiere la autorización escrita de la Cooperación Técnica Belga (CTB). Se terminó de imprimir en Octubre 2008
ERRNPHGLFREORJVSRWFRP Contenido Tabla de contenidos Los autores Agradecimiento Léxico Presentación
INTRODUCCIÓN consideraciones previas el grado de certeza de un diagnostico los umbrales los argumentos el análisis complejo conclusión
LOS
UMBRALES
introducción umbral de decisión factores que afectan el umbral tratar o seguir investigando algunos ejemplos para comprender mejor conclusión
RELACIONES
ENTRE LOS ARGUMENTOS Y LAS HIPÓTESIS
introducción ejemplo de criminología ejemplo de medicina conclusión ejercicios
EL
PODER DE UN ARGUMENTO
introducción definición del poder simetría entre poderes de confirmación y de exclusión patognomónico los determinantes de la fuerza
FUERZA
DE UN ARGUMENTO APLICADA A UN CONTEXTO CLÍNICO
representación gráfica conclusión
v ix xii xii 1 1 2 4 5 8 11 13 13 13 15 19 26 27 29 29 29 31 34 34 35 35 35 43 45 45 49 53 62
iii
EL
PANORAMA: ANÁLISIS DE RAZONAMIENTO CLÍNICO COMPLEJO
introducción las leyes el inventario de datos la construcción del panorama ejemplo de panoramas conclusión
Apéndice 1: Las escalas de probabilidad Apéndice 2: El teorema de Bayes Apéndice 3: ¿Qué son los logaritmos?
iv
65 65 68 70 72 76 82 85 95 105
Los Autores
Jef Van den Ende MD. PhD. Médico internista belga, nacido en 1949. Hizo sus estudios de medicina y de especialidad en la Universidad Católica de Leuven, Bélgica. Ha desarrollado gran parte de su carrera en países en desarrollo. Desde 1976 hasta 1982 trabajó para Medicus Mundi en el distrito de Dungu en la República Democrática del Congo (ex - Zaire). Desde el 2000 hasta el 2002 estuvo a cargo de la coordinación docente en el Hospital Universitario de Kigali, en Rwanda. Ha colaborado intensamente en proyectos en América Latina, especialmente en Ecuador y Bolivia. Es profesor de patología tropical y analítica en el Instituto de Medicina Tropical de Amberes, Bélgica. Actualmente es jefe del Departamento de Ciencias Clínicas en el mismo Instituto. Hizo su doctorado sobre malaria de importación. Desde hace 20 años ha dedicado gran parte de su carrera a la epidemiología clínica en enfermedades tropicales, a la inteligencia artificial y a la enseñanza interactiva con el uso de programas de computadora. Es el creador del programa Kabisa para la enseñanza del análisis de decisiones clínicas. Ha realizado varias publicaciones internacionales, principalmente relacionadas con la clínica de la malaria, malaria de importación, síndrome hipereosinofílico, esplenomegalia tropical y análisis de decisiones clínicas. Además es revisor de las revistas Tropical Medicine & International Health y Medical Decision Making. Es también pianista clásico, ganador de varios premios en Bélgica. Habla 8 idiomas, entre ellos el español. Está casado con Marijs y tiene tres hijos: Klara, Bram y Peter.
Juan M. Moreira MD. MSc. Médico ecuatoriano nacido en 1964. Hizo sus estudios de medicina en la Universidad Central de Quito y una maestría en Ciencias Biomédicas Tropicales en el Instituto de Medicina Tropical de Amberes, Bélgica. Empezó su carrera en la provincia de Esmeraldas en 1992 como médico rural del Subcentro de San Francisco de Onzole. Entre 1993 y 1995 fue coordinador de la red de atención primaria en el Área de Salud Borbón y desde 1997 hasta 2003 fue director e investigador del Centro de Epidemiología Comunitaria y Medicina Tropical (CECOMET) con sede en la ciudad de Esmeraldas. Actualmente es coordinador científico y académico en el mismo Instituto e Investigador Asociado del Centro de Biomedicina de la Universidad Central del Ecuador. Además es epidemiólogo del Ministerio de Salud Pública del Ecuador. Ha formado parte de equipos de trabajo que se encargan del control comunitario de malaria, oncocercosis, pian, tuberculosis y enfermedades cardiovasculares. Ha sido instructor de Epidemiología en varios programas universitarios en Ecuador; desde 1998 es profesor invitado
vi
Autores
de Epidemiología Clínica en el Postgrado de Medicina Tropical de la Universidad San Simón de Cochabamba en Bolivia y desde 2003 ha sido invitado como docente auxiliar de Patología Analítica en el Diploma de Medicina Tropical del Instituto Príncipe Leopoldo de Amberes, Bélgica. Desde 1997 ha mantenido una estrecha colaboración con el Prof. Jef Van den Ende en la investigación en toma de decisiones clínicas y actualmente es candidato para un doctorado por la Universidad de Amberes en ese tema. Está casado con Elisa Carbo, tiene dos hijos: Martín y Andrea.
Zeno Bisoffi MD. DTM&H Médico italiano nacido en 1955. Hizo sus estudios de medicina en la Universidad de Padova, Italia y la especialidad en Medicina Tropical, Higiene y Salud Pública en la Escuela de Medicina Tropical de Londres, Reino Unido. Desde 1982 a 1985 trabajó en Nicaragua como cooperante de la ONG MLAL y desde 1986 a 1990 en Burundi como “Primary Health Care Officer” de UNICEF. Actualmente dirige el Centro para Enfermedades Tropicales del Hospital “S. Cuore” de Negrar, Verona; es profesor encargado de epidemiologia clínica de la Universidad de Brescia y docente invitado de la misma disciplina y de medicina tropical en otras universidades italianas y europeas. Es miembro del colegio de docentes del “European Course in Tropical Epidemiology” (ECTE) y ha sido director del mismo curso en las ediciones de 2000 y de 2005. También es Secretario general de la Sociedad Italiana de Medicina Tropical (SIMET) y al mismo tiempo hace parte del “Steering Committee” de TROPNETEUROP (European Network on Imported Infectious Diseases). Actualmente es vice Presidente y Presidente electo de la Federación de las Sociedades Europeas de Medicina Tropical (FESTMIH). Sus intereses científicos se concentran sobre todo en los aspectos clínicos de la medicina tropical y en la epidemiología clínica, en su aplicacion a la toma de decisiones. En estos aspectos colabora desde hace varios años con el Prof. Jef Van den Ende. Ha ganado algunas medallas, la más importante ha sido una de plata por haberse clasificado segundo de su categoría en la Maratón atlética de la Habana en noviembre 2005 (medalla otorgada por el gran Alberto Juantorena). Está casado con Margherita Corradini y tiene tres hijos: Federico, Francesco y Marco.
vii
Agradecimientos:
Los autores agradecen a todas las personas que a lo largo de estos años han colaborado para el desarrollo de esta propuesta. En la elaboración del texto han contribuido Serge Bertschy y Fons Van Gompel. En el aporte de ideas y conceptos han contribuido Bettina Bisig, Hugo Van Puymbroeck, Bruno Dujardin, Patrick Van der Stuyft, Marleen Boelaert, Frank Haegeman y Paulin Basinga. La implementación de los cursos e investigaciones en América Latina estuvo apoyada al inicio por el equipo técnico del Proyecto APS en Ecuador, de manera especial por José Castro, Leo Reyntjens y Pierre De Paepe. En Bolivia por Jan Coenen, Marjan Pirard y Faustino Torrico. También agradecemos a Louis Vermeulen que, desde Amberes, se ha ocupado de la accesibilidad del Programa Kabisa para los estudiantes de todo el mundo y a las demás personas que han trabajado en la concepción y el proceso de desarrollo de esta herramienta de tanta utilidad para los cursos. La presente edición se pudo realizar gracias al apoyo de la cooperación bilateral entre el Municipio del Distrito Metropolitano de Quito y el Reino de Bélgica, en especial gracias al interés de los codirectores del Proyecto Salud de Altura, Ruth Lucio y Johan Herteleer. Finalmente queremos agradecer a los médicos de Ecuador y Bolivia que han asistido a nuestros cursos, tanto para principiantes como para nivel avanzado, quienes han dado brillantes ideas para que este sueño siga adelante.
ix
LEXICO
Argumento:
Todos los elementos que son útiles para un diagnóstico: edad, sexo, factores de riesgo, síntomas, signos, resultados de laboratorio e imagenología.
Certeza:
La probabilidad de que un paciente tenga la enfermedad estudiada, después de reunir una serie de argumentos a favor y en contra.
Especificidad:
La tasa de verdaderos negativos en los pacientes que no tienen la enfermedad estudiada.
Odds
(chances en español)
Probabilidad de que un evento ocurra dividido para la probabilidad de que no ocurra.
Poder de confirmación:
El poder intrínseco que un argumento tiene para confirmar una sospecha. La razón entre los verdaderos positivos y los falsos positivos en una muestra de pacientes.
Poder de exclusión:
El poder intrínseco que un argumento tiene para excluir una sospecha. La razón entre los verdaderos negativos y los falsos negativos en una muestra de pacientes.
Prevalencia:
La frecuencia de una enfermedad en la población correspondiente.
Probabilidad:
Proporción de casos favorables dividido para todos los posibles.
Sensibilidad:
La tasa de verdaderos positivos en los enfermos.
Sospecha
La probabilidad de que un paciente tenga la enfermedad estudiada, antes de empezar las investigaciones
xi
Presentación1 Esta publicación es fruto de años de experiencia y gestación de un grupo de eminentes autores: el Prof. Jef Van den Ende del Instituto Tropical de Amberes- Bélgica, el Dr. Zeno Bisoffi del Centro de Enfermedades Tropicales de Verona- Italia y el Dr. Juan Moreira, del Centro de Enfermedades Tropicales de Esmeraldas - Ecuador; con la contribución, no menos importante, de muchos médicos, enfermeros/as, estadísticos e informáticos europeos, africanos y latinoamericanos que han participado en actividades de docencia e investigación en el tema.Tiene como objeto abordar un tema fundamental y complejo en la medicina: ¿cómo tomar decisiones clínicas acertadas?, aún cuando no se disponen de todos los elementos posibles. La enseñanza tradicional de la medicina y su práctica se han orientado por siglos a acumular toda la información necesaria para diagnosticar y curar enfermedades, con la expectativa errónea, tanto de médicos como de usuarios, de que se llegará a establecer un diagnóstico con un grado de certeza cercano al 100%. Muchos asumen que la acumulación de argumentos, en muchos casos indiscriminada e irracional, es el camino para llegar al diagnóstico. Sin embargo, quienes trabajan en los servicios de salud, saben que la incertidumbre es una realidad permanente. La teoría de la toma de decisiones clínicas brinda una respuesta a esta situación, y permite manejar casos complejos con el grado de certeza requerido en cada uno. Este manual es una herramienta para entender la teoría de la toma de decisiones clínicas y de manera progresiva adentrarse en cada uno de sus conceptos básicos. Parte de la relación entre los argumentos, que pueden ser signos o síntomas, resultados de laboratorio o de imágenes, y los posibles diagnósticos, con criterios de exclusión y de confirmación. Contrariamente a la opinión generalizada, muchas veces es más importante excluir ciertos diagnósticos que llegar a la certeza absoluta del diagnóstico final. En un niño con fiebre alta súbita, excluir una meningitis, una neumonía, un cuadro de malaria, una otitis, puede ser más importante que confirmar la naturaleza de un cuadro viral mal definido, que se resolverá en pocos días. Los autores exponen con claridad los diferentes modelos de toma de decisiones. Nos recuerdan que no es necesario llegar a certezas absolutas para actuar. Esto se hace evidente al revisar el modelo de umbrales: tomamos decisiones cuando superamos un punto a partir del cual el problema está suficientemente definido para actuar. Pero también, es necesario reconocer las situaciones en las que se puede esperar, sin correr riesgos El arte de no intervenir innecesariamente es posiblemente uno de los mayores desafíos para el médico. Las escalas de probabilidad permiten estimar, de manera intuitiva, pero con un respaldo de un modelo matemático riguroso, la probabilidad de que una persona determinada tenga una 1
Este manual es una versión revisada de una edición inicial que se realizó en el marco del Proyecto CECOMET en Esmeraldas en los años 90, con un enfoque menos centrado en enfermedades tropicales, y más en enfermedades comunes en climas templados. Los principios básicos se pueden aprender en un curso introductorio de unas 20 horas, aunque el doble de tiempo es aconsejable para llegar a un entendimiento más a profundidad. Va acompañado de un CDROM con ejercicios prácticos que se pueden realizar en casa (KABISA).
xiii
cierta afección o enfermedad (la que también se llama la probabilidad “a priori”), para después de aplicar una serie de argumentos, poder confirmar o descartarla. Finalmente, están los panoramas diagnósticos, que permiten integrar y aplicar los conceptos anteriores en una toma de decisiones clínica aplicada a la vida real. En un primer círculo están aquellos posibles diagnósticos urgentes, graves y tratables, mientras que otros diagnósticos, aunque más comunes, están en círculos más lejanos. Las ventajas del método son numerosas, y el profesional que lo maneja bien termina por intuir, como un sexto sentido, cuales son las probabilidades 'a priori' de cierto diagnóstico en grupos determinados de sexo y de edad, se dará cuenta de la fuerza de un argumento en un contexto determinado. Sabrá que la probabilidad de que una prueba ELISA positiva en una persona con conducta sexual de riesgo, con pérdida de peso y diarrea persistente, signifique VIH es altísima; mientras que la misma prueba en un screening de una población de bajo riesgo tendrá más falsos que verdaderos positivos. Utilizará de manera espontánea los panoramas diagnósticos: en un niño con fiebre alta, querrá descartar de manera inmediata una meningitis, una neumonía, un episodio de malaria o una otitis media; en un recién nacido con vómito persistente, querrá descartar una hipertrofia del píloro, un proceso infeccioso o una invaginación intestinal. Este esquema de pensamiento a su vez llevará de manera inevitable a una exigencia mayor en hacer las preguntas correctas, buscar el signo preciso, pedir el examen que permite diferenciar entre una y otra patología. Las ventajas no se limitan al ámbito clínico, sino que permiten una organización de los servicios más efectiva, orientada a las necesidades de cada situación y paciente en general. Permiten forjar una práctica médica más ética y racional, eliminando algunos sesgos del mercado, demasiado expuesto a intereses comerciales.También llevan los estándares de exigencia científica: las normas y protocolos nacionales deberán no solamente basarse en evidencias científicas, pero responder también a criterios de costo-efectividad. La aplicación del método requiere no solamente de una capacitación inicial, que la deberían incluir todas las universidades en su pregrado de medicina, como parte de la formación de base. También requiere de un adiestramiento continuo, mediante su aplicación en la práctica diaria, con círculos de estudio y procesos de capacitación continua. La toma de decisiones clínicas se debería complementar con otros enfoques, entre los cuales están: la medicina basada en evidencias, el uso de protocolos, el uso racional de medicamentos y la relación médico-paciente. Aunque los enfoques son distintos, y pueden parecer a primera vista contradictorios, en los hechos no lo son. El uso de protocolos y normas permite establecer las reglas del juego mínimas, mientras que la toma de decisiones permite llegar a la excelencia y afinar cada vez más el juicio clínico. La medicina seguirá siendo un arte, tanto como una ciencia.Y con un manejo adecuado de la toma de decisiones clínicas, podremos contar con artistas más científicos, que manejen las destrezas del manejo racional de las incertidumbres. Johan Herteleer Médico Familiar y Co-director Proyecto Salud de Altura Quito, 30 de septiembre de 2008 xiv
1 Introduccion Consideraciones previas El médico es un científico que posee un gran conocimiento bibliográfico, pero, paradójicamente, no es gracias a este conocimiento que adquiere su prestigio. Este más bien es consecuencia de la pertinencia de sus decisiones. Estas decisiones conciernen a la salud, el bienestar y la vida de sus pacientes. Son finalmente ellos quienes juzgan sobre la calidad del médico en función de la satisfacción alcanzada. Tranquilizar a una mujer que presenta un nódulo del seno luego de haber excluido un tumor mamario maligno, confirmar un diagnóstico de neumonía, prescribir el delicado tratamiento para una colagenopatía, ordenar una cesárea en un sufrimiento fetal prolongado con el objetivo de proteger al niño que está por nacer, pedir una tomografía en un paciente que no podría asumir el costo.Todos estos son ejemplos de decisiones con las cuales un médico está confrontado cada día. ¿Cuál es la base lógica de razonamiento que nos permite elaborar diagnósticos? ¿Cuál es la lógica que nos permite justificar nuestras decisiones y en ciertos casos ponernos al abrigo de críticas por parte de la sociedad? ¿Cuál es la parte de intuición y de experiencia subjetiva que rige nuestra actitud diagnóstica?
Un día en Azogues, en Ecuador, un médico general de un centro de salud recibe a una muchacha de 25 años proveniente de la amazonía, región tropical del país. Ella presenta un estado gripal: fiebre, dolores musculares y articulares. El examen físico es normal. Tomando en cuenta la ausencia de síntomas que sugieran una patología grave le prescribe un antipirético. Dos días más tarde se entera de que su paciente ha sido hospitalizada por un absceso amebiano del hígado.
¿Tuvo razón el médico de no investigar más?, por otro lado ¿tendrá, de ahora en adelante, esta experiencia un peso particular cada vez que reciba un paciente febril? ¿Puede la lógica diagnóstica traducirse en un lenguaje formal, aún matemático? Esto nos permitiría evitar más fácilmente los eventuales errores de nuestro razonamiento, dando una base más científica a nuestras actividades. La enseñanza tradicional de la medicina tiene sus bases en la descripción clásica de las diferentes patologías, pero forma muy poco a los estudiantes en la toma de decisiones para los casos menos clásicos. Por ejemplo, ningún médico va a dudar en iniciar un tratamiento antituberculoso en un hombre adulto que ha adelgazado considerablemente, que tiene tos crónica y hemoptisis y en el cual el examen de esputo muestra bacilos alcohol ácido resistentes (BAAR). Este caso corresponde a una descripción típica de tuberculosis pulmonar. Sin embargo no es raro encontrar, en algún hospital, pacientes con tos crónica, sin disminución de peso, sin hemoptisis, con exámenes seriados 1
de esputo que no muestran BAAR, ni radiografías que muestren cavernas y que, pese a ello, tienen tuberculosis pulmonar.(1-3) Estos casos atípicos plantean problemas de decisiones que todo médico tendría que saber como enfrentar.(4)
El grado de certeza de un diagnóstico Escala de certeza Un hombre de 32 años, soltero, de Sucumbíos, Ecuador, se presenta en la consulta de un centro de salud con un cuadro de diarrea crónica, episodios de fiebre desde hace algunos días sin ningún otro signo de infección particular, adelgazamiento de 8 kg en dos meses. Por otra parte se queja de prurito y el examen clínico pone en evidencia adenopatías generalizadas y una candidiasis bucal. Con este cuadro clínico el médico hace una referencia al hospital provincial donde piden exámenes complementarios, obteniendo una fórmula leucocitaria que nos muestra leucopenia y un test rápido para VIH positivo. Se hace el diagnóstico de SIDA.
De ahora en adelante vamos a llamar “argumentos” a todos los elementos que son útiles para un diagnóstico: edad, sexo, factores de riesgo, síntomas, signos, resultados de laboratorio e imágenes. En este caso los argumentos que nos permiten avanzar hacia la certeza de nuestro diagnóstico de SIDA son: edad joven, diarrea crónica, adelgazamiento, prurito, adenopatías, candidiasis, leucopenia y el test VIH. Desde una probabilidad muy inverosímil hasta la certeza casi absoluta, pasamos por ciertos grados de certeza que podrían ser calificados con adjetivos.(Figura 1.1) En nuestro caso podemos decir que, solo con el argumento de la edad, este paciente tenía una probabilidad cercana a 0% de estar enfermo de SIDA; la edad y la diarrea crónica, luego la fiebre y el adelgazamiento nos hacen avanzar en la escala de certeza; los exámenes hematológicos y serológicos permiten afirmar con certeza el diagnóstico de SIDA, llegando finalmente a una probabilidad cercana al 100%. Figura 1.1: Escala de certeza.
A la izquierda se observa la escala de probabilidad en porcentaje, a la derecha están las categorías nominales que podrían corresponder a la escala cuantitativa.
2
Introducción
Para muchos de nosotros es más fácil comprender un concepto que una cifra: si un paciente nos pregunta: ¿Qué probabilidad tengo de tener SIDA? (sin presentar ningún síntoma de la enfermedad), decirle que tiene una probabilidad de 0.01% le explicará menos que si le contestamos que es "poco probable" que tenga la enfermedad. Sin embargo encontrar una correspondencia precisa entre un concepto y una cifra es muy difícil. Si pedimos a algunos médicos que califiquen con adjetivos las probabilidades expresadas en porcentajes las respuestas van a ser muy diferentes. Para algunos decir “poco probable” corresponderá a una probabilidad de 30%, mientras que para otros corresponderá a una probabilidad del 1%. Por esta razón en lo que sigue del texto no continuamos con categorías fijas, puesto que ellas difieren mucho entre las personas, sin embargo trataremos de hacer que las probabilidades matemáticas sean fácilmente comprensibles. Cada argumento que investigamos en un paciente contribuye a aumentar la certeza de la enfermedad que sospechamos. Del mismo modo, cuando un argumento es negativo, por ejemplo el paciente no tiene fiebre, obtenemos información que nos hace reducir la probabilidad de la enfermedad. La integración de todos estos datos en la escala de certeza, es lo que nos hace llegar a una probabilidad final de diagnóstico. En la figura 1.2 vemos una serie de argumentos que representan la evolución del valor de la probabilidad del diagnóstico de SIDA sobre una escala de certeza: cada argumento anamnésico, clínico o paraclínico suplementario actúa sobre el valor de esta probabilidad; sin embargo, un solo argumento (por ejemplo el test serológico rápido para VIH) tiene un valor relativo y, por sí solo, no es suficiente para alcanzar un nivel de certeza absoluto. Figura 1.2: Evolución de la sospecha clínica de SIDA en la escala de certeza.
Cada argumento añadido a la probabilidad anterior contribuye a cambiar la probabilidad final. Con la presencia solo de diarrea la probabilidad de SIDA es baja. Si además de diarrea hay adelgazamiento la probabilidad va a aumentar.Todo paciente parte de una probabilidad de inicio cuando está en la sala de espera.
3
El punto de partida en la sala de espera Todo paciente que está en la sala de espera de nuestro consultorio es sospechoso de padecer algún problema de salud. Cuando vemos a todos los pacientes que están allí sentados identificaremos a algunos que ya conocemos previamente: son aquellos que vienen para un seguimiento o están siendo investigados para conocer mejor la causa del problema. En estos pacientes conocidos ya tenemos una idea de cuál es la probabilidad del problema que les aqueja; sin embargo hay otros a quienes nunca antes hemos visto. Estos pacientes “desconocidos” también son sospechosos de tener alguna enfermedad, aún si no conocemos nada de ellos. Por algo están en la sala de espera. Si somos médicos generales la mayor parte de los pacientes tendrán una infección respiratoria o una infección de vías urinarias, si somos neumólogos la mayor parte tendrán un EPOC. La primera pregunta de anamnesis que haremos tiene que ser añadida a esta probabilidad inicial o sospecha. Si no lo hacemos todo el resto de nuestro razonamiento estará equivocado.
Los umbrales ¿Qué grado de certeza debemos alcanzar para anunciar a un paciente que tiene lepra cuando esta enfermedad es aún considerada como una maldición? ¿Cuándo ordenaremos una pielografía ascendente en un paciente con una hidronefrosis? sabiendo que dicho examen podría provocar una sepsis, o que podría hacerse una perforación del uréter ¿Cuándo tenemos argumentos suficientes para comenzar un tratamiento de una neumonía con una fluoroquinolona de tercera generación, conociendo que el costo de un tratamiento de 10 días podría llegar a ser de más de 100 dólares? ¿Cuándo podemos tranquilizar a un paciente que tiene un test VIH positivo y decirle que no era más que un falso positivo? Toda hipótesis diagnóstica tiene una cierta probabilidad de ser la patología que sufre nuestro paciente: los argumentos investigados van a aumentar esta probabilidad si son positivos, pero no permiten (o muy rara vez) alcanzar una certeza absoluta. Por eso es necesario conocer donde está el “umbral” que tenemos que sobrepasar para iniciar cualquier tipo de acción médica (umbral de acción). Así mismo, si los argumentos son negativos, estos van a disminuir nuestra certeza frente a la hipótesis. Sin embargo es necesario conocer dónde se encuentra el “umbral” que nos permita abandonar dicha hipótesis (umbral de exclusión). Mientras nuestro grado de certeza no haya alcanzado el valor de cualquiera de estos dos umbrales, debemos continuar investigando argumentos suplementarios o utilizar la evolución en el tiempo como un argumento suplementario (Figura 1.3). (5; 6)
4
Introducción
Figura 1.3 Los umbrales.
Los dos umbrales, de acción y de exclusión subdividen la certeza en tres campos: el campo de acción, el campo de investigación y el campo de exclusión.
El umbral de decisión varía en función de la enfermedad que estamos sospechando y del contexto en el cual estamos trabajando. Una enfermedad grave o muy contagiosa nos hará actuar más rápidamente, es decir que tendrá un umbral bajo. Un tratamiento caro o peligroso nos hará esperar un poco antes de actuar, es decir que pondremos el umbral más arriba. Además de estos factores, que son más o menos objetivos, existen otros factores subjetivos como las expectativas del paciente, la situación socio-económica, la carga moral que tenga para el médico la iatrogenia. Esto nos permite comprender, por ejemplo, porqué no es necesario confirmar el diagnóstico de una gripe con exámenes serológicos mientras que es esencial confirmar el de sarcoma de tibia antes de decidir la amputación del miembro inferior. Esto nos permite también comprender porque el valor de un umbral difiere según el contexto en el cual se trabaja: en medicina de catástrofe, la prioridad es salvar el mayor número posible de vidas antes que tratar a todos a cualquier precio. Así mismo, el umbral de acción necesario para decidir hacer una cesárea de emergencia en un hospital rural durante una guardia en la noche será mucho más alto que en un hospital de especialidades.
Los argumentos Confirmar un diagnóstico Las adenopatías pueden ser causadas por un gran número de patologías mientras que una candidiasis bucal en un adulto joven es más específica que el diagnóstico de SIDA. Podemos entonces subdividir los argumentos en función de su fuerza: argumentos débiles, argumentos buenos, argumentos fuertes y argumentos muy fuertes, estos últimos por sí solos nos permitirán subir mucho en la escala de certeza (Fig. 1.4).
5
Figura 1.4 Escala de certeza con la fuerza de los argumentos
El tamaño de cada flecha representa la ganancia en probabilidad que un argumento tiene. Un argumento débil nos hace ganar medio paso, un argumento bueno un paso, un argumento fuerte un paso y medio y un argumento muy fuerte dos pasos.
Si retomamos ahora los argumentos de nuestro paciente tomando en cuenta su fuerza y los representamos en una escala de certeza, obtendríamos un cuadro mucho más preciso como el que se encuentra en la Figura 1.2. Siguiendo este mismo razonamiento, ¿que podríamos decir de la fuerza de argumentos tales como un estado febril o una gota gruesa positiva en el cuadro del paludismo por P. falciparum?, ¿qué fuerza tiene el hallazgo de un niño somnoliento para confirmar una meningitis bacteriana?, ¿cuál es la fuerza del "signo de Romaña" (edema bipalpebral unilateral) en la enfermedad de Chagas?, ¿la palidez conjuntival es un buen argumento para una carencia de hierro? Un buen ejercicio es tratar de responder a estas preguntas con cuadros similares al de la Figura 1.4, donde el argumento estudiado está representado por una flecha cuya longitud es más o menos proporcional a su fuerza. Un hombre de 42 años ingresa por fiebre y dolor abdominal localizado en el hipocondrio derecho, irradiado hacia atrás. Se queja además de hematuria y disuria. Al examen físico la fiebre es de 39°, se observan movimientos continuos en búsqueda de una posición antálgica, los puntos renales son positivos a la palpación y hay evidencia de dolor a la percusión. El examen de orina está normal, la ecografía no muestra hidronefrosis ni cálculos.Se ha iniciado un tratamiento con antiespasmódicos y antibióticos, pero la evolución no es favorable: el paciente continúa con dolor intenso.
Excluir un diagnóstico Varias preguntas pueden ser hechas: ¿El dolor en hipocondrio derecho es un argumento fuerte para una colecistitis? ¿La ausencia de hematíes en el examen de orina sería un fuerte argumento de exclusión de una litiasis renal? 6
Introducción
¿Una ecografía que no muestra hidronefrosis ni cálculos excluiría el diagnóstico de litiasis renal? ¿Cuál es la fuerza de exclusión de la ausencia de ictericia para colecistitis? Aunque los médicos a veces no consideramos la ausencia de un signo o síntoma, el resultado negativo de un examen contribuye notablemente en el razonamiento clínico. Una tarea fundamental en el trabajo de un médico es excluir enfermedades que puedan poner en riesgo la vida del paciente o generar una discapacidad severa. Así como un argumento positivo tiene una cierta fuerza para confirmar, los argumentos negativos tienen también una fuerza para excluir, la cual puede ser representada en la escala de certeza.
Asimetría de un argumento Si la presencia de un argumento tiene un fuerte poder de confirmación, ¿tiene necesariamente su ausencia un fuerte poder de exclusión? Las fuerzas de confirmación y de exclusión de un argumento pueden ser asimétricas. Por ejemplo, si encontramos un cálculo en una ecografía renal el diagnóstico de litiasis es indudable, pero ¿qué pasa si la ecografía renal está normal? ¿Podemos, con este dato, excluir una litiasis?; por otro lado, la presencia de fiebre contribuye un poco a pensar en el diagnóstico de colecistitis, pero ¿qué pasaría si el paciente no tuviera fiebre?, ¿podríamos excluir una colecistitis?
Los determinantes del poder de un argumento ¿Cuáles son los criterios que determinan la fuerza de confirmación o de exclusión de los argumentos? Los argumentos patognomónicos de una enfermedad tienen, cuando son encontrados, una gran fuerza de confirmación del diagnóstico: así, por ejemplo, la micrografía en la enfermedad de Parkinson, una imagen radiológica de balas de cañón en metástasis pulmonares de un adenocarcinoma. La fuerza de exclusión de un diagnóstico será por el contrario máxima para los argumentos indispensables en la definición de caso, cuando estos están ausentes: la ausencia de hiperglicemia en un niño comatoso que antes se encontraba en buen estado de salud excluye el diagnóstico de diabetes, así mismo la ausencia de hipotensión excluye un choque hipovolémico. Entre estas dos clases extremas se encuentran los argumentos que son encontrados con más frecuencia y que tienen variable poder de confirmación y de exclusión de los diagnósticos: la presencia de palidez en una paciente que se queja de fatiga crónica es, por ejemplo, un buen argumento de una carencia de hierro, su ausencia, por el contrario, no tiene prácticamente ninguna fuerza de exclusión de dicho diagnóstico. La fuerza de un argumento depende de la frecuencia con la que encontremos resultados falsos. La fiebre se encuentra presente en un gran número de enfermedades, además de la malaria. Eso quiere decir que hay fiebres falsamente positivas para malaria, lo cual le quita fuerza de confirmación a la fiebre. Así mismo, aproximadamente nueve de cada diez pacientes con tuberculosis meníngea presentan un BAAR falsamente negativo en el LCR, lo cual disminuye notablemente la fuerza de exclusión a este examen. 7
El análisis complejo Las diferentes estrategias diagnósticas Al principio de su obra de epidemiología clínica el profesor Sackett cita cuatro estrategias principales que son utilizadas regularmente por los médicos, en su actividad cotidiana de diagnóstico:(7) La primera consiste en reconocer inmediatamente la patología del paciente cuando hay elementos físicos evidentes que corresponden a cierta descripción clínica; así en ciertas malformaciones congénitas (labio leporino, pie equino, polidactilia, ...), en anomalías cromosómicas (síndrome de Down, Síndrome de Turner, ...) y en diferentes estados patológicos en los cuales uno de los signos o el conjunto de ellos son fácilmente reconocibles (el aliento del insuficiente hepático, el olor de las heces en una hemorragia digestiva, el cuadro clínico del Kwashiorkor, la erupción de la varicela, la hidrofobia de la rabia, los movimientos del Parkinson,...). A esto se le llama el reconocimiento de un patrón. Es evidente que la capacidad del médico que le permite reconocer un diagnóstico de la forma antes mencionada depende mucho de su experiencia: a fuerza de haber encontrado varios pacientes con una misma enfermedad es capaz de reconocer más fácilmente su aspecto. La segunda estrategia se basa en algoritmos, a partir de una información o de un grupo de argumentos se sigue una lista de preguntas en las cuales la respuesta, frecuentemente dicotómica, lleva a una segunda pregunta precisa. Ésta es la estrategia recomendada por los programas dirigidos a enfermeros o promotores de salud en los dispensarios rurales y permite tamizar una mayoría de diagnósticos posibles (diarrea, infección respiratoria aguda, fiebre, ...), quedando gran parte para resolver en ese nivel y otros para referencia a un nivel de mayor complejidad. Las universidades frecuentemente enseñan la tercera estrategia que permite hacer un diagnóstico en base a un inventario completo (anamnesis, examen físico, exámenes paraclínicos). Cuando observamos las fichas de hospitalización en los diferentes hospitales, nos damos cuenta de la diversidad de opiniones frente a este concepto de anamnesis y de examen físico completos; y es así, por ejemplo, que no es raro observar que un servicio hospitalario pida a sus internos que completen la sección de antecedentes personales hasta el punto de citar, de forma extensa, todas las enfermedades de la infancia, incluyendo la reacción del paciente a todos los fármacos que ha recibido hasta aquel día. Es evidente, por una parte, que esta práctica aumenta mucho el trabajo del médico desde el ingreso de su paciente sin que esto le aporte muchos argumentos pertinentes sobre el problema actual de éste; por otra parte se puede esperar que las respuestas del paciente no siempre correspondan a la realidad. Luego de esta observación, podríamos decir que cada estudiante debería ser capaz, al final de su formación, de ejecutar una anamnesis y un examen físico con todos los detalles, pero que debería ser rara la ocasión en la que todos los argumentos tendrían que ser pedidos.
8
Introducción
La cuarta estrategia es la que nos interesa y que tiene sus bases en una investigación orientada (Sackett la llama “hypothetico-deductive strategy”) a uno o varios argumentos (anamnésicos, clínicos o paraclínicos). El médico elabora una lista de hipótesis compatibles con sus primeros argumentos. Enseguida investiga argumentos suplementarios, con un fuerte poder de confirmación o de exclusión, que le permiten así discernir poco a poco la hipótesis que le parece más probable. Aceptará esta hipótesis como el diagnóstico de su paciente a partir del momento en que los argumentos le hayan permitido alcanzar el umbral requerido para actuar. Ejemplo para apreciar las diferentes estrategias: Un hombre de 45 años, chofer de un camión en la costa ecuatoriana, es transferido a un hospital de especialidades con una historia de fiebre, por la cual un médico le ha prescrito quinina hace tres días. Al día siguiente la orina está muy oscura. Al momento del ingreso en urgencias, el clínico constata palidez y una ligera ictericia. El laboratorio confirma una anemia profunda, una bilirrubina indirecta de 3 mg/dl y una gota gruesa ligeramente positiva para P. falciparum. La combinación de la quinina, la gota gruesa débilmente positiva, la orina oscura, la ictericia y la anemia profunda permiten al clínico "reconocer" inmediatamente un "síndrome de fiebre hemoglobinúrica biliosa”. Tomando en cuenta el riesgo asociado a un tratamiento con quinina o sus análogos como la mefloquina o halofantrine, instaura un tratamiento con artemisina. Inmediatamente inicia una búsqueda activa de otras causas de hemólisis. El paciente se queja también de dolor abdominal y en el examen físico hay una ligera sensibilidad del abdomen. Una ecotomografía abdominal muestra esplenomegalia moderada (14 cm) y un poco de líquido en la cavidad peritoneal. Estos datos y el tinte vidrioso del paciente no le agradan para nada al clínico; además su intuición le incita a pedir una hospitalización en cuidados intensivos para una supervisión más cercana. El médico jefe del servicio de cuidados intensivos lo admite, pero no comprende la inquietud del clínico y cuestiona su motivación.
En este momento el clínico ha cambiado su estrategia diagnóstica: cuestiona su hipótesis inicial y trata de combinar todos los argumentos: “Supongamos que la orina negra era solamente orina muy oscura, podría tratarse de un paludismo tratado insuficientemente. Por otra parte, la combinación de paludismo y de líquido en el vientre no concuerda más que con una hipótesis: ruptura espontánea del bazo”
De esta forma cambió su estrategia de "reconocimiento del cuadro clínico" por "investigación orientada". Ordena una transfusión y profundiza la anamnesis, esto lo lleva a obtener información sobre dos síncopes en los días precedentes. El paciente es estabilizado y transferido a sala donde el interno de guardia reconstituye toda la historia clínica, con el clásico método universitario:"inventario completo". La anamnesis sistemática revela un accidente leve en el camión hace un mes, en el cual el paciente se golpeó con la puerta en el hipocondrio izquierdo. Sufrió dolores intensos durante algunas horas. Además el paciente dijo haber tenido picos febriles en los 6 meses precedentes.
Estos nuevos datos permiten dibujar la historia real: crisis regulares de paludismo causaron una ligera esplenomegalia, el accidente provocó una fisura del bazo con 9
hemorragia subcapsular, la última crisis de malaria provocó un aumento del tamaño del bazo que a su vez provocó una verdadera ruptura. Este ejemplo muestra que diferentes estrategias son a menudo utilizadas consecutivamente o al mismo tiempo en un paciente en particular.
El panorama diagnóstico Hasta aquí hemos considerado los argumentos frente a una sola hipótesis diagnóstica y esta reflexión es muy teórica; en la realidad, en una consulta, jugamos con varios argumentos con el fin de alcanzar un umbral de acción para una de las hipótesis compatibles con los síntomas y signos del paciente, habiendo al mismo tiempo alcanzado el nivel máximo de exclusión de otras patologías sospechadas.
Un paciente de 58 años, faenador de carne en el camal, consulta en un centro de salud por presentar fiebre reciente, cefalea, dolor muscular, ictericia y decaimiento. El médico en la consulta lo examina y encuentra una hepatomegalia. Inmediatamente piensa en una hepatitis viral y lo envía a su casa, recomendándole reposo y prescribiendo antitérmicos. Cinco días más tarde los familiares del paciente lo llaman con urgencia porque su estado se ha deteriorado mucho. La ictericia ha aumentado significativamente, se observan púrpuras, equimosis, y escleróticas anaranjadas. Está oligúrico y se está desarrollando un edema pulmonar. El médico decide referirlo de inmediato al hospital en donde se realizan exámenes complementarios encontrando un aumento significativo de la bilirrubina sin cambios en las enzimas hepáticas y una linfocitosis con aumento de polimorfonucleares. Todo esto, incluido su antecedente ocupacional lleva a pensar en una leptospirosis, por lo que se inicia tratamiento con penicilina.
La ictericia tiene un gran panorama de hipótesis diagnósticas entre las cuales se encuentra efectivamente la hepatitis viral, pero también el cáncer de páncreas, la cirrosis, una colecistitis, una colelitiasis, la malaria, la pancreatitis, la fiebre amarilla y por supuesto la leptospirosis. El médico debe, ante este panorama, precisar la hipótesis correcta en función de los diferentes argumentos que pueden estar presentes o ausentes en el cuadro clínico (fiebre, dolor muscular, cefalea, hepatomegalia, aumento de la bilirrubina...) hasta alcanzar el umbral de confirmación de este diagnóstico y el umbral de exclusión de otras patologías que también podrían tener repercusiones graves en la salud del paciente. El error en este caso consistió en quedarse con el diagnóstico más frecuente en la zona de procedencia del paciente, el cual puede efectivamente explicar la ictericia, la fiebre, la cefalea, la hepatomegalia y el decaimiento; pero esto significó no tomar en cuenta otras enfermedades que podrían ser graves y que además son tratables, como es el caso de la leptospirosis. En este paciente, el hecho de no haber considerado la posibilidad de que la sintomatología pueda corresponder a una leptospirosis pudo significar un retraso del tratamiento con graves consecuencias para la vida del paciente. Escoger entre una multitud de hipótesis a menudo no es claro y no existen directivas universales que ofrecer.
10
Introducción
Las apariencias engañan. Por un lado, no es conveniente dejarse seducir por una hipótesis plausible con todos los argumentos que se tienen hasta el momento, pero por otra parte, nuestro rol como médicos es el de ponderar nuestros esfuerzos en la investigación de un diagnóstico grave, pero que no es tratable. Figura 1.5 El panorama diagnóstico.
En el primer círculo se encuentran las enfermedades graves y/o tratables, en el segundo las menos graves o sin tratamiento específico, que pueden esperar hasta que se hayan excluido todas las del primer círculo.
Conclusión Luego de esta introducción queda claro que: • No es necesario alcanzar una certeza absoluta sea cual fuere el diagnóstico que tengamos para emprender una acción: cada enfermedad tiene su propio grado de certeza requerido, dependiendo de una multitud de factores. Podríamos decir que en medicina la meta no es dar un diagnóstico, sino ayudar al paciente, resolver su problema, sirviéndose de una sospecha de causa, de un diagnóstico. • Tampoco es necesario llegar siempre a una probabilidad cero en un determinado paciente para excluir una hipótesis. • Salvo en casos excepcionales un solo argumento no es suficiente para hacer un diagnóstico, o para alcanzar un grado de certeza suficiente para actuar. • Cada argumento tiene un poder de confirmación y de exclusión para una patología determinada. • Estos poderes (de confirmación y de exclusión) no son necesariamente simétricos, en la mayoría de casos son asimétricos. • La sospecha clínica (“el punto de partida”) es tan importante como la fuerza de los argumentos recogidos para determinar el grado de certeza obtenido. • El camino a seguir entre una serie de hipótesis en un paciente en particular puede ser difícil y no sigue reglas fijas, sin embargo un esquema panorámico que permita priorizar lo grave y tratable, valorando la fuerza de los argumentos a pedir, podría hacer más eficiente el razonamiento clínico. 11
En el transcurso de los diferentes capítulos que seguirán intentaremos desarrollar estas nociones para terminar en una tentativa de modelo de análisis complejo: el "panorama".
Los 5 grandes principios de la lógica clínica: 1.
2.
Si una enfermedad es poco frecuente en una región, necesitamos más o mejores argumentos, o argumentos que en una región donde es frecuente. La fuerza de un argumento jamás es infinitamente grande. La mayoría de los argumentos son asimétricos Cada enfermedad tiene un umbral de acción y de exclusión. Un diagnóstico diferencial sigue prioridades bien definidas.
Este texto tiene sobretodo la 3. ambición de sensibilizar al lector respecto a las bases del análisis de 4. decisiones. Los ejercicios propuestos no son más que una ilus5. tración y no reemplazan de ninguna forma una enseñanza interactiva entre un profesor y varios grupos pequeños conformados por 4 a 5 participantes: en una enseñanza de este tipo algunos argumentos son propuestos a los diferentes grupos, los cuales tratan en conjunto de describir el panorama de hipótesis con estos argumentos y de identificar los argumentos suplementarios que tienen un fuerte poder de confirmación y de exclusión, permitiendo así llegar al diagnóstico más probable (o más útil). El trabajo de grupo permite a cada participante confrontar su razonamiento al de sus colegas y percibir la pertinencia o los errores. Una enseñanza completa tendrá una fase de comprensión del análisis de decisiones (el objetivo de estudio de esta obra). Luego vendrá una fase de aprendizaje durante la cual cada participante, con la ayuda de un cierto número de ejercicios, se familiarizará con la metodología. Esto le permitirá llegar a una fase de dominio en la que será capaz de utilizarla sin esfuerzo en su práctica diaria.
Referencias (1)
(2) (3) (4) (5) (6) (7)
Carvalho de Queiroz Mello F, Do Valle Bastos LG, Machado Soares SL, Rezende VMC, Barreto Conde M, Chaisson RE, Kritski AL, Ruffino Netto A, Loureira Werneck G. Predicting smear negative pumonary tuberculosis with classification trees and logistic regression: a cross sectional study. BMC Public Health 2006; 6:43-50. Siddiqi K, Lambert ML, Walley J. Clinical diagnosis of smear-negative pulmonary tuberculosis in low-income countries: the current evidence. Lancet Infect Dis 2003 May;3(5):288-96. Kanaya AM, Glidden DV, Chambers HF. Identifying pulmonary tuberculosis in patients with negative sputum smear results. Chest 2001 Aug;120(2):349-55. Hall KH. Reviewing intuitive decision-making and uncertainty: the implications for medical education. Med Educ 2002 Mar;36(3):216-24. Pauker SG, Kassirer JP. Therapeutic decision making: a cost-benefit analysis. N Engl J Med 1975 Jul 31;293(5):229-34. Pauker SG, Kassirer JP. The threshold approach to clinical decision making. N Engl J Med 1980 May 15;302(20):1109-17. Sackett D, Haynes R, Guyatt GH, Tugwell P. Clinical Epidemiology: a basic science for clinical medicine. 2 ed. Boston: Little, Brown and Company; 1991.
12
2 LOS UMBRALES Introducción En los libros de medicina se pueden encontrar los diagnósticos diferenciales de los diversos cuadros clínicos, los exámenes complementarios para confirmar las hipótesis y los tratamientos de cada una de las patologías sospechadas. Sin embargo, la verdadera dificultad en el trabajo del médico no es la adquisición de este conocimiento libresco, sino confirmar o excluir una hipótesis, comunicar el diagnóstico de una patología grave, justificar la prescripción de un tratamiento caro o peligroso, ordenar exámenes suplementarios potencialmente peligrosos, ordenar medidas de profilaxis general cuando se corre el riesgo de que una epidemia se extienda. El principal problema, entonces, es el de determinar el nivel de certeza a partir del cual se justifica iniciar cualquier acción médica o detener la investigación de una causa. Este nivel de certeza constituye un umbral. Si luego de haber hecho la investigación de una sospecha clínica, usando los medios diagnósticos disponibles, sobrepasamos este umbral, podemos iniciar una acción médica. Si el umbral no ha sido sobrepasado se hace necesario pensar si la enfermedad que sospechamos no ha sido excluida, es decir si hemos ido más allá del umbral de exclusión. En varios artículos y libros se pueden encontrar procedimientos matemáticos muy complejos que permiten calcular el valor de estos umbrales;(1-3) sin embargo nuestra meta en este texto no es la de repetir esos fundamentos teóricos, si no más bien de poder sensibilizar a nuestros lectores en la noción de los umbrales en el contexto de la toma de decisiones médicas y en los factores que influyen en sus valores, con el objetivo de que estos puedan ser estimados de una forma intuitiva pero al mismo tiempo racional.
Umbral de decisión La probabilidad que tiene un paciente de estar afectado por una enfermedad en particular puede variar entre 0% y 100%. Dentro de este rango ¿A partir de que grado de certeza podemos o debemos iniciar una acción contra esta enfermedad? Empecemos con un ejemplo: Una niña de 4 años fue llevada por su madre a la consulta de un centro de salud de la capital. La niña empezó 12 horas antes con un estado febril y taquipnea. Durante el examen físico el médico encontró crepitantes en la auscultación. El resto del examen físico fue normal.
Ante este cuadro el médico decidió comunicar el diagnóstico de neumonía a la madre y prescribió un tratamiento con amoxicilina - acido clavulánico, recomendándole que regrese en caso de no haber mejoría. No consideró indispensable pedir una radiografía de tórax, menos aún un cultivo de secreciones. Con los pocos argumentos de su anamnesis y del examen clínico, llegó a un nivel de certeza suficiente para poder actuar (comunicar el diagnóstico y prescribir el tratamiento), sin haber necesitado ir más lejos en su investigación diagnóstica.
13
Figura 2.1 Umbral de decisión
El umbral de decisión puede encontrarse en cualquier lugar dentro del rango de cero a 100 %. Mientras más alto está, más seguros debemos estar antes de actuar.
Si traducimos esta conducta al lenguaje de toma de decisiones clínicas podríamos decir que el médico alcanzó el umbral necesario para actuar. Por eso comunicó el diagnóstico de neumonía a la madre y prescribió al mismo tiempo el tratamiento necesario. Considerando que no llegó a una certeza absoluta de que en realidad se trataba de una neumonía podríamos decir que, al no haber pedido más exámenes, corrió el riesgo de iniciar un tratamiento con antibiótico para alguien que no tenía la enfermedad. Si, por el contrario, hubiera preferido esperar hasta tener un cultivo de secreciones, hubiera corrido el riesgo de dejar sin tratamiento a alguien que lo necesitaba. ¡De eso precisamente se trata el umbral de decisión! Es un “juego de equilibrio” entre el riesgo de tratar y no tratar. Implica poner en una balanza los pros y los contras, los beneficios y los riesgos, incluyendo los costos de la decisión. Mientras más arriba situemos al umbral (acercándose a 100%), más riesgo corremos de considerar equivocadamente a un buen número de pacientes como personas sanas mientras que en verdad sufren de una patología (falsos negativos) y, por consecuencia, los dejamos sin el tratamiento que necesitan. Esta situación es particularmente nefasta cuando la enfermedad es grave (causa mortalidad o invalidez, por ejemplo, la meningitis bacteriana), cuando es vulnerable por una acción terapéutica (por ejemplo, un antibiótico) o cuando se corre el riesgo de tener graves consecuencias sobre el medio (por ejemplo, una enfermedad epidémica) (Figura 2.1). En cambio, si situamos el umbral muy abajo (cerca de 0%), más riesgo tenemos de considerar erróneamente a un buen número de personas sanas como enfermas afectadas por cierta patología (falsos positivos), tratándolas innecesariamente. Esto es particularmente peligroso en casos en los cuales el tratamiento lleva consigo un riesgo potencial para la salud como, por ejemplo, cuando pensamos iniciar una terapia con suero antiofídico para la mordedura de una serpiente que no ha sido identificada, dado el riesgo que se corre de tener una reacción anafiláctica o, como cuando se piensa hacer una cirugía que pueda acarrear hemorragias, infecciones o lesiones de órganos. Esto también se aplica cuando el tratamiento es caro o largo (por ejemplo, hipertensión 14
Los umbrales
arterial esencial, diabetes) o cuando la enfermedad puede acarrear un rechazo al paciente por la sociedad (por ejemplo, el SIDA o la lepra).
Factores que afectan el umbral de decisión Varios factores afectan o influyen en el valor de certeza necesario para la decisión. Aquí trataremos de mostrar los principales y de examinar su influencia. Figura 2.2 Factores que influyen en el umbral
Los factores objetivos: la enfermedad y el tratamiento En la figura 2.2 se encuentran representados los factores clave que influyen en el umbral de decisión. De hecho, este umbral podría ser definido como el punto de equilibrio entre los efectos nefastos de una enfermedad no tratada (falsos negativos), por un lado, y los efectos secundarios del tratamiento en las personas que no tienen la enfermedad en cuestión (falsos positivos). La mayor parte de los demás factores actúan sobre el umbral de decisión por la influencia que ejercen sobre estos dos factores clave.
La enfermedad •
La gravedad de la enfermedad: Es importante, por ejemplo, tratar los estados de preeclampsia, puesto que su evolución puede ser fatal para la paciente y el feto: en caso de una enfermedad grave y tratable, el umbral de decisión a partir del cual se decide iniciar un tratamiento será bajo con el fin de tener muy pocos “falsos negativos”, es decir enfermos sin tratar. La gravedad hay que entenderla como lo que podría pasar si dejamos a un enfermo sin su tratamiento.
•
Las consecuencias sobre el ambiente: Será necesario emprender precozmente medidas profilácticas contra toda enfermedad epidémica grave (cólera, peste, fiebre amarilla,...) para evitar la propagación desastrosa a toda la población circundante1. Su umbral será bajo (una probabilidad baja puede ser suficiente para emprender una acción en contra). No solo las enfermedades epidémicas tienen repercusiones en el medio.También las
1
Si con el tiempo estas medidas son inútiles, al estar el diagnóstico de una de estas enfermedades excluido, se podrá detener las medidas que, por otro lado, no habrán hecho correr un riesgo particular al paciente.
15
enfermedades que influyen sobre la capacidad de respuesta de las personas ante ciertas situaciones tienen un efecto negativo en el medio, por ejemplo un chofer del trole que tiene crisis epilépticas. ¡Imaginen las consecuencias desastrosas que pueden ocurrir!
El tratamiento •
La eficacia Es obvio que si una enfermedad es tratable bajará el umbral de decisión. Por el contrario, muchas enfermedades no son tratables, o la logística de un tratamiento es muy complicada en algunos contextos (SIDA, enfermedades tumorales, infecciones multirresistentes, insuficiencia renal crónica, enfermedades muy graves que necesitan una estructura de cuidados intensivos, hipertensión arterial esencial). Esto explica la razón por la cual para algunas enfermedades el umbral de decisión es más elevado en un país con escasos recursos que en un país rico. Sin embargo, esto no justifica el hecho de que en un país pobre no se busque la forma de solucionar un problema de este tipo, si realmente es diagnosticado, es decir si se ha alcanzado una certeza suficiente: ¡el dejar de hacerlo sería una falta de responsabilidad profesional!
•
La toxicidad del tratamiento: Antes de decidir el inicio del tratamiento con Amfotericina B en un paciente con una sospecha de micosis profunda, será necesario alcanzar un umbral más alto. Por el contrario, ante una sospecha de tuberculosis, que también puede evolucionar hacia la gravedad, los efectos adversos serios del tratamiento son muy raros, por lo tanto la certeza requerida para iniciar el tratamiento no debe ser alta.
•
El costo del tratamiento: ¿Cómo ver el efecto de este factor? Supongamos que como director de un hospital de distrito un día le ofrecen la posibilidad de comprar unos antibióticos muy baratos. Esto cambiará su umbral de decisión para tratar la fiebre tifoidea. Si los antibióticos que antes tenía eran costosos, era conveniente estar bastante seguro antes de iniciar un tratamiento. La certeza exigida era alta con el fin de reservar el tratamiento solo para los casos más seguros. Una vez que el costo de los antibióticos baja ya no habrá problemas de abastecimiento, entonces la certeza necesaria para iniciar el tratamiento desciende, es decir escoge un umbral más bajo. Otro ejemplo, si bien una osteosíntesis es el tratamiento de elección para los casos de fractura de fémur, en la mayor parte de hospitales con pocos recursos se preferirá a menudo (y lastimosamente) una tracción. De todas maneras, el costo de un tratamiento no tendría que tener una gran influencia sobre el umbral, pues éste debería estar relacionado al “costo de una vida”. Evidentemente todos pensamos que una vida es invalorable, pero también sabemos que existe un límite de gastos más allá del cuál casi ninguna familia o sistema de seguridad social puede llegar. Por eso se hace necesario definir cuál es el “costo de una vida” en un determinado contexto. En los EEUU han llegado al con16
Los umbrales
senso de que a toda persona se le debería garantizar una diálisis, en caso de necesitarla. En este caso podríamos inferir que el costo de una vida en ese país es el equivalente al costo de una diálisis, es decir alrededor de 50 mil dólares.(4) En países con extrema escasez de recursos, como algunos del África subsahariana, casi ninguna familia promedio puede permitirse gastar más de 20 dólares para salvar la vida de un niño y el Estado tiene pocas alternativas de sostén. Una alternativa en ese caso podría ser la de preguntar a un grupo promedio de médicos cuál sería la cantidad máxima de dinero que cada uno de ellos estaría dispuesto a pagar para salvar su propia vida. Un estudio realizado en Ruanda reveló que el costo promedio de una vida, estimado de esta manera, fue de 5 mil dólares, mientras que el costo total de un tratamiento estándar de 6 meses para tuberculosis fue de apenas 13 dólares.(5)
Otros factores Existen factores que dependen del contexto en el cual se trabaja y de quién y para quién se toma la decisión. Ciertamente son estos factores y su influencia sobre el umbral los que crean la gran diferencia en la práctica de la medicina entre los países con pocos recursos y los países ricos.
El contexto social y económico: En los países en desarrollo no existe una buena estructura de sostén para las personas más desfavorecidas. Las personas tienen que hacerse cargo de pagar sus gastos en salud, a veces a costa del presupuesto que tendría que estar destinado a sostener los gastos corrientes de la familia. Es casi seguro que una persona pobre con un diagnóstico de diabetes, de hipertensión o de cualquier otra enfermedad crónica va a terminar abandonando el tratamiento que debería ser tomado por el resto de la vida, por no poder pagarlo. El médico que toma una decisión en estos contextos debe esforzarse por considerar estos factores tratando, en la medida de lo posible, en no alterar el equilibrio familiar o social, garantizando las medidas más eficientes posibles.
Las repercusiones psicológicas y sociales de la enfermedad: El ser humano pertenece a un grupo social en general bien definido que se diferencia de los otros grupos por una cultura propia; esto le lleva a tener una noción relativa del hombre “ideal”. Si por ejemplo, en una cierta enfermedad, la imagen del hombre se aparta demasiado de la “ideal”, su sociedad puede rechazarlo ya sea físicamente (por ejemplo aislando a los psicóticos, los huérfanos, los ancianos,...) o socialmente (negándoles el acceso a un empleo, o no acercándoseles, por SIDA, esterilidad, lepra, enfermedades psiquiátricas) provocando graves repercusiones psicológicas. El umbral de decisión necesario para comunicar un diagnóstico de este tipo de enfermedades a un paciente deberá ser muy alto con el fin de evitar etiquetar con un diagnóstico equivocado a una persona que no tiene la enfermedad en cuestión.
La expectativa del paciente: La forma como los pacientes ven sus problemas de salud puede cambiar mucho de un contexto a otro. Una persona joven da mucho valor a los años que le que17
dan por vivir mientras que una persona anciana aprecia más la calidad de vida antes que la cantidad de años. Del mismo modo una mujer nulípara que consulta por un problema de esterilidad estará dispuesta a consagrar mucho más esfuerzos en la búsqueda de una etiología para la cual exista un tratamiento satisfactorio, mientras que una madre de varios hijos que presenta una esterilidad secundaria no dará mayor importancia al problema. Idealmente toda decisión clínica debería tomarse en función de las expectativas del paciente. De hecho las decisiones deberían ser compartidas, sin embargo, en los casos en que esto no se pueda o cuando el paciente prefiera dejar todo en las manos del médico, es importante que siempre se considere el mayor beneficio, o el menor daño, para el paciente y su familia.
El contexto político: En algunos casos de situaciones extremas, por ejemplo en situaciones de catástrofe (erupciones volcánicas, terremotos, desplazamiento masivo de poblaciones, campos de refugiados, epidemias,...) el objetivo principal del personal médico será más bien de salvar el mayor número posible de personas, antes que de salvar a todo paciente a cualquier precio. Por ejemplo, el umbral de toda cirugía electiva será muy elevado.
El temor a cometer errores El sesgo de omisión (resistencia al riesgo) Muchas decisiones clínicas están influenciadas por el “miedo” a cometer errores que los médicos pueden tener. En efecto, ningún médico está libre de cometer errores, aun cuando las decisiones hayan sido tomadas de la forma más racional posible. Sin embargo cuando las consecuencias de nuestras decisiones han sido desfavorables nos sentimos culpables. Este temor de cometer un error puede hacer que se tomen decisiones irracionales, sobretodo cuando las consecuencias desfavorables podrían ser debidas a la acción médica. El efecto obtenido es que, a veces, preferimos dejar de actuar porque sobreestimamos el daño que podemos hacer. Esto se puede ilustrar con un ejemplo. La encargada del control de una epidemia de peste en Ecuador tenía que recomendar un tratamiento profiláctico para algunos niños menores de 1 año que estuvieron en contacto cercano con un enfermo. La literatura sugiere que para los niños menores de 8 años se use cotrimoxazol y que, tanto las tetraciclinas como el cloramfenicol, se reserven para los niños mayores de 8 años.(6) En ese momento solo disponía de cloramfenicol pero le preocupaba el riesgo de que los niños mueran a causa de una depresión medular provocada por el tratamiento. Por otro lado las comunidades estaban muy alejadas de la ciudad y disponer de dosis suficientes de cotrimoxazol iba a tomar algunos días. Finalmente decidió no recomendar el cloramfenicol a pesar de los riesgos.
¿Fue una decisión correcta? Es cierto que un niño que toma cloramfenicol puede desarrollar una depresión medular, pero este importante efecto adverso solo se presenta en uno de cada 100 mil tratamientos.(7;8) Además no todos los niños con depresión medular llegan a morir, siendo la probabilidad de muerte a causa del tratamiento 18
Los umbrales
mucho más baja. Por otro lado El riesgo que estos niños tenían de adquirir la enfermedad era bastante alto: la peste es una enfermedad muy transmisible. ¡En caso de enfermar la probabilidad de morir, en caso de peste pulmonar, es de al menos 50%! La probabilidad de causar daño por el tratamiento es extremadamente baja comparada con los riesgos de la enfermedad y en esta ocasión las personas que tomaron la decisión omitieron el tratamiento por el temor a causar daño. Debe considerarse que, para este ejemplo, se ha considerado un tratamiento profiláctico en lugar de un tratamiento curativo. En efecto, las decisiones no solo toman en cuenta la probabilidad de estar enfermo si no también la probabilidad de contraer una enfermedad en el futuro. Este fenómeno es conocido en el lenguaje de las decisiones clínicas como el sesgo de omisión: se prefiere omitir un tratamiento o una acción terapéutica por el temor a causar daño, lo cual es particularmente nefasto cuando los riesgos de la enfermedad son mayores.(9) Todo médico que hace una decisión debe tomar en cuenta que no solamente se puede hacer daño al actuar. En ocasiones también se hace daño al dejar de actuar y el nivel de responsabilidad no deja de ser menor en este último caso.
El efecto de “la persona importante” A ningún médico le gustaría estar en los zapatos del cirujano encargado del tratamiento del Presidente de los EEUU, ¡a menos que esté dominado por el deseo de fama y honor! Suponga que usted es el cirujano y el Presidente presenta vómito, febrícula y un dolor en fosa ilíaca derecha. En el examen físico usted encuentra sensibilidad pero no resistencia. El recuento leucocitario es de 11000/μl, y en la ecosonografía no se alcanza a ver el apéndice. Con esto datos ¿Estaría usted dispuesto a operar? Pocos cirujanos se arriesgarían a retirar un apéndice sano en el Presidente de los EEUU; seguramente esta conducta sería diferente en el caso de un ciudadano común. Este fenómeno no solo ocurre con el Presidente de los EEUU o con cualquier otro líder político. Aunque esto va contra el principio de igualdad de las personas, el umbral de decisión toma en cuenta las características sociales de los pacientes. Si nos trasladamos a una escala más familiar todos estamos de acuerdo en que haremos todo lo que está a nuestro alcance para salvar la vida de un niño mientras que aceptaremos más fácilmente la muerte de un anciano.
Tratar o seguir investigando Los argumentos, es decir las pruebas diagnósticas en el sentido más amplio (argumentos clínicos y paraclínicos), ¿tienen una influencia sobre el umbral? En principio, no. Los argumentos los utilizamos más bien para avanzar en nuestro grado de certeza (y entonces alcanzar el umbral de decisión), si son positivos, o para retroceder (y alejarnos del umbral) si están ausentes o son negativos. Mientras no impliquen un costo muy alto, ni un gran riesgo para el paciente, utilizaremos todos los argumentos disponibles para confirmar o rechazar una hipótesis diagnóstica. Pero supongamos ahora que al terminar nuestro recorrido diagnóstico solo nos queda un examen muy caro o difícilmente disponible o muy agresivo o peligroso, por ejemplo una resonancia magnética, o una punción lumbar en malas condiciones de esterilidad, y por tanto con riesgo de 19
infección provocada. Es en ese momento que nuestro trabajo se complica un poco. La elección ya no es solo de “tratar o no tratar”: aquí debemos decidir si hacemos el examen o no, antes de tomar la decisión final. En este caso el examen tiene el efecto de escindir nuestro umbral de decisión único (tratar o no hacer nada) en dos nuevos umbrales: el umbral de acción y el umbral de exclusión (Figura 2.3).(2) Figura 2.3: Los dos umbrales
El umbral de acción divide el campo de decisión en dos opciones: hacer el examen (y tratar al paciente en caso de que sea positivo, o no tratarlo si es negativo); o tratar al paciente sin hacer el examen. El umbral de exclusión, en cambio, divide el campo de decisión en la opción de hacer el examen (y tratar en caso de que sea positivo, o no tratar si es negativo); o dejar al paciente sin el tratamiento de la enfermedad que sospechamos sin necesidad de hacer ningún examen (pero más bien buscar otros posibles diagnósticos).
Campos diagnósticos Los dos umbrales de exclusión y de acción subdividen la escala de probabilidades en tres campos (figura 2.4): El campo de exclusión, correspondiendo a las probabilidades cuyo valor es inferior al umbral de exclusión. Si nos encontramos en este nivel de probabilidades explicaremos al paciente que no tiene la enfermedad que sospechábamos. El campo de acción, correspondiendo a las probabilidades cuyo valor es superior al umbral de acción. Cuando la probabilidad diagnóstica está situada en este campo, debe iniciarse una acción (tratamiento, comunicación del diagnóstico y de su pronóstico) sin necesidad de hacer el examen ya que, cualquiera que sea el resultado, la opción terapéutica no va a cambiar. El campo del examen, o de la investigación, que está situado entre los umbrales de acción y de exclusión. Cuando la probabilidad está situada en este campo, será necesario hacer el examen para decidir: en función de su resultado se tomará la decisión (tratar si es positivo, excluir y no tratar si es negativo). 20
Los umbrales
Figure 2.4: Campos decisionales
El siguiente caso clínico nos permitirá ilustrar este concepto. Un niño de tres años procedente de un pequeño pueblo rural en Colombia es traído por su madre a un centro de salud con tos, fiebre, y disnea inespecífica. La madre cuenta que los síntomas aparecieron en las últimas seis horas. La auscultación pulmonar revela crepitantes bilaterales. No hay dolor torácico. El médico sospecha una neumonía lobar y piensa que podría ser útil hacer una radiografía. Sin embargo decide finalmente tratar al niño con antibióticos de amplio espectro sin hacer la radiografía.
Primero que nada necesitamos imaginar dónde se encuentra el umbral de decisión para iniciar un tratamiento antibiótico ante una sospecha de neumonía en un niño. La mortalidad y morbilidad de una neumonía no tratada son altas. Por otro lado, el riesgo de tener efectos adversos severos por el tratamiento es bajo y el costo por lo general es asequible. No hay estigma ni ningún otro factor subjetivo. Por eso el umbral de decisión debe de ser bajo (podríamos decir que no es mayor a 5%). En segundo lugar necesitamos estimar cuál es la probabilidad de neumonía lobar en este caso. Para esto, necesitamos estimar un punto de partida de nuestra sospecha, es decir la prevalencia de la enfermedad en cualquier centro de salud rural de Sud América. Digamos que uno de cada 100 niños que llegan a un centro de salud tiene neumonía, entonces el punto de partida está en 1%. Como parece razonable decir que la combinación de fiebre, tos y disnea es un buen predictor de neumonía lobar en un niño, podemos estar confiados en decir que el umbral de decisión de 5% ha sido sobrepasado. Incluso podemos presumir que hemos alcanzado una probabilidad cercana al 50%. Si a esto aumentamos los crepitantes en la auscultación llegamos a una probabilidad cercana a 90%. Ahora, para lograr resolver la incertidumbre de hacer o no la radiografía de tórax en busca de consolidaciones necesitamos conocer cuál es el poder de este examen. Como ya hemos sobrepasado el umbral de decisión, debemos hacer este examen solo si este puede disminuir la probabilidad por debajo de 5%. Aparte de esto, el costo del examen también tiene que ser tomado en cuenta.
21
La amplitud del campo de investigación depende ante todo de las características del examen en cuestión, las que se analizarán en los siguientes capítulos; ¿qué información adicional me traerá este examen?, ¿es de buena calidad?, ¿es costoso?, ¿está disponible?, ¿es agresivo?, ¿es peligroso? Si representamos la influencia de los diferentes factores (utilidad del tratamiento, riesgo ligado al tratamiento, riesgo ligado a los exámenes complementarios) sobre el valor de los umbrales de acción y de exclusión, obtendríamos el esquema representado en la Figura 2.5: Figure 2.5: Factores que influyen sobre los dos umbrales
Aquí se puede observar que los factores relacionados con la enfermedad y el tratamiento desplazan a los dos umbrales de forma paralela: un tratamiento peligroso hace subir el umbral de acción y bajar el umbral de exclusión. Por el contrario, los factores ligados al examen tienen un efecto simétricamente opuesto, es decir bajan el umbral de acción cuando suben el umbral de exclusión y viceversa: intuitivamente podemos imaginar que, mientras mejor sea la calidad del examen, su disponibilidad relativamente buena, su riesgo para el paciente no muy alto, más grande será el campo de investigación. Al contrario, si el examen es de mala calidad, y/o su disponibilidad no muy buena, o su costo muy elevado, o si es peligroso para el paciente, el campo de investigación será restringido y los dos umbrales se aproximarán. La calidad de un examen se evalúa por su poder de confirmación y su poder de exclusión, los mismos que serán tratados a profundidad en los siguientes capítulos. Para que la realización de un examen sea pertinente, este nos debería permitir cambiar una decisión: un resultado negativo tendría que ser capaz de disminuir la probabilidad de la enfermedad por debajo del umbral de decisión, y un resultado positivo tendría que aumentar la probabilidad por encima del umbral de decisión. Por eso la amplitud entre el umbral de decisión y el umbral de acción está definida por el poder de exclusión, mientras que la amplitud entre el umbral de decisión y el umbral de exclusión está definida por el poder de confirmación. 22
Los umbrales
Ocasionalmente el poder de un examen se evalúa mediante su “odds ratio”. En efecto este último no es otra cosa que el poder discriminativo total del examen, compuesto por la suma del poder de confirmación y el poder exclusión. Por eso la amplitud total del campo de investigación está definida por el “odds ratio” del examen (Figura 2.6). Sin embargo no debemos olvidar que el costo del examen y su riesgo siempre reducirán la amplitud de este campo. Figure 2.6: Efecto de la calidad del examen en el campo de investigación
El eje “y” es una escala logarítmica que representa la probabilidad de enfermedad. En este caso hipotético el umbral de decisión (en rosado) está situado en una probabilidad de alrededor de 5%. Cuando se necesita un nuevo examen el umbral de decisión se escinde en dos nuevos umbrales: el umbral de acción (azul) y el umbral de exclusión (amarillo). El campo entre el umbral de acción y el umbral de exclusión es el campo de investigación. El campo máximo entre el umbral de acción y el umbral de decisión está definido por el impacto de un resultado negativo (poder de exclusión), mientras que el campo entre el umbral de exclusión y el umbral de decisión está definido por el impacto de un resultado positivo (poder de confirmación). La amplitud del campo de investigación está definida por el odds ratio.
¿Cómo estimar el umbral de decisión en el “lecho del enfermo”? Hemos visto que el umbral de decisión se expresa en grado de certeza, es decir en probabilidades. El umbral de decisión no es más que el grado de certeza mínimo que necesitamos antes de iniciar una intervención terapéutica o de comunicar un diagnostico a un paciente.(1) Si decimos que nuestro umbral de decisión está situado en 20% quiere decir que nos exigimos estar en 20% seguros de que el paciente tiene la enfermedad antes de actuar, pero por otro lado también quiere decir que aceptamos equivocarnos en 20% de pacientes. Es muy importante darse cuenta que hemos subrayado la palabra “aceptamos”. En efecto, tener un umbral del 80% no quiere decir que vamos a equivocarnos en 20%, solo quiere decir que aceptamos tener esa proporción de falsos positivos. Esto lo explicaremos en detalle más adelante. Tomando en cuenta lo anterior, para estimar el umbral de decisión podríamos hacernos la siguiente pregunta: “¿si tuviera diez (o cien) pacientes con características parecidas al actual; a cuantos yo aceptaría tratar, a pesar de que no tienen la enfermedad, 23
para no dejar sin tratamiento a una persona (que no sabemos quien es) que está verdaderamente enferma?” Si la respuesta es 9 contra 1 el umbral de decisión está en 10%. Si la respuesta es 4 contra 1 el umbral de decisión está en 20% (4+1=5, entonces 1 es el 20% de 5). Esta pregunta nos da una buena aproximación a la definición de Pauker y Kassirer que dice que el umbral de decisión para una enfermedad, en determinado contexto, es el punto de equilibrio en el cual los riesgos y beneficios del tratamiento se igualan a los riesgos y beneficios de dejar de tratar, de manera que ninguna de las dos opciones sea preferida.(1) Tomemos el siguiente ejemplo: Un militar de 22 años, se presenta en el servicio de urgencias del hospital con una temperatura axilar de 40°C, una rigidez de nuca ligera y una erupción purpúrica leve en las muñecas y los codos.
El cuadro hace sospechar en una meningitis meningocócica. Se trata de una enfermedad con una evolución muy rápida, que si no se trata puede llevar en pocas horas a la muerte o dejar secuelas muy serias. Además hay que considerar que es una enfermedad altamente transmisible. El tratamiento con penicilina parenteral es muy eficaz, muy barato y el riesgo de efectos adversos es muy bajo. Por consecuencia, todos estarán de acuerdo en que, si estamos frente a diez personas con sospecha de meningitis meningocócica, pero no sabemos cual de ellos tiene en verdad la enfermedad, está justificado tratar inútilmente hasta nueve que en realidad no la tienen, con tal de no dejar a un verdadero enfermo sin tratamiento. En otras palabras, estamos situando nuestro umbral de decisión en 10%. Esto significa que, ante un paciente con estas características, aceptamos estar 10% seguros de que tiene meningitis meningocócica para iniciar el tratamiento. En el ejemplo presentado seguramente este nivel de probabilidad ya ha sido alcanzado. Tomemos un ejemplo en el otro extremo: Una mujer de 54 años se presenta en un centro de salud con un nódulo palpable en el seno izquierdo y retracción de la piel; últimamente, dice haber perdido peso.
El caso hace pensar de inmediato en un cáncer mamario. El tratamiento sería una mastectomía, aunque de eficacia dudosa porque la enfermedad en la paciente parece estar en estado avanzado. Por otro lado, este tratamiento tiene serias repercusiones psicológicas. Seguramente ningún médico que se encuentre frente a diez mujeres que presentan un nódulo mamario, va a proponer hacer una mastectomía sin antes haber hecho una biopsia para estar completamente seguro del diagnóstico. Además hay que tomar en cuenta que debemos comunicar el diagnóstico, explicando de una forma clara cuál es el pronóstico. ¡No aceptamos equivocarnos con nadie! El umbral de decisión está muy cercano al 100%.
Certeza requerida vs. Certeza alcanzada Como dijimos antes, cuando estimamos un valor muy bajo para el umbral existe un 24
Los umbrales
malentendido: Muchos médicos piensan que un número demasiado importante de pacientes que no tienen la enfermedad van a ser tratados en vano. Tomemos como ejemplo a la apendicitis. Cuando no es tratada las complicaciones son graves. El tratamiento estándar es la laparotomía abdominal, el cual es un procedimiento eficaz pero - como toda cirugía - no está exenta de riesgos y - por toda la logística necesaria - tiene un costo relativamente alto. Por todo esto la mayoría de los cirujanos aceptan un umbral de decisión de alrededor de 30%, lo que quiere decir que si en un determinado paciente ya se alcanza un 30% de certeza está justificado hacer la cirugía. Sin embargo algunos cirujanos piensan que tener un umbral de decisión de 30% significa que 70% de los casos son operados inútilmente. ¡Esto es completamente falso! Un umbral de decisión de 30% significa que aceptamos equivocarnos en el 70% y no que vamos a equivocarnos en este porcentaje. El umbral de decisión, que es la certeza mínima requerida, es completamente diferente a la certeza alcanzada en el paciente individual. Un médico que recibe a un paciente con sospecha de apendicitis realiza una serie de preguntas de anamnesis, hace un examen físico y pide examenes complementarios. Con esta información el médico alcanza una cierta probabilidad de la enfermedad. En la mayor parte de los casos la probabilidad es alta, estando el promedio cerca del 90%. Una pequeña parte de pacientes presenta un cuadro atípico, alcanzando probabilidades más bajas. Son únicamente estos pacientes los que podrían ser falsos positivos. El umbral es sobretodo útil para justificar la decisión de tratamiento en estos casos, en quienes la incertidumbre es mayor. La figura 2.7 ilustra esta repartición. Figura 2.7 : Certeza requerida vs. Certeza alcanzada para apendicitis
El eje “y” representa la probabilidad alcanzada. El eje “x” representa el número de pacientes que alcanza cada probabilidad. Las barras horizontales representan la distribución del total de pacientes. La línea horizontal inferior representa la certeza requerida (umbral de decisión), la línea horizontal superior representa el promedio de probabilidad alcanzado en el total de pacientes.
25
Algunos ejemplos clínicos para comprender mejor Diabetes ¿A partir de qué valor de probabilidad podemos comunicar el diagnóstico de diabetes? Ejemplo de un campo de investigación grande con umbral de acción cercano a 100% En una mujer campesina, divorciada y madre de 6 niños. Durante un chequeo general que realiza el médico rural de la comunidad se le detecta una glicemia en ayunas de 130 mg/dl.
Discusión: La diabetes es una enfermedad crónica que tiene consecuencias muy graves cuando no es tratada. El tratamiento no cura la enfermedad, solo la controla. Sin embargo una vez que está bajo control el pronóstico es aceptablemente bueno. Por otro lado, el lograr un control eficaz es muy difícil: los hábitos dietéticos deberán cambiar drásticamente, el tratamiento deberá ser tomado de forma ininterrumpida para el resto de la vida, tendrá que complementarlo con una serie de medidas de autocuidado. Lo más importante, en un país que no cuente con un sistema de seguridad social bien establecido, la paciente deberá contar con un presupuesto mensual extra para comprar los medicamentos y realizar los controles sucesivos para el resto de la vida. En casos extremos, como el del ejemplo, la mujer tendrá que elegir entre alimentar a sus hijos o comprar su tratamiento. Por todo esto hará falta estar prácticamente seguro del diagnóstico antes de comunicarlo y decidir iniciar el tratamiento. El umbral de acción está cerca de 100%. Por otro lado, si en realidad tiene diabetes, no podemos dejar de diagnosticarla, debido a las consecuencias graves de la enfermedad. Por eso la amplitud del campo de investigación es muy grande: haré todos los examenes necesarios para llegar a confirmar la enfermedad o para excluirla: ¡ante todo caso dudoso, haremos los examenes!
Fiebre amarilla ¿Desde qué valor de probabilidad podemos excluir una fiebre amarilla? : ejemplo de campo de investigación grande con un umbral de exclusión que tiene un valor cercano a 0% Una campesina de la región de Cochabamba en Bolivia es llevada en marzo de 1997 al servicio de emergencias del hospital de distrito en estado comatoso febril, con ictericia y cilindruria; siendo la gota gruesa negativa. De esta región fueron reportados 12 casos de fiebre amarilla en los dos meses anteriores de los cuales 10 murieron, y el año anterior fueron reportados algunos casos más.
Discusión : La fiebre amarilla es una enfermedad grave no solamente para el paciente sino para toda la población de la región y del país si algunas medidas de prevención no son puestas en marcha rápidamente.También es una enfermedad contra la cual solamente existe un tratamiento sintomático, en la que los exámenes serológicos que tienen un fuerte poder de confirmación y de exclusión no hacen correr ningún riesgo al paciente, y donde el costo del test seguramente será tomado a cargo por la comunidad mundial. 26
Los umbrales
Por otro lado, a pesar de existir una vacuna muy eficaz, organizar una campaña de vacunación masiva implica un esfuerzo considerable y un costo elevado, tanto por la organización, como por la vacuna misma. Para excluir una fiebre amarilla, en un contexto de gran sospecha, será entonces necesario alcanzar una probabilidad cercana a 0%: un falso negativo puede engendrar consecuencias graves mientras que para los falsos positivos, el médico establecerá medidas profilácticas que podrá detener una vez que regresen los resultados de los exámenes serológicos. Por otra parte las consecuencias de una falsa alerta mundial no pueden ser subestimadas, entre otras razones por las repercusiones que eso podría tener en el turismo internacional.
Conclusión La meta del trabajo clínico no es necesariamente alcanzar un diagnóstico seguro para una cierta enfermedad, si no más bien de tomar la decisión correcta frente a un paciente y su contexto. En este capítulo hemos tratado de estudiar los criterios cualitativos que influyen sobre nuestros umbrales de decisión. Estos umbrales pueden ser calculados formalmente de forma matemática: la relación entre el umbral de decisión (“umbral único”) y los dos umbrales de acción y de exclusión, que aparecen cuando hay que decidir si se debe o no hacer un último examen, dependen del poder, el costo y el riesgo del examen.
•
No hay que hacer un diagnóstico: hay que llegar a una certeza lo suficientemente alta para actuar.
•
Los factores subjetivos y generales influyen mucho más sobre nuestras decisiones que los datos objetivos.
•
Si no podemos obtener bastante evidencia para tratar o referir, no podemos olvidar de excluir la enfermedad.
27
Referencias ((1) Pauker SG, Kassirer JP. Therapeutic decision making: a cost-benefit analysis. N Engl J Med 1975 Jul 31;293(5):229-34. (2) Pauker SG, Kassirer JP. The threshold approach to clinical decision making. N Engl J Med 1980 May 15;302(20):1109-17. (3) Hunink M, Glasziou P, Siegel J, Weeks J, Pliskin J, Elstein AS, et al. Decision making in health and medicine. Integrating evidence and values. 1 ed. Cambridge: Cambridge University Press; 2001. (4) King JT, Jr., Tsevat J, Lave JR, Roberts MS. Willingness to pay for a quality-adjusted life year: implications for societal health care resource allocation. Med Decis Making 2005 Nov;25(6):667-77.. (5) Basinga P, Moreira J, Bisoffi Z, Bisig B,Van den Ende J. Why Are Clinicians Reluctant to Treat Smear-Negative Tuberculosis? An Inquiry about Treatment Thresholds in Rwanda. Med Decis Making 2007 Jan;27(1):53-60. (6) Grant L, Campbell D. Plague and Other Yersinia Infections. In: Braunwald E, Fauci A, Kasper D, Hauser S, Longo D, Jameson L, editors. Harrison's principles of Internal Medicine. 15 ed. New York: Mc.Graw Hill; 2001. (7) Young N.S. Aplastic Anemia, Myelodisplasia and Related Bone Marrow Failure Syndromes. In: Braunwald E, Fauci A, Kasper D, Hauser S, Longo D, Jameson L, editors. Harrison's principles of Internal Medicine. 15 ed. New York: Mc.Graw Hill; 2001. (8) Chaplin S. Bone marrow depression due to mianserin, phenylbutazone, oxyphenbutazone, and chloramphenicol--Part II. Adverse Drug React Acute Poisoning Rev 1986;5(3):181-96. (9) Ritov I, I, Baron J. Protected Values and Omission Bias. Organ Behav Hum Decis Process 1999 Aug;79(2):79-94.
28
3 Relaciones entre los argumentos y las hipótesis Introducción Ciertos fenómenos causan o testifican sobre otro fenómeno. Esto quiere decir que la presencia de uno está en relación con la presencia del otro. En medicina esas relaciones se analizan en el estudio de los riesgos y en la prueba de la presencia de una patología. Por ejemplo, la presencia de cianosis puede estar relacionada con una neumonía. Esto no solo se hace en medicina. En otras ciencias las relaciones entre fenómenos también pueden ser analizadas: así, por ejemplo los meteorólogos, a partir del aspecto del cielo, de las medidas barométricas, de las fotografías tomadas desde satélites, tratan de prever el clima que habrá en los días siguientes. De igual manera, en criminología, es esencial aportar un cierto número de pruebas con el fin de confirmar las sospechas de culpabilidad de los diferentes acusados.
Ejemplo de criminología Un banco importante en el centro de una gran ciudad de Sudamérica es asaltado por una veintena de ladrones armados; la policía empieza a cercar el barrio donde se encuentra el banco antes de que los ladrones puedan dejarlo. Los policías empiezan una requisa sistemática de todas las personas del barrio y las reparten en dos grupos: las personas armadas y las personas sin armas. Al final del proceso, cada uno de los dos grupos es subdividido en función de la implicación de las diferentes personas en el asalto al banco. Entonces, la población presente en el barrio en el momento del asalto al banco es repartida arbitrariamente en 4 categorías: 1) los ladrones armados, 2) los ladrones que se deshicieron de su arma el momento de la requisa o que no llevaban arma en el asalto,3) los transeúntes armados pero que no están implicados en el asalto al banco y finalmente 4) los transeúntes sin armas.
Con la ayuda de una tabla de contingencia (tabla de cuatro entradas), podemos describir el efecto discriminativo del argumento (portar un arma) en relación a la hipótesis (ser un ladrón), usando una representación gráfica donde se visualizan los verdaderos positivos (ladrones armados), los falsos positivos (transeúntes armados), los verdaderos negativos (transeúntes no armados) y los falsos negativos (ladrones no armados) ( Tabla 3.1). Tabla 3.1 Relación entre hipótesis y argumentos hipótesis + (ladrón)
hipótesis (transeúnte)
argumento + (armado)
verdaderos positivos
Falsos positivos
argumento (no-armado)
falsos negativos
Verdaderos negativos
29
Figura 3.1
Supongamos que hemos identificado a 20 ladrones que participaron en el asalto al banco y que escogemos a un número igual de personas (20) entre la población de transeúntes que se encontraban en el perímetro cercado en el momento del asalto al banco. Si representamos a estos 40 ladrones transeuntes individuos en nuestra tabla de 4 entradas, la sin sin situación se esquematiza de la siguiente manera arma arma (Figura 3.1). Obviamente el número de personas que corresponden a cada una de estas cuatro categorías no siempre es igual y puede variar según el contexto en el que nos encontremos. Vamos a imaginar tres situaciones posibles. Para las situaciones descritas a continuación suponemos tácitamente que la mayor parte de ladrones están armados en el momento de la requisa. ladrones armados
transeuntes armados
Primera situación: Figura 3.2
ladrones armados
transeuntes sin arma
País tranquilo y ninguna persona susceptible de llevar un arma por su función (policía, guardia, militar, etc.) está presente en el barrio cercado: la proporción de personas armadas es muy pequeña en el grupo de los transeúntes y muy grande en el grupo de los ladrones. En esta situación el hecho de llevar un arma es un muy buen argumento a favor de la culpabilidad de la persona requisada, y el hecho de no estar armado es un muy buen argumento a favor de la inocencia.
Segunda situación: Figura 3.3
ladrones armados
transeuntes armados
transeuntes sin arma
30
Es posible que un gran cuartel militar se encuentre dentro del perímetro cercado por la policía, lo que aumentará mucho la importancia del grupo de transeúntes armados. La proporción de personas armadas es similar a la de personas no armadas en el grupo de transeúntes: en esta situación el hecho de estar armado es un argumento que aumenta moderadamente la sospecha de culpabilidad de la persona requisada, y el hecho de estar desarmado ayuda moderadamente en favor de la inocencia.
Argumentos e hipótesis
Tercera situación: Figura 3.4
ladrones armados
transeuntes armados
País con inestabilidad política, la mayor parte de personas llevan un arma para defensa personal. La proporción de personas armadas es muy grande entre los ladrones y los transeúntes; igualmente la proporción de personas no armadas es muy pequeña tanto en los ladrones como en los transeúntes. En esta situación el argumento sea positivo o negativo no aumenta ni disminuye nuestra certeza de culpabilidad de la persona requisada.
Estas representaciones permiten visualizar fácilmente la relación que existe entre un argumento y una hipótesis. • Cuando la razón entre verdaderos positivos y falsos positivos es muy alta la presencia del argumento confirma ampliamente la hipótesis (primer caso), • Cuando la razón entre verdaderos negativos y falsos negativos es muy alta la ausencia del argumento niega ampliamente la hipótesis (primer caso), • Cuando el número de verdaderos positivos y falsos positivos es similar, el argumento no tiene mayor relación con la hipótesis estudiada. Al igual si el número de falsos negativos y verdaderos negativos es parecido (tercer caso). En la segunda situación (Figura 3.3), nos encontramos en una situación intermedia: el argumento no es muy válido ni para confirmación, ni para exclusión.
Ejemplo de medicina Este mismo enfoque puede ser aplicado en medicina. Vamos a considerar el caso de un paciente y trataremos de visualizar, con la ayuda de un esquema similar al anterior, la relación que liga a diferentes argumentos con la hipótesis diagnóstica estudiada: Un paciente de 25 años que pasó durante un tiempo trabajando en un pozo petrolero en la amazonía es hospitalizado en Quito para la investigación de una fiebre de instalación reciente. Siguió una quimioprofilaxis regular con cloroquina durante su estadía en la amazonía y, luego de treinta días después de su regreso a Quito. Presentó un episodio de diarrea durante el año precedente. En el examen físico se evidencia una temperatura de 39 grados C, un pulso regular de 110/min, una TA de 110/80, el examen abdominal pone en evidencia un hipocondrio derecho doloroso a la palpación y una hepatomegalia dolorosa. La maniobra de Murphy es positiva. La ecografía de hígado pone en evidencia tres abscesos de más de cinco cm de diámetro a nivel de lóbulo derecho, la serología para amebiasis es positiva en inmunofluorescencia a una dilución 1/800. Diagnóstico: Múltiples abscesos hepáticos amebianos.
Consideremos un grupo de 100 casos de abscesos hepáticos amebianos y un segundo de 100 pacientes hospitalizados por otra razón diferente a un absceso hepático. Repartamos los 200 pacientes en cuatro grupos según tengan o no un absceso hepático amebiano, por una parte, y según presenten el argumento estudiado o no (Tabla 3.2). 31
Tabla 3.2 Relación entre argumentos e hipótesis clínicas
Absceso amebiano de hígado
No absceso amebiano de hígado
Argumento + (Ej.: antecedente de diarrea, hipertermia, hepatomegalia, serologia +)
verdaderos positivos
falsos positivos
Argumento (Ej.: no antecedente de diarrea, no hipertermia, no hepatomegalia, serologia -)
falsos negativos
verdaderos negativos
Obtenemos una representación gráfica similar al modelo de criminología estudiado más arriba donde la superficie de cada cuadrado es proporcional al número de personas que representa:
Argumento 1 : antecedentes de diarrea en el año precedente Figura 3.5
Dentro del grupo de pacientes que tienen un absceso amebiano del hígado y aquel que repreabsceso + absceso senta a los 100 pacientes que no tienen esta diarrea + diarrea + enfermedad, la proporción de personas con antecedentes de diarrea en el año precedente es más o menos igual a aquella de las personas que no han tenido diarrea. El antecedente de haber absceso + absceso tenido diarrea en el último año es igual de frediarrea diarrea cuente en ambos grupos. Por eso la imagen gráfica representa cuatro cuadrados con una superficie idéntica y podemos decir que no existe ninguna relación entre este argumento y la hipótesis diagnóstica; dicho de otra forma, este argumento no cambia la certeza frente a nuestra hipótesis.
Argumento 2 : fiebre Figura 3.6
La representación gráfica es ahora asimétrica. Observamos que son muy raros los pacientes absceso + con un absceso amebiano de hígado que no tieabsceso fiebre + Tº + nen fiebre; sin embargo el argumento fiebre se puede encontrar también en algunos pacientes del grupo de referencia: la fiebre es entonces un absceso argumento que si está relacionado con la enferTº medad en cuestión pero su descubrimiento no nos hace avanzar mucho en nuestra certeza diagnóstica; su ausencia, por el contrario, puede ser útil para excluir un diagnóstico de absceso amebiano de hígado. 32
Argumentos e hipótesis
Argumento 3 : hígado doloroso Figura 3.7 absceso + dolor +
absceso + dolor -
absceso diarrea -
Este tercer ejemplo nos da una representación gráfica opuesta a la del ejemplo precedente: entre los pacientes afectados por un absceso amebiano de hígado, la palpación del hígado será dolorosa en alrededor de la mitad de los casos; pero por otro lado la presencia de este signo en la población de referencia es raro.
Por esta razón el hallazgo de un hígado doloroso aumenta la sospecha de absceso amebiano de hígado. Su ausencia, por el contrario, ayuda poco para excluir.
Argumento 4 : la serología de amebiasis positiva (superior à 1/200) Figura 3.8
absceso + sero >1/200 absceso sero <1/200
La relación entre este argumento y el diagnóstico de absceso amebiano de hígado es esta vez muy positiva: casi todos los enfermos tendrán una serología positiva, mientras que serán muy raros los positivos entre las personas del grupo de referencia. Una serología positiva para un absceso amebiano de hígado es un argumento fuerte para confirmación del diagnóstico; su ausencia es también un argumento fuerte para su exclusión.
Resumiendo, podemos decir que un argumento que raramente se encuentre presente en una población de referencia (ejemplo, imagen ecográfica sospechosa de absceso hepático amebiano) tiene –cuando se lo encuentra– un valor fuerte de confirmación de nuestra hipótesis. Al contrario, un argumento que raramente se encuentre ausente en los enfermos (por ejemplo, serología positiva para amebiasis), tiene un fuerte poder de exclusión. Por último, un argumento presente en la mitad del grupo de enfermos y de la población de referencia (ejemplo, antecedentes de diarrea), no tiene relación con la hipótesis estudiada y es inútil en el proceso diagnóstico.
33
Conclusión En varias disciplinas se analizan las relaciones entre fenómenos. En clínica, el médico debe abstenerse de recoger información inútil. Los esfuerzos tienen que concentrarse en los datos que más aporten para la confirmación y/o exclusión de un diagnóstico.
Un argumento es fuerte si siempre está presente en los sospechosos y ausente en los no-sospechosos.
Un argumento que casi nunca se encuentre en pacientes con otras enfermedades será útil para confirmar. Un argumento que casi nunca se encuentre ausente en quienes tienen la enfermedad que sospechamos será útil para excuir. Los demás argumentos serán débiles y aun inútiles.
Ejercicios A continuación de este ejemplo trate de establecer relaciones entre diferentes argumentos y el absceso hepático amebiano, ¿qué podemos decir de la relación de datos clínicos conocidos como son el signo de Blumberg y la apendicitis?, ¿un BAAR de esputo negativo y la tuberculosis pulmonar?, ¿cefaleas intensas y migraña?, ¿rigidez de nuca y meningitis bacteriana?, ¿reacción de Widal y fiebre tifoidea?
34
4 El poder de un argumento Introducción En el segundo capítulo analizábamos el nivel de certeza requerido para actuar o para detener cualquier investigación. El objetivo del capítulo precedente, en cambio, era acercar las relaciones existentes entre un argumento y una hipótesis diagnóstica, tratando de representar gráficamente esta relación. En esta sección nos vamos a interesar en cuantificar estas relaciones: ¿qué es lo que nos permite decir que un argumento es débil, bueno o fuerte en relación a una patología en particular?, ¿tienen las fuerzas de exclusión y de confirmación de un argumento valores simétricos?, ¿cómo podemos explicar que la fuerza de un argumento pueda variar según el contexto de la población con la que trabajamos? Una vez más es necesario aclarar que cuando hablamos de “argumento”, nos referimos a cualquier tipo de hallazgo clínico. Esto incluye los síntomas que un paciente nos cuenta durante la anamnesis, los signos que encontramos en el examen físico, y los datos que obtenemos del laboratorio o del servicio de imágenes. Para cuantificar la fuerza de un argumento es necesario primero considerar que existen dos grandes tipos. El primero corresponde a aquellos que se expresan de forma categórica y dicotómica (por ejemplo presencia de fiebre, de diarrea o de erupción cutánea). Cuando estos están presentes señalan una anormalidad en la salud del paciente examinado; la respuesta que obtenemos cuando los indagamos es “SI” o “NO”. El segundo grupo corresponde a los que se expresan de forma cuantitativa. Para éstos es necesario determinar valores precisos (por ejemplo, tasa de hemoglobina, peso, tensión arterial,...). Su fuerza depende de la precisión con la cual se determinen los valores “normales”. Es lo que también se conoce como el punto de corte. Adicionalmente hay otro tipo de argumentos que están entre lo dicotómico (SI o NO) y lo cuantitativo. Son aquellos que nos informan sobre un grado de afectación de manera ordinal. Por ejemplo el resultado de una radiografía puede clasificarse en diferentes grados: “sin ninguna alteración”, “alteración leve”, alteración moderada”, “alteración severa”. Aunque este tercer tipo de argumento se acerca más al tipo categórico, para analizar su fuerza es más práctico considerarlo como si fuera cuantitativo. La ausencia de alteración puede corresponder al nivel “cero”, la alteración leve puede corresponder al nivel “uno” y así sucesivamente.
Definición del poder El poder de confirmación de un argumento Observemos lo que ocurre durante una consulta pediátrica en Puyo, Ecuador: Caso 1: niño de 6 años con disnea espiratoria y sibilancias en la auscultación. Caso 2: lactante de cuatro meses que presenta taquipnea desde el nacimiento.Tiene tos, expectoración amarillenta, fiebre, tiraje intercostal, cianosis, crepitaciones en pulmones, soplo sisto-diastólico en foco mitral. 35
Caso 3: niña de 10 años se queja de tenesmo y diarrea con sangre. Caso 4: niño de 7 años que presenta fiebre y dolor a la deglución. Caso 5: lactante que presenta varias lesiones seudoforunculosas en la espalda derecha de donde sale una larva al hacer presión lateral. Caso 6: lactante hospitalizado por estado altamente febril.
Argumentos con un fuerte poder de confirmación Los primeros cinco casos de esta consulta parecen simples al ser el argumento descrito en cada uno de ellos tan demostrativo de la patología subyacente: disnea y sibilancias para un asma, soplo sisto-diastólico en foco mitral de un lactante con taquipnea desde el nacimiento para una cardiopatía congénita, el tenesmo acompañado de diarrea con sangre para una disentería amebiana, la fiebre y dolor de garganta para una faringitis y la extracción de una larva para una miasis forúnculosa (tupe). Figura 4.1 asma
otras enfermedades
Representemos, por ejemplo, la relación existente entre la disnea espiratoria y el asma en una tabla de cuatro entradas similar a aquellas del capítulo precedente. La mayoría de pacientes enfermos con asma tendrán disnea espiratoria mientras que en los pacientes verdaderos que tienen otras enfermedades este signo ausente negativos está casi siempre ausente. Uno podría decir que debería estar siempre ausente en los que no tienen asma; pero no hay que olvidar que también se puede encontrar disnea espiratoria en otras enfermedades como la bronquitis, la bronquiolitis, la difteria, los cuales vendrían a ser falsos positivos. DISNEA
verdaderos presente positivos
Podemos ver que la superficie que representa a los falsos positivos (pacientes que tienen disnea espiratoria pero no asma) es muy pequeña en relación a la que representa a los verdaderos positivos. Si pusiéramos en una balanza habría un gran desequilibrio. Con esto podemos afirmar que el poder de confirmación de este argumento es muy grande. En otros ejemplos la situación es diferente.Tomemos el caso de la diarrea con sangre y la amebiasis. Sabemos que no encontramos siempre diarrea con sangre en las personas con amebiasis. Por otra parte encontrar este signo en otras enfermedades es raro, aunque siempre hay unos falsos positivos.
36
Poder de un argumento
Figura 4.2
otras enfermedades
Vemos que el desequilibrio entre verdaderos positivos y falsos positivos es menos importanpresente te que en el ejemplo anterior, por eso el poder positivos de confirmación es menos fuerte. También se observa que los verdaderos negativos y falsos negativos están equilibrados; pero eso no nos falsos verdaderos interesa por ahora (por eso la hemos dejado en ausente negativos negativos gris), ya que en este caso el niño si tiene el argumento. El poder de confirmación de un argumento se evalúa por el equilibrio –en términos matemáticos la razón– que existe entre verdaderos positivos y falsos positivos. Mientras menos falsos positivos haya, más fuerte será el poder.
DIARREA
CON SANGRE
amebiasis verd.
Argumento con un poder de confirmación débil El caso 6 es aquel del niño traído al hospital con un cuadro altamente febril. Este argumento no permite – por sí solo – tener la certeza de un diagnóstico en particular, paludismo por ejemplo. Existen numerosas patologías que pueden acompañarse de un estado altamente febril en un niño pequeño. Figura 4.3 paludismo FIEBRE ALTA
presente
ausente
verdaderos positivos
otras enfermedades
falsos positivos
verdaderos negativos
Este argumento se encuentra presente en casi 100% de casos de paludismo, pero también es frecuente en otras enfermedades. De esta forma el equilibrio entre el número de verdaderos positivos (niños en los que la fiebre alta es causada por el paludismo) y el número de falsos positivos (niños sin paludismo pero con fiebre alta) es mucho más pequeña que en los casos precedentes. Por eso el argumento fiebre tiene un poder débil para confirmar paludismo.
Luego de comparar los tres ejemplos deducimos que el poder de confirmación está determinado sobretodo por los falsos positivos. En otras palabras, un argumento es fuerte si se encuentra únicamente en los enfermos, y no en los no-enfermos (o los pacientes que tienen otra enfermedad).
El poder de exclusión de un argumento Pasemos ahora a una consulta de ginecología y obstetricia en Santa Cruz de la Sierra, Bolivia: Caso 7: test de embarazo negativo en una paciente de 22 años que presenta un dolor pélvico agudo. Caso 8: Pap test de rutina negativo en una trabajadora sexual. Caso 9: ausencia de defensa abdominal en una paciente con sospecha de embarazo extrauterino.
Argumentos con un gran poder de exclusión Nuestra experiencia clínica ya nos permite decir que el diagnóstico de embarazo extrauterino puede ser excluido en el caso 7, al igual que el de cáncer de cuello de útero en el caso 8. 37
Dibujemos la relación entre un test de embarazo y el embarazo extrauterino: Figura 4.4 EEU
otras Existen muy pocos casos en los que una mujer enfermedades
embarazada puede tener un test de embarazo negativo (falsos negativos). Por otro lado también es improbable que este argumento se presente en una mujer no embarazada. Al haber tenido un resultado negativo en el test, ahora es la parte verdaderos inferior de la tabla de cuatro entradas la que nos negativo negativos interesa y en particular el equilibrio entre las superficies que representan a los verdaderos negativos y los falsos negativos. De acuerdo a la figura podemos decir que el test de embarazo tiene un poder de exclusión muy fuerte para embarazo extrauterino. TEST
EMBARAZO
positivo
verdaderos positivos
Argumento con un débil poder de exclusión Figura 4.5 EEU
DEFENSA
ABDOMINAL
presente
ausente
verdaderos positivos falsos negativos
El caso 9 de esta consulta nos presenta un argu-
otras enfermedades mento con un débil poder de exclusión frente a
verdaderos negativos
un embarazo extrauterino: en efecto, bastantes pacientes con una hemorragia intraperitoneal secundaria a una ruptura de un embarazo extrauterino no presentarán defensa abdominal, por lo menos en el comienzo de la enfermedad. Evidentemente, la mayor parte de pacientes del grupo sin embarazo extrauterino tampoco presentarán este argumento.
El equilibrio entre los verdaderos negativos y los falsos negativos es, en este caso, muy diferente a aquel de los dos casos precedentes. Mantenemos la idea de que únicamente los bloques inferiores son los que interesan para la exclusión: la comparación de los dos ejemplos permite concluir que sobretodo son los falsos negativos quienes determinarán el poder de exclusión. Por tanto, un argumento tiene un fuerte poder de exclusión si está siempre presente en una enfermedad. Combinando los dos poderes, podemos decir que un argumento es perfecto en las dos direcciones (para confirmación y para exclusión) cuando está siempre y únicamente presente en una enfermedad.
Estimar el poder de un argumento positivo Una vez que tenemos clara la noción del poder de un argumento, podemos estimarlo fácilmente. Comencemos por el caso de un argumento positivo, donde buscamos el poder de confirmación. En los párrafos anteriores nos referimos al equilibrio entre 38
Poder de un argumento
verdaderos y falsos positivos. Matemáticamente este equilibrio no es más que una razón, es decir la división de los verdaderos positivos para los falsos positivos. El poder de confirmación es la razón entre la probabilidad de tener un argumento positivo entre los enfermos y la probabilidad de tener un argumento positivo entre los que no tienen la enfermedad en cuestión. Para la disnea espiratoria y el asma, es claro que hay muchos más verdaderos positivos que falsos positivos: podríamos decir que hay 100 verdaderos positivos por 2 falsos positivos. Entonces el poder es de 50 (100 dividido para 2 = 50), y podemos decir que es un argumento con un poder de confirmación fuerte. En el caso de la diarrea con sangre y la amebiasis, hay 40 verdaderos positivos por 1 falso positivo: la razón es 40.También decimos que el poder es fuerte. En el caso de la fiebre y el paludismo, hay 100 verdaderos positivos por cada 30 falsos positivos. El resultado es 3, por lo tanto la fuerza es débil.
Estimar el poder de un argumento negativo Siguiendo el mismo razonamiento, el poder de un argumento negativo es la razón entre los verdaderos negativos y los falsos negativos. En otras palabras, la probabilidad de encontrar un argumento negativo en los que no tienen la enfermedad contra la probabilidad de encontrar un argumento negativo en los enfermos. De nuevo aquí, considerando los tres ejemplos que vimos más arriba, observamos una gran diferencia en los valores de los poderes para cada uno de ellos: En el caso de la paciente de 22 años que presenta un dolor pélvico agudo, es evidente que casi todos los casos de embarazo extrauterino tienen un test positivo, lo que quiere decir que casi no hay falsos negativos. Hay muchos más verdaderos negativos que falsos negativos. Sin temor a equivocarnos podemos decir que hay 100 verdaderos negativos contra solo un falso negativo, lo que da como resultado 100. Por lo tanto el poder de exclusión es muy fuerte. En el caso de la trabajadora sexual, es posible que a veces un Pap test resulta negativo a pesar de haber una displasia o un cáncer. Sin embargo hay algunos casos en los que el Pap test resulta positivo en personas que en realidad no tienen ni cáncer ni displasia, es decir que el número de verdaderos negativos se reduce. Por esto podemos decir que la razón de verdaderos negativos contra falsos negativos es de 10 contra 1, es decir 10; por lo tanto el poder de exclusión es bueno. En el caso de la ausencia de defensa abdominal, sabemos que la sangre no irrita mucho el peritoneo, por lo menos no como una peritonitis o la presencia de material fecal. Una defensa se observa en menos de la mitad de casos de embarazo extra uterino. Por otro lado una defensa puede encontrarse en una apendicitis o en una colecistitis, por lo tanto se puede decir que hay 30 falsos positivos, por consecuencia hay 70 verdaderos negativos. Considerando que puede haber al menos 50 falsos negativos el resultado es 70 contra 50, prácticamente 1: el poder de exclusión es inútil.
39
Veamos aquí una representación gráfica de los poderes: Figura 4.6
Verdaderos positivos
Falsos positivos
PODER DE CONFIRMACION
Verdaderos negativos
Falsos negativos
PODER DE EXCLUSION
Estimar los verdaderos y falsos positivos y negativos De esta manera se puede ver que el procedimiento para estimar el poder de un argumento es muy sencillo. Sin embargo muchos dirán que lo difícil es estimar el número de personas que entran en cada casillero de la tabla de cuatro entradas. En realidad no es tán difícil. Para hacerlo correctamente, hay que empezar considerando un grupo de personas con la enfermedad para la cual queremos analizar el poder de un argumento y otro grupo de personas que no tienen esa enfermedad, pero que pueden tener cualquier otra, e incluso pueden tener el argumento sin estar enfermos. Para calcular fácilmente, es preferible considerar grupos de 100 pacientes. Podríamos imaginar un estudio en un grupo de 100 pacientes con neumonía, escogidos al azar. Haciendo una estimación intuitiva podemos decir que, en este grupo, el dolor torácico puede estar presente en 20% de los casos. Entonces deducimos que hay 20% de verdaderos positivos, por lo tanto 80% de falsos negativos. A la tasa de verdaderos positivos se le conoce también como la sensibilidad. Es muy frecuente encontrar datos de sensibilidad como resultado de investigaciones sobre valor diagnóstico de un argumento, y muchos clínicos piensan –erróneamente– que esto es suficiente para conocer el poder de un argumento. Sin embargo, la sensibilidad no ayuda mucho en la práctica clínica si no se la combina con la tasa de falsos positivos. De esta manera obtenemos el poder de confirmación.(1) Figura 4.7
DOLOR
TORACICO
presente
ausente
neumonía
otras enfermedades
Verdaderos positivos
Falsos positivos
Falsos negativos
Verdaderos negativos
Otra forma de estimar intuitivamente la sensibilidad es basándonos en nuestra experiencia. Basta pensar en la proporción de casos de neumonía, en los cuales hemos encontrado el dolor torácico. Si decimos uno en 10 significa que es el 10% de casos; si decimos dos en 10 será el 20%. Como veremos más adelante no hace falta ser exactos.
Lo que sí resulta un poco más difícil es la estimación de los falsos positivos. Este dato está prácticamente ausente en la literatura médica. Para poder hacerlo intuitivamente tenemos que considerar los dos bloques en gris de la figura 4.7. Si fuera una investigación, podríamos imaginar que 100 pacientes sin neumonía, pero con cualquier otra enfermedad, son tomados al azar. A estos les preguntamos si tienen dolor torácico. En 40
Poder de un argumento
este grupo puede haber pacientes con trauma, con zona, con espasmo del esófago, con infarto que sí tienen dolor torácico pero que no tienen neumonía. Sin embargo éstos no son tan frecuentes en un contexto de medicina general. La mayor parte son pacientes con otras enfermedades que no tienen dolor torácico. Por esa razón podemos intuir que aproximadamente 5% de pacientes de este grupo de referencia son falsos positivos: es decir que tienen dolor torácico, pero no tienen neumonía. Por consecuencia podemos decir también que hay 95% de verdaderos negativos, puesto que 100 menos 5 hacen 95. A esta tasa de verdaderos negativos la llamamos también la especificidad. La especificidad es una noción difícil de comprender y manipular. Por eso preferimos estimar intuitivamente y trabajar con la tasa de falsos positivos que – como hemos visto – no es más que el complemento de los verdaderos negativos. En este punto el lector podría estar decepcionado: ¿cómo es posible que se intente calcular el poder de un argumento con datos estimados intuitivamente? En realidad la idea no es tan descabellada. Por un lado resulta necesario hacerlo porque los datos de la literatura sobre sensibilidad y especificidad de un argumento son escasos. Pero lo más importante es que la tasa de falsos positivos puede cambiar considerablemente de un sitio a otro. Esto se debe a que este valor depende fuertemente de la distribución de enfermedades en el contexto de nuestro trabajo. Si comparamos la distribución de enfermedades en la consulta de un cardiólogo con la que se encuentra en la consulta de un médico general se pueden ver grandes diferencias. En el caso del primero la mayor parte de sus pacientes tendrán hipertensión, insuficiencia cardiaca, angina, arritmias; mientras que donde el médico general, si bien estas enfermedades también pueden estar, se pierden en una lista más grande de otras patologías. Eso implica que la tasa de falsos positivos de, por ejemplo, un tercer ruido para una insuficiencia cardiaca será más grande en el consultorio del cardiólogo que en el del médico general. Por consecuencia el poder de confirmación será más débil en el primero. Finalmente hay que considerar que el cambio en los poderes de los argumentos es casi imperceptible si nos equivocamos entre 20 y 30%. (1;2) Todo esto nos lleva a decir que la mejor manera de estimar los falsos negativos es pensar en la distribución de personas que llegan a nuestra consulta. Simplemente preguntándonos: de 100 personas que han llegado a la consulta durante la última semana, ¿cuántos han presentado el argumento que estoy analizando, sin que tengan la enfermedad que sospecho?. Esto nos va a dar un número muy acertado de falsos positivos que me permitirá calcular los diferentes poderes. Esta reflexión corresponde a la segunda columna de nuestra tabla de cuatro entradas representadas en la Figura 4.8 Figura 4.8
Verdaderos positivos
Falsos positivos
Falsos negativos
Verdaderos negativos
Concluyendo podríamos decir que mientras más alta sea la sensibilidad de un argumento (cerca de 100%), más tiende a disminuir el número de falsos negativos, por lo tanto cambia el poder de exclusión. Mientras más alta sea la especificidad de un argumento (cerca de 100%), más tiende a disminuir el número de falsos positivos y sobre todo cambia el poder de confirmación. 41
Podemos poner todos los valores también en una tabla de contingencia. Es decir que la llenamos con las tasas de verdaderos y falsos positivos y negativos. Usemos el ejemplo de la neumonía y el dolor torácico. Tabla 4.1 Dolor torácico en neumonía Neumonía
Pacientes sin neumonía
Dolor torácico
20
5
Sin dolor torácico
80
95
Total
100
100
Ahora que hemos estimado la tasa de los verdaderos y falsos positivos y negativos, podríamos calcular los poderes: Figura 4.9
Verdaderos positivos
Falsos positivos
PODER DE CONFIRMACION
Verdaderos positivos Falsos negativos Verdaderos negativos Falsos positivos
20% 80% 95% 5%
Poder de confirmación: Poder de exclusión:
20/5= 4 95/80= 1.2
Verdaderos negativos
Falsos negativos
PODER DE EXCLUSION
Ambos valores son bajos, sobretodo el poder de exclusión. Si uno no tiene dolor torácico, no excluye una neumonía. Si lo tiene, ayuda un poco al diagnóstico. ¿Por qué decimos que ambos valores son bajos?, ¿qué quiere decir un poder de confirmación débil o uno fuerte?. Hay que empezar considerando que el poder de un argumento es una razón, es decir una operación matemática en la que se comparan dos conjuntos separados. Si ambos conjuntos son de igual tamaño el resultado de la división es 1. Mientras más grande sea el tamaño del primer conjunto, comparado con el segundo, mayor será el resultado de la división. Esto quiere decir que el poder de un argumento puede ir desde 1 hasta el infinito. Si para el poder de confirmación obtenemos un resultado igual a 1 quiere decir que el número de verdaderos positivos es igual al número de falsos positivos, por tanto el poder de confirmación es inútil. En cambio si el número de falsos positivos es “cero” no es posible hacer una división, quiere decir que en ese caso, cualquiera que sea el número de verdaderos positivos el poder de confirmación es infinito. 42
Poder de un argumento
En realidad el resultado del poder de confirmación es exponencial, y como tal debe ser representado en una escala logarítmica, lo cual nos da categorías de poderes. Si en una hoja de cálculo de excel calculamos el logaritmo de base 10 (usando la función Log10) de todos los valores de poder de confirmación desde el 1 hasta el 100 podemos identificar 5 categorías de poder más o menos bien definidas: “inútil”, “débil”, “bueno”, “fuerte” y “muy fuerte” (Tabla 4.2, apéndice 1). Tabla 4.2 Clasificación categórica de los poderes de un argumento Poder calculado Razón verdaderos / falsos
Poder transformado en Logaritmo de base 10
Categoría de poder
1
0
Inútil
3 (2 - 5)
0,5
Débil
10 (6 - 17)
1
Bueno
30 (18 - 56)
1,5
Fuerte
100 (57 - …)
2
Muy fuerte
Esta tabla es válida tanto para los poderes de confirmación (verdaderos positivos / falsos positivos), como para los poderes de exclusión (verdaderos negativos / falsos negativos). Para fines prácticos se puede decir que, para confirmar, un argumento es inútil si el número de verdaderos positivos es igual al de falsos positivos; en cambio es débil si la razón entre verdaderos positivos y falsos positivos está alrededor de 3; así mismo es bueno si está alrededor de 10; fuerte si está alrededor de 30 y muy fuerte alrededor de 100. (Tabla 4.1) Teóricamente esta progresión puede continuar hasta el infinito. Si el resultado de la división está alrededor de 300 el argumento será “muy muy fuerte” y si está alrededor de 1000 será “muy muy muy fuerte”. Estas dos últimas categorías son extremadamente raras. Casi no existen argumentos con un poder superior a 100. El mismo razonamiento es aplicable al poder de exclusión. La aplicación de estas fuerzas en una escala fácil de comprender y aplicar en la práctica será explicada en el siguiente capítulo.
Simetría entre poderes de confirmación y de exclusión El poder de exclusión de un argumento no depende del poder de confirmación. Esto quiere decir que si un argumento tiene un poder de confirmación fuerte para un diagnóstico particular, no necesariamente su poder de exclusión va a ser fuerte también. Por ejemplo si encontramos defensa abdominal sospechamos fuertemente en una apendicitis, pero si la defensa abdominal está ausente no podemos excluir este diagnóstico. Así mismo una muestra de esputo negativa tiene un débil poder de exclusión frente a una tuberculosis pulmonar, mientras que si es positiva tiene un fuerte poder de confirmación. Este es un error muy frecuente que cometen los clínicos con poca experiencia que trae como consecuencia, tanto el uso excesivo de exámenes diagnós43
ticos, como el hecho de que muchos pacientes que ameritan un tratamiento se queden sin el mismo. Del mismo modo, si la ausencia de un argumento excluye un diagnóstico, su presencia no necesariamente lo confirma: la fiebre no ayuda mucho para confirmar un diagnóstico de paludismo, mientras que en un paciente afebril prácticamente excluimos la posibilidad de esta enfermedad. Examinemos el caso de una paciente hospitalizada en Esmeraldas, Ecuador, por una embolia pulmonar. Una mujer de 38 años, que habita en una comunidad del río Santiago en Esmeraldas llega al hospital con polipnea de inicio súbito y dolor torácico, entre los antecedentes refiere edema de miembro inferior derecho desde hace dos días. Al examen físico se encuentra afebril, con frecuencia cardiaca de 120/min. Se realiza una radiografía de tórax en la que se observa una condensación. La hipótesis diagnóstica es embolia pulmonar.
Cada uno de los diferentes argumentos expuestos en este caso tiene un cierto poder de confirmación y de exclusión. Podemos decir que la probabilidad de encontrar taquicardia en un grupo de pacientes con embolia pulmonar es muy alta. Por otra parte, la probabilidad de tener taquicardia en personas sin enfermedad no es baja: basta pensar en todos los pacientes con fiebre, por ejemplo. El signo está casi siempre presente, pero no es único para embolia, entonces es un argumento bueno para excluir y débil para confirmar. Para el argumento edema de miembros inferiores el poder de confirmación de la hipótesis diagnóstica embolia pulmonar es fuerte mientras que su poder de exclusión es más bien débil: el argumento es raro en pacientes sin embolia, pero en embolia no es tan frecuente. El síntoma no está siempre presente, pero es más único. Por otra parte vemos que un paciente con embolia pulmonar tiene poca probabilidad de tener una condensación en la radiografía de tórax, pero también hay algunos pacientes en el hospital con condensación. El signo está raramente presente, y no es único. Entonces, los poderes de confirmación y de exclusión de este argumento son débiles: se trata de un argumento simétrico. Tabla 4.3: Poder de los argumentos para embolia pulmonar Argumentos
PC
PE
Polipnea
muy fuerte
bueno
Inicio súbito
bueno
débil
Dolor torácico
bueno
débil
Taquicardia
débil
bueno
Edema de pierna
fuerte
débil
Condensación
débil
débil
en Rx de tórax
44
Poder de un argumento
Patognomónico Durante la formación clínica los profesores de semiología enseñan varios signos patognomónicos. En nuestra terminología ¿qué significa que un argumento es "patognomónico"? Patognomónico quiere decir que el poder de confirmación es infinitamente alto. Es decir que hacemos el diagnóstico sobre la base de un solo argumento. Como vimos antes, para que el poder de confirmación sea infinitamente alto es necesario que no existan falsos positivos. Un ejemplo es el aspecto de un herpes zonal típico: no hay ninguna otra enfermedad que simule a esta presentación. Solo observando el aspecto hacemos el diagnóstico. ¿Existe su equivalente en negativo? Sí: el hecho de ser un hombre excluye un embarazo extrauterino, el hecho de vivir en los Andes excluye la enfermedad del sueño. Solo que nunca utilizamos el término patognomónico en negativo. Podríamos llamarlo un argumento obligatorio. De todas maneras, un argumento patognomónico debe ser interpretado con precaución.
Los determinantes de la fuerza Varios factores influyen sobre la validez de un argumento y, por consecuencia, sobre su fuerza. Aquí analizamos los factores más importantes.
La recolección de los datos clínicos Ya en el principio de cualquier contacto clínico, varios factores influirán sobre la fuerza de los argumentos: • ¿El médico comprendió bien a su paciente? Problemas de idioma, de dialecto. (Trate, por ejemplo, de hacer un examen de sensibilidad cutánea en una vieja mujer shuar no habiendo ningún médico ni auxiliar de enfermería que pueda hacer de traductor). • ¿Dispone en verdad el paciente de la terminología adecuada para expresar lo que siente? • Si el paciente tiene ya en mente una causa probable, ¿dará una información objetiva? • Teniendo ya el médico en su mente una hipótesis probable, ¿será selectivo en la interpretación de la historia y de los argumentos? Son innumerables los sesgos de observación de parte del paciente y del médico. No hay que confundir estos sesgos con la utilización inteligente de los resultados: por ejemplo, un argumento con un débil poder de confirmación será tomado con cautela cuando es positivo. Lo mismo haremos para un argumento con un débil poder de exclusión cuando es negativo.
45
Paraclínica: la transmisión de los datos Todos tenemos un respeto exagerado por los argumentos paraclínicos: sobreestimamos los resultados de laboratorio o los resultados de imagenología médica. En principio, estos argumentos podrían ser más fiables. No podemos olvidar, por el contrario, que estos argumentos nos llegan a través de una cadena de transmisión, en la cual los "errores" pueden ser frecuentes: error de etiqueta, intercambio de sueros, contaminación con otro suero, error de clasificación. Aún en los laboratorios con más alta reputación es normal encontrar del 1 a 2% de errores en la transmisión de datos. Al contrario, en el aspecto de una pitiriasis rosea de Gilbert, no hay ninguna transmisión de datos, es el clínico el que observa. Por otro lado muchos exámenes de laboratorio tienen reacciones cruzadas y los exámenes de imágenes dependen también de la interpretación del observador.
El valor de positividad En el párrafo "características de base" hemos visto que existen argumentos cualitativos y cuantitativos. Para los argumentos cuantitativos hay que determinar a partir de que valor consideramos el resultado como positivo. Este límite de positividad influirá sobre los poderes de confirmación y de exclusión del argumento. Una apendicitis puede acompañarse de una leucocitosis alta. Pero ¿qué es una leucocitosis alta?, ¿diez mil, ¿catorce mil?, ¿dieciséis mil? El efecto se puede observar en la Figura 4.10 A la izquierda está representado por puntos un grupo de pacientes con apendicitis; a la derecha un grupo de pacientes con otras enfermedades. El tamaño de los círculos se corresponde con la cantidad de pacientes existente en cada grupo. Existen tres líneas horizontales que corresponden a diferentes puntos de corte. La línea roja está colocada en 16 mil leucocitos, es decir consideramos positivo si los leucocitos son más de 16 mil; la línea amarilla está colocada en 14 mil leucocitos; finalmente la línea verde está colocada en 10 mil leucocitos. Si colocamos nuestro punto de corte en 16 mil, habrá pocos pacientes con otras enfermedades que alcancen este valor, por lo tanto el argumento será fuerte si está presente. Por el contrario, más de la mitad de las apendicitis no alcanzan este valor, su poder de exclusión será débil, por consecuencia, la ausencia de este argumento no nos permite excluir una apendicitis. Si en cambio colocamos nuestro punto de corte en 14 mil, el argumento tendrá un buen poder de confirmación si está presente: hay algunos pacientes con otras enfermedades diferentes a la apendicitis que tendrán una leucocitosis de 14 mil. Tampoco ayudaría mucho a excluir, puesto que hay pacientes con apendicitis que no alcanzarían este valor. Finalmente si el punto de corte está en 10 mil el argumento se vuelve fuerte para excluir, son muy pocos los pacientes con apendicitis que tienen menos de 10 mil leucocitos; sin embargo es débil para confirmar, por cuanto hay bastantes pacientes sin apendicitis que tienen valores superiores a 10 mil. En nuestra interpretación, combinamos todo lo precedente: si la leucocitosis es alta, lo utilizamos para confirmar, si es baja para excluir. 46
Poder de un argumento
Figura 4.10 Efecto del punto de corte sobre el poder de un argumento cuantitativo: recuento de leucocitos en apendicitis
Este gráfico debe ser interpretado con cautela, pues se origina en datos ficticios y tiene como fin solamente demostrar el efecto de tomar diferentes puntos de corte. Un metanálisis publicado en el 2004 dice que en realidad el poder de confirmación del recuento leucocitario a diferentes puntos de corte siempre es débil. A un punto de corte de 15 mil, el poder de confirmación no sobrepasa de 7 y a un punto de corte de 10 mil el poder de exclusión tampoco sobrepasaría de 6.(3)
El factor tiempo El médico, durante su anamnesis, se interesa de 1. Cada argumento tiene un poder de confirmación y un poder de exclusión forma par ticular en la 2. Estos respectivos poderes raramente son simétricos relación que existe entre 3. Los argumentos que son pruebas absolutas de una un argumento y su expreenfermedad son raros. sión en el tiempo, más particularmente, su duración, su agravamiento, su carácter intermitente, o su desaparición. Una diarrea, por ejemplo, es un argumento que habla en favor de muchas etiologías. El espectro diagnóstico está fuertemente restringido, según que hablemos de una diarrea de inicio brusco, que desencadena en una deshidratación grave por la cual muere el paciente en pocas horas; de una diarrea crónica; de un episodio diarreico de tres días al inicio de unas vacaciones en un medio tropical; o de una diarrea súbita luego de una cena en la cual los alimentos eran de una calidad higiénica dudosa. El poder de confirmación y de exclusión de este argumento está entonces amplificado o reducido en función de su expresión en el tiempo.
47
Referencias (1)
(2) (3)
Van den Ende J, Bisoffi Z,Van Puymbroek H,Van der Stuyft P,Van Gompel A, Derese A, et al. Bridging the gap between clinical practice and diagnostic clinical epidemiology: pilot experiences with a didactic model based on a logarithmic scale. J Eval Clin Pract 2007 Jun;13(3):374-80. Van den Ende J, Moreira J, Basinga P, Bisoffi Z.The trouble with likelihood ratios. Lancet 2005 Aug 13;366(9485):548. Andersson RE. Meta-analysis of the clinical and laboratory diagnosis of appendicitis. Br J Surg 2004 Jan;91(1):28-37.
48
5 Fuerza de un argumento aplicada a un contexto clínico
Cuando el grupo dirigido por David Sackett publicó, en los años ochenta, su famoso libro “Epidemiología clínica: ciencia básica para la medicina clínica”, muchas cosas cambiaron en la manera de comprender y enseñar la medicina.(1) Sackett empezó a poner en duda el valor de muchas cosas que se daban por sentadas en el análisis diagnóstico y en las implicaciones para la toma de decisiones clínicas. Con esto puso las bases para lo que más tarde conoceríamos como el movimiento de Medicina Basada en la Evidencia.(2) Aunque parezca increíble, el análisis diagnóstico propuesto por Sackett está basado en una teoría muy antigua desarrollada en el siglo XVIII por el matemático Thomas Bayes y luego refinada por Alan Turing, otro matemático del siglo XX, que se hizo famoso al decodificar los mensajes encriptados del ejército alemán durante la II guerra mundial, facilitando así la victoria de las tropas aliadas.(3;4) Actualmente el teorema de Bayes y las redes bayesianas se utilizan en casi todos los dominios de la ciencia,(5) pero ya en 1959 Ledley y Lusted , en un famoso artículo publicado en la revista Science, propusieron su uso en medicina como una forma de desarrollar un sistema computado de razonamiento clínico.(6) Efectivamente este famoso teorema, que no es más que el cálculo de las probabilidades condicionales, constituye el método más apropiado para conocer la probabilidad de que un enfermo que se encuentra en un determinado contexto, tenga una cierta enfermedad, en función de los datos clínicos encontrados. Aunque parece tan sencillo su uso no se ha divulgado en medicina por un lado porque, hasta ahora, ha sido abordado casi exclusivamente por los epidemiólogos y, por otro lado, porque se le ha dado un excesivo énfasis a las fórmulas matemáticas sin tratar de explicar y comprender el principio lógico que está por detrás, con un lenguaje accesible para la mayoría.(7) ¿De qué manera un argumento cambia la probabilidad de una enfermedad? Esta es justamente la pregunta que se trata de resolver con el teorema de Bayes y que, en este capítulo, intentaremos explicar. Para comprender mejor vamos a partir de un ejemplo práctico. Un joven estudiante de 17 años acude a la consulta de un médico general de su confianza. Está extremadamente ansioso: hace unas horas acaba de retirar el resultado de la prueba para VIH del laboratorio de la Cruz Roja. En el papel se lee en letras mayúsculas la etiqueta REACTIVO. Él no tiene ningún síntoma. Se hizo el examen porque se lo pedían como requisito para ingreso a la Universidad. Aunque es soltero, no se considera alguien que se involucre en prácticas sexuales de riesgo. Desde hace unos meses tiene una enamorada, siempre ha tenido relaciones sexuales con preservativo y nunca ha pagado a nadie por tener sexo. Ahora quiere saber cuál es su futuro. Le pregunta al médico: ¿Cuál es la probabilidad de estar realmente infectado con VIH? En la Cruz Roja le dijeron que este resultado no necesariamente significa que tiene el virus y, que para saberlo, hacía falta repetir el examen con otro método, pero ¿Cómo se explica eso?, ¿No deberían ser siempre confiables los exámenes de laboratorio?
49
El médico no sabe bien como responder a las preguntas. Hace unas semanas asistió a un curso sobre el uso de pruebas diagnósticas para VIH y aprendió que las pruebas rápidas que actualmente se usan, tienen una sensibilidad siempre mayor a 97% y una especificidad de al menos 98%.(8) Como además ha aprendido a calcular el poder de confirmación de un test, coloca inmediatamente estos valores en una tabla de cuatro entradas y obtiene lo siguiente (Tabla 5.1): Tabla 5.1 Relación entre resultado test VIH e infección.
Efectivamente una prueba rápida para diagnóstico de VIH tiene un poder de confirmación FUERTE. En el caso de una prueba con el principio ELISA el poder de confirmación va a ser MUY FUERTE, pues tanto la sensibilidad como la especificidad están sobre 99%.(8) Entonces, ¿Cómo explicar al joven la necesidad de hacer una segunda prueba? Tomemos un segundo ejemplo, para ver lo que pasaría en otra situación. El programa nacional de VIH-SIDA decide hacer una investigación para conocer la prevalencia de infección VIH en las trabajadoras sexuales que deambulan por las calles del centro de Guayaquil. Durante una semana logran hacer un test rápido a 100 mujeres. Luego de procesar las muestras encuentran un resultado REACTIVO en tres de ellas. Asumimos que el test usado fue exactamente el mismo que en el ejemplo anterior. ¿Cuál es la probabilidad de que cada una de estas tres mujeres se encuentre realmente infectada por el VIH?
Intuitivamente todos dirán que la probabilidad es alta; pero, ¿Cómo es posible que, en el caso de las trabajadoras sexuales, estemos tan seguros de que realmente están infectadas, mientras que en el caso del joven del ejemplo anterior mantengamos aún una duda? La explicación se encuentra en el análisis del contexto al que pertenece cada una de estas personas. En el caso de las trabajadoras sexuales sabemos que están permanentemente expuestas a la infección, más aun si no se protegen con preservativos durante las relaciones. Sin temor a equivocarnos podemos decir intuitivamente que al menos 1 de cada 100 trabajadoras sexuales que deambulan por las calles de Guayaquil tienen la infección. El caso del joven es diferente: aun cuando sabemos que muchos adolescentes tienen relaciones sexuales de riesgo, el nivel de exposición al que llegan no se acerca a aquel de las trabajadoras sexuales. Si juntáramos a un grupo de 5000 adolescentes típicos de 50
Fuerza de un argumento
Quito, que más o menos corresponde a la población de estudiantes de cualquier colegio público, quizás solo 1 o 2 de ellos están infectados por el VIH, es decir 0,04%. ¡Aquí se encuentra la gran diferencia! Cualquier trabajadora sexual ya tiene una sospecha mínima de 1% de estar infectada, antes de hacer una prueba, mientras que en un adolescente típico esta sospecha inicial será solo de 0,04%. La prueba a la cual se sometieron, tanto el joven como las trabajadoras sexuales, es la misma. Su poder de confirmación no cambia, pues es intrínseco de la prueba y, como vimos antes, este poder es de 48, lo que significa que es FUERTE (Tabla 5.1). Sin embargo, el efecto provocado por esta fuerza de la prueba debe ser interpretado en función del contexto en que se encuentra cada persona en la cual ha sido aplicada. Este contexto no es otra cosa que la sospecha inicial: en el caso del joven al que le pidieron la prueba para entrar a la universidad vimos que ésta es muy baja; en el caso de las trabajadoras sexuales la situación es diferente. Si partimos de una sospecha inicial baja, la probabilidad después de la prueba será más alta, pero no tanto como cuando partimos de la sospecha inicial que tendría una trabajadora sexual. Este efecto vamos a verlo en la Figura 5.1 Figura 5.1 Efecto del mismo test en dos personas diferentes.
En el eje “y” se encuentran las probabilidades en porcentajes, pero representadas en una escala logarítmica. Cada línea representa a un sujeto. En el extremo izquierdo de cada línea se encuentra la probabilidad antes de hacer la prueba, en el extremo derecho la probabilidad obtenida después de la prueba.
Esta figura les parecerá un poco extraña. En primer lugar la probabilidad después de la prueba a la que llegamos con el joven es de apenas 2%, mientras que en el caso de la trabajadora sexual es más alta, pero aún así no llega a ser superior a 32%. En efecto, si aplicáramos la formula de Bayes a los datos que tenemos, estos serían los resultados que se obtendrían. Esto se debe a que, en el cálculo de probabilidades, el poder de una prueba es aplicado a la probabilidad que había antes de hacer dicha prueba1. El segundo aspecto que llamará la atención es la escala que está representada en el eje “y”. A continuación explicamos por qué hemos optado por usar esta escala. 1
Para los que están interesados en conocer en detalle la fórmula de Bayes sugerimos leer el apéndice, aunque esto no es indispensable para continuar la lectura del texto.
51
La escala de probabilidades En realidad se trata de una escala logarítmica1. El uso de esta escala tiene muchas ventajas de interpretación, tanto para el cálculo como para la visualización; por eso la usaremos siempre para estimar la probabilidad obtenida después de hacer una prueba en un determinado paciente. La primera ventaja consiste en que en una escala semejante los extremos están “estirados” de manera que podemos visualizar lo que ocurre en probabilidades muy bajas o muy altas. Esto no sería posible en una escala linear, pues los valores comprendidos entre 0,01 y 1 o aquellos comprendidos entre 99 y 99,99 estarían “escondidos”. En la Figura 5.2 se puede observar cómo una escala logarítmica se corresponde con una escala linear. Figura 5.2 Probabilidades en Log10 de los odds y en porcentajes
A la izquierda se encuentra la escala en logaritmos de base 10 del odds de las probabilidades.A la derecha se encuentran las correspondientes probabilidades en porcentaje. La escala logarítmica tiene un eje de simetría “cero” que corresponde a una probabilidad de 50%. Es una escala infinita tanto hacia abajo como hacia arriba.
En este tipo de escala tenemos un eje de simetría “cero” que corresponde a una probabilidad de 50%. Esta noción es muy compatible con nuestra intuición: un paciente que tiene una probabilidad de 50% de estar afectado por una enfermedad se encuentra situado en una posición neutra, en la que tiene tanto riesgo de presentar la enfermedad como de no presentarla. A partir de esta posición neutra la escala sube con valores positivos o baja con valores negativos, los cuales se miran como “en espejo”, el uno en relación al otro. La imagen en espejo de 10% será 90%, la de 1% será 99%, la de 0,1% será 99,9% y así sucesivamente. Otra característica interesante es que la escala es infinita, tanto para arriba como para abajo, lo cual también tiene su racionalidad: en una gran parte de pacientes nunca llegamos a estar absolutamente seguros de que tenga una enfermedad, así como tampoco de que no la tenga. 1
Para los interesados en conocer en detalle la escala logarítmica sugerimos leer el apéndice, tampoco esto es indispensable para continuar con la lectura del texto.
52
Fuerza de un argumento
La segunda gran ventaja de usar esta escala, que es justamente la misma razón por la que Napier inventó hace 400 años los logaritmos,(9) está en el hecho de que , en lugar de hacer las complicadas operaciones aritméticas que nos exige la fórmula de Bayes, podemos simplemente “adicionar” uno tras otro los poderes de cada prueba. Es decir con la ayuda de este dibujo ya no necesitamos hacer los cálculos, simplemente dibujamos las flechas que representan a cada argumento, desde su punto de partida. El tamaño de cada flecha se determinará por la fuerza que tenga el argumento en cuestión, tanto para confirmar como para excluir, como ya lo explicamos en el capítulo precedente.
Representación gráfica Esto todabía sigue siendo demasiado complicado. Finalmente la forma más sencilla de aplicar todo esto, y la que aconsejamos que se utilice en la práctica, es la de un gráfico. Para empezar hay que pensar en la escala logarítmica como si fueran “los pasos de una escalera”. Un argumento inútil no nos ayuda ni a avanzar ni a retroceder. Un argumento débil nos hace mover medio paso (hacia arriba si el argumento está presente, hacia abajo si está ausente). Un argumento bueno hará mover 1 paso; uno fuerte 1 paso y medio y uno muy fuerte permitirá un movimiento de 2 pasos. (Figura 5.3) Figura 5.3: Representación de los poderes en la escala
El uso de varios argumentos en serie Cuando nos aproximamos al problema clínico de un paciente en particular hacemos varias preguntas en serie. Empezamos con una anamnesis, continuamos con un examen físico, luego pedimos exámenes de laboratorio y de imágenes. Cada pregunta tiene el objetivo de hacer variar nuestra sospecha inicial. Si la respuesta es afirmativa la probabilidad de tener la enfermedad que sospechamos sube, si es negativa en cambio 53
baja. Aunque no nos damos cuenta todas estas preguntas son hechas de una manera más o menos serial, es decir una detrás de la otra. Esto es más evidente cuando pedimos exámenes complementarios: por ejemplo, frente a la sospecha de una pielonefritis empezamos con un examen elemental de orina, si encontramos signos de infección pedimos un cultivo o una ecografía renal. De hecho, este proceso es necesario en los pacientes de los ejemplos anteriores.Tanto para el joven estudiante como para las trabajadoras sexuales que tuvieron una prueba rápida reactiva para VIH es absolutamente necesario continuar la investigación con una segunda prueba. El objetivo de la investigación, sin embargo, es diferente en cada caso: es de suponer que en el joven lo más probable es que estemos ante un falso positivo, por lo tanto nos interesa hacer una segunda prueba para excluir la infección y tranquilizarlo; en el caso de las trabajadoras sexuales, en cambio, nos interesa confirmar para poder dar las recomendaciones necesarias. Supongamos que en estas dos personas hacemos un segundo test del tipo ELISA, el cual tiene un poder de confirmación de 99 - es decir MUY FUERTE - y en ambos casos obtenemos un resultado reactivo. ¿Cómo deberíamos interpretar este nuevo resultado? Con el uso de nuestra escala esto es facilísimo: simplemente dibujamos una flecha que avanza dos pasos (porque se trata de un test MUY FUERTE) partiendo desde la probabilidad obtenida después de la primera prueba. De esta manera obtenemos lo siguiente (Figura 5.4): Figura 5.4 Efecto de dos tests en serie en dos personas diferentes.
En el eje “y” se encuentran las probabilidades en porcentajes, pero representadas en una escala logarítmica. Cada línea representa a un sujeto. En el extremo izquierdo de cada línea se encuentra la probabilidad antes de hacer la prueba, en la mitad la probabilidad obtenida después de la primera prueba y en el extremo derecho la probabilidad obtenida después de la segunda prueba.
Vemos que la probabilidad final alcanzada en el caso de la trabajadora sexual ya es muy alta, cercana al 99%, mientras que en el caso del joven apenas alcanzamos una probabilidad que está alrededor de 50%. Es la misma explicación que cuando veíamos el efecto de una sola prueba: mientras más arriba se encuentre el punto de partida más alta va a ser la probabilidad alcanzada, aunque la prueba sigue teniendo el mismo poder intrínseco. El mensaje que daremos a cada paciente será distinto: al joven le recomendaremos confirmar con una tercera prueba, con la trabajadora sexual ya estamos en un nivel en el que casi le podemos asegurar que está infectada. 54
Fuerza de un argumento
Sin embargo la intuición nos dice que en el caso del joven es más probable que una segunda prueba no sea reactiva. Como dijimos antes, el objetivo principal en este caso es excluir la infección. ¿Cuál sería el efecto de un resultado no reactivo en la segunda prueba? En este caso ya no debemos tomar en cuenta el poder de confirmación de la prueba, si no su poder de exclusión. Poniendo los datos en una tabla de contingencia obtenemos lo siguiente (Tabla 5.2): Tabla 5.2. Relación entre resultado test ELISA para VIH e infección.
Una prueba con un poder de exclusión MUY FUERTE nos hace mover dos pasos, pero el movimiento ya no será hacia arriba, como cuando el resultado era positivo, si no hacia abajo. Eso sí, partiendo de la probabilidad alcanzada después de la primera prueba. El efecto lo podemos ver en la Figura 5.5, donde comprobamos que la probabilidad alcanzada por el joven después de haber tenido un resultado no reactivo en el test ELISA es incluso más baja que la que tenía antes de empezar toda la investigación. Lo mismo ocurre con la trabajadora sexual en caso de que en ella también el test ELISA resulte negativo. Figura 5.5: Efecto de dos tests en serie en dos personas diferentes.
En el eje “y” se encuentran las probabilidades en porcentajes, pero representadas en una escala logarítmica. Cada línea representa a un sujeto. En el extremo izquierdo de cada línea se encuentra la probabilidad antes de hacer la prueba, en la mitad la probabilidad obtenida después de la primera prueba y en el extremo derecho la probabilidad obtenida después de la segunda prueba
55
De esta forma vemos como toda la interpretación clínica que hacemos, cuando estamos analizando una hipótesis diagnóstica en un determinado paciente, puede ser representada gráficamente. Esto con el fin de estimar la probabilidad final alcanzada sin necesidad de fórmulas matemáticas. En la figura 5.6 se puede observar cual sería el resultado obtenido si pusiéramos en forma gráfica una serie de preguntas en una sospecha de infección por VIH. Figura 5.6: Evolución de la probabilidad con varios argumentos en serie
Otro ejemplo Consideremos el siguiente caso clínico: Una mujer shuar de 30 años de edad llega al consultorio del Hospital de Méndez, en la amazonía ecuatoriana. Se queja de tos de más de dos meses de evolución, disnea inespecífica y hemoptisis. Usted pide un BAAR de esputo pero este resulta negativo, por lo que decide hacer una Rx de tórax en la que se observa infiltrado apical.
Lo primero que sospechamos es en una tuberculosis pulmonar, por eso resulta necesario estimar la sospecha inicial, es decir, el punto de partida desde el cual vamos a interpretar todos los argumentos que esta paciente presenta. Una manera podría ser la de considerar que la sospecha inicial es la prevalencia de la tuberculosis pulmonar en la población ecuatoriana la cual, según las informaciones estadísticas, es de 5 en 10 mil. Sin embargo hay que tomar en cuenta el hecho de que las prevalencias obtenidas de las estadísticas oficiales están relacionadas con la población general del país, en la cual se encuentran más personas sanas que enfermas. Un servicio de salud, como el hospital de este ejemplo, corresponde a un contexto diferente al de la población general: las personas que acuden a un hospital lo hacen, por lo general, porque tienen algún problema de salud, por tanto ya no es una población constituida por personas sanas y, por eso, la prevalencia de todas las enfermedades, incluída la tuberculosis, es más alta. Si no disponemos de datos sobre la distribución de enfermedades en el servicio de salud en el que trabajamos, no nos queda otra alternativa que basarnos en nuestra 56
Fuerza de un argumento
experiencia. Para esto es necesario hacer un pequeño ejercicio intuitivo con la siguiente pregunta: “De los últimos 100 pacientes que he visto en este servicio de salud, ¿Cuántos han tenido tuberculosis?” Si la respuesta es 1, entonces ya sabemos que la sospecha inicial es de 1%; si la respuesta hubiera sido 5, entonces la sospecha inicial sería de 5%. En enfermedades menos frecuentes tendremos que hacer la misma pregunta sobre 1000 pacientes. Este ejercicio intuitivo necesita un cierto control mental de nuestra parte. Como seres humanos tenemos una tendencia a sobreestimar la frecuencia de algunos eventos que nos han llamado la atención, que nos han provocado una reacción emocional.(10) En los médicos este fenómeno ocurre a menudo. Por ejemplo, después de haber descubierto una colagenopatía en algún paciente, la cual ha requerido un ejercicio intelectual y reflexivo intenso, no dejamos de pensar en esa enfermedad en todos los siguientes pacientes que vemos con algún síntoma parecido; incluso hacemos de inmediato juicios tales como: “¡es sorprendente como ha aumentado la frecuencia de esta enfermedad en los últimos tiempos!” y transmitimos estas ideas a nuestros pacientes. Por eso, cuándo estimamos intuitivamente la frecuencia de una enfermedad debemos ser muy cautos controlando nuestro pensamiento. Siempre hay que tomar en cuenta un principio: las enfermedades raras son raras y su frecuencia cambia en grandes períodos, cada 10, 20 o 30 años, por ejemplo en los años 60 la obesidad era rara, ahora es más frecuente, pero esa situación no cambió de un momento al otro, ha sido el producto de varios cambios sociales ocurridos en los últimos 40 años. Es diferente el caso de las enfermedades altamente transmisibles que pueden originar una epidemia, por ejemplo la gripe, el dengue, la malaria, la diarrea, en las cuales la frecuencia puede cambiar de un mes a otro. La tuberculosis pulmonar es una enfermedad transmisible pero su velocidad de transmisión no es tan alta como la de una diarrea causada por contaminación del agua. ¡La tuberculosis no tiene brotes epidémicos! Regresando a nuestro ejemplo de la mujer shuar, podemos decir con confianza que la sospecha inicial de tener tuberculosis pulmonar, si estamos en el Hospital de Méndez, es de 1%. A esta probabilidad inicial también se la conoce como la probabilidad pretest. Hemos visto que un argumento modificará, por su poder de confirmación o de exclusión, esta probabilidad pre-test en una probabilidad post-test. Al finalizar toda la búsqueda de argumentos llegaremos a una probabilidad post-test final, o mejor dicho a una certeza. Veamos cómo evoluciona el valor de esa probabilidad. El primer argumento que la paciente de nuestro ejemplo presenta es la tos crónica. Necesitamos conocer cuál es el poder de confirmación de este argumento. Como vimos en el capítulo anterior, requerimos conocer la proporción de verdaderos positivos y falsos positivos. Intuitivamente podemos decir que 9 de cada 10 pacientes con tuberculosis presentan tos crónica, es decir que la proporción de verdaderos positivos, también conocida como sensibilidad, es de 90%. Estimar la proporción de falsos positivos es un poco más difícil. Para eso necesitamos imaginar un grupo de personas que NO tienen tuberculosis pulmonar, pero que acuden a la consulta con cualquier otra enfermedad, y preguntarnos en cuántos de ellos se encuentra también tos crónica. Supongamos 100 pacientes en un consultorio de medicina general como el del ejemplo, ¿Cuántos pacientes de éstos tienen tos crónica? Entre éstos estarán quienes tienen una bronquitis crónica, un asma, una alergia, una fibrosis pulmonar, habrá algunos fumadores, etc. A partir de aquí podemos ensayar algunas estimaciones: ¿Serán la mitad? 57
Probablemente no, a menos que nos encontremos atendiendo en un servicio de neumología; ¿Será 1 de cada 100? Tampoco, la tos crónica, incluso en la población general es más frecuente; ¿Serán 4 de cada 10? Todavía parece un poco exagerado; ¿Uno de cada 10?, ¿Tres de cada 10?, allí parece que hemos encontrado una suerte de “punto de equilibrio”: la frecuencia de tos crónica en un grupo de personas que NO tienen tuberculosis pulmonar se encuentra entre 1 de cada 10 y 3 de cada 10, es decir en 2 de cada 10, por consecuencia la tasa de falsos positivos es de 20%. Con esto ya es posible hacer el cálculo del poder de confirmación, para lo cual ponemos los valores en una tabla (Tabla 5.3) Tabla 5.3: Poder de confirmación para la tos en tuberculosis
Este argumento ya lo podemos representar en nuestra escala de certeza: dibujaremos una flecha que haga subir “medio escalón” desde la probabilidad pre-test que, como vimos antes, es de 1%, con esto llegamos a una probabilidad post-test que está alrededor de 5% (Figura 5.6). Figura 5.7: Evolución de un argumento desde la probabilidad inicial
Los siguientes argumentos tendrán que ser representados a partir de la probabilidad alcanzada con la tos crónica. En caso de estar presentes la probabilidad subirá, si en cambio están ausentes la probabilidad disminuirá. Para resumir presentamos en la Tabla 5.4 los datos necesarios para calcular los poderes de confirmación de los argumentos 58
Fuerza de un argumento
presentes y el poder de exclusión del BAAR de esputo, que es el único argumento ausente en la paciente del ejemplo. Tabla 5.4: Argumentos para tuberculosis
De esta manera se puede representar toda la evolución de la probabilidad en un solo gráfico, como sigue (Figura 5.7) Figura 5.7: Evolución de varios argumentos en serie desde la probabilidad inicial
Resumiendo, la probabilidad de base que tenía esta paciente era de 1%. Como se ve en el gráfico, a este momento lo llamamos “sala de espera”, pues es la probabilidad que tendría cualquier paciente de tener cualquier enfermedad antes de que el médico lo atienda, es decir cuando efectivamente está en la “sala de espera”. Luego de haber recogido, durante la consulta, varios argumentos (positivos y negativos) en esta misma persona, la probabilidad post-test de que ahora se encuentre afectada por esta enfermedad es de 99%: los argumentos positivos (tos, disnea inespecífica, hemoptisis y una radiografía de tórax que presenta infiltrado apical) han aumentado el valor de esta probabilidad y el argumento negativo (ausencia de BAAR en esputo) lo ha descendido. 59
La lección más importante, luego de revisar este caso, es que la paciente tiene una probabilidad bastante alta de estar enferma con tuberculosis pulmonar,A PESAR de un examen de esputo negativo para BAAR. Las implicaciones de este resultado son de una importancia enorme. Si el médico en este momento piensa que la certeza alcanzada no es suficiente para iniciar el tratamiento, la paciente podría quedarse sin recibir la atención adecuada a pesar de tener la enfermedad. Por otro lado la certeza no es del 100%, de manera que aún existe una, aunque muy pequeña, probabilidad de que tenga cualquier otra enfermedad y no tuberculosis. ¿Cuál es el nivel de certeza requerido? La respuesta solo se obtendrá después de una estimación adecuada del umbral que, como vimos en el segundo capítulo, toma en cuenta los riesgos de dejar sin tratamiento a alguien que tiene la enfermedad vs. los riesgos de tratar a alguien que no tiene la enfermedad. Para el caso de la tuberculosis podemos decir que el umbral, es decir la certeza requerida, es bastante bajo. Un estudio realizado en Ruanda mostró que es de máximo 11%,(11) por lo tanto en esta paciente el umbral ha sido superado de lejos y se puede tratar con toda seguridad, aún si su examen de esputo es negativo.
Notas adicionales Nuevas herramientas En los últimos 30 años han sido propuestas algunas herramientas que facilitan el uso del teorema de Bayes en la práctica clínica. El más conocido de todos es el nomograma de Fagan en el cual, mediante un trazo que parte de la probabilidad pre-test pasando por el poder del test, se llega a la probabilidad post-test.(12) Aunque es una herramienta muy interesante tiene algunas desventajas para su uso cotidiano en la práctica clínica. La primera desventaja es que solo se puede calcular el efecto de un test a la vez, necesitando poner varios nomogramas, uno al lado del otro, para poder observar la evolución de la probabilidad.(13) La segunda desventaja, que es quizás la más importante, es que la herramienta está basada en “likelihood ratios”, que pueden traducirse al castellano como “cocientes de probabilidad”. En realidad estos no son otra cosa que el poder de un argumento pero calculados de una forma diferente y más complicada,1 por eso requieren que el usuario tenga nociones más avanzadas de epidemiología clínica, lo que no es el caso de la mayor parte de los médicos.(7) También en los últimos años, con la expansión en el uso de computadoras de mano (más conocidas como “Handheld”, PDAs o Palm) se ha puesto a disposición de los médicos calculadoras bayesianas en las cuales es suficiente introducir la probabilidad pre-test, luego el cociente de probabilidad del test cuyo efecto se quiere conocer y se obtiene la probabilidad post-test. Estas calculadoras no han superado conceptualmente al nomograma de Fagan, por lo que siguen teniendo sus mismas desventajas. El método que hemos propuesto aquí supera estos obstáculos y, más que una herramienta física, intenta convertirse en una destreza, a la que pueda recurrirse cuando sea necesario analizar el efecto de una prueba aplicada a un paciente que se encuentra en un determinado contexto.(14)
El valor predictivo Dentro del contenido de todo curso de epidemiología siempre se insiste en la noción del Valor Predictivo Positivo y Negativo como una forma para evaluar el beneficio de 1
Para los interesados, en anexo se explica en detalle la diferencia entre likelihood ratios y poder de confirmación. No es indispensable para continuar la lectura del texto.
60
Fuerza de un argumento
una prueba. De hecho, esto no es otra cosa que la aplicación del teorema de Bayes sin embargo, en la práctica clínica, esto ha dado origen a mucha confusión. Por un lado, el valor predictivo, al ser una noción más utilizada en la epidemiología permite conocer el valor de un argumento en una población dada. Esto se aleja de las necesidades a las cuáles un médico se confronta durante la práctica clínica. Cuando éste analiza el valor de un test está más interesado en conocer el valor del mismo en un paciente en particular, no en una población. Hay que recordar que la prevalencia de una enfermedad en una población es diferente de la sospecha inicial que un paciente tiene - de padecerla - cuando se encuentra en la “sala de espera”. Cada paciente tiene su propia historia y por consecuencia su propia sospecha, la que incluso cambia según el tipo de “sala de espera” que tengamos: por ejemplo, la sospecha de insuficiencia cardiaca en la “sala de espera” de un médico general es bastante más baja que la que se encuentra en “la sala de espera” de un servicio de cardiología. Por otro lado el uso extensivo del valor predictivo en la literatura médica, para analizar el beneficio de las pruebas diagnósticas, ha dado lugar a interpretaciones erróneas que a la larga pueden perjudicar el manejo de los pacientes. En la mayor parte de estudios en los que se analiza el valor predictivo la sospecha inicial de la enfermedad ya se encuentra muy elevada, por consecuencia la probabilidad post-test siempre terminará siendo alta. Un ejemplo real de esto podemos encontrar en la interpretación de los argumentos frente a una sospecha de apendicitis. Uno de los puntajes más populares para el diagnóstico de esta enfermedad es el score de Alvarado. Según el artículo original de este estudio el valor predictivo positivo de todos los argumentos incluidos en el score es superior al 90%.(15) Un metanálisis más reciente, que en lugar de analizar el valor predictivo positivo usa los cocientes de probabilidad, revela que en realidad todos estos argumentos son débiles.(16) El error de interpretación se da porque en la población de origen del estudio de Alvarado la sospecha inicial de apendicitis ya era bastante alta.
La exactitud de los datos A menudo nuestro método es criticado porque basamos la estimación de probabilidades en muchos datos intuitivos. Se dice que: “si se calcula con basura se obtiene basura”. Sin embargo esto no es tan cierto. Se podría decir que la situación ideal sería que la estimación de sensibilidad y especificidad de todos los datos clínicos estuviera basada en estudios realizados con una metodología apropiada. Lamentablemente ese no es el caso, pero tampoco es algo imprescindible. Por un lado existe una ausencia casi absoluta de estudios que evalúen la sensibilidad y la especificidad de los síntomas y signos de las diferentes enfermedades. Esto debido a que hay poco interés en hacerlo pero también a que la organización de este tipo de investigaciones no es tan fácil. Por otro lado el trabajo de un médico clínico se desarrolla en una diversidad de contextos epidemiológicos, cada uno con una frecuencia diferente de enfermedades, lo que trae como consecuencia que las tasas de falsos positivos cambian de un sitio a otro. Esto implica que la estimación de la fuerza de un test y de la frecuencia de enfermedades tiene que, necesariamente, ser un análisis intuitivo que cada médico realiza para el contexto en el cual ejerce sus actividades. Por último hay que señalar que, al usar un método de representación en categorías de poder, las pequeñas variaciones que se pueden encontrar en los porcentajes de sensibilidad y especificidad afectan muy poco el resultado final, tanto para la estimación de la fuerza de un test como para el cálculo de probabilidades. 61
Conclusión Ni la sensibilidad y ni la especificidad, por sí solas, nos permiten conocer la fuerza de un argumento. Es mediante la combinación de ambas, midiendo el equilibrio (o desequilibrio) entre verdaderos y falsos que podemos estimar el aporte que un argumento puede tener en nuestra sospecha diagnóstica. Usando el teorema de Bayes, esta fuerza puede ser aplicada directamente en la prevalencia o la sospecha inicial. Las fuerzas de una serie de argumentos nos ayudan, de esta forma, a llegar a una probabilidad final. Desafortunadamente las fórmulas que se encuentran por detrás del teorema de Bayes son excesivamente complejas, lo que dificulta su aplicación en la práctica clínica de todos los días. La representación gráfica de las fuerzas de un argumento, en una escala de certeza logarítmica, facilita la aplicación del teorema de Bayes y permite visualizar el efecto que se obtiene luego de varios argumentos en serie. El valor predictivo es una noción utilizada en epidemiología: de hecho no da el valor de un argumento, sino el valor de un argumento en una población dada, lo que no se aplica en clínica, donde cada paciente tiene su propia historia, y por consecuencia, su propia sospecha. El uso de estimaciones intuitivas, cuando éstas son hechas de una manera objetiva, es muy fiable y apropiado para la situación de trabajo de un clínico.
62
Fuerza de un argumento
Referencias (1) (2) (3) (4) (5) (6) (7) (8) (9) (10) (11) (12) (13) (14)
(15) (16)
Sackett D, Haynes R, Guyatt GH, Tugwell P. Clinical Epidemiology: a basic science for clinical medicine. 2 ed. Boston: Little, Brown and Company; 1991. Sackett DL, Rosenberg WM. On the need for evidence-based medicine. J Public Health Med 1995 Sep;17(3):330-4. Bayes T. An Essay Toward Solving a Problem in the Doctrine of Chances. Philosophical Transactions of the Royal Society of London 1764;53:370-418. Good I.J. Studies in the history of probability and statistics XXXVIII. AM Turing's statistical work in world war II. Biometrika 1979;66:393-6. Wiggins C.What is Bayes' theorem, and how it can be used to assign probabilities to questions such as the existence of God? What scientific value does it have? Scientific American . 4-12-2006. Ledley RS, Lusted LB. Reasoning foundations of medical diagnosis; symbolic logic, probability, and value theory aid our understanding of how physicians reason. Science 1959 Jul 3;130(3366):9-21. Van den Ende J, Moreira J, Basinga P, Bisoffi Z.The trouble with likelihood ratios. Lancet 2005 Aug 13;366(9485):548. Ferreira Junior OC, Ferreira C, Riedel M,Widolin MR, Barbosa-Junior A. Evaluation of rapid tests for anti-HIV detection in Brazil. AIDS 2005 Oct;19 Suppl 4:S70-S75. Stoll C. When slide rules ruled. Scientific American 294[5], 69-75. 2006. Eddy DM. Probabilistic reasoning in clinical medicine: Problems and opportunities. In: Kahneman D, Slovic P, Tversky A, editors. Judgement under uncertainty: Heuristics and Biases.Cambridge: Cambridge University Press; 1982. Basinga P, Moreira J, Bisoffi Z, Bisig B,Van den Ende J. Why Are Clinicians Reluctant to Treat Smear-Negative Tuberculosis? An Inquiry about Treatment Thresholds in Rwanda. Med Decis Making 2007 Jan;27(1):53-60. Fagan TJ. Letter: Nomogram for Bayes theorem. N Engl J Med 1975 Jul 31;293(5):257. Grimes DA, Schulz KF. Refining clinical diagnosis with likelihood ratios. Lancet 2005 Apr 23;365(9469):1500-5. Van den Ende J, Bisoffi Z,Van Puymbroek H,Van der Stuyft P,Van Gompel A, Derese A, et al. Bridging the gap between clinical practice and diagnostic clinical epidemiology: pilot experiences with a didactic model based on a logarithmic scale. J Eval Clin Pract 2007 Jun;13(3):374-80. Alvarado A. A practical score for the early diagnosis of acute appendicitis. Ann Emerg Med 1986 May;15(5):557-64. Andersson RE. Meta-analysis of the clinical and laboratory diagnosis of appendicitis. Br J Surg 2004 Jan;91(1):28-37.
63
6 El Panorama: Análisis del Razonamiento Clínico Complejo 1.1 Introducción En contraste con la abundancia de literatura que se escribe sobre terapéutica y sobre el desarrollo de métodos para el diagnóstico, muy poco se ha escrito sobre las bases que guían el razonamiento clínico. Recién a finales de los setenta Kassirer empezó, en su serie “clinical problem solving” que hasta ahora se publica periódicamente en el New England Journal of Medicine, a realizar algunos ensayos en ese sentido.(1) Contemporáneamente un grupo importante de psicólogos cognitivos también comenzó a desarrollar algunos experimentos en ese campo, coincidiendo con el advenimiento del computador personal, el cual nos incitó a analizar la lógica humana con el fin de imitarla electrónicamente.(2-4) A pesar de eso, hasta la fecha, no existen resultados concretos que permitan generalizar recomendaciones que puedan ser integradas en la práctica clínica de todos los días y en la enseñanza médica. Podríamos preguntarnos porqué esto ha sido así. La principal razón, y mas bien un pretexto, parece ser una mezcla de respeto por el secreto médico y de veneración de la intuición. Todos experimentamos una resistencia considerable cuando hay que violar la intimidad de una consulta, la intimidad de parte del paciente, que quiere proteger sus datos, y la intimidad por parte del médico que mira a sus contactos y sus análisis como sagrados. Todos somos reticentes a hacer analizar nuestra intuición. Es por eso que las reservas mencionadas debilitan substancialmente a los ejercicios clínicos. Involucrarse en la vida privada de un paciente, y esto delante del público es a menudo visto como un problema ético. El lazo entre estas dos reservas no es tan fácil de comprender. No hay ningún obstáculo ético para que nuestra intuición sea disecada, formalizada y mejorada. Lamentablemente los métodos para hacerlo todavía están poco desarrollados y quizás, seguir insistiendo en eso, no sea tan importante. La competencia del médico está basada en su conocimiento y en un saber-hacer. Está comprobado que existe poca diferencia entre los conocimientos que moviliza por una parte un clínico y por otra parte un estudiante. La diferencia se encuentra en la utilización de la información : un clínico experimentado utiliza la información con una lógica más elaborada, más fina.(2, 3) La lógica probabilística, con el uso del análisis bayesiano que explicamos en el capítulo anterior, aborda solo una pequeña parte del razonamiento clínico, que es la relación entre una enfermedad y un argumento, y luego entre una enfermedad y varios argumentos. El problema es que en la vida real debemos encontrar relaciones entre una multitud de enfermedades y argumentos, por lo cual el desafío es mucho mayor. ¿Cómo podemos abrirnos un camino en este tipo de situaciones? En los últimos 30 años la OMS y la OPS han invertido muchos recursos en la construcción de algoritmos, los que han estado principalmente dirigidos para el primer nivel 65
de atención. El ejemplo más conocido es el de los algoritmos para la Atención Integrada de las Enfermedades Prevalentes de la Infancia (AIEPI).(4) La idea era de poder ayudar a los agentes de salud comunitarios (promotores de salud y auxiliares de enfermería) que trabajan en zonas con poca accesibilidad a tener una lógica fija que les permita solucionar problemas médicos urgentes, principalmente relacionados con la referencia oportuna de casos graves a un nivel de atención mayor. Más tarde esta lógica algorítmica se trasladó a varios textos de medicina y a varias líneas guías relacionadas con el manejo de problemas complejos. Lo sorprendente es que son muy raros los clínicos con experiencia que actúan siguiendo algoritmos establecidos y esto puede tener varias explicaciones. La primera podría ser que, contrariamente a la estructura de un algoritmo que es esencialmente serial, el razonamiento humano utiliza sobre todo pasos paralelos, cuya lógica compleja es difícil de entender. Este razonamiento paralelo permite hacer el "reconocimiento de un patrón", actividad para la cual el cerebro humano es muy bueno.(5, 6) La segunda podría estar relacionada con la ponderación de los estímulos. Contrariamente a los transistores de una computadora, las neuronas reaccionan de manera ponderada y analógica1; un transistor toma una decisión digital, dicotómica. Un transistor puede captar y emitir una sola palabra, o mensaje: “si” o “no”, “+” o “-“. En cambio, las neuronas pueden captar mensajes intermedios, como “un poco”, “mucho” etc., y enviar una respuesta también “ponderada”, como “estamos mas o menos convencidos que…”. En lenguaje de computadora la última frase sería redondeada en un sencillo “si”, que es totalmente diferente y mucho menos rico. Finalmente la tercera explicación tiene que ver con el sentido común que tiene un médico, el cual está basado en el conocimiento y la experiencia. Un clínico experimentado puede darse cuenta en unos pocos minutos que las restricciones que impone un razonamiento algorítmico pueden tener consecuencias importantes en el manejo de un paciente, por lo tanto prefiere no seguirlo. En el enfoque algorítmico el razonamiento intuitivo, paralelo y analógico, es traducido en un enfoque serial y dicotómico, de complejidad variable (Fig. 6.1 y 6.2). Este enfoque es perfecto para una computadora, para delegar tareas simples a personal menos calificado, y para la solución de problemas bien delimitados.
1
Por analógico nos referimos a que a cada estímulo se le da el valor real de la magnitud que se quiere transmitir.
66
El panorama
Figura 6.1 Algoritmo en escalera
La debilidad de los algoritmos es fácil de mostrar: de acuerdo a la figura 6.1, en un paciente con una neumonía, que no presenta fiebre, ¡el diagnostico no será hecho! El algoritmo presentado en la figura 6.2 es un poco más complejo; sin embargo eso no lo hace más eficaz. Figura 6.2 Algoritmo complejo
67
También en este algoritmo el razonamiento es demasiado ingenuo: el paciente no puede tener una febricula, tampoco puede tener bocio y fiebre al mismo tiempo, etc. Estas representaciones algorítmicas no representan la lógica intuitiva del médico, y por consecuencia es obvio que en un cierto momento van a ser rechazadas. Quizás algunos algoritmos que indican el camino para la realización de tareas o intervenciones específicas puedan ser más útiles como recordatorios. De hecho, muchos médicos dicen que no siguen los algoritmos de forma rígida pero que, sin embargo, los usan como una plantilla de control para verificar que todo lo que está previsto ha sido hecho. Por estas razones en este libro proponemos otra forma de representar nuestra lógica diagnóstica. Al igual que los algoritmos, esta lógica está basada en el análisis de un argumento clave como se hace en el diagnóstico diferencial clásico. Sin embargo, en lugar de emplear las ramas que tiene un algoritmo la representamos como un “panorama”. A partir del argumento clave se puede hacer un recorrido visual de todas las enfermedades prioritarias siguiendo un razonamiento paralelo y analógico(Figura 6.3). (7) Figura 6.3 Panorama
El volcán que está en el centro representa el síntoma clave. Las colinas alrededor del volcán representan las enfermedades prioritarias que estamos obligados a confirmar y/o excluir, mientras que las que se encuentran más alejadas son las enfermedades menos prioritarias.
Las leyes Las leyes para construir un panorama son muy pocas, pero hay que tomarlas siempre en cuenta. Estas pueden ser deducidas a partir de una serie de errores o sesgos en el razonamiento diagnóstico. El espectro de enfermedades: En los libros de medicina interna el espectro de enfermedades consideradas en el diagnóstico diferencial de ciertos síntomas clave suele ser exhaustivo y, por eso, se hace difícil de manejar. La mayoría de médicos no nos acordamos, por ejemplo, de todas las enfermedades que están dentro del diagnóstico dife68
El panorama
rencial de fiebre. Por eso, al hacer nuestro espectro mental nos contentamos con incluir solo las enfermedades más frecuentes. Aunque ésta parecería ser una estrategia muy eficiente tiene una trampa: Hay ciertas enfermedades que son poco frecuentes pero que pueden traer consecuencias fatales para el enfermo. Si además estas son susceptibles de ser controladas por una intervención médica, por ejemplo con un antibiótico o una cirugía, el error de haberlas pasado por alto es imperdonable. Un ejemplo es la meningitis. Esta no es una enfermedad frecuente sin embargo, si no se trata a tiempo, puede ser fatal y, además, es fácilmente tratable. No es raro escuchar historias de niños que han muerto o han quedado severamente discapacitados porque, a raíz de un episodio de fiebre, el médico no sospechó y no trató a tiempo una posible meningitis. Por otro lado hay enfermedades que, aunque son muy frecuentes, no amenazan la vida de la persona y-o no tienen un tratamiento específico. El ejemplo más típico de estas últimas es la gripe: es la enfermedad más común y aunque puede ser muy molestoso para un paciente tener goteo nasal, fiebre, dolor muscular, cefalea, estos síntomas desaparecen en algunos días sin necesidad de tratamiento específico y, en la mayoría de los casos, sin amenazar la vida del enfermo o dejar secuelas graves. Por esta razón al construir el espectro de enfermedades en un panorama, si bien hay que ser eficiente, no hay que caer en la trampa de considerar únicamente lo más frecuente: Hay que acordarse de todo lo que puede afectar gravemente al paciente y que además sea susceptible de tratamiento. Evitar la imagen congelada: Hay que cuidarse del efecto típicamente humano de "imagen congelada", que consiste en una perdida relativa del ánimo para seguir buscando otras alternativas una vez que una solución plausible ha sido identificada. Un clínico ideal debería probar consecutivamente una serie de patologías que podrían corresponder al caso que tiene frente a él: la realidad nos enseña que esto no siempre sucede así. Existe la tendencia a detenerse ante la primera patología plausible, congruente, olvidándose de las otras hipótesis en juego. Este fenómeno es compatible con el término "imagen congelada" que se utiliza en ecografía, cuando el imagenólogo inmoviliza la imagen actual para estudiarla mejor o para fotografiarla, dejando a un lado el resto. Cada uno de nosotros sabe que este error es más que cierto y también podría llamárselo “razonamiento en túnel” o “sesgo de confirmación”.(8) El sesgo de confirmación consiste en la tendencia a buscar información que confirme el diagnóstico que ya ha sido escogido, interpretando todos los datos en ese sentido, sin buscar otras hipótesis plausibles. La ley que se infiere de este error es que, ante un espectro de enfermedades incluidas en el panorama, el clínico no solo debe tratar de confirmar una de ellas, si no que tiene que excluir todas las que pueden afectar gravemente al enfermo y son susceptibles de tratamiento. Solo cuando todas estas enfermedades prioritarias hayan sido excluidas puede pensar en otras menos graves y-o sin tratamiento. Más de una enfermedad: Siempre es posible que un paciente esté afectado por más de una sola enfermedad. Muchos clínicos piensan que un argumento favorable para una enfermedad disminuye la probabilidad de otras enfermedades. Aunque esto puede ser correcto desde el punto de vista probabilístico únicamente sería válido cuando tenemos la seguridad de que el paciente está afectado por una sola enfermedad a la vez, es decir cuando las enfermedades son mutuamente exclusivas, lo que nunca es cierto.
69
Evitar el fenómeno del basurero: siguiendo la misma lógica de creer que al excluir varias hipótesis (echándolas al basurero) aumentamos la probabilidad de una enfermedad caemos otra trampa. La enfermedad que queda podría necesitar más evidencia antes de iniciar una acción médica, lo que en otras palabras quiere decir que tiene un umbral de decisión más alto, el cual no ha sido aún alcanzado. En clínica no podemos contentarnos solamente con excluir. También hay que probar, teniendo en mente el principio del umbral de decisión.
El inventario de datos ¿Cómo utilizar estas leyes en la práctica? ¿Hay que buscar siempre todas las enfermedades posibles? ¿Hay que continuar eternamente después de haber encontrado una causa muy probable? Un análisis complejo no es una empresa que se debe poner en marcha ante cualquier situación clínica: muchos pacientes se presentan con un problema simple, o evidente, o se presentan para un seguimiento. Un análisis complejo se impone solamente si estamos ante un signo o un síntoma que sugiere al menos una patología grave, que podría estar escondida detrás de una patología común y banal. Parte de la competencia de un médico consiste exactamente en distinguir entre situaciones peligrosas y “tranquilas”: a menudo, una consulta empieza con definir el síntoma de entrada, y con “pesar” este síntoma. Una hemoptisis pasajera en un paciente que tiene todos los síntomas de una gripe no necesita un análisis complejo; una hemoptisis en un paciente que se queja de tos desde hace dos meses es otra cosa. Describimos un análisis complejo en 5 pasos. Los 3 primeros siguen más o menos el mismo método que la generación de hipótesis clásica. El paso de "los puntos nodales" ha sido aumentado para fundir mejor los diagnósticos, evitando conclusiones demasiado simplistas, y para poner en marcha la discusión de los argumentos "confusores". El paso "prioridades" ha sido insertado a causa del efecto "imagen congelada".
La lista de los diagnósticos diferenciales. Ante un síntoma dado, una serie de causas probables aparecen espontáneamente en nuestra mente. Esta serie no es exhaustiva, pero debería incluir las enfermedades en las cuales una intervención médica es necesaria: enfermedades graves y tratables. Además incluiremos las causas más frecuentes. No hay ninguna lógica detrás de esta lista: está basada en asociaciones espontaneas que hace nuestra mente. El razonamiento humano con frecuencia echa mano de ciertas estrategias que le permiten estimar la frecuencia de un evento en situaciones de incertidumbre. Estas estrategias han sido descritas por los psicólogos cognitivos como la heurística de representatividad y la heurística de disponibilidad.(8) La heurística es una capacidad típica del ser humano para buscar la solución de un problema mediante métodos no rigurosos. Podría definirse como el arte y la ciencia del descubrimiento y de la invención, resolviendo problemas mediante la creatividad y el pensamiento lateral. La heurística de representatividad consiste en hacer la asociación de lo que observamos con un estereotipo que ya tenemos preconcebido; por ejemplo: ante una tos crónica con hemoptisis y disminución de peso asociamos de inmediato una tuberculosis pulmonar. La heu70
El panorama
rística de disponibilidad, en cambio, consiste en asociar lo que se observa con una situación que se nos viene a la mente con facilidad al habernos causado, en el pasado, emotividad; por ejemplo: uno de los autores cuenta que, cada vez que ve un niño con fiebre, se le viene a la mente aquel niño que examinó hace muchos años, en quien no sospechó una leucemia, probándose más tarde que tenía la enfermedad. Si bien estas estrategias pueden servir como pistas que ayudan en la construcción del espectro de enfermedades, a menudo pueden engendrar un sesgo peligroso al no tomar en cuenta la frecuencia de las enfermedades y la contribución real de los argumentos.(9) Es necesario tener mucho cuidado con estas estrategias propias del razonamiento humano y considerar siempre algunas leyes básicas de probabilidades.
Fisiopatología del síntoma o del signo. Otra forma de llegar a la lista de causas podría ser un enfoque del tipo causa - efecto, en el que se analicen la naturaleza del síntoma o del signo y las formas como estos podrían producirse. En realidad, el paso 1 y 2 son complementarios: el momento en el cual las asociaciones espontáneas han sido agotadas, el paso 2 permite re-encontrar familias o capítulos enteros (en caso de ictericia, todas las ictericias hemolíticas; en caso de vómitos, las patologías cerebrales). El primer enfoque se parece más a la forma realista de llegar al diagnóstico, el segundo enfoque a la forma académica. Como ya lo hemos dicho, en la práctica los dos son complementarios. Es importante subrayar que el enfoque fisiopatológico solo lo utilizamos aquí para completar la lista de causas.
El inventario y el análisis del peso de los argumentos Para cada diagnóstico posible, se investigarán los síntomas y signos clave (los argumentos). De nuevo, no tiene sentido una enumeración exhaustiva. Lo que nos interesa son los argumentos con un fuerte poder de confirmación y/o de exclusión. Las petequias son raras en caso de meningitis, pero si están presentes, tienen un fuerte poder de confirmación, por lo tanto es muy importante investigar este signo. Al contrario, el poder de confirmación y de exclusión que tiene el estreñimiento para una hepatitis es bajo, por tanto no será necesario incluirlo dentro de nuestra lista de argumentos a investigar ante tal sospecha.1 También es importante buscar los argumentos con un fuerte poder de exclusión: estos permitirán descartar muy rápido una serie de hipótesis. Muchos de estos argumentos son simples preguntas de anamnesis y examen físico que hacemos rutinariamente. Por ejemplo, estamos en Quito (2800 m. de altitud, no hay transmisión de malaria) y atendemos a un paciente con fiebre. Le preguntamos si ha viajado a la costa o a la amazonía en los últimos seis meses. Si el paciente dice que no ha viajado a la costa hemos excluido inmediatamente una malaria y no necesitamos seguir investigando más en esa dirección. Esta estrategia no funciona si estamos atendiendo al mismo paciente en una ciudad de la costa o de la amazonía (hay transmisión de malaria): allí no hace falta preguntar si ha viajado a una zona endémica, pues ya está allí, por eso estamos obligados 1
... pero en asociación con fiebre e ictericia, puede significar el inicio de una hepatitis, y en combinación con fiebre y leucopenia, sugiere una fiebre tifoidea. Estos argumentos débiles podrán ser usados más tarde en la corroboración de nuestra sospecha diagnóstica.
71
a pedir un examen de Plasmodium en gota gruesa de sangre, si esta es negativa habremos excluido el diagnóstico, pues el poder de exclusión es fuerte.
Los puntos nodales En la lista de los signos y de los síntomas, se busca los argumentos comunes a varias enfermedades. Estos elementos constituirán los puntos nodales del camino lógico. Desde el punto de vista teórico, estos pasos son extremadamente importantes para la construcción de un “marco de trabajo” virtual, crucial en el “reconocimiento de un patrón”. Los puntos nodales sirven igualmente de pivote para la discusión de los elementos confusores en el diagnóstico, es decir de los signos y síntomas comunes que son considerados como “trampas” en el diagnóstico diferencial clásico.
Definición de las prioridades Muy a menudo, el clínico piensa primero en las enfermedades más comunes. Esto en cierto modo tiene sentido, sin embargo también puede inducir a cometer errores. Por ejemplo, algunas normas de manejo de la fiebre, en áreas donde existe transmisión de malaria dicen: "ante toda fiebre, piense primero en malaria". El problema es que el médico sin experiencia, para quien esta estrategia habría sido concebida, puede olvidarse de que existen otros problemas menos frecuentes, pero tan o más graves que la malaria, como la meningitis. Esto es más peligroso aún si se considera que, para esta última, el pronóstico depende del inicio temprano de un tratamiento antibiótico. Como lo señalamos más arriba, a este efecto lo llamamos “imagen congelada” e induce a un “sesgo de confirmación”.Toda estrategia diagnostica debe incluir reglas que eviten esta “imagen congelada" sobre una enfermedad plausible que esconde otra enfermedad más grave. Es por eso que algunas prioridades deben ser determinadas antes de iniciar la construcción de cualquier representación gráfica. Pensar en la gravedad, la urgencia y la vulnerabilidad (del problema) es la clave para evitar este error. En la práctica, estos tres parámetros pueden ser reducidos a dos, combinando la gravedad y la urgencia. La patología urgente siempre es grave, y en los panoramas, el factor tiempo no juega ningún rol. Los diferentes diagnósticos deben ser evaluados de acuerdo a su gravedad y su vulnerabilidad (en el terreno de trabajo) y, en caso de empate, la frecuencia (prevalencia) puede constituir el criterio dirimente.
La construcción del panorama ¿Cómo representar el trabajo hecho hasta ahora en un esquema utilizable? La construcción de una representación gráfica, de un “marco de trabajo” sigue leyes muy precisas. Subrayemos antes que todo, que nuestro ejercicio tiene una lógica exclusivamente diagnóstica, aunque en la práctica, algunas medidas terapéuticas más o menos urgentes ya son incorporadas en el manejo del paciente. Esto se hace especialmente para 72
El panorama
las medidas de soporte vital: en un paciente con diarrea siempre iniciaremos una hidratación sin importar cual es la causa de la diarrea. De ser necesario esta se investigará más tarde. Ha sido probado que la mayoría de los clínicos nunca separa estos dos aspectos, y que consideran las elecciones terapéuticas de forma temprana en su encuentro con el paciente. El análisis presentado aquí solo concierne a los pasos lógicos en la investigación de un diagnóstico. Lo que proponemos es una representación gráfica paralela y ponderada, que hemos llamado “el panorama diagnóstico”, considerando que tiene la forma del cuadro de un panorama, donde podemos ver un volcán en el centro que representan el síntoma clave, algunas colinas que rodean a este volcán, que representan a las enfermedades prioritarias, y otras colinas más alejadas que representan las enfermedades menos prioritarias. Las colinas pueden estar rodeadas de arboles que representan los argumentos.(Figura 6.3) La construcción del panorama equivale a poner en una suerte de mapa las enfermedades que van a ser objeto de análisis y los argumentos que van a servir para discernir entre las diferentes enfermedades, en otras palabras se necesita ubicar en este mapa a las colinas y los árboles que estarán rodeando al argumento clave.
El argumento clave El panorama diagnostico debe partir de un síntoma o signo clave, sin embargo el panorama depende del contexto para el cuál va a ser diseñado. No es muy útil hacer un panorama diagnostico sobre un problema genérico, por ejemplo “fiebre”. La lista de enfermedades en este panorama va a ser demasiado extensa y difícil de manejar. Es mejor hacer algunas especificaciones sobre el grupo poblacional y el escenario de trabajo en el cual el panorama debe ser aplicado, por ejemplo “fiebre en el niño en un hospital provincial de la costa ecuatoriana”. De esta forma el panorama tendrá una aplicación práctica inmediata.También se puede hacer un panorama para una situación clínica particular, por ejemplo “cefalea en el paciente VIH positivo”. Es importante que el argumento o problema clave genere una serie de hipótesis entre las cuales se encuentren algunas enfermedades graves y tratables, pues es justamente para este tipo de situaciones en donde este ejercicio de razonamiento se vuelve más útil.
Las colinas Las colinas del panorama van a corresponder a las enfermedades que hemos considerado importantes para analizar ante la presencia del argumento o problema clave. Regresando al paso 5 de nuestro inventario de datos, es decir a la definición de prioridades, durante la cual clasificamos a las enfermedades en dos grupos, las graves y tratables y las menos graves o no tratables, hacemos dos círculos concéntricos de colinas. El círculo interno representa las patologías graves y tratables: un buen clínico siempre hará una búsqueda de todas estas patologías aún si, desde el comienzo, una sola patología le parece la más probable. En el círculo externo estarán las otras enfermedades menos graves o no tratables. Esto 73
no quiere decir que estas enfermedades son de menor importancia para el paciente. Simplemente son enfermedades cuyo tratamiento puede esperar o para las cuales da lo mismo esperar un poco, pues no hay mucho que ofrecer, aparte de medidas paliativas. En el círculo externo a veces se encuentran algunas enfermedades frecuentes. Por ejemplo en un panorama para la “fiebre en el niño” se encontrará la gripe. En casi cualquier contexto lo más probable es que un niño con fiebre tenga solamente una gripe, sin embargo para la gripe no tenemos ninguna intervención eficaz. Lo único que podemos hacer es reducir las molestias y evitar que la temperatura suba excesivamente provocando convulsiones. Por esa razón la gripe, como causa de fiebre en un niño, no necesitará mayor investigación, por lo tanto se la ubica en el segundo círculo. Esto significa que solamente se la tomará en cuenta cuando todas las enfermedades del círculo interno hayan sido excluidas. También en el círculo externo se encontrarán enfermedades graves, muchas veces mortales, pero para las cuales no hay ningún tratamiento. Por ejemplo en el panorama para “tos crónica en un adulto” se encontrará el cáncer de pulmón. El diagnóstico de cáncer de pulmón es muy importante para el paciente, por las consecuencias fatales que va a tener. Es nuestro deber asegurar de que, en caso de que ese sea el diagnóstico, se hagan todas las investigaciones necesarias para confirmar el mismo de manera que el paciente y la familia sean adecuadamente informados, sin embargo esta investigación solo se hará cuando las enfermedades del primer círculo hayan sido excluidas. En cambio en el círculo interno a veces nos vamos a encontrar con enfermedades poco frecuentes, pero para las cuales es importante actuar rápidamente. En el panorama para “ictericia en un adulto” una de las hipótesis será una leptospirosis. Esta es una enfermedad infecciosa poco frecuente en la población general, aunque puede haber situaciones sanitarias especiales en las cuales muchas personas pueden contagiarse. El hecho de que la leptospirosis sea una enfermedad con consecuencias graves si no se trata y que, además, sea fácilmente tratable hace que tenga que estar en el primer circulo. Una hepatitis viral es siempre más probable, pero para esta no hay mucho que hacer, por lo tanto se la pondrá en el circulo externo. Este enfoque constituye un cambio de paradigma en la forma de analizar un problema clínico. La gravedad y la vulnerabilidad de las enfermedades son el criterio de priorización más importante, mientras que la frecuencia será tomada en cuenta luego, cuando lo urgente y tratable haya sido excluido para definir cual es finalmente la enfermedad más probable. Este enfoque es compatible con la teoría del umbral de decisión, que abordamos en el segundo capítulo. De hecho, las enfermedades del círculo interno son justamente las que tienen un umbral bajo. Resumiendo, en el panorama las enfermedades graves y tratables irán en el círculo interno de colinas, mientras que las menos graves o poco tratables irán en el círculo externo, sin tomar en consideración la frecuencia.
Los árboles Para poder diferenciar entre una y otra patología nos servimos de los síntomas, signos, exámenes de laboratorio e imágenes, es decir de los argumentos. Estos son los pun74
El panorama
tos nodales de nuestro camino lógico y la eficacia y eficiencia que tengamos como clínicos depende de una adecuada selección de los mismos: ¡el buen clínico es el que sabe exactamente cuáles son las preguntas que se deben hacer! En el panorama estos puntos nodales - argumentos están representados por los árboles que “adornan” las colinas. El grupo de árboles (argumentos) más importante es el que se encuentra al interior del círculo interno de patologías. Estos argumentos son cruciales porque nos deben permitir confirmar y-o excluir todas y cada una de las patologías que se encuentran en el círculo interno, es decir las que hemos considerado prioritarias. Constituyen los argumentos que obligatoriamente debemos preguntar-pedir a todo paciente que se presente con el síntoma clave. Esto tiene implicaciones muy importantes para el paciente, para los servicios de salud y para la docencia. Por lo general este grupo de argumentos está compuesto por preguntas de anamnesis y examen físico que hacemos rutinariamente. En términos de costos podríamos decir que estas preguntas no tienen ninguna consecuencia, pues hacer una palpación o una auscultación no cuesta nada, pero podría darse el caso que tengamos que hacer una maniobra que cause molestia al paciente, por ejemplo un tacto vaginal o un tacto rectal. La implicación de incluir una de estas maniobras de examen físico en el grupo de argumentos que se encuentran al interior del círculo interno es que: “en todo paciente que se presente con el síntoma clave en cuestión tendríamos la obligación de hacerla”. En el caso de los exámenes de laboratorio o de imágenes hay otras consecuencias. Por un lado está el costo del examen y por otro está el posible riesgo del mismo. Si, por ejemplo, decidimos que en un determinado panorama debemos incluir al interior del círculo interno una tomografía axial contrastada, la implicación es que: “todo paciente que se presente con este síntoma clave deberá asumir el costo y los riesgos de la tomografía axial contrastada”. Incluso, si el paciente está afiliado a un sistema de seguros, debería ser la aseguradora la que tendría -por razones éticas - que asumir el costo del examen. Por esa razón la selección de los argumentos - puntos nodales que se encuentran al interior del círculo interno debe ser hecha con mucha precisión. Los criterios que debemos tomar en cuenta para escoger estos argumentos son el poder de confirmación y el poder de exclusión. Se dará preferencia a aquellos que tengan el más alto poder de confirmación y-o de exclusión y que ayuden a discriminar bien entre una y otra patología. Si se da el caso de que uno de estos argumentos es un examen que tiene costo y-o que tiene riesgo o causa molestias al paciente debemos reflexionar muy bien si vale la pena incluirlo al interior del círculo o, si más bien, lo dejamos fuera del círculo para tomarlo en cuenta más tarde cuando todas las demás patologías del círculo interno hayan sido excluidas. Hay que comprender muy bien que no está prohibido poner un examen de laboratorio o de imágenes al interior del círculo interno, pero si lo hacemos tenemos que justificar la razón: el costo o el riesgo de dicho examen debe tener menos peso que el daño que podríamos provocar al dejar de hacerlo. Sobretodo hay que considerar que la implicación será que, si el examen se encuentra al interior del círculo interno, va a tener que ser realizado a todo paciente que se presente con el argumento clave.
75
Un segundo grupo importante de árboles son aquellos que se encuentran al exterior del círculo interno. Estos son los argumentos que vamos a emplear en un segundo momento del análisis diagnóstico cuando todas, excepto una de las patologías del círculo interno hayan sido excluidas. Estos argumentos nos servirán para confirmar aquella que no ha sido excluida. Finalmente quedan los árboles más periféricos, aquellos que servirán para confirmar yo excluir las patologías del círculo externo. A manera de ejemplo, retomamos aquí los pasos a seguir ante un problema difícil de resolver: la ascitis en el adulto.
Ejemplo de panorama: ascitis en un adulto. Las patologías Si estamos ante un caso de ascitis (en un adulto), pensamos inmediatamente en una serie más o menos larga de patologías: • • • • • •
Descompensación cardíaca Beriberi Cirrosis Estadio terminal de una fibrosis Una ascitis falsa: sangre en el peritoneo: ruptura del bazo, embarazo extra-uterino. Tuberculosis peritoneal
Luego de un análisis más profundo, algunas enfermedades más raras se añaden: • • • •
Metastasis o carcinomatosis peritoneales Sindrome nefrótico Pericarditis Enfermedad veno-oclusiva1
La fisiopatología En forma paralela a la investigación de las causas, nos acordamos de la fisiopatología del síntoma o del signo, lo que nos ayuda aún más a encontrar otras causas, o a poner en orden las que ya tenemos. En este caso, la fisiopatología es esencialmente la del equilibrio de Starling que gobierna toda formación de edema. •
La presión en aumento de los capilares no juega ningún papel, conociendo que los esfínteres de las arteriolas siempre son competentes.
•
La permeabilidad de las paredes de los capilares puede estar afectada, lo que juega un rol en las infecciones, como la tuberculosis, y en las carcinomatosis.
1
Se debe a un daño tóxico de los sinusoides hepáticos. Puede sobrevenir por el uso de altas dosis de quimioterapia o de azatioprina en pacientes receptores de transplantes.También se ha documentado la intoxicación por alcaloides pirrolizidinicos presentes en heliotropos u otras plantas. En 1992 se presentó una epidemia en Tadjikistan debido a trigo contaminado con heliotropos causando cerca de 4000 casos. En Perú se ha documentado casos en personas que han consumido tisanas preparadas con Senecio tephrosioides, conocido como huamanrripa, como agente antitusígeno.
76
El panorama
•
La fuerza aspiratriz de las proteínas (presión oncótica) puede jugar un rol en las hipoproteinemias, aunque en el adulto la ascitis raramente es debida a esta eventualidad, salvo en el cuadro de la cirrosis o de un síndrome nefrótico.
•
La presión en descenso juega un rol extremadamente importante en las descompensaciones, en la cirrosis y en la enfermedad veno-oclusiva. Nótese, sin embargo, que una cirrosis (y por consecuencia una fibrosis) no causa ascitis en ausencia de hipoproteinemia. Lo mismo se aplica para las trombosis idiopáticas de la vena porta.
Una ascitis puede estar simulada por la presencia de sangre en el peritoneo, en caso de ruptura esplénica o de embarazo extra-uterino. Una "ascitis aguda" debe siempre hacer pensar en estas eventualidades. La presentación de estas dos patologías puede ser extremadamente traicionera, no podríamos dejar de considerarlas ante una "ascitis" que está acompañada de hipotensión o de vértigos.
Las prioridades Las patologías graves y vulnerables, deben ser investigadas antes que nada: algunas descompensaciones, beriberi, pericarditis, tuberculosis, síndrome nefrótico ( y evidentemente las "falsas ascitis")
El inventario de los argumentos; los puntos nodales. Después de haber encontrado los argumentos con poderes de confirmación o de exclusión buena o fuerte, buscamos los síntomas o signos comunes, y ponemos todo en una matriz que nos permita analizar los puntos nodales (Tabla 6.1). Escogeremos aquellos que tengan un fuerte poder de confirmación y o de exclusión y que, por lo tanto, sirvan para discriminar entre las diferentes patologías:
77
78
Tabla 6.1 Matriz para analizar puntos nodales. Ejemplo ascitis.
El panorama
Construcción del panorama En primer lugar, dibujamos las patologías prioritarias para que formen el círculo interno. Luego colocamos, al interior del círculo interno los “grandes argumentos”, es decir aquellos argumentos que disponen de un poder de confirmación o de exclusión importante y que van a ser pedidos - preguntados obligatoriamente a todas las personas con el síntoma clave. Estos argumentos son los puntos nodales que hemos escogido de la matriz de análisis de los puntos nodales. Alrededor de las patologías, colocamos los otros argumentos fuertes que preguntaremos cuando las demás enfermedades del círculo interno hayan sido excluidas y nos ayudan a llevar el diagnóstico en una o varias direcciones más restringidas (Figura 6.4). Figura 6.4 Panorama simple para ascitis.
Ya en este momento, podemos mostrar como utilizar el panorama. Si el paciente se presenta con ascitis, fiebre y dolor, ya es claro que nos dirigimos hasta una tuberculosis peritoneal; la ley de la “imagen congelada” nos obliga a agotar todos los argumentos en el círculo interior. ¡Podría ser que se trata de un paciente con pericarditis, que tiene dolor abdominal solo por casualidad! De esta manera una buena investigación de todos los argumentos centrales permite una combinación inteligente, y previene que nos equivoquemos. Luego, añadimos en un círculo más lejano al centro, "en el horizonte", las enfermedades no prioritarias, igualmente con sus "grandes argumentos". Por último, ligamos los argumentos a sus respectivas patologías (Figura 6.5).
79
Figura 6.5 Panorama completo para ascitis.
Evidentemente, se trata aquí de un panorama completo, que casi nunca es necesario. Sin embargo, como ejercicio en la universidad o en una capacitación continua, puede ser útil.
Otro ejemplo: dolor pélvico en la mujer El siguiente panorama (Figura 6.6) presenta otro análisis complejo con su algoritmo elaborado para un problema muy frecuente: el dolor pélvico en la mujer.
80
El panorama
Figura 6.6 Panorama para dolor pélvico en la mujer
81
Conclusión Reemplazamos el algoritmo dicotómico serial por una representación paralela y análoga (ponderada) de nuestra lógica diagnóstica. ¿Quiere esto decir que nosotros seguimos siempre “panoramas” similares junto al lecho de nuestros enfermos? Evidentemente no, lo que presentamos es una representación gráfica que permite realizar ejercicios de razonamiento. Además, en la mayoría de nuestros enfermos el síntoma predominante no es ni alarmante, ni difícil de interpretar. Una lógica netamente más simple puede ser seguida. Sin embargo las grandes reglas siempre deben ser respetadas: reflexionamos siempre, preguntándonos si no hay una patología peligrosa y tratable que se esconde detrás de un cuadro aparentemente inocente. La mejor forma de interrogarse es utilizando los argumentos en el círculo interior, que deberá ser totalmente agotado antes de ir más lejos, aún si a primera vista el cuadro es simple y habla por si mismo.
Referencias (1) (2) (3) (4) (5) (6) (7) (8) (9)
Kassirer JP. Teaching problem-solving--how are we doing? N Engl J Med 1995 Jun 1;332(22):1507-9. Norman G. Building on experience--the development of clinical reasoning. N Engl J Med 2006 Nov 23;355(21):2251-2. Norman G. Research in clinical reasoning: past history and current trends. Med Educ 2005 Apr;39(4):418-27. Integrated management of childhood illness. Rev Panam Salud Publica 1997 Aug;2(2):13841. Elstein AS, Schwarz A. Clinical problem solving and diagnostic decision making: selective review of the cognitive literature. BMJ 2002 Mar 23;324(7339):729-32. King-Sun F. Recent developments in pattern recognition. IEEE Transactions on computers 1980;29(10):845-54. Van Puymbroeck H, Remmen R, Denekens J, Scherpbier A, Bisoffi Z, Van den Ende J. Teaching problem solving and decision making in undergraduate medical education: an instructional strategy. Med Teach 2003 Sep 1;25(5):547-50. Tversky A, Kahneman D. Judgement under uncertainty: heuristics and biases. Science 1974;185:1124-31. Eva KW, Norman GR. Heuristics and biases--a biased perspective on clinical reasoning. Med Educ 2005 Sep;39(9):870-2.
82
Apéndices
Apéndice 1 Las escalas de probabilidad Introducción La epidemiología clínica fue desarrollada por epidemiólogos y matemáticos. Su lógica es fundamentalmente diferente a la de los clínicos: los primeros basan su pensamiento sobre una población y sobre datos matemátiEpidemiólogo: población cos mientras que los últimos lo basan sobre un matemática enfoque intuitivo y sobre un paciente en particular. Para la mayor parte del personal médico, es Clínico: paciente difícil aplicar estas nociones de epidemiología en intuición su actividad cotidiana. (1) Para superar esta brecha, varios instrumentos han sido construidos y propuestos en la literatura médica. El más conocido de todos es el nomograma de Fagan. (2) Este instrumento visual permite, con el trazo de una línea que pasa a través del poder de confirmación, observar el cambio desde una probabilidad pre - test a una probabilidad post - test.(figura A 1.1) Figura A 1.1: Nomograma de Fagan
En el lado izquierdo se encuentra la probabilidad pre test. En el lado derecho la probabilidad post test. En el centro se encuentra el likelihood ratio.Trazando una línea que parta de la probabilidad pre test pasando por el likelihood ratio se obtiene la probabilidad post test.
85
Aunque ha sido una de las contribuciones más interesantes para hacer del uso del Teorema de Bayes algo fácil de utilizar tiene todavía algunas limitaciones. La primera limitación es que solo se puede observar el cambio producido por un argumento a la vez. Si quisiéramos ver el cambio producido por varios argumentos en serie tendríamos que poner varios nomogramas, uno al lado del otro.(3) La segunda y quizás más importante limitación es que, quien usa el nomograma debe saber cómo calcular el likelihood ratio, tanto negativo como positivo. Sabemos que likelihood ratio es sinónimo del poder de un argumento, por tanto eso no debería ser un problema para quienes ya han leído los capítulos anteriores de este libro. Sin embargo para la forma negativa de éste parámetro, es decir para el poder de exclusión, el resultado es un número decimal inferior a 1. Esto constituye un importante problema de interpretación. Es más fácil “visualizar” la diferencia que existe entre un poder de exclusión de 2 y de 20, que hacerlo para la diferencia entre un likelihood ratio negativo de 0,5 y 0,05. Aunque en realidad viene a dar lo mismo: 0,5 es la inversa de 2 y 0,05 es la inversa de 20. Aparte del nomograma de Fagan otros métodos han sido propuestos con menos éxito, (4) sin embargo, y a pesar de las limitaciones que mencionamos antes, éste sigue siendo propuesto en la mayor parte de literatura médica relacionada con el tema y se elaboran programas especiales para computadoras de mano y sitios web interactivos basados en el mismo.(5;6) Lo que resulta todavía increíble es que haya habido tan poco interés en la literatura médica por desarrollar modelos que superen las limitaciones de los métodos hasta ahora propuestos. En este libro hemos descrito un modelo que trata de hacerlo, permitiendo al personal médico integrar fácilmente todas las nociones de toma de decisiones en su práctica cotidiana, respetando el fundamento matemático intrínseco.(7) Lo que es importante es que cualquier modelo que se proponga respete cuatro mensajes principales de la toma de decisiones en medicina, los cuales ya los hemos analizado en los capítulos principales de este libro. Estos son: • que el clínico siempre debe basarse en una probabilidad pre-test. • que cada argumento tiene un poder relativo intrínseco. • que el poder discriminativo de un argumento es a menudo asimétrico. • que el clínico deberá alcanzar un cierto umbral de certeza antes de poder iniciar cualquier acción médica.
Límites de una escala nominal De acuerdo a su experiencia personal y su intuición, un médico “sabe” que una enfermedad en particular es frecuente mientras que otra le parece extremadamente rara; “siente” que un argumento es más o menos fuerte en la confirmación o en la exclu1
Para el poder de exclusión hacemos la división de verdaderos negativos para falsos negativos. En cambio para el likelihood ratio negativo tenemos que dividir falsos negativos para verdaderos negativos. Como casi siempre los falsos negativos son menos que los verdaderos negativos su resultado es un decimal inferior a 1.
86
Apéndice 1
sión de una hipótesis diagnóstica;“percibe” también que luego de haber reunido varios argumento anamnésicos, clínicos y paraclínicos, la probabilidad post-test de su paciente ha alcanzado el umbral de confirmación necesario para iniciar un tratamiento. Nuestro razonamiento no funciona con cifras si no con conceptos que más o menos respetan una escala nominal, una escala basada en palabras que representan categorías. Lo mismo les sucede a los pacientes : si una mujer de 60 años le pregunta a usted cual es su probabilidad de que ella se enferme de SIDA (no presentando ningún síntoma de la enfermedad), le comprenderá mejor si usted le dice que esa posibilidad es inverosímil que si usted le dice que en su caso la probabilidad pre-test es de 0,01%. Los médicos no cuantifican el valor de una tasa de prevalencia, sino que dicen que una cierta hipótesis es muy rara, rara, habitual, frecuente o muy frecuente. Así mismo califican la fuerza de un argumento como débil, buena o fuerte, y las probabilidades pre y post-test como inverosímil, poco verosímil, poco probable, eventual, posible, probable, muy probable, seguro, etcétera. El mayor problema de una escala nominal está ligado a su subjetividad: si pedimos a varios médicos que califiquen con adjetivos las probabilidades expresadas en porcentajes ¡las respuestas serán muy diferentes! Por esa razón no se puede fijar una cifra definitiva a las categorías mencionadas. En la Figura A 1.2 las damos solo como un ejemplo para su interpretación. Figura A 1.2: Categorías intuitivas representadas en una escala de probabilidad
87
De acuerdo a lo de arriba, anunciar, por ejemplo, a un paciente que es posible que sufra de una cierta enfermedad correspondería a una probabilidad de 50%. Aparte de la subjetividad, una escala nominal no nos permite aplicar el teorema de Bayes, es decir aplicar un argumento a un paciente particular. Habría que encontrar una transformación matemática que junte la escala nominal del clínico con la escala numérica del epidemiólogo.
Límites de una escala numérica lineal Hemos visto, en los capítulos del libro, que cada hipótesis tiene una cierta probabilidad pre-test de corresponder con el diagnóstico del paciente, y que los argumentos recogidos nos llevan a una cierta probabilidad post-test cuyo valor dependerá de la fuerza de sus argumentos : imaginemos un caso en el cual la probabilidad pre-test es de 1% y que los dos argumentos encontrados nos dan una probabilidad post-test de 10% con el primer argumento y de 19% con el segundo : podemos representar todos estos datos sobre una escala de certeza que va desde 0 hasta 50%, y el esquema que se obtiene es el de la figura A 1.3: Figura A 1.3: Efecto de la linearidad con dos tests
A menudo esto no puede ser representado gráficamente porque el médico trabaja por lo general en el campo situado muy cerca de 0% o de 100%,: la probabilidad pretest es casi siempre muy baja (0,1%, 0,01%, ...) y los umbrales de acción de tratamiento de los enfermos hospitalizados muy elevados (99,9%, 99,99%, ...). Las probabilidades situadas entre los valores de 10 y 90% son casi siempre menos decisivas que aquellas cuyo valor se acerca a 0 o a 100% y no se pueden ver en una escala linear. Por este motivo sería necesario “estirar” los extremos y la única manera de lograrlo es con una escala logarítmica.
88
Apéndice 1
Límites de la expresión numérica de la razón de verosimilitud Un problema similar existe también con los poderes de un argumento cuyos valores son intrínsecamente exponenciales y deberían estar representados sobre una escala logarítmica más que en una escala numérica lineal. Explicaremos esto en detalle : •
Por una parte un argumento con un poder de confirmación (PC) de 100 no es 10 veces más fuerte que un argumento con un PC de 10. Consideremos, por ejemplo, una enfermedad con una probabilidad pre-test de 1% y dos argumentos cuyos PC son de 10 y de 100 respectivamente: el valor post-test con el primer ejemplo será de 9%, mientras que con el segundo será de 50%. Este segundo valor no es 10 veces mayor que el primero, en realidad es bastante inferior de lo que podíamos esperar
•
Por otro lado, la ganancia en certeza lograda con un argumento varía con el valor de la probabilidad pre-test.
Para realizar una ganancia en certeza desde 90 % hasta la proximidad de la certeza absoluta, hace falta un argumento tan fuerte como que el que se requiere para ir desde 10 hasta 90%: esto se explica por el hecho de que nuestra apreciación sigue una escala logarítmica.
Consideremos por ejemplo, un argumento cuyo PC es de 100. La ganancia en certeza lograda por este argumento depende de la probabilidad pre-test de la enfermedad considerada: si ésta es de 10%, la probabilidad posttest será de 90% y la ganancia en certeza de 80%; si ésta es de 90% la probabilidad post-test será de 99,9% y la ganancia en certeza solo de 9,9%. El mismo argumento parece entonces dar una gran ganancia en certeza cuando la probabilidad pre-test es baja y una pequeña ganancia si esta es alta. Este fenómeno se puede ver en la Figura A 1.4. Figura A 1.4: Efecto de el mismo test partiendo de diferente probabilidad pre - test
89
Ventajas de un modelo logarítmico en relación a las probabilidades pre-test y post-test Estamos acostumbrados a estimar las probabilidades como proporciones aritméticas, lo más a menudo en porcentaje, sin embargo la intuición se adapta mucho mejor a una escala logarítmica. Esto no tiene nada de sorprendente. Cuando hace 400 años Napier desarrolló el principio de los logaritmos lo hizo justamente para facilitar el cálculo intuitivo.(8) En ese entonces no existían las calculadoras y a la gente se le hacía extremadamente difícil realizar multiplicaciones y divisiones con más dos cifras. Lo más adecuado era tener una escala categórica que permita hacer sumas en lugar de multiplicaciones y restas en lugar de divisiones. Un poco más tarde Oughtred desarrolló la primera regla de cálculo que nuestros padres usaron hasta los años sesenta del siglo pasado y que sirvió para hacer trabajos tan complejos como el cálculo estructural del Empire State Building.(9) La genialidad de la regla de cálculo es que estaba basada en operaciones logarítmicas.Vendría a ser algo así como el nomograma de Fagan pero que gracias a operaciones con logarítmicos permitía hacer cálculos matemáticos muy complejos. Esto también se observa en otros dominios de la vida. La famosa escala de Richter que nos permite predecir la intensidad de un terremoto también es logarítmica, así como la escala de notas en un teclado de piano. Entonces ¿por qué no existe en medicina una escala de este tipo que se pueda adaptar fácilmente a nuestra intuición? Esto permitiría “visualizar” los extremos y además sumar y restar argumentos sin necesidad de hacer multiplicaciones ni transformaciones complejas. No es necesario caer en estado de pánico ahora que vamos a explicar la escala logarítmica para la práctica clínica. Para comprenderla es necesario regresar un momento a la noción de “odds”. Por ejemplo, decir que un paciente tiene una probabilidad pretest de 0,001% equivale a decir que tiene 1 “chance” sobre 100.000 si lo expresamos en probabilidades. Pero si lo expresamos en odds debemos decir que tiene 1 “chance” contra 99999. Así mismo decir que un paciente tiene una probabilidad post-test de 99,999% equivale a decir que tiene 99.999 “chances” sobre 100.000 si lo expresamos en probabilidades, o 99.999 “chances” contra 1 si lo expresamos en odds. Notarán que al expresar en odds hemos utilizado la palabra contra en lugar de la palabra sobre, lo que quiere decir que en odds estamos hablando de dos grupos diferentes: los “enfermos” y los “no enfermos”; por lo tanto es una razón. Por el contrario cuando hablamos en probabilidades el grupo de enfermos está incluido dentro del total de pacientes; es decir es una proporción. Al ser el primero una razón podemos dividir el grupo de “enfermos” para el grupo de “no enfermos” y obtenemos lo que en realidad sería el odds. De esta manera, si la probabilidad de estar enfermo es de 1 sobre 10000, entonces la razón “enfermos” contra “no enfermos” es 1 contra 99999, lo que equivale a decir que el odds es de 0,00001. Del mismo modo una probabilidad de 99,999% equivale a un odds de 99999. Una vez que la noción de odds está clara, no queda nada más que calcular el logaritmo de base 10 de nuestro resultado en odds (log10 odds). Una vez más, no hace falta caer en pánico, esto se hace muy fácilmente con una función de excel. El equivalente en log10 odds de estas dos últimas probabilidades es entonces respectivamente de -5 y de +5. En la siguiente tabla se puede ver representados los valores de las diferentes probabilidades expresadas en porcentaje, en odds y en log10 odds. 90
Apéndice 1
Tabla A 1.1 Equivalencia de probabilidades expresadas en porcentaje, en odds, y en log10 odds
Probabilidades expresadas en % 0,0009 0,009 0,09 0,9 9 50 91 99 99,9 99,99 99,999
En odds 0,00001 0,0001 0,001 0,01 0,1 1 10 100 1000 10000 100000
En log10 odds -5 -4 -3 -2 -1 0 1 2 3 4 5
Al representar tanto los porcentajes como los log10 odds en una escala se puede ver como los extremos, que en una escala linear serían invisibles, ahora se pueden ver porque han sido “estirados”. Figura A 1.5: Probabilidades en Log10 odds y en porcentajes
91
Esta nueva escala logarítmica presenta varias ventajas: •
• •
Está construida alrededor de un eje de simetría que corresponde a una probabilidad de 50% : el valor log10 odds de 50% es 0. Esta noción es muy compatible con nuestra intuición: un paciente que tiene una probabilidad de 50% de estar afectado por una enfermedad se encuentra como situado en una posición neutra en la que tiene tanto riesgo de presentar la enfermedad como de no presentarla. Permite un trabajo mucho más ligero con las probabilidades extremas, cercanas a 0 o a 100%: las probabilidades de 99,9% et 99,99% que parecen muy cercanas, se expresan en la nueva escala por valores bien distintos de 3 y 4. Está globalmente más adaptada a la escala nominal utilizada intuitivamente por la mayoría de los clínicos.
Ventajas en relación a los poderes de un argumento Como ya dijimos antes los valores de los poderes de un argumento no son lineares si no exponenciales. También se derivan de una razón: los verdaderos contra los falsos. Para el poder de confirmación los verdaderos positivos contra los falsos positivos, mientras que para el poder de exclusión los verdaderos negativos contra los falsos negativos. Por esa razón los poderes de los argumentos también podrían ser representados en logaritmos. Esto permite clasificar a los poderes de los argumentos en categorías: los argumentos con un poder de 100, 10 y 1 tendrán en la escala log10, los valores respectivos de 2, 1, y 0, de esta manera ya se puede poner un nombre “cualitativo” a cada categoría. Esto se detalla en la siguiente tabla. Tabla A 1.2: Poderes de los argumentos calculados y en categorías
Para confirmar
Para excluir
Clasificación categórica de la fuerza del argumento
100 (>56)
2
-2
Muy fuerte
30 (18-56)
1.5
-1.5
Fuerte
10 (6-17)
1
-1
Bueno
3 (2-5)
0.5
-0.5
Débil
1
0
0
Inútil
Poder del argumento calculado y rango
92
Poderes en log10
Apéndice 1
Aplicación del teorema de Bayes en una escala logarítmica Todo lo anterior ya permite utilizar el Teorema de Bayes sin utilizar cálculos complicados. Para hacerlo vamos a usar la escala de probabilidades en log10 odds que vimos en los párrafos precedentes y aplicaremos las categorías de fuerza del argumento. Para esto vamos a sumar el poder del argumento en log10 a la probabilidad pre - test en log10 odds cuando el argumento está presente, o restarlo si el argumento está ausente, siguiendo la siguiente fórmula: log10 de la probabilidad pre-test + log10 del Poder = log10 de la probabilidad post-test
Así, por ejemplo, si recibimos a un paciente en quien sospechamos una enfermedad rara (entonces asumimos que el valor de probabilidad pre-test es 0,001, por lo tanto su log10 será de - 3) en quien ponemos en evidencia un argumento que tiene un poder de confirmación muy fuerte (cuyo poder de confirmación es de 100, por lo tanto su log10 de +2). Con esto llegamos a una certeza (en log10 odds) de -1, ya que -3+2=-1. Por lo tanto podemos decir que es poco probable que este paciente pueda estar afectado, aún si el test es positivo. Una certeza de -1 en log10 odds significa una probabilidad de 10%. El detalle de este cálculo con los tres métodos, el clásico Bayes, el categórico y el intuitivo se puede ver en la Tabla A 1.3 Tabla A 1.3: Cálculo de probabilidades con tres métodos Escala
Probabilidad pre-test
Linear (%)
0.1%
Linear (odds)
PC de los argumentos
Probabilidad post-test
calculo imposible
100
10%
0,001
x
100
=
0.1
Logarítmica
-3
+
2
=
-1
Clínica (intuitiva)
una enfermedad “rara” sospechada en un paciente
un argumento que con un poder es presenta de confirmación muy fuerte
“probable”
93
Conclusión Los clínicos que han tenido la ocasión de familiarizarse con esta escala logarítmica pueden utilizar fácilmente los datos epidemiológicos como las probabilidades pre y posttest y el poder de los argumentos en su trabajo cotidiano. La fórmula matemática del teorema de Bayes se convierte así en algo mucho más “manejable”. En este apéndice hemos presentado un modelo para la representación de las bases de la epidemiología diagnostica clínica que ofrece tres ventajas principales : 1. 2. 3.
Permite hacer ejercicios prácticos mucho más ligeros porque ya no requieren cálculos complicados; Se facilita la comprensión de la evolución del valor de la probabilidad post-test luego de cada argumento encontrado en el paciente, noción necesaria para poder analizar problemas clínicos complejos; Ofrece una estructura lógica que permite a los clínicos efectuar su trabajo cotidiano de una manera más científica.
Referencias (1) (2) (3) (4) (5) (6) (7)
(8)
Moreira J,Van den Ende J.Toma de decisiones en medicina: una disciplina huerfana. Rev.Fac Cien Med (Quito) 2007 May; 32: 3-5 Fagan TJ. Letter: Nomogram for Bayes theorem. N Engl J Med 1975 Jul 31;293(5):257. Grimes DA, Schulz KF. Refining clinical diagnosis with likelihood ratios. Lancet 2005 Apr 23;365(9469):1500-5. McGee S. Simplifying likelihood ratios. J Gen Intern Med 2002 Aug;17(8):646-9. Glasziou P. Which methods for bedside Bayes? ACP J Club 2001 Nov;135(3):A11-A12. Interactive Nomogram Centre for Evidence Based Medicine. http://www.cebm.net/index.aspx?o=1161 . Fecha de acceso 15/06/2007. Van den Ende J, Bisoffi Z,Van Puymbroek H,Van der Stuyft P,Van Gompel A, Derese A, et al. Bridging the gap between clinical practice and diagnostic clinical epidemiology: pilot experiences with a didactic model based on a logarithmic scale. J Eval Clin Pract 2007 Jun;13(3):374-80. Stoll C. When slide rules ruled. Scientific American 2006; 294: 69-75. 2006.
94
Apéndice 2 El teorema de BAYES Con frecuencia escuchamos hablar sobre el Teorema de Bayes. Este teorema fue desarrollado en 1764 por el matemático y religioso Thomas Bayes con el propósito de calcular las probabilidades condicionales, es decir la probabilidad de que un evento ocurra (o no ocurra) a condición de que otro evento previo haya ocurrido.(1) El Teorema de Bayes no ha perdido actualidad y, por el contrario, cada vez se lo propone más como un método de análisis en muchas áreas del conocimiento científico.(2) En medicina clínica se recomienda su uso, entre otras cosas, para averiguar la probabilidad de un diagnóstico a condición de que un signo o síntoma esté presente.(3;4) Para comprender mejor vamos a retomar el ejemplo de criminología del segundo capítulo, en el cual estudiábamos la relación existente entre el hecho de llevar un arma y aquel de pertenecer a un grupo de ladrones de banco: es posible que, aún en situación de paz, la policía descubra una persona que, a pesar de estar armada, no pertenece a la banda de ladrones. La sospecha frente a esta persona será muy diferente según el tamaño del perímetro cercado alrededor del banco, por ejemplo, si el número de ladrones es de 20 entre 100 personas requisadas, el hecho de encontrar un arma en alguna de estas personas llevará a una certeza más alta que la que se obtendría si los ladrones fueran 20 entre 1000 personas requisadas. Con esta misma lógica, la relación existente entre la presencia de edema en el dorso del pie y el kwashiorkor es muy diferente si la estudiamos en la población general, entre los que consultan un centro de salud, o entre los que están en un centro de recuperación nutricional. La prevalencia de kwashiorkor es muy elevada en este último grupo, y de esta forma la presencia de edema en el dorso del pie en uno de los niños de este centro llevará más fácilmente a pensar en esta patología. Por el contrario, el mismo argumento entre quienes consultan en un centro de salud no hace pensar inmediatamente en este diagnóstico. Esto no quiere decir que hay un cambio en el poder de confirmación de edema en el dorso del pie con el kwashiorkor. El poder de este argumento siempre es bueno, ya sea que se trate de un niño en un centro de salud o de otro en un centro de recuperación nutricional. Lo que sucede es que en la primera situación el kwashiorkor es menos frecuente que en la segunda. En un centro de salud no solo llegan niños desnutridos, más bien la mayor parte son niños con estado nutricional normal, entonces el mismo signo puede estar causado por otras patologías como insuficiencia cardíaca, flebitis o síndrome nefrótico. En el centro de recuperación nutricional, en cambio, al menos la cuarta parte de los niños que llegan tendrán kwashiorkor, si encontramos el signo es casi seguro que se debe a esta enfermedad.1 Poniéndolo en el lenguaje de Bayes, la probabilidad de kwashiorkor, cuando se tiene la condición de edema del pie, es más alta cuando un niño está en un centro de recuperación nutricional, que cuando está en un centro de salud; porque en el primer caso la 1
Para los lectores más avanzados: la especificidad también varía con la situación, en la medida en que la mezcla de enfermos en las otras personas, que no presentan la enfermedad en cuestión, varía también. Pero esta diferencia en especificidad juega un rol menos importante que la diferencia en prevalencia.
95
probabilidad de inicio (antes de conocer la condición de tener edema del pie) es más alta que en el segundo caso. Cuando no se aplica el Teorema de Bayes, se comparan dos muestras de personas, las unas que padecen de la patología y las otras no; pero sin que estas muestras sean representativas de la población general, tomando en cuenta solamente a la sensibilidad y la especificidad del test pero no a la prevalencia de la enfermedad en la población. En cambio, cuando se toma en cuenta a la prevalencia nos acercamos mucho a la situación real en la que está situado el médico el momento en que realiza su trabajo de búsqueda del diagnóstico de su paciente. La población de enfermos y no enfermos, con la cual el médico trabaja, es realmente una muestra representativa de la población, permitiendo interpretar los resultados de un test aplicado a un paciente individual. El problema clínico que un médico tiene en su trabajo de todos los días es que no sabe si el paciente tiene la enfermedad o no; solo tiene, como elemento de análisis, el resultado de los diferentes test anamnésicos, clínicos o paraclínicos, y lo que le interesa es interpretar el significado de estos resultados. Con el siguiente ejemplo trataremos de comprender la lógica que explica este fenómeno: Realizamos un estudio de seroprevalencia para VIH en una población determinada de 1.000.000 habitantes. El test que utilizamos tiene una sensibilidad de 95% y una especificidad de 99%. Consideremos ahora dos casos, el primero el caso del Ecuador donde se estima una tasa de prevalencia de infecciones VIH de 0.01%, y el segundo el caso de un país africano donde esta tasa es aproximadamente de 10%.
Hemos representado enseguida tres tablas de cuatro entradas (Tabla A 2.1 - A 2.3). En la primera no hemos puesto valores, mientras que en la segunda y tercera están escritos los valores de sensibilidad y de especificidad del test (en el centro de la tabla) y la representación cifrada de los cuatro sub-grupos de la población según que sus habitantes sean realmente seropositivos o no y que sean reconocidos como tales por un test de tamizaje : los verdaderos positivos, los falsos positivos, los verdaderos negativos y los falsos-negativos: Tabla A 2.1:Tabla de contingencia sin datos
96
Apéndice 2
Tabla A 2.2:Tabla de contingencia con los datos de prevalencia de VIH en Ecuador = 0.01%
Cuando la prevalencia es baja, como en Ecuador, vemos que menos de una de cada 100 personas que tuvieron un test positivo son verdaderos positivos, es decir si 10 personas tienen un test positivo, 9 de ellos podrán estar tranquilos, pues no serán verdaderos positivos. Tabla A 2.3:Tabla de contingencia con los datos de prevalencia en Africa=10%
Al contrario, cuando la prevalencia es elevada, como en el caso del África, nueve de cada 10 personas que tienen un test VIH positivo serán verdaderos positivos. Mostremos estos dos ejemplos con nuestros diagramas de cuadrados (Figuras A 2. 1, 2 y 3):
97
Figura A 2.1: situación de investigación: igual número de infectados que de no infectados, prevalencia 50%:
Verdaderos positivos
Falsos negativos
Falsos negativos
Verdaderos negativos
Figura A 2.2: endemia importante: 10% de personas infectadas
Verdaderos negativos
Figura A 2.: endemia mínima: 0,01% de personas infectadas
Verdaderos negativos
Se observa que entre todos los que tuvieron un resultado positivo al test, la proporción de verdaderos positivos va disminuyendo progresivamente a medida que disminuye la prevalencia. Nótese que la sensibilidad y la especificidad, es decir las relaciones verticales, no han cambiado (En la última figura, el número de falsos negativos es tan pequeño que la impresora no logra imprimirlo) Estas consideraciones nos llevan a hablar de la noción que en epidemiología se conoce como el Valor predictivo de un argumento, o de un test en una población dada: 98
Apéndice 2
El valor predictivo después de un argumento positivo es la probabilidad que tiene un individuo de tener la enfermedad cuando tiene un test positivo. También nos permite conocer el valor predictivo después de un argumento negativo (VP -), el cual es la probabilidad que tiene un individuo de tener la enfermedad cuando tiene un test negativo. Nótese que lo último no es igual al Valor predictivo negativo. El valor predictivo después de un test negativo toma en cuenta el cambio en la probabilidad de estar enfermo cuando el resultado del test fue negativo, mientras que el valor predictivo negativo “clásico”, que se aprende en epidemiología, toma en cuenta la probabilidad de NO estar enfermo, lo cual es muy poco útil y confuso para la práctica clínica, por lo tanto no lo estudiaremos aquí. A partir de esto ya podemos deducir la primera conclusión importante, es decir que tanto el valor predictivo positivo como el valor predictivo después de un test negativo varían con la prevalencia de la enfermedad en un determinado contexto. El teorema de Bayes nos permite calcular estos dos valores. Conociendo la sensibilidad y la especificidad del argumento estudiado y la prevalencia de la enfermedad en la población en la que trabajamos podemos aplicar la siguiente fórmula : VP+ =
Se * Pr ( Se * Pr) + (1 − Sp)(1 − Pr)
En la que Se significa sensibilidad, Sp significa especificidad y Pr significa probabilidad de tener la enfermedad. Entonces, si la sensibilidad de un test para el diagnóstico de VIH es 95%, la especificidad es 99% y la probabilidad de tener VIH para una persona perteneciente a la población del Ecuador es de 0.01%, entonces podemos reemplazar los símbolos en la fórmula de la siguiente manera: VP + =
0.95 * 0.0001 0.000095 = = 0.0095 *100 = 0.94% [(0.95 * 0.0001)+ (1− 0.99)* (1 − 0.0001)] 0.01009
Esto quiere decir que, tomando en cuenta la prevalencia de VIH en Ecuador, un individuo perteneciente a la población general y que no presenta ningún síntoma, pero que tuvo un resultado positivo a un examen con una sensibilidad de 95% y una especificidad de 99%, tiene una probabilidad de estar realmente infectado por el VIH de apenas 0.94%. Nótese que para realizar el cálculo tuvimos que transformar los porcentajes en probabilidades, es decir que los dividimos para 100, de lo contrario hubiéramos tenido que cambiar la fórmula. De igual manera, se puede calcular el valor predictivo después de un resultado negativo al test con la siguiente fórmula: VP − =
(1 − Se) * Pr [(1 − Se) * Pr] + [ Sp * (1 − Pr)]
99
Es útil haber visto e interpretado estas fórmulas calculándolas uno mismo por lo menos una vez, para que se pueda comprender el concepto. De allí en adelante será mucho más fácil y útil representarlas en una tabla de cuatro entradas; sin embargo es muy raro que un médico clínico tenga el tiempo y las ganas de hacerlo. ¡Son muy raras las personas que se acuerdan de estas fórmulas! 1
Fuerza de un argumento aplicado a un paciente en particular Hasta aquí hemos visto el teorema de Bayes según la prevalencia de la enfermedad en la población. Ahora veamos este mismo teorema aplicado a un paciente en particular. ¿Que pensamos nosotros de un test VIH positivo en una prostituta y de un test igualmente positivo en el obispo de la región donde trabajamos? De hecho estas personas pertenecen a dos sub-poblaciones diferentes: la sub-población de prostitutas y la de religiosos de cualquier país no tienen para nada la misma prevalencia de infección por VIH. De esta forma como para el caso de los dos países con prevalencias que difieren en un factor de 1000, el número de falsos positivos será muy diferente según se considere la sub-población de prostitutas (prevalencia de personas VIH+ muy elevada) o la subpoblación de religiosos (prevalencia extremadamente baja). La probabilidad de que una prostituta sea realmente positiva para VIH cuando tiene un resultado positivo para el test es muy alta, mientras que esta probabilidad es baja para nuestro obispo a quien podremos seguramente tranquilizarlo.
La fuerza de un argumento según el contexto de trabajo La tasa de prevalencia en una población nos informa sobre la proporción de personas afectadas por esta enfermedad en la población general. Esta tasa es entonces utilizada durante los estudios epidemiológicos de una población. Cuando recibimos a un paciente en la consulta, la tasa de prevalencia ya no nos interesa, si no la probabilidad de que nuestro paciente pueda estar realmente afectado por una determinada patología. Por esta razón debemos acostumbrarnos a pensar en la frecuencia de enfermedades en nuestro contexto de trabajo. Cuando un paciente llega a la consulta del médico y se sienta en la sala de espera tiene casi con seguridad algún problema de salud. Si un día cualquiera nos detenemos a observar a todos los pacientes sentados en la sala de espera, incluso antes de escucharlos y examinarlos podemos, con bastante certeza, predecir la prevalencia de una enfermedad en nuestro contexto. Es suficiente hacer la siguiente reflexión: en los últimos 100 pacientes que he visto ¿qué enfermedades he encontrado? Supongamos el caso de un cardiólogo que por un momento analiza la prevalencia de enfermedades de los pacientes que se encuentran en su sala de espera. Podrá decir que la cuarta parte son hipertensos, otra cuarta parte corresponde a los que tienen insuficiencia cardiaca, una octava parte tienen arritmias. En cambio un bloqueo atrioventricular por el síndrome de Adams Stokes se presenta muy rara vez en la carrera profesional de cualquier cardiólogo, por tanto su frecuencia será, al menos 1
Para poder hacer algunos ejercicios sobre este tópico recomendamos el uso de un programa casero que hemos realizado en Excel y que se encuentra disponible en el sitio web del Instituto de Medicina Tropical de Amberes www.itg.be. Una vez que han ingresado al sitio dirigirse a “scientific departments”, luego “clinical sciences”, y luego “training”. Allí podrán descargar de forma gratuita el programa “Advanced course in Clinical Epidemiology”. Este programa está en diferentes idiomas incluido el español. Existen también varios artículos y publicaciones que explican esto en profundidad pero quizás las más importantes son las de Sackett .(5;6)
100
Apéndice 2
de 1 en 5 mil. Del mismo modo un médico general que trabaja en un centro de salud puede estimar que la cuarta parte de sus pacientes vienen con un síndrome respiratorio agudo, una octava parte tienen infección de vías urinarias, otra octava parte tendrán diabetes o hipertensión; en cambio una insuficiencia cardiaca - que en el consultorio de un cardiólogo ocupa la cuarta parte - se presentará en 1 de cada 500 pacientes que acuden a la consulta del médico general. Estas reflexiones, que parecen demasiado intuitivas ya nos ayudan mucho a establecer cual es la prevalencia de las enfermedades en nuestro contexto de trabajo. En clínica, decimos que tenemos una cierta sospecha de una enfermedad: esta sospecha para nuestro paciente corresponde a la prevalencia. Si ya hemos estimado esta prevalencia de enfermedades en nuestro contexto, ya tenemos el punto de partida. La precisión que logramos con esta estimación ya es suficiente como para empezar el razonamiento diagnóstico. El descubrimiento o la ausencia de un argumento investigado harán variar esta sospecha inicial (también conocida como probabilidad pre - test) según la fuerza del argumento en cuestión. Si el argumento es positivo, su poder de confirmar el diagnóstico sospechado va a añadirse al valor de la probabilidad pre-test; si es negativo su poder de exclusión se sustraerá del valor de la probabilidad pre-test. Resumiendo, podríamos retomar las prevalencias de infección VIH en los dos países como sospecha para nuestros dos casos clínicos, el obispo y la prostituta. Para la prostituta, podríamos asumir como si el test VIH ha sido efectuado en una población de 10.000 prostitutas de las cuales 1040 resultaron positivas (950 verdaderas-positivas y 90 falsas-positivas). Siendo la tasa de prevalencia de la seropositividad para VIH de 10%; la tasa de “prevalencia” o de “verdadera-positividad” en la población de prostitutas con un test VIH positivo es de 91% (950/1040). Por el contrario, cuando recibimos a un obispo, podríamos estimar su probabilidad pretest en 0.1%. Si el test rápido para VIH - que tiene la misma sensibilidad y especificidad del que se aplicó a la prostituta - resulta ser positivo, llegaría entonces a una probabilidad post-test de solamente 9% de ser efectivamente seropositivo. Estos resultados no dejan de sorprender a cualquiera que los vea por primera vez. ¿Cómo es posible que un test tan fuerte, en el obispo ayude a llegar solamente hasta 9% de certeza? Esto se debe a que es necesario distinguir dos elementos claves en la estimación de probabilidades. Uno es el poder o fuerza intrínseca del test, que depende de su sensibilidad y especificidad. Otro muy diferente es el contexto o sospecha inicial del individuo a quien se aplique el test. Si la sospecha inicial que tiene un paciente es muy baja, aún si aplicamos un test muy fuerte, el resultado positivo incrementará la probabilidad hasta un nivel todavía bajo. Por el contrario en un individuo en el cual la sospecha inicial ya es muy alta, la aplicación de un test débil puede llevar a alcanzar una certeza considerablemente alta. Por increíble que parezca, este es el origen de muchos errores de interpretación de exámenes en la práctica clínica, así como también de mala interpretación de resultados de estudios clínicos que han sido publicados en famosas revistas internacionales.(7) La probabilidad post-test se traduce en lenguaje clínico como “certeza”: el grado de certeza es la probabilidad alcanzada con nuestro argumento.
101
Podemos representar estos datos en la Figura A 2.4. Eso fue lo que se explicó en el capítulo 5. Figura A 2.4: Diferencia entre el significado de un test VIH (elisa) positivo en un obispo comparado con una prostituta.
Los poderes de un argumento en lenguaje Bayesiano En el capítulo 4 aprendimos como estimar el poder de un argumento. En lenguaje Bayesiano a los poderes de un argumento se les conoce como “likelihood ratio”, cuya traducción al castellano sería “razón de probabilidad”. El poder de confirmación sería el “likelihood ratio positivo”, mientras que el poder de exclusión sería el “likelihood ratio negativo”
La fórmula para calcular para calcular el likelihood ratio positivo es básicamente la misma que vimos en el capítulo 4 para la estimación del poder de confirmación, pero aquí la LHR + =
PT | E PT | E
vamos a escribir en lenguaje matemático. En donde LHR+ significa likelihood ratio positivo, PT significa probabilidad de tener un resultado positivo, E significa estar enfermo, E significa no estar enfermo, y el signo | significa “a condición”. Notaran que esta formula equivale a decir verdaderos positivos / falsos positivos. En cambio la formula para calcular el likelihood ratio negativo difiere un poco de la forLHR − =
PT | E PT | E
mula para calcular el poder de exclusión que aprendimos en el capítulo 4. En este caso LHR- significa likelihood ratio negativo, PT significa probabilidad de tener un test negativo, el resto de símbolos son los mismos que se utilizaron en la fórmula de arriba.
102
Apéndice 2
Así mismo podrán notar que esta fórmula equivale a decir falsos negativos / verdaderos negativos. Por eso decimos que difiere un poco de la que se mostró en el capítulo 4 para el poder de exclusión, pues dicha formula era verdaderos negativos / falsos negativos. Como se podrá observar esta última fórmula no es más que el inverso de la primera. Esta es una astucia matemática realizada con el fin de obtener resultados superiores a 1, que facilitan el cálculo con el método explicado en el capítulo 4. Debido a que el “likelihood ratio” se deriva de la sensibilidad y de la especificidad es lógico que lo podemos utilizar para calcular el valor predictivo positivo y el valor predictivo después de un resultado negativo de un test. Sin embargo esto requiere de otra transformación matemática. Debido a que los likelihood ratio son exponenciales, no pueden ser multiplicados directamente por la probabilidad de una enfermedad. Para eso necesitamos transformar la probabilidad pre test en odds. El resultado final que se obtiene es entonces una probabilidad final en odds, que una vez más requerirá una transformación en probabilidades. Esto está explicado en el apéndice relacionado con la escala logarítmica.
Redes Bayesianas y Bayes “ingenuo” El teorema de Bayes tiene dos limitaciones. La primera es que supone que las enfermedades son mutualmente exclusivas, es decir que uno no puede tener más de un diagnóstico a la vez. La otra limitación es que supone que los argumentos son condicionalmente independientes, por ejemplo que la deshidratación es independiente de la diarrea. Es por eso que ahora al Teorema de Bayes se lo llama Bayes “ingenuo”. Para superar estas limitaciones se ha desarrollado el método de las redes Bayesianas que permiten diagnósticos múltiples y utilizan relaciones de dependencia mucho más ricas que el método clásico. Explicar en detalle las redes Bayesianas está fuera del propósito de este texto, sin embargo tienen un gran potencial para el desarrollo de sistemas expertos en medicina. Para quien tenga curiosidad en conocer más sobre este método recomendamos visitar el sitio web del Proyecto ELVIRA desarrollado por la Universidad Nacional de Educación a Distancia en España.
103
Conclusión A manera de conclusión de este anexo, podemos decir que: •
El teorema de Bayes es el método con el cual se calculan las probabilidades de que una persona tenga un determinado diagnóstico a condición de que tenga un determinado argumento.
•
Con el Teorema de Bayes podemos calcular el Valor Predictivo de un examen
•
El Valor Predictivo de un examen varía con la prevalencia de la enfermedad en la población.
•
Se puede calcular el Valor Predictivo usando los poderes de un argumento, que en lenguaje clásico se conocen como likelihood ratio, pero eso requiere de una transformación compleja.
•
Las redes Bayesianas son métodos avanzados que superan algunas limitaciones del Teorema de Bayes y pueden ser usadas para el desarrollo de sistemas expertos.
Referencias (1) (2) (3) (4) (5) (6) (7)
Bayes T. An Essay Toward Solving a Problem in the Doctrine of Chances. Philosophical Transactions of the Royal Society of London 1764;53:370-418. Wiggins C.What is Bayes' theorem, and how it can be used to assign probabilities to questions such as the existence of God? What scientific value does it have? Scientific American . 4-12-2006. Fagan TJ. Letter: Nomogram for Bayes theorem. N Engl J Med 1975 Jul 31;293(5):257. Grimes DA, Schulz KF. Refining clinical diagnosis with likelihood ratios. Lancet 2005 Apr 23;365(9469):1500-5. Sackett D, Haynes R, Guyatt GH, Tugwell P. Clinical Epidemiology: a basic science for clinical medicine. 2 ed. Boston: Little, Brown and Company; 1991. Jaeschke R, Guyatt G, Sackett DL. Users' guides to the medical literature. III. How to use an article about a diagnostic test. A. Are the results of the study valid? Evidence-Based Medicine Working Group. JAMA 1994 Feb 2;271(5):389-91. Ioannidis JP.Why most published research findings are false. PLoS Med 2005 Aug;2(8):e124.
104
Apéndice 3 ¿Qué son los logaritmos? En varios capítulos del libro hemos mencionado a los logaritmos. Casi siempre este tema causa alguna resistencia entre los médicos. En este anexo trataremos de explicar de que se trata. Si ax=m, entonces se puede decir que x, que es el exponente, es el logaritmo de m de base a. Aunque a puede ser cualquier número vamos a enfocarnos en los logaritmos “simples” en los cuales a=10, o sea los logaritmos de base 10. El logaritmo simple de 1000 es 3 porque al elevar 10 a la 3ra potencia (103) obtenemos 1000 (103=1000). A la inversa, el antilog de 3 es 1000 Esto se puede hacer fácilmente con una hoja de Excel.(Figura A 3.1) Hacemos una primera columna en la que ponemos números del 0.001 hasta el 1000 y en una segunda columna insertamos la función del logaritmo de base 10 que se encuentra en el menú insertar/funciones, escogiendo la función LOG10 y escribiendo en el paréntesis la celda del número que queremos transformar a logaritmo. En este ejemplo transformamos el número 0.001, que se encuentra en la celda A2. Figure 1: Insertando la funcion logaritmo en excel.
105
Ahora podemos copiar esta función en las otras celdas y obtenemos los logaritmos de cada uno de los números.(figura A 3.2) Nótese que el logaritmo de uno (1) es cero (0). Figura A 3.2:
Los exponentes no necesitan ser números enteros, pueden ser decimales. Por ejemplo 10 elevado a la potencia 0.25 es igual a 1.778, eso quiere decir que el logaritmo de 1.778 es 0.25. Del mismo modo 10 elevado a la potencia 0.7 es 5.012, lo que quiere decir que el logaritmo de 5.012 es 0.7. ¿Cuál es la utilidad de esto? Al expresar todo en términos de 10 elevado a una potencia podemos multiplicar números simplemente sumando los exponentes. De esta manera si queremos multiplicar 1.788 x 5.012, que es lo mismo que multiplicar 100.25x100.7 simplemente hacemos 100.25+0.7, que da como resultado 100.95. Si ahora buscamos el antilog de 0.95 obtenemos 8.912, que es el mismo resultado que obtendríamos al multiplicar 1.788 x 5.012. Esto era de una importancia enorme hace 400 años, en el tiempo en que Napier desarrolló el concepto de los logaritmos. En ese entonces no había calculadoras, por lo cual era imposible hacer operaciones matemáticas complejas como multiplicaciones y divisiones, pero existían tablas logarítmicas y reglas de cálculo, que fueron las precursoras de las calculadoras, las que permitían convertir toda multiplicación o división en una suma o resta). Exactamente de la misma manera como para multiplicar hacemos sumas, para dividir podemos usar substracciones. No hasta hace mucho tiempo, en los años 60, nuestros padres y tíos todavía usaban las reglas de calculo, ya que no contaban con calculadoras electrónicas, y con el uso de éstas pudieron hacer grandes obras de ingeniería, como el cálculo estructural del Empire State Building en Nueva York. ¿Cuál es la importancia de esto en medicina? En casi todos los dominios de la ciencia se utilizan logaritmos para explicar el “peso” de un evento al ciudadano común. Por 106
Apéndice 3
ejemplo, los geofísicos explican la intensidad de un terremoto mediante la escala de Richter, que no es más que una escala logarítmica, los músicos aprenden las notas en el teclado de un piano con una escala logarítmica, en el colegio nos explican el grado de acidez o alcalinidad con el pH, que es otra escala logarítmica. ¿Por qué en medicina no tenemos una escala que sirva para medir el “peso” de un argumento?, de manera que solo tengamos que añadir o sustraer pesos, en lugar de aplicar formulas complejas como las del teorema de Bayes. Eso es lo que tratamos de hacer al convertir los poderes de confirmación y de exclusión, así como la escala de probabilidades en logaritmos. Ahora le proponemos, que a manera de ejercicio, usted intente hacer algunas transformaciones logarítmicas con el uso de Excel.
107
9 789978 926536