Rafael Casañas Avila Análisis de Decisiones en Medicina Tarea 1
Master en Física Médica. Asignatura: Análisis de Decisiones en Medicina. 2015-2016 Tarea1 Alumno: Rafael Casañas Avila Ejercicio 1.1. Sea una distribución de probabilidad P dada por la siguiente tabla.
Señale cuáles de estas relaciones son verdaderas y cuáles son falsas. Para la primera y la quinta, indique detalladamente los cálculos que ha realizado. 1. IP (A, B) falso Cálculos: Para poder decir que es falso v amos a calcular las probabilidades P(A,B) a partir de la tabla anterior. Sabemos que la probabilidad conjunta de P(A,B)
(+,+) +,+) = (+,+,) +,+,) = 0,03+0,12 = 0,15
(+,¬) +,¬) = (+,¬,) +,¬,) = 0,07+0,28 = 0,35
(¬,+) ¬,+) = (¬,+,) ¬,+,) = 0,03+0,27 = 0,30
(¬,¬) ¬,¬) = (¬,¬,) ¬,¬,) = 0,02+0,18 = 0,20
De esta manera podemos tener la tabla de probabilidades conjuntas en la siguiente tabla:
Página 1 de 14
Rafael Casañas Avila Análisis de Decisiones en Medicina Tarea 1
P(A,B)
(+) (¬)
(+) (¬) 0,15 0,30 0,45
0,35 0,20 0,55
0,50 0,50 1,00
Si ahora calculamos las probabilidades condicionadas de ambas v ariables podremos sacar conclusiones y ver si los nodos están o no conectados:
0,15 = 0,3 (+|+) = (+,+) = (+) 0,50 0,30 = 0,6 (+|¬) = (¬,+) = (¬) 0,50 0,35 = 0,7 (¬|+) = (+,¬) = (+) 0,50 0,20 = 0,4 (¬|¬) = (+,¬) = (¬) 0,50 (+|+) ≠ (+|¬)
Dado que la podemos concluir que la probabilidad de la variable B se ve afectada dependiendo si la variable A toma un valor u otro, y por tanto existe un camino entre ambas variables por lo que la afirmación es falsa.
2. IP (A, C) Falsa 3. IP (B, C) Falsa 4. IP (A, B|C) Verdadera 5. IP (B, C|A) Falsa Para poder decir que es falso v amos a calcular las probabilidades P(B,C) a partir de la tabla del enunciado del ejercicio. Sabemos que la probabilidad conjunta de P(B,C)
(+,+) = (,+,+) = 0,03+ 0,03 = 0,06
(+,¬) = (,+,¬) = 0,12+ 0,27 = 0,39
(¬,+) = (,¬,+) = 0,07+ 0,02 = 0,09
Página 2 de 14
Rafael Casañas Avila Análisis de Decisiones en Medicina Tarea 1
(¬,¬) = (,¬,¬) = 0,28+ 0,18 = 0,46
De esta manera podemos tener la tabla de probabilidades conjuntas en la siguiente tabla:
P(B,C)
(+) (¬)
(+) (¬) 0,06 0,09 0,15
0,39 0,46 0,85
0,45 0,55 1,00
Una vez construida la tabla de probabilidades de las variables B y C, lo que tenemos que decidir si es verdadero o falso es Ip(B,C|A) Sabemos que la probabilidad condicionada de A,B dado C viene dada por la siguiente expresión:
) (, | ) = ( ,, (,) Dado que tenemos la bala de probabilidades del enunciado del problema P(A,B,C) y además hemos construido la tabla de probabilidades de B y C, podemos calcular la tabla de probabilidades condicionadas:
0,03 = 0,5 (+,+|+) = (+,+,+) = (+,+) 0,06 0,12 = 0,26 (+,¬|+) = (+,+,¬) = (+,¬) 0,39 0,07 = 0,78 (¬,+|+) = (+,¬,+) = (¬,+) 0,09 0,28 = 0,61 (¬,¬|+) = (+,¬,¬) = (¬,¬) 0,46 Como podemos observar de los resultados anteriores, cualquier combinación de probabilidades entre B y C se ve afectada de manera diferente por la activación de la variable A y por tanto podemos decir que B y C deben ser dos variables situadas por encima del grafo con respecto a la variable A y por tanto podemos decir que la expresión a evaluar es falsa, ya que existe un camino entre B y C activo dado C.
Página 3 de 14
Rafael Casañas Avila Análisis de Decisiones en Medicina Tarea 1
Ejercicio 1.2. Sea un grafo no dirigido G que contiene cinco nodos y los siguientes enlaces: A-B, A-C, B-C, B-D y C-E. 1. Indique cuáles de las siguientes relaciones son verdaderas y cuáles son falsas, y qué caminos activos existen entre las variables de cada relación. A
C E
B
D
a) IG (A,B) falsa. A y B están directamente conectados. Además están conectados a través de C b) IG (B,D) falsa. B y D están directamente conectados c) IG (A-D) falsa. A y D están conectados a través de B y a través de C y B d) IG (D-E) falsa. D y E están conectados a través de B y C y a través de B, A y C
2. Indique cuáles de las siguientes relaciones son verdaderas y cuáles son falsas. Indique también para cada una de ellas qué caminos activos existen entre las dos primeras vari ables y si algún camino entre ellas ha sido bloqueado por la tercera variable. a) IG (A,B|C) Falsa A y B están directamente conectados. Se ha bloqueado un camino entre A y B a través de C. b) IG (A,D|B) Verdadera. Existían dos cambios entre A y D que han sido bloqueados a través de B. c)
IG (D,E|C) Verdadera. Existían dos caminos entre D y E que han sido bloqueados a través de C
d) IG (D,E|A) Falsa. D y E están conectados a través de B y C. Se ha bloqueado un camino a través de B, A y C.
Página 4 de 14
Rafael Casañas Avila Análisis de Decisiones en Medicina Tarea 1
Ejercicio 1.3. Sea un grafo dirigido G que contiene seis nodos y los siguientes enlaces: A -> C, B -> C, B -> D, C -> E, C -> F y D -> F.
A
B
E
C
D
F
1. Indique para cada una de las siguientes relaciones si es verdadera o falsa; indique también para cada una de ellas qué caminos entre las dos variables están activos y cuáles están inactivos. a) IG (A,B) Verdadera b) IG (A,E) Falsa. Existe un camino activo entre A y E a través de C c) IG (A,D) Verdadera d) IG (A, F) Falsa. Existe un camino activo entre A y F a través de C e) IG (D,E) Falsa. Existe un camino activo e ntre D y E a través de B y C f ) IG (E, F) Falsa. Existe un camino activo entre E y F a través de C
2. Indique cuáles de las siguientes relaciones son verdaderas y cuáles son falsas. Indique también para cada una de ellas si algún camino entre las dos primeras variables que estaba inactivo ha sido activado por la tercera, y viceversa, es decir, si algun camino que estaba activo ha sido bloqueado. a) IG (A,B|C) Falsa. El camino ha sido activado entre A y B por la presencia de C b) IG (A,B|E) Falsa. El camino ha sido activado entre A y B por E ya que E es un descendiente de A y B a través de C c) IG (A,B|F) Falsa. El camino ha sido activado entre A y B por la presencia de F d) IG (A,D|C) Verdadera e) IG (A,D|F) Falsa. El camino ha sido activado entre A y D por la presencia de F Página 5 de 14
Rafael Casañas Avila Análisis de Decisiones en Medicina Tarea 1
f ) IG (A, F|C) Verdadera. Se ha bloqueado el camino entre A y F por C g) IG (A,F|E) Falsa. Existe un camino activo entre A y F a través de C h) IG (D,E|B) Verdadera. Se ha bloqueado el camino entre D y E a través de B y C i ) IG (E,F|C) Verdadera. Se ha bloqueado e l camino entre E y F por C
Página 6 de 14
Rafael Casañas Avila Análisis de Decisiones en Medicina Tarea 1
Ejercicio 1.4. Sea P una distribución de probabilidad que satisface la siguiente propiedad de dependencia: ¬IP (A,B). Dibuje todos los grafos no dirigidos y grafos dirigidos acíclicos de dos variables que sean mapas de independencia (I-maps) de P.
A
B
A
B
Página 7 de 14
A
B
Rafael Casañas Avila Análisis de Decisiones en Medicina Tarea 1
Ejercicio 1.5. Sea P una distribución de probabilidad que satisface la siguiente propiedad de independencia: IP (A,B) Dibuje todos los grafos no dirigidos y grafos dirigidos acíclicos de dos variables que sean mapas de independencia (I-maps) de P. Sugerencia: Preste atención, porque hay más grafos de los que uno pueda pensar en principio.
Por más vueltas que le doy solamente veo un único grafo posible con dos v ariables:
A
B
Página 8 de 14
Rafael Casañas Avila Análisis de Decisiones en Medicina Tarea 1
Ejercicio 1.6.
A
A
B B
B
A C C
Página 9 de 14
C
Rafael Casañas Avila Análisis de Decisiones en Medicina Tarea 1
Ejercicio 1.7 En cierto país, la prevalencia de la fiebre tifoidea es el 0’001 y la de la tuberculosis 0’01. La fiebre tifoidea produce fiebre siempre, y bradicardia (ritmo cardíaco lento) en el 40 % de los casos. La tuberculosis produce fiebre en el 60 % de los casos y taquicardia (ritmo cardíaco más rápido de lo normal) en el 58 %. La prevalencia de la fiebre en pacientes que no sufren ninguna de estas dos enfermedades es el 1’5 %, la de bradicardia el 0’05 % y la de taquicardia el 1’3 %. 1. Según el método bayesiano ingenuo, indique qué variables intervienen en este problema y qué valores puede tomar cada una de ellas. Las variables que intervienen en este problema son: Diagnóstico (d): que puede tomar tres estados. Que el paciente presente fiebre tifoidea (ft), o que presente tuberculosis (tb) o que no tenga ninguna de ellas (s)
Fiebre (f): puede estar ausente o presente Braquicardia (b): puede estar ausente o presente Taquicardia (t): puede estar ausente o presente
Página 10 de 14
Rafael Casañas Avila Análisis de Decisiones en Medicina Tarea 1
2. Dibuje el diagrama correspondiente al método bayesiano ingenuo.
3. Indique las probabilidades condicionadas (en forma de tablas) que definen el modelo. Se exponen a continuación las diferentes tablas de probabilidad del nodo. Del propio enunciado del problema se desprende que probabilidad de que presente cada uno de los diferentes diagnósticos es la de al siguiente tabla:
P(d)
ft 0,001
tb 0,01
s 0,989
Del mismo modo, la probabilidad de que un paciente presente o no presente fiebre en función del diagnóstico sería la recogida en la siguiente tabla: P(f|d) +f -f
ft 1 0
tb 0,6 0,4
s 0,015 0,985
Igualmente, la probabilidad de que un paciente presente o no presente braquicardia en función del diagnóstico sería la recogida en la siguiente tabla: P(b|d) +b -b
ft 0,4 0,6
tb 0 1
s 0,0005 0,9995
Finalmente, la probabilidad de que un paciente presente o no presente taquicardia en función del diagnóstico sería la recogida en la siguiente tabla: P(t|d) +t -t
ft 0 1
tb 0,58 0,42
s 0,013 0,987
Página 11 de 14
Rafael Casañas Avila Análisis de Decisiones en Medicina Tarea 1
4. Señale las hipótesis que está utilizando para resolver este problema y discuta si son razonables o no, es decir, si parecen ser una buena aproximación. La hipótesis que se están tomando es que a la hora de definir el diagnóstico se plantea como paciente sano aquel que no presenta ni fiebre tifoidea ni tuberculosis, aunque pudiera presentar alguna otra enfermedad no contemplada en el modelo. L o que sí serviría es para descartar del diagnóstico estas dos enfermedades. Además pudiera darse el caso poco probable que el paciente tuviera las dos enfermedades, es decir, fiebre tifoidea pero sabemos que esta posibilidad tiene una probabilidad del 0,001%, que en una primera aproximación podemos considerar despreciable. 5. ¿Cuál es el diagnóstico para cada una de las posibles combinaciones de hallazgos: fiebre, no fiebre, taquicardia, bradicardia, ritmo normal, fiebre y taquicardia, fiebre y ritmo normal, etc.? Si lo desea, puede utilizar el programa OpenMarkov para completar la tabla, pero en ese caso debe realizar “a mano” y mostrar los cálculos detallados para dos de esas combinaciones. Para poder calcular el diagnóstico de cada una de las posibles combinaciones nos vamos a basar en el teorema de Bayes. De esta forma, para calcular la probabilidad de un determinado diagnóstico d, dada cualquiera de la ocho combinaciones de las var iables f, b y t (ausentes o presentes) vamos a usar la siguiente expresión:
, |) · () (1) (| , , ) = ( , ∑ (,,|) Para ello, vamos a construir prime ro la tabla de probabilidad condicionada para cada evento (e) a partir de las tablas de probabilidad condicionada de cada uno de los síntomas expuestas antes: e +f, +b, +t +f, +b, -t +f, -b, +t +f, -b, -t -f, +b, +t -f, +b, -t -f, -b, +t -f, -b, -t
p(e|ft) 0 0,4 0 0,6 0 0 0 0
p(e|tb) 0 0 0,348 0,252 0 0 0,232 0,168
p(e|s) 9,75e-8 7,4e-6 0,000195 0,01479 6,4025e-6 7,4e-6 0,0128 0,9717
De esta forma podemos calcular usando la expresión (1) las diferentes combinaciones de probabilidad de un determinado diagnóstico condicionada a las diferentes combinaciones de eventos (se calculan dos de ellas a m ano y el resto con el programa Elvira):
Página 12 de 14
Rafael Casañas Avila Análisis de Decisiones en Medicina Tarea 1
·() = 0,252·0,01 (|+,−,−) = (+,−,−|) ∑ (+,−,−|) 0,2 52 · 0,0 1+ 0.6 · 0,0 01 + 0,0 1479 · 0,9 89 = 0,14199 · () = 0,01479·0,989 (|+,−,−) = (+,−,−|) ∑ (+,−,−| ) 0.2 52 · 0.0 1+ 0.6 · 0.0 01 + 0,0 1479 · 0,9 89 = 0,8241 El resto de las combinaciones se calculan con el programa Elvira
e +f, +b, +t +f, +b, -t +f, -b, +t +f, -b, -t -f, +b, +t -f, +b, -t -f, -b, +t -f, -b, -t
p(ft|e) 0 0,98 0 0,03 0 0 0 0
p(tb|e) 0 0 0,95 0,14 0 0 0,15 0,01
p(s|e) 1 0,02 0,05 0,82 1 1 0,85 0,99
6. La experiencia demuestra que, cuando hay tuberculosis, la fiebre y la taquicardia van asociadas en la mayor parte de los casos (es decir, generalmente la tuberculosis produce taquicardia si y sólo si produce fiebre). ¿Cuestiona esta observación la validez de los resultados obtenidos en el apartado anterior? A la luz de los resultados del apartado anterior o bservamos que si la taquicardia está presente y la fiebre está presente, estado la braquicardia ausente, la probabilidad de que un paciente presente tuberculosis es de un 95%, lo cual parece indicar el modelo podría ser válido en base a la experiencia.
Página 13 de 14
Rafael Casañas Avila Análisis de Decisiones en Medicina Tarea 1
Sin embargo, si además de estar presente la fiebre y la taquicardia, también lo está la braquicardia, el modelo descarta la tubercuosis totalmente e indica que el paciente estaría sano (o al menos no presenta ninguna de las dos enfermedades analizadas), lo cual va en contra de la experiencia. Por tanto podemos observar que el modelo presenta deficiencias a la hora de reproducir ciertas combinaciones de evidencias.
Página 14 de 14