TEOREMA DE BAYES Sea A1 ,…. An Un sistema completo de sucesos, tales que la probabilidad de cada uno de ellos es distinta de cero, sea B un suceso cualquiera del que se conocen las probabilidades condicionales P( B / Ai) , entonces la probabilidad de P( Ai / B)
viene dada por la expresión:
P( Ai / B) =
P( Ai)P( B / Ai) P( A1) P(B / A1) + P( A2) P( B / A2) +...+ P( An) P( B / An)
Las técnicas de Bayes permiten abordar en forma diferente el área de “Toma de decisiones”, formulándolas en términos de pérdidas o ganancias económicas y no en términos de la probabilidad de tomar la decisión correcta. Así, por ejemplo, tomar una o dos decisiones que pudieran ser incorrectas puede ser beneficio en términos económicos. La prob probabi abililida dad d cond condic icio iona nall toma toma en cuent cuenta a la info inform rmaci ación ón en cuant cuanto o a la ocurrencia de un evento, para predecir la probabilidad de otro (s) evento (s). Por tanto, este concepto se puede ampliar para la revisión de las probabilidades basadas en nueva información, y para determinar la probabilidad de que un evento particular se debió a una causa especifica. Ejemplo: Tres maquinas A, B y C producen el 45%, 30% y 25% respectivamente del total de las piezas producidas en una empresa. Los porcentajes de producción defectuosa de estas maquinas son del 3%, 4% y 5%. a) Selecciona onamos una pieza al azar; cal calcul cula la prob robabi abilidad de que sea defectuosa. b) Toma Tomamo mos s al azar azar una una piez pieza a y resu result lta a ser ser defe defect ctuo uosa sa;; calc calcul ula a la prob probab abililid idad ad de haber sido producida en la maquina B. c) Que Que maqu maquin ina a tien tiene e mayor mayor prob probab abililid idad ad de hab haber er prod produc ucid ido o la cita citada da pie pieza za defectuosa?
Solución.
La maquina con mayor probabilidad de haber producido la pieza defectuosa es A.
Tenemos, P ( A / B ) =
P ( A ∩ B )
→
P ( B )
P ( B / A) =
P ( B ∩ A)
P ( A ∩ B ) = P ( A / B )P (B ) →
P ( A)
P ( B ∩ A) = P ( B / A) P ( A)
Ejemplo1: Se tienen dos sucesos aleatorios A, B P ( A)
=
P ( B)
0, 40 40
=
0, 70 70
P ( A / B)
=
0, 30
P ( B / A) = ?
P ( A) = 1 − P ( A) P ( A)
=
P ( A)
1 − 0, 40 40
=
0, 60 60
P ( B / A)
=
P ( B / A)
=
P( A / B) x
0, 30 x
P ( B ) P ( A)
0,70
→
0,60
P( B / A)
=
0, 35
Ejemplo2. Grupo de personas en un centro de salud F = Fiebre G = Gripe P ( F )
=
0, 75 75
P (G / F )
=
0, 80
P (G / F )
=
0,10
Solución P (G ∩ F )
=
P(G / F ) xP( F )
P (G ∩ F )
=
0, 0, 80 x0, 75
P (G ∩ F )
=
0, 60
P (G ∩ F )
=
P(G / F ) xP( F )
P (G ∩ F )
=
0, 0,10 x0, 25
P (G ∩ F )
=
0, 025
P (G )
=
P(G ∩ F ) + P(G ∩ F )
P (G )
=
0, 60 60 + 0, 02 025
P (G )
=
0,625 ,625(62 (62,5%) ,5%)
DECISION BAJO INCERTICUMBRE La toma toma de decis decisio ione nes s bajo bajo incer incerti tidu dumb mbre, re, al igua iguall que que bajo bajo ries riesgo, go, impl implic ica a accio accione nes s alte altern rnat ativ ivas as cuyas cuyas retrib retribuci ucion ones es depen depende den n de los los esta estado dos s de la natu natural ralez eza a (Ale (Aleat atori orios) os),, En form forma a espe especí cífi fica ca,, la matr matriz iz de retri retribu buci ción ón de un problema de decisión con m acciones alternativas y n estados de la naturaleza se puede representar como sigue:
El elemento
ai
representa la acción i , y el elemento elemento
s J
representa el estado de
la naturaleza j . La retribución o resultado asociado con la acción
ai
y el estado
s J
es V ( a , s ). i
J
La diferencia entre tomar bajo riesgo y bajo incertidumbre e que en el caso de la incertidumbre, la distribución de probabilidades correspondiente a los estados
s J ,
.., n, se desc descon onoc oce e o no se pued puede e determ determin inar ar.. Esta Esta falt falta a de j = 1, 2, 3 ….., información ha conducido a desarrollar los criterios siguientes para analizar el problema de decisiones: 1. Laplace. 2. Minimax. 3. Savage. 4. Hurwicz Esos criterios difieren en el grado de conservadurismo quien presente quien toma decisiones al encarar la incertidumbre. El criterio criterio Laplace se basa en el Principio de la razón insuficiente. Como no se conocen las distribuciones de probabilidades de los estados de la naturaleza, P { s }, no hay razón para creer que sean distintas. Así, las alternativas se evalúan con la hipótesis optimista de que es igualmente probable que ocurra J
cualquiera de todos los estados, esto es, que P { s } = P { s }… = P { s } = 1/n. 1
2
n
Dado que la retribución V ( a , s ) representa ganancia, la mejor alternativa es la que produce i
J
1 n máx _ ai ∑ v( ai , j j ) n j= 1 Si V ( a , s ) representa una pérdida, entonces la minimización sustituye a la maximización. i
J
El criterio Maximin (Minimax) se basa en la actitud conservadora de elegir la mejor entre la peores condiciones posibles. Si V ( a , s ) es una pérdida, se selecciona la acción que corresponde al criterio Minimax: mín a máx s v ( ai , s j ) J
i
i
j
Si V ( a , s ) es ganancia, se usa el criterio Maximin, definido por: máx má xa mín s v ( ai , s j ) i
J
i
j
El crit criteri erio o de pesa pesadu dumb mbre re o arrep arrepent entim imie ient nto o de Savage Savage trat trata a de moder moderar ar el conserv conservadu aduris rismo mo del criter criterio io Minima Minimax x (Maxim (Maximin) in) reempl reemplaza azando ndo la matriz matriz de retrib retribuci ución ón (De gananci ganancia a o pérdid pérdida) a) V ( a , s ) por una matriz de pérdida (o pesadumbre) mediante la siguiente transformación: i
J
Si v es érdida
v(a ji,s ) mín ja {v(ak j,s )}
Si v es ganancia
−
r(a ji,s ) { =
máx ja {v(ak j,s )} v(ak j,s ) −
Para ver como el criterio de Savage “Modera” el criter criterio io Minima Minimax x (Maxim (Maximin) in) veamos la siguiente matriz de perdida V ( a , s ): i
J
La aplicación del criterio Minimax indica que es preferible
a
segura de $ 10.000. Sin embargo, podríamos optar por
a1 ,
probabilidad de solo perder $ 90 si ocurre Veamos
lo
que
sucede
si
2
, con una pérdida porque hay una
s2
se
usa
la
siguiente
matriz
de
pesadumbre/arrepentimiento r ( a , s ): J
r
El criterio Minimax, cuando se aplica aplica a la matriz matriz de pesadumbre/a pesadumbre/arrepent rrepentimien imiento, to, seleccionará a a , que era lo que buscaba. El Crite Criteri rio o de Hurw Hurwic icz z está está dise diseñad ñado o para para refl reflej ejar ar las las acti actitu tude des s de toma toma de decisiones que vayan desde la más optimista hasta la más pesimista se define: 0 <= a <=, y se supone que V ( a , s ) representa una ganancia. Entonces la acción que se seleccione debe estar asociada con: 1
i
máxa i
J
máx s j v (ai , s j ) + (1 − α ) min s j v ( ai , s j )
α
El parámetro a es el índice de optimismo. Si a = 0, el criterio es conservador, por que se aplica aplica el criterio Minimax Minimax normal. normal. Si a = 1, el criterio produce resultados optimistas, por que busca la mejor de las mejores condiciones. Se puede ajustar el grado de optimismo(o de pesimismo) seleccionando un valor adecuado de a en el
intervalo (0,1). En ausencia de una fuerte preferencia al optimismo o al pesimismo, una elección adecuada sería a = 0.5. Si V ( a , s ) representa una pérdida, entonces el criterio cambia a: mína α mín s v ( ai , s j ) + (1 − α ) máx s v ( ai , s j ) i
i
J
j
j
Ejemplo: Ejemplo : National Outdoors School (NOS) prepara un campamento de verano en el corazón de Alaska, para adiestrar a las personas en supervivencia en la naturaleza. Estima que la asistencia puede estar en una de las cuatro categorías: 200, 250, 300 y 350 personas. El costo del campamento será mínimo si se construye para adaptarse exactamente a la demanda. Las variaciones de más o menos de la demanda ideal Incurren Incurren en costos adicionales, adicionales, debido a construccione construcciones s sobrantes sobrantes (No usadas) usadas) o a ingresos perdidos, cuando no cabe toda la demanda. Si a a a representan los 1
4
tama tamaños ños de los los camp campam ament entos os (200, (200, 250, 250, 300 300 y 350 350 perso persona nas) s) y s a s la asistencia, asistencia, la tabla tabla siguiente siguiente resume resume la matriz de costo (en miles miles de $) en este caso. 1
4
El problema se analizará con los cuatro criterios. Laplace. Laplace . Dada P { s } = 1/4., j = 1, 2, 3,4, los valores esperados para las diversas acciones se calculan como sigue: J
∑ { a } = ¼ (5+10+18+25) = $ 14,500 1
∑ { a } = ¼ (8+7+12+23) = $ 12,500 ------ Optimo 2
∑ { a } = ¼ (21+18+12+21) = $ 18,500 3
∑ { a } = ¼ (30+22+19+15) = $ 21,500 Minimax. El criterio Minimax produce la siguiente matriz: 4
Savage. La matriz matriz de pesadu pesadumbr mbre/a e/arrep rrepent entimi imient ento o se determ determina ina restand restando o la matr matriz iz diago diagona nall 5, 7, 12, 12, 15 de las column columnas as 1, 2, 3 y 4 respe respect ctiva ivame ment nte, e, entonces,
Hurwicz. La tabla siguiente es resumen de los cálculos.
Si se usa una adecuada a se puede determinar la alternativa optima. Por ejemplo con a = 0,25, la mejor alternativa será
(5) + (1-0,25) (25) = 20 0,25 (7) + (1-0,25) (23) = 19
a1 0,25 a
2
a3
.
a3 a
4
0,25 (12) + (1-0,25) (21) = 18,75 Mejor decisión 0,25 (15) + (1-0,25) (30) = 26,25
Y si a = 0,30, lo optimo será
a
2
(5) + (1-0,30) (25) = 19 0,30 (7) + (1-0,30) (23) = 18,2 Mejor decisión
a1 0,30 a
2
a3
0,30 (12) + (1-0,30) (21) = 18,3
a
0,30 (15) + (1-0,30) (30) = 25,5
4