IESE Universidad de Navarra Barcelona-Madrid
2-195-044 ADN-238
7 0 0 2 / 1 0 / 7 0 z e o L a d e n i P l e n o i L . f o r P a / l e d o v i s u l c x e o s u l e a r a
EL TEOREMA DE BAYES
familiar.
(*)
Vamos a tratar de ilustrar el teorema de Bayes mediante un ejemplo que nos sea
Es bien conocido que, de los negocios nuevos que se crean, sólo unos pocos acaban teniendo éxito (alrededor de un 10%). Si somos un inversor que apuesta apuesta en negocios de nueva creación, estaremos interesados en apostar bien. Veamos cómo la información acerca de la persona que va a sacar adelante el negocio nos hace estar más o menos seguros del éxito del negocio. Si no sabemos nada más, la siguiente distribución refleja la incertidumbre inicial sobre si un negocio nuevo tendrá éxito o no. 0,9
o t i u t a r a t l u s n o c e d o t n e m u c o D
0,1
Exito
Fracaso
A esta probabilidad se la llama a priori o inicial, es decir, previa a tener otra información. Como hemos dicho, el éxito o el fracaso dependerán mucho de la persona que lo lleve adelante, del emprendedor, y en concreto de su preparación profesional previa. Así, (*) Nota técnica técnica de la División División de Investiga Investigación ción del del IESE. Preparada por el profesor Manuel Baucells. Enero de 1995. Copyright Copyright © 1995, IESE. IESE. Prohibida la reproducción, total o parcial, sin autorización escrita del IESE.
2
IESE Universidad de Navarra
195-044 ADN-238
podemos estar interesados en saber la relación que hay entre el nivel de educación previa (básica, universitaria, MBA) y el ser o no un emprendedor con éxito. Por experiencia sabemos que, de los negocios que han ido bien (éxito), un 30% fueron llevados a cabo por un MBA, un 50% por un universitario (Univ) y el resto, un 20%, por alguien con sólo estudios básicos (EB). Por el contrario, de los que fueron mal (fracaso), en un 10% de los casos había un MBA, en un 40% un universitario y, en un 50%, el resto. Pongamos esta información en un árbol de sucesos. 7 0 0 2 / 1 0 / 7 0 z e o L a d e n i P l e n o i L . f o r P a / l e d o v i s u l c x e o s u l e a r a o t i u t a r a t l u s n o c e d o t n e m u c o D
Probabilidad conjunta
0,3
Exito
0,5
0,1
0,2
0,9
MBA
0,03
Univ
0,05
EB
0,02
MBA
0,09
Univ
0,36
EB
0,45
0,1
Fracaso
0,4 0,5
Total 1,00 Repasemos una vez más la información que tenemos: P(Exito)
= 0,1
P(MBA/Exito) = 0,3 P(Univ/Exito) = 0,5 P(EB/Exito) = 0,2
P(Fracaso)
= 0,9
P(MBA/Fracaso) = 0,1 P(Univ/Fracaso) = 0,4 P(EB/Fracaso) = 0,5
Estas últimas son las probabilidades condicionadas. Son las probabilidades (P) de que se dé un suceso (nivel de estudios) sabiendo que (/) ha ocurrido otro (éxito o fracaso). En forma de árbol, queda claro que son las probabilidades de las ramas de la derecha, dado que han ocurrido las de la izquierda. En la columna de la derecha del árbol se leen las probabilidades conjuntas, es decir, que se den los dos sucesos a la vez. Tendremos: P (Exito y MBA) P (Exito y Univ) P (Exito y EB)
= P(Exito)·P(MBA/Exito) = 0,1·0,3 = 0,03 = 0,05 = 0,02
P (Fracaso y MBA) = 0,09 P (Fracaso y Univ) = 0,36 P (Fracaso y EB) = 0,45
3
IESE Universidad de Navarra
195-044 ADN-238
Observemos cómo la probabilidad de éxito es la suma de las probabilidades conjuntas: P (Exito) = 0,03 + 0,05 + 0,02 = 0,1 P (Fracaso) = 0,09 + 0,36 + 0,45 = 0,9
7 0 0 2 / 1 0 / 7 0 z e o L a d e n i P l e n o i L . f o r P a / l e d o v i s u l c x e o s u l e a r a
Ya intuimos que tener un MBA aumenta la probabilidad de éxito. Sin embargo, debemos ser rigurosos al razonar. La pregunta que el inversor se hace es la probabilidad de éxito o fracaso dependiendo del nivel de educación del emprendedor. Es decir, preguntas del tipo: P(Exito/MBA) P(Fracaso/MBA) P(Exito/Univ) P(Fracaso/Univ) P(Exito/EB) P(Fracaso/EB) Que no hay que confundir con cualquier otra probabilidad que aparece en el árbol. Para responderlas, deberemos dar la vuelta al árbol. Probabilidad conjunta
xito MBA 0,12 0,41
o t i u t a r a t l u s n o c e d o t n e m u c o D
0,03
Fracaso xito
0,09
Fracaso xito
0,36
Fracaso
0,45 Total 1,00
0,05
Univ
0,47
0,02
EB
Cambiando las ramas de orden, la columna de probabilidades conjuntas se mantiene. Ahora bien, ¿cómo hemos encontrado el 0,12, el 0,41 y el 0,47? Sencillamente, sumando las probabilidades conjuntas. P (MBA) = P (Exito y MBA) + P (Fracaso y MBA) = 0,03 + 0,09 = 0,12 P (Univ) = P (Exito y Univ) + P (Fracaso y Univ) = 0,05 + 0,36 = 0,41 P (EB) = P (Exito y EB) + P (Fracaso y EB) = 0,02 + 0,45 = 0,47 Para completar el árbol queremos conocer, por ejemplo, P(Exito/MBA). Sabemos que debe cumplirse la siguiente relación: P(MBA)·P(Éxito/MBA) = P(Exito y MBA) 0,12·P(Exito/MBA) = 0,03 es decir,
4
IESE Universidad de Navarra
195-044 ADN-238
P(Exito/MBA) = \F(P(Exito y MBA), P(MBA)) = \F(0,03, 0,12) = 25% En definitiva, de los negocios de nueva creación, un 12% son llevados por MBA, un 41% por universitarios y un 47% por otros. Si un 3% del 12% de MBA tiene éxito, significa que un \F(0,03, 0,12) = 25% de los MBA tiene éxito.
7 0 0 2 / 1 0 / 7 0 z e o L a d e n i P l e n o i L . f o r P a / l e d o v i s u l c x e o s u l e a r a o t i u t a r a t l u s n o c e d o t n e m u c o D
Acabamos de escribir el teorema de Bayes, que nos permite pasar de unas probabilidades a otras en el momento que tenemos información. Por tanto, podemos completar el árbol anterior con todos los cálculos: Probabilidad conjunta
xito
0,25
MBA
0,75
0,12 0,41
Fracaso xito
0,09
Fracaso xito
0,36
Fracaso
0,45 Total 1,00
0,12
Univ
0,88 0,47
0,04
EB
0,96
0,03
0,05
0,02
Al final, no era tan complicado. Se trataba de ver, de entre los MBA (0,12), qué proporción ha tenido éxito. Por tanto, si el inversor tiene información sobre el emprendedor, sus probabilidades deben ser ahora:
0,88 MBA
0,75
Universitario
0,96 Educación Básica
0,25 0,12
Exito
Fracaso
Exito
0,04
Fracaso
Exito
Fracaso
Es por esto que se suelen llamar probabilidades a posteriori o final, es decir, después del experimento o de la nueva información.
5
IESE Universidad de Navarra
195-044 ADN-238
Si trabajamos con árboles de probabilidad, vemos que el teorema de Bayes significa dar la vuelta al árbol para encontrar las probabilidades condicionadas que buscamos. La fórmula general del teorema de Bayes es: P(A/B) = \F(P(A y B), P(B))
7 0 0 2 / 1 0 / 7 0 z e o L a d e n i P l e n o i L . f o r P a / l e d o v i s u l c x e o s u l e a r a o t i u t a r a t l u s n o c e d o t n e m u c o D
Otra manera de visualizarlo es mediante el cuadrado de probabilidades conjuntas. En un cuadrado de probabilidad de 1x1, en horizontal representamos la probabilidad de la primera rama, y en vertical las probabilidades condicionadas de la segunda rama. El área interior será la probabilidad conjunta, que sencillamente es el producto de probabilidades.
P(MBA|Exito) 0,3
P(Univ|Exito) 0,5
P(EB|Exito) 0,2
o t i x é 3 0 , y 0 B E
MBA y fracaso 0,09
P(MBA|Fracaso) 0,1
Univ y fracaso 0,36
P(Univ|Fracaso) 0,4
EB y fracaso 0,45
P(EB|Fracaso) 0,5
o t i x é 5 y 0 , v 0 i n U
o t i x é 2 0 , y 0 B E
Exito 0,1
Fracaso 0,9 MBA
= 0,03 + 0,09 = 0,12
Univ
= 0,05 + 0,36 = 0,41
EB
= 0,02 + 0,45 = 0,47
Y razonando sobre el gráfico vemos como: P(Exito/MBA)
= \F(P(Exito y MBA), P(MBA))
= \F(0,03, 0,12)= 0,25
P(Fracaso/MBA) = \F(P(Fracaso y MBA), P(MBA)) = \F(0,09, 0,12) = 0,75
IESE Universidad de Navarra
P(Exito/Univ)
6
195-044 ADN-238
= \F(P(Exito y Univ), P(Univ)) = \F(0,05, 0,41) = 0,12
P(Fracaso/Univ) = \F(P(Fracaso y Univ),P(Univ)) = \F(0,36, 0,41) = 0,88 P(Exito/EB)
= \F(P(Exito y EB), P(EB)) = \F(0,02, 0,47) = 0,04
P(Fracaso/EB) = \F(P(Fracaso y EB),P(EB)) = \F(0,45, 0,47) = 0,96 7 0 0 2 / 1 0 / 7 0 z e o L a d e n i P l e n o i L . f o r P a / l e d o v i s u l c x e o s u l e a r a o t i u t a r a t l u s n o c e d o t n e m u c o D