MONOGRAFÍA SOBRE LA SIMULACIÓN DE MONTE CARLO 1
Monografía sobre la Simulación de Monte Carlo Carlos Cabrera Manrique, Renato Castro Cruz, Juan Diego Morales Q , Carlos Prado Puma y Aldair Rojas Ramírez Universidad Nacional de Ingeniería
Notas del autor Escuela de Ingeniería Industrial, Universidad Nacional de Ingeniería Este trabajo ha sido financiado por los propios alumnos. La correspondencia relacionada con este trabajo de investigación debe ser dirigida a Daniel Ortega Loayza, Universidad Nacional de Ingeniería, Av. Túpac Amaru Rímac Lima 210 Contacto:
[email protected]
MONOGRAFÍA SOBRE LA SIMULACIÓN DE MONTE CARLO 2
ÍNDICE
Carátula Índice Introducción Marco Teórico Simulación Definición………………………………………………………………………5 Tipos de simulación…………………………………………………………………………5 Etapas de una simulación…………………………………………………………………..7 Ventajas y Desventajas de los Modelos de Simulación…………………………………...7 Importancia…………………………………………………………………………………7 Usos del Modelo de Simulación……………………………………………………………9 Probabilidades Definición…………………………………………………………………………………..13 La Probabilidad y la toma de decisiones………………………………………………..14 Significado de la Probabilidad y la toma de decisiones………………………………..17 Simulación de Monte Carlo Contexto histórico…………………………………………………………………………24 Definición de la Simulación de Monte Carlo……………………………………………25 Componentes Principales de la Simulación de Monte Carlo Pseudo Generador de Números Random……………………………….27
MONOGRAFÍA SOBRE LA SIMULACIÓN DE MONTE CARLO 3
Funciones de Densidad de Probabilidad…………………………………..27 Aplicaciones del Método de Monte Carlo Aplicación 1……………………………………………………………………..40 Aplicación 2……………………………………………………………………..45 Aplicación 3………………………………………………………………..51 Aplicación 4………………………………………………………………………..53 Conclusiones Referencias
MONOGRAFÍA SOBRE LA SIMULACIÓN DE MONTE CARLO 4
INTRODUCCIÓN
El significado del verbo “simular” y del sustantivo “simulación” son significados compartidos por una amplia mayoría de los ciudadanos. Simular, y su acción, simulación adquieren el significado de “representar a algo fingiendo o imitando lo que no es” (DRAE, 2015). Distinto del verbo simular es el verbo “experimentar”, y su correspondiente sustantivo, “experimentación”, que requiere de vivir o de “notar en uno mismo alguna cosa, alguna impresión o algún sentimiento” (DRAE, 2015). Qué bueno sería poder experimentar situaciones reales en las que, de algún modo, estuvieran implicadas la aleatoriedad, la incertidumbre. Pero esto no siempre es posible. En todo caso se pueden simular con el “riesgo” que ello conlleva. Así, no es posible que en la escuela se experimente la equiprobabilidad con el lanzamiento de una moneda ideal, la “moneda” con igual probabilidad en ambos lados. Entre otras razones porque no existe tal moneda. En su lugar, se simula esa idea teórica con el lanzamiento de moneadas reales (euro, distintos pesos, sol, bolívar, colón, guaraní, córdoba, dólares de cualquier tipo, etc.) con el objetivo compartido por sus usuarios de poder obtener conclusiones sobre esa “moneda” que es, a la vez, euro, peso, sol, bolívar, colón, guaraní, córdoba o dólar y ninguna de todas ellas. No obstante, con cualquiera de dichas monedas reales se pueden experimentar sensaciones compartidas, como la incertidumbre o la aleatoriedad, pero no resultados posibles. Podemos experimentar cara o cruz o canto, en las monedas reales, pero simular solamente cara o cruz con ellas. Dentro de esta palabra “simulación” se encuentra relacionado el método Montecarlo, el cual es un procedimiento numérico y experimental que sirve para encarar problemas cuya solución no
MONOGRAFÍA SOBRE LA SIMULACIÓN DE MONTE CARLO 5
es posible a través de métodos analíticos; la ventaja fundamental de esta técnica es que gracias a su naturaleza y forma de solución, es posible generar información, simular y de ese modo ahorrar tiempo y costos cuando se la aplica. La simulación es aplicable a diferentes ramas técnicas del saber humano y por ende a sistemas administrativos y de negocios; el contexto de su tratamiento permite lograr importantes ahorros y ser una herramienta poderosa de apoyo a la toma de decisiones. El presente trabajo trata de exponer en forma simple la simulación aplicada a distintos casos para obtener un modelo que describa la situación problemática así como los resultados. La simulación de este proceso se la realiza de manera manual, aclarando que todo este procedimiento puede ser replicado en un programa de computadora que permitiría con seguridad establecer sensibilidades y cambios importantes al comportamiento teórico del modelo. Estos programas de computadoras pueden ser variados, hoy existentes en el mercado como: Minitab, @risk, etc.
MONOGRAFÍA SOBRE LA SIMULACIÓN DE MONTE CARLO 6
MARCO TEÓRICO Simulación
Definición Es el proceso de diseñar y desarrollar un modelo computarizado de un sistema o proceso y conducir experimentos con este modelo con el propósito de entender el comportamiento del sistema o evaluar varias estrategias con las se puede operar el sistema.
a) Modelo de simulación: conjunto de ideas acerca del funcionamiento del sistema expresado en relaciones funcionales entre los elementos del sistema.
b) Proceso de simulación: la acción de llevar a cabo un conjunto de pasos que lleve a una modelación, generalmente, mediante un ordenador para conocer el comportamiento ergo su funcionamiento.
Tipos de Simulación De acuerdo a la naturaleza del modelo empleado, la simulación puede ser por (Fishman, 1978): a) Identidad: Es cuando el modelo es una réplica exacta del sistema en estudio. Es la que se utiliza en las empresas automotrices cuando se realizan ensayos de choques de automóviles utilizando unidades reales.
MONOGRAFÍA SOBRE LA SIMULACIÓN DE MONTE CARLO 7
b) Cuasi-identidad: Se utiliza una versión ligeramente simplificada del sistema real. Por ejemplo, los entrenamientos militares que incluyen movilización de equipos y tropas pero no se lleva a cabo una batalla real.
c) Laboratorio: Se utilizan modelos bajo las condiciones controladas de un laboratorio. Se pueden distinguir dos tipos de simulaciones:
d) Juego operacional: Personas compiten entre ellas, ellas forman parte del modelo, la otra parte consiste en computadoras, maquinaria, etc. Es el caso de una simulación de negocios donde las computadoras se limitan a recolectar la información generada por cada participante y a presentarla en forma ordenada a cada uno de ellos. e) Hombre-Máquina: Se estudia la relación entre las personas y la máquina. Las personas también forman parte del modelo. La computadora no se limita a recolectar información, sino que también la genera. (e.g. simulador de vuelo).
f) Simulación por computadora: El modelo es completamente simbólico y está implementado en un lenguaje computacional. Las personas quedan excluidas del modelo. (e.g. es el simulador de un sistema de redes de comunicación donde la conducta de los usuarios está modelada en forma estadística). Este tipo de simulación a su vez puede ser:
1. Digital: e.g. una computadora digital.
MONOGRAFÍA SOBRE LA SIMULACIÓN DE MONTE CARLO 8
2. Analógica: e.g. una computadora analógica. En este grupo también se pueden incluir las simulaciones que utilizan modelos físicos. Etapas de una simulación
Como se observa en la figura 1, tenemos que previamente formular el problema a resolver ya que al identificar y comprender a través de una descripción en términos precisos el problema que la organización enfrenta se podrá llevar al paso de colocar objetivo y el plan del proyecto global. Al tener los objetivos claros podremos recién ser capaces de recoger la información y las variables para la conceptualización del modelo. Posteriormente, se sigue con la construcción del modelo a partir de la data recogida y se verifica si está bien hecho el modelo. En el caso de ser negativo la verificación, se repite el paso de la construcción del modelo; sin embargo si se logra verificar todos los pasos de verificación se continuará con los pasos 8, 9 y 10 (Diseño de experimentos, producción de los datos y análisis y si verifica si no se añade más datos adicionales). Si se logra satisfactoriamente todos estos pasos, se pasa a la implementación del modelo para resolver dicha situación conflictiva.
MONOGRAFÍA SOBRE LA SIMULACIÓN DE MONTE CARLO 9
Figura 1
Ventajas y desventajas de los modelos de simulación Ya que la simulación es en muchas ocasiones una herramienta apropiada de análisis, es preciso considerar las ventajas y desventajas de su utilización.
a) Ventajas a.1) Una vez construido, el modelo puede ser modificado de manera rápida con el fin de analizar diferentes políticas o escenarios.
MONOGRAFÍA SOBRE LA SIMULACIÓN DE MONTE CARLO 10
a.2) Generalmente es más barato mejorar el sistema vía simulación, que hacerlo directamente en el sistema real. a.3) Es mucho más sencillo comprender y visualizar los métodos de simulación que los métodos puramente analíticos. a.4) Los métodos analíticos se desarrollan casi siempre, para sistemas relativamente sencillos donde suele hacerse un gran número de suposiciones o simplificaciones, mientras que con los modelos de simulación es posible analizar sistemas de mayor complejidad o con mayor detalle. a.5) En algunos casos, la simulación es el único medio para lograr una solución.
b)Desventajas b.1) Los modelos de simulación en una computadora son costosos y requieren mucho tiempo para desarrollarse y validarse. b.2) Se requiere gran cantidad de corridas computacionales para encontrar "soluciones óptimas", lo cual repercute en altos costos. b.3) Es difícil aceptar los modelos de simulación. b.4) Los modelos de simulación no dan soluciones óptimas. b.5) La solución de un modelo de simulación puede dar al analista un falso sentido de seguridad. Importancia La capacidad de los modelos de simulación para tratar con la complejidad, manejar la variabilidad de las medidas de desempeño y reproducir el comportamiento a corto plazo permite que la simulación sea una herramienta poderosa para la optimización en la toma de decisiones.
MONOGRAFÍA SOBRE LA SIMULACIÓN DE MONTE CARLO 11
Usos de la simulación Actualmente la simulación presta un invalorable servicio en casi todas las áreas posibles, algunas de ellas son: a) Procesos de manufacturas: Ayuda a detectar cuellos de botellas, a distribuir personal, determinar la política de producción. b) Plantas industriales: Brinda información para establecer las condiciones óptimas de operación, y para la elaboración de procedimientos de operación y de emergencias. c) Sistemas públicos: Predice la demanda de energía durante las diferentes épocas del año, anticipa el comportamiento del clima, predice la forma de propagación de enfermedades. d) Sistemas de transportes: Detecta zonas de posible congestionamiento, zonas con mayor riesgo de accidentes, predice la demanda para cada hora del día. e) Construcción: Predice el efecto de los vientos y temblores sobre la estabilidad de los edificios, provee información sobre las condiciones de iluminación y condiciones ambientales en el interior de los mismos, detecta las partes de las estructuras que deben ser reforzadas. f) Diseño: Permite la selección adecuada de materiales y formas. Posibilita estudiar la sensibilidad del diseño con respecto a parámetros no controlables. g) Educación: Es una excelente herramienta para ayudar a comprender un sistema real debido a que puede expandir, comprimir o detener el tiempo, y además es capaz de brindar información sobre variables que no pueden ser medidas en el sistema real. h) Capacitación: Dado que el riesgo y los costos son casi nulos, una persona puede utilizar el simulador para aprender por sí misma utilizando el método más natural para aprender: el de prueba y error.
MONOGRAFÍA SOBRE LA SIMULACIÓN DE MONTE CARLO 12
¿Cuándo se debe utilizar la simulación? A primera vista, pareciera que un modelo de optimización resulta más conveniente que uno de simulación pues brinda resultados exactos rápidamente y menudo puede llegar a optimizarlo, sin embargo, existen situaciones que no se pueden adaptar a este modelo y que la simulación puede tratar por lo que es importante analizar la situación de contexto.
Cuando es difícil o imposible obtener modelos analíticos, dependiendo de los factores de complicación. (e.g. para determinar los tiempos de espera en un cajero automático o cuando se quiere evaluar la probabilidad de un producto para generar beneficios). Los modelos analíticos por lo general predicen solamente un comportamiento promedio o “de estado estable” (a largo plazo). En modelos de la vida real, sin embargo, a menudo es importante comprender la variabilidad posible en las medidas de desempeño, o la manera en que varían las medidas de desempeño a corto plazo.
La simulación puede llevarse a cabo utilizando una amplia variedad de programas, desde los de hoja de cálculo (Excel, Lotus), pasando por los complementos de hoja de cálculo (Crystal Ball, @Risk) y los lenguajes generales de programación (PASCAL, C++), hasta los lenguajes especialmente diseñados para la simulación (SIMAN). Por lo que resulta razonable construir y utilizar un simulador, aun cuando este claro que se podría elaborar un modelo analítico (de optimización) con mayor tiempo y esfuerzo.
MONOGRAFÍA SOBRE LA SIMULACIÓN DE MONTE CARLO 13
Probabilidades Definición La probabilidad es simplemente qué tan posible es que ocurra un evento determinado. Cuando no se está seguro del resultado de un evento, podemos hablar de la probabilidad de ciertos resultados: qué tan común es que ocurran. Al análisis de los eventos gobernados por la probabilidad se le llama estadística. La probabilidad es una medida de la certidumbre asociada a un suceso o evento futuro y suele expresarse como un número entre 0 y 1 (o entre 0 % y 100 %). Una forma tradicional de estimar algunas probabilidades sería obtener la frecuencia de un acontecimiento determinado mediante la realización de experimentos aleatorios, de los que se conocen todos los resultados posibles, bajo condiciones suficientemente estables. Un suceso puede ser improbable (con probabilidad cercana a cero), probable (probabilidad intermedia) o seguro (con probabilidad uno). La probabilidad de un evento se denota con la letra P y se expresa en términos de una fracción y no en porcentajes, por lo que el valor de P cae entre 0 y 1. Por otra parte, la probabilidad de que un evento "no ocurra" equivale a 1 menos el valor de P y se denota con la letra Q. 𝑃(𝑄) = 1 − 𝑃(𝐸) El mejor ejemplo para entender la probabilidad es echar un volado: Hay dos posibles resultados: águila o sol. ¿Cuál es la probabilidad de que caiga águila? La podemos encontrar al usar la ecuación P(A) =?, y tal vez, intuitivamente, sepas que la probabilidad es mitad y mitad, o sea 50%. ¿Pero cómo podemos resolver eso?
MONOGRAFÍA SOBRE LA SIMULACIÓN DE MONTE CARLO 14
Probabilidad = Número de posibilidades que cumplen la condición/ Números de experimentos En este caso: P (H) = 0,5 La probabilidad de un evento solo puede ser un número entre 0 y 1 y también puede escribirse como un porcentaje. La probabilidad del evento A suele escribirse como P(A). Si P(A) > P (B), el evento A tiene una mayor probabilidad de ocurrir que el evento B Si P(A) = P (B), los eventos A y B tienen la misma probabilidad de ocurrir.
Las probabilidades y la toma de decisiones
Generalmente en las clases de probabilidad los problemas se reducen al cálculo de la probabilidad de un determinado evento. La resolución de un problema de calcular una probabilidad de un evento, consiste en redactar el evento en términos de matemáticas y proceder a utilizar el algoritmo adecuado para calcular la probabilidad de dicho evento. Para entender lo que estamos hablando, consideremos la siguiente situación. Ejemplo. En las fiestas cívicas de Zapote hay un puesto donde se puede jugar DADOS A SEIS. Este juego consiste en lanzar dos dados distintos, si la suma de los resultados de los dados es menor igual a 6 se gana el juego sino se pierde. ¿Cuál es la probabilidad de ganar DADOS A SEIS? Solución. El problema tiene como único fin calcular una probabilidad: la probabilidad de que al lanzar dos dados distintos la suma de los resultados sea menor igual a 6. La siguiente tabla muestra los posibles resultados de la suma al lanzar dos dados, se sombrean los resultados menores iguales a seis:
MONOGRAFÍA SOBRE LA SIMULACIÓN DE MONTE CARLO 15
+
1
2
3
4
5
6
1
2
3
4
5
6
7
2
3
4
5
6
7
8
3
4
5
6
7
8
9
4
5
6
7
8
9
10
5
6
7
8
9
10
11
6
7
8
9
10
11
12
Resulta que de los 36 posibles resultados al lanzar dos dados sólo hay 15 en los cuales la suma de los resultados es menor igual a 6. Por lo tanto, la probabilidad de ganar el juego es 15/36. Se resolvió el problema. Note que solo se hizo el cálculo pero no interesa utilizarlo para algo. Es más, para el estudiante, no interesa saber cuánto da la probabilidad, solo si lo hizo correcto o no. El único fin del estudiante es que su cálculo concuerde con la respuesta correcta. Estos tipos de problemas no entran en las situaciones problema de Brousseau (1986) y descontextualizan el concepto de probabilidad. Recordemos que un concepto adquiere sentido en su aplicación. Así se deben plantear situaciones en las cuales el estudiante al involucrarse con el problema, vea como una opción recurrir a la probabilidad para medir la posibilidad de ocurrencia de uno o varios eventos que detecte, y utilice el valor de esas probabilidades para dar una solución al problema. Pero, ¿Cómo serán estas situaciones problema? ¿Qué tipo de solución dan al problema? Para plantear estas situaciones problemas debemos analizar las aplicaciones del concepto de probabilidad. Una de las principales aplicaciones de la probabilidad es la toma de
MONOGRAFÍA SOBRE LA SIMULACIÓN DE MONTE CARLO 16
decisiones. Cambiar un problema como “calcule la probabilidad de ganar el juego” por “¿Jugaría dicho juego?” o “pagaría por jugar dicho juego”, le da sentido al problema e involucra al estudiante. Replanteemos el ejemplo anterior. Ejemplo. En las fiestas cívicas de Zapote hay un puesto donde por 1000 soles se puede jugar DADOS A SEIS. Este juego consiste en lazar dos dados distintos, si la suma de los resultados de los dados es menor igual a 6 se gana el juego sino se pierde. Si se gana el juego, se obtiene un premio de 1 500 soles. ¿Jugarías DADOS A SEIS? En esta situación problema el estudiante debe tomar una decisión: jugar o no DADOS A SEIS. Así, para decidir se requiere que el estudiante recurra a un subproblema que le ayudara a decidir, este es: ¿Cuál es la probabilidad de resolver DADOS A SEIS? De acuerdo al ejemplo anterior, la probabilidad de ganar el juego es de 15/36. Pero la solución del problema no queda ahí, se debe tomar la decisión. Resulta que 15/36 es aproximadamente 41.67%. Así, la probabilidad de ganar DADOS A SEIS es cercana al 42% que es menor al 50%, por lo que la decisión más racional es no jugar el juego, pues es mayor la probabilidad de no ganarlo (cerca del 58%) que la probabilidad de ganarlo (cerca del 42%). La probabilidad se puede ver como un modelo para resolver problemas de toma de decisiones. Una de las características principales del modelo probabilístico es que no es determinista, es decir la solución brinda al problema de toma de decisiones no es la correcta sino la que probablemente sea más beneficiosa. El cálculo de probabilidades por sí solo no es atractivo para los estudiantes y erosiona el V Encuentro sobre Didáctica de la Estadística, la Probabilidad y el Análisis de Datos 6 concepto de probabilidad. Los significados de las probabilidades y la toma de decisiones
Batanero (2005) brinda los distintos significados históricos de la probabilidad:
MONOGRAFÍA SOBRE LA SIMULACIÓN DE MONTE CARLO 17
• Significado intuitivo. Es producto de ideas intuitivas y se da en personas que no han estudiado probabilidades, pero a través de frases y expresiones logran cuantificar el grado de ocurrencia de un evento. • Significado laplaciano. La probabilidad es vista como un valor relativo formado por el número de resultados que favorecen el evento, entre el número total de resultados. Este significado es aplicable cuando la cantidad total de resultados es finita y estos son equiprobables. • Significado frecuencial. La probabilidad es el valor al que se acerca la frecuencia relativa con que es observado el evento cuando la cantidad de veces que se repite un experimento aumenta, suponiendo que ese valor límite existe. En este caso, la frecuencia relativa con que es observado el evento, cuando la experiencia se repite un número grande de veces, es una aproximación a la probabilidad. Para un abordaje más detallado de este nivel puede consultar Sanabria & Núñez (2010, 2011). • Significado subjetivo. La probabilidad es el grado de ocurrencia del evento basado en el conocimiento y la experiencia personal. Esta puede ser diferente para distintas personas. • Significado teórico. La probabilidad es una teoría matemática formalizada. Sobre estos significados de probabilidad, Batanero (2005) indica: “… su enseñanza no puede limitarse a una de estas diferentes perspectivas, en razón de que están ligadas dialécticamente. La probabilidad puede contemplarse como razón de posibilidad a favor y en contra, como evidencia V Encuentro sobre Didáctica de la Estadística, la Probabilidad y el Análisis de Datos 8 proporcionada por los datos, como grado de creencia personal y como modelo matemático que ayuda a comprender la realidad”. Por lo tanto, una buena propuesta sobre la enseñanza de la probabilidad debe integrar los otros significados de probabilidad. Así, es importante que el
MONOGRAFÍA SOBRE LA SIMULACIÓN DE MONTE CARLO 18
estudiante confronte la probabilidad obtenida (de forma frecuencial o teórica) con el valor intuitivo que él tenía de esa probabilidad. Así, en la enseñanza de la probabilidad, el docente debe buscar situaciones problema que le permitan recorrer la diversidad semántica del concepto de probabilidad, pues estos distintos significados nutrirán y darán forma al concepto que adquiera en probabilidad. Pero, ¿Cómo introducir los significados de probabilidad en la toma de decisiones? En los problemas de toma de decisiones se puede rescatar los significados de probabilidad y ver cómo estos influyen en la toma de decisiones. A nivel de secundaria los significados utilizados son: intuitivo, frecuencial y teórico. El significado intuitivo de probabilidad ayuda a comprender el problema y se puede asociar con una toma de decisión intuitiva para resolver el problema, y que luego se puede contrastar con la decisión final. Además, esto permite ver la existencia de mitos o conceptos erróneos. Ejemplo (¿Juegas o no?) En las fiestas cívicas de Zapote hay un puesto donde por 1000 soles se puede jugar DADOS A SEIS. Este juego consiste en lazar dos dados distintos, si la suma de los resultados de los dados es menor igual a 6 se gana el juego sino se pierde. Si se gana el juego, se obtiene un premio de 1 500 soles. Se debe tomar una decisión: jugar o no DADOS A SEIS. a) Analice las repercusiones de las diferentes decisiones que se puede tomar. b) Intuitivamente, ¿Cuál decisión tomaría? ¿Por qué? En el ejemplo, la parte “a)” corresponde a la sección anterior. La parte b) es importante que el docente analice las respuestas de sus estudiantes. Por ejemplo, un estudiante puede decir que tomará la decisión de no jugar, pues los resultados donde la suma es menor a 6 son: 2,3, 4,5 y 6. Estos son 5 de 11 resultados, por lo que no es favorable jugar. Sin embargo esto refleja un obstáculo epistemológico, que traducido a probabilidad, el estudiante está utilizando la Ley de Laplace para calcular la probabilidad a eventualidades no equiprobables. Posiblemente, esto se
MONOGRAFÍA SOBRE LA SIMULACIÓN DE MONTE CARLO 19
evidencie más claramente cuando en las partes siguientes del problema se solicite tomar la decisión. Pero además, el significado intuitivo se puede introducir al solicitarle al estudiante que simule en concreto varias veces la experiencia aleatoria, ver qué decisión tomaría con base en los datos obtenidos y comparar esta decisión con la decisión racional según la probabilidad. Esto permite introducir la importancia de la Ley de los Grandes Números, el significado frecuencial y además favorece el entendimiento del problema. Ejemplo (¿Juegas o no?) En las fiestas cívicas de Zapote hay un puesto donde por 1000 colones se puede jugar DADOS A SEIS. Este juego consiste en lazar dos dados distintos, si la suma de los resultados de los dados es menor igual a 6 se gana el juego sino se pierde. Si se gana el juego, se obtiene un premio de 1 500 soles. Se debe tomar una decisión: jugar o no DADOS V Encuentro sobre Didáctica de la Estadística, la Probabilidad y el Análisis de Datos 9 A SEIS. a) Analice las repercusiones de las diferentes decisiones que se puede tomar. b) Antes de decidir si se va al puesto a pagar por jugar este juego, juegue DADOS A SEIS en el aula, veinte veces. c) Intuitivamente, ¿Cuál decisión tomaría teniendo en cuenta los datos obtenidos en b)? ¿Por qué? En este ejemplo, note que la parte b) favorece que el estudiante comprenda bien el problema y vea cuándo gana y cuándo pierde. Veamos las respuestas que pueden obtener tres estudiantes:
# De veces que se
Ganó
Decisión intuitiva
ganó Josefina
7
Menos de la mitad
No jugar
Antonella
10
La mitad
Es indiferente
Alonso
12
Más de la mitad
Sí jugar
MONOGRAFÍA SOBRE LA SIMULACIÓN DE MONTE CARLO 20
Como vimos, la decisión racional utilizando la probabilidad es la de Josefina. Pero ¿por qué la decisión intuitiva puede fallar? Recuerde que la Ley de los Grandes Números establece las condiciones bajo las cuales la probabilidad frecuencial de que ocurra el evento se aproxima a la probabilidad real o teórica: Dada una experiencia aleatoria, sea A un evento, si la experiencia se repite un número suficientemente grande de veces, entonces la probabilidad frecuencial de A será muy cercana al valor real de la probabilidad. Así, pocas simulaciones de la situación involucrada puede llevar a tomar una decisión intuitiva incorrecta. Esto es parte de la comprensión correcta del significado frecuencial de probabilidad. El significado frecuencial de probabilidad se puede introducir en el cálculo de la probabilidad. Ejemplo (¿Juegas o no?) En las fiestas cívicas de Zapote hay un puesto donde por 1000 soles se puede jugar DADOS A SEIS. Este juego consiste en lazar dos dados distintos, si la suma de los resultados de los dados es menor igual a 6 se gana el juego sino se pierde. Si se gana el juego, se obtiene un premio de 1 500 soles. Se debe tomar una decisión: jugar o no DADOS A SEIS. Realice un análisis formal de la situación y conteste: ¿Jugaría DADOS A SEIS? En este ejemplo, como ya se mencionó, para resolverlo el estudiante debe recurrir a calcular la probabilidad de ganar el juego para orientar su decisión. Este cálculo lo puede realizar utilizando probabilidad frecuencial. Para ello, simulemos. este juego cien veces utilizando Excel. Para eso se denota en la hoja de Excel:
MONOGRAFÍA SOBRE LA SIMULACIÓN DE MONTE CARLO 21
Celda
A1
B1
C1
Escribir
Dado 1
Dado 2
¿Ganó?
Celda
A2
B2
C2
Escribir
=ALEATORIO.ENTRE (1;6)
=ALEATORIO.ENTRE (1;6)
=SI (A2+B2<=6;”SI”;”NO”)
Note que si la de los resultados de los dados es menor a seis (A2+B2<=6), entonces se da con respuesta SÍ, pues si se ganó el juego. Hasta el momento se ha simulado sólo un juego, donde un posible resultado es:
Para simular cien juegos, basta seleccionar las celdas escritas de la fila 2 y con el mouse arrastrar estas fórmulas hasta la fila 101, obteniendo
MONOGRAFÍA SOBRE LA SIMULACIÓN DE MONTE CARLO 22
Para determinar cuántas veces se ganó el juego de las cien partidas, se puede escribir en un celda vacía “=CONTAR.SI (C2:C101;"=SÍ")”.
En nuestra simulación, el valor que da esta celda es 44. Por lo tanto, la probabilidad frecuencial de ganar el juego es de 44%. Por lo tanto la decisión racional utilizando probabilidad frecuencial es no jugarlo. Incluso el estudiante puede realizar también el cálculo de la probabilidad teórica de ganar el juego (cerca del 42%) y compararla con la probabilidad frecuencial. En general, el concepto de probabilidad frecuencial se puede aprovechar de diferentes formas en problemas de toma de decisiones: a) En algunas situaciones se puede realizar el cálculo de probabilidades tanto de forma frecuencial como de forma teórica. Esto permitirá a los estudiantes valorar la compatibilidad de los significados.
MONOGRAFÍA SOBRE LA SIMULACIÓN DE MONTE CARLO 23
b) En algunas situaciones donde el significado teórico es insuficiente o muy tedioso y es necesario recurrir al significado frecuencial para el cálculo las probabilidades. Un ejemplo de esto, es el problema de Monty Hall donde se debe tomar una decisión: Cambiarse o no de puerta. Y para ello, el cálculo de probabilidad suele ser muy tedioso teóricamente por V Encuentro sobre Didáctica de la Estadística, la Probabilidad y el Análisis de Datos 11 lo que se recurre al enfoque frecuencial. c) En la toma de decisiones. Para esclarecer la última opción. De acuerdo a la Ley de los Grandes Números, la decisión tiende a ser más contundente cuando es mayor la cantidad de veces que decido o no realizar la experiencia aleatoria. Ejemplo. Considere el juego DADOS A SEIS y suponga que ahora se pagan 1000 colones por jugar y si gana obtiene 2 000 colones. Manuel tiene 200 mil colones y decide invertirlos y paga 200 juegos de DADOS A SEIS. Él espera recuperar el dinero invertido y obtener algo de ganancia. Apoyaría la decisión de Manuel. En este ejemplo, se debe tomar una decisión: apoyar o no a que Manuel invierta su dinero en Dados a SEIS. La probabilidad de ganar dados (ya sea que se halle de forma frecuencial o teórica) es cerca al 42%. Por lo que, de acuerdo al significado frecuencial de probabilidad y a la Ley de los Grandes Números, si de los 200 juegos que juega Manuel gana un número n de veces, entonces 𝑛 / 200 ≈ 42% De donde n es aproximadamente 84. Es decir, se espera ganar alrededor de 84 juegos, obteniendo una ganancia aproximada de 168 mil y gasto 200 mil. Por lo tanto, la decisión más racional es no apoyar a Manuel.
MONOGRAFÍA SOBRE LA SIMULACIÓN DE MONTE CARLO 24
Note que en este ejemplo se introduce intuitivamente el concepto de esperanza de variables aleatorias.
Simulación de Monte Carlo
Contexto Histórico Dada una situación de entender la probabilidad del resultado al lanzar una moneda hacia arriba, no solo una vez; sino millones de veces se tendrá un estimado de cuál de las dos caras fue la más seleccionada. Pero como este tipo de preguntas y curiosidades pueden generar la solución a problemas relacionado a lo que pasa en un reactor nuclear, en una recesión, o a largas distancias astronómicas con las estrellas. La idea de usar el azar en una manera determinada fue revolucionaria y nació como idea de dos de las mentes más grandes que EEUU haya visto jamás. La primera simulación Monte Carlo fue desarrollada y usada sistemáticamente durante el Proyecto Manhattan, el cual fue el proyecto que EEUU buscaba en el periodo de la Segunda Guerra Mundial (1939-1945) para desarrollar armamento nuclear ante la sospecha de indicios nucleares en la Alemania Nazi y contó con la participación de grandes físicos de la época. Los dos artífices de dicha simulación John von Neumann y Stanislaw Ulam, sugirieron dicho modelo para investigar las propiedades de los neutrones que viajan a través de un blindaje contra radiación. Monte Carlo fue llamado así por el principado de Mónaco por ser la “capital del juego de azar”, al tomar una ruleta como un generador simple de números aleatorios. El nombre y el
MONOGRAFÍA SOBRE LA SIMULACIÓN DE MONTE CARLO 25
desarrollo sistemático de los métodos de Monte Carlo datan aproximadamente desde 1944 con el desarrollo de la computadora. La simulación de Monte Carlo es ahora más usada como una herramienta científica para resolver problemas analíticos no prácticos en la resolución, de mucho consumo, y costosos.
Definición de la Simulación de Monte Carlo La simulación de Monte Carlo es una técnica cuantitativa que hace uso de la estadística y de los ordenadores para imitar, mediante modelos matemáticos, el comportamiento aleatorio de sistemas reales no dinámicos. Esta simulación proporciona soluciones a una gran variedad de problemas matemáticos complejos posibilitando la realización de experimentos con muestreos de números pseudoaleatorios desde una computadora. La clave de la simulación de Monte Carlo consiste en crear un modelo matemático probabilístico del sistema, identificando las variables (inputs por computadora) cuyo comportamiento aleatorio determina al sistema en sí. Cuando se identifique estas variables se pasa a generar muestras aleatorias (valores concretos) y analizar el comportamiento del sistema ante los valores generados. Tras repetir n veces el experimento dispondremos de n observaciones sobre el comportamiento del sistema, lo cual será un muy buen indicador de su funcionamiento. Se aclara que mientras más veces se haya realizado la experimentación, es decir mientras n sea mayor, nuestro error disminuirá considerablemente. Matemáticamente se puede definir este método:
MONOGRAFÍA SOBRE LA SIMULACIÓN DE MONTE CARLO 26
Figura 2 Dada un largo escenario X y una distribución f(x) sobre X, se dibuja escenarios N independientes e idénticamente distribuidos. Ver Figura 2.
𝑁
1 → 𝑝𝑁 (𝑥) = 𝑝(𝑥) ∑ 1(𝑥 (𝑖) = 𝑥) 𝑁→ ∞ 𝑁 𝑖=1
Se puede también usar este ejemplo (Ver Figura 2) para tener resultados computacionales. 𝑁
1 𝐸𝑁 (𝑓) = ∑ 𝑓(𝑥 (𝑖) ) 𝑁 𝑖=1
→ 𝑁→ ∞
𝐸(𝑓) = ∑ 𝑓(𝑥)𝑝(𝑥) 𝑥
MONOGRAFÍA SOBRE LA SIMULACIÓN DE MONTE CARLO 27
Componentes Principales de la Simulación de Monte Carlo
Pseudo Generador de Números Random También llamado generador pseudo-aleatorio de números (GPAN), es un algoritmo que produce una sucesión de números que es una muy buena aproximación a un conjunto aleatorio de números. La sucesión no es exactamente aleatoria en el sentido de que queda completamente determinada por un conjunto relativamente pequeño de valores iniciales (estado del GPAN). Si bien es posible generar sucesiones mediante generadores de números aleatorios por dispositivos mecánicos que son mejores aproximaciones a una sucesión aleatoria, los números pseudoaleatorios son importantes en la práctica para simulaciones (por ejemplo, de sistemas físicos mediante el método de Montecarlo), y desempeñan un papel central en la criptografía. Un pseudo generador de números random muy común es el linear congruential generator (LGC). Dado una muestra nth, In, la siguiente muestra sería:
𝐼𝑛+1 = (𝑎𝐼𝑛 + 𝑐) 𝑚𝑜𝑑𝑚 Donde: mod es un operador matemático que pertenece a una librería ya incluida en los distintos lenguajes de programación (e.g. Matlab, @risk)
Funciones de Densidad de Probabilidad La función de densidad de probabilidad, función de densidad, o, simplemente, densidad de una variable aleatoria continua describe la probabilidad relativa según la cual dicha variable
MONOGRAFÍA SOBRE LA SIMULACIÓN DE MONTE CARLO 28
aleatoria tomará determinado valor. La probabilidad de que la variable aleatoria caiga en una región específica del espacio de posibilidades estará dada por la integral de la densidad de esta variable entre uno y otro límite de dicha región. La función de densidad de probabilidad (FDP o PDF en inglés) es no-negativa a lo largo de todo su dominio y su integral sobre todo el espacio es de valor unitario. Muestreo de las funciones de densidad de probabilidad a) Distribución Uniforme Continua: Es una familia de distribuciones de probabilidad para variables aleatorias continuas, tales que para cada miembro de la familia, todos los intervalos de igual longitud en la distribución en su rango son igualmente probables. El dominio está definido por dos parámetros, S y R, que son sus valores mínimo y máximo. La distribución es a menudo escrita en forma abreviada como U(S,R).
𝑝(𝑥) =
1 ,𝑅 ≤ 𝑥 ≤ 𝑆 𝑆−𝑅
Para propósitos de muestreo, usamos generalmente el uso de función de distribución acumulativa, cual está definida como una integral del PDF:
𝑥
𝑃(𝑥) = ∫ 𝑝(𝑥) = 𝑅
𝑥−𝑅 ,𝑅 ≤ 𝑥 ≤ 𝑆 𝑆−𝑅
b) Distribución Exponencial:
𝑥
−𝜏 𝑝𝑎𝑟𝑎 𝑥 ≥ 0 𝑓(𝑥) = 𝑃(𝑥) = { 𝜏𝑒 0 𝑐𝑎𝑠𝑜 𝑐𝑜𝑛𝑡𝑟𝑎𝑟𝑖𝑜
MONOGRAFÍA SOBRE LA SIMULACIÓN DE MONTE CARLO 29
c) Distribución Normal: También llamada distribución de Gauss o distribución gaussiana. Es una de las distribuciones de probabilidad de variable continua que con más frecuencia aparece aproximada en fenómenos reales. La importancia de esta distribución radica en que permite modelar numerosos fenómenos naturales, sociales y psicológicos. Mientras que los mecanismos que subyacen a gran parte de este tipo de fenómenos son desconocidos, por la enorme cantidad de variables incontrolables que en ellos intervienen, el uso del modelo normal puede justificarse asumiendo que cada observación se obtiene como la suma de unas pocas causas independientes.
𝜑(𝑥; 𝜇; 𝜎 2 ) =
1 𝜎 √2𝜋
𝑒
(𝑥−𝜇)2 − 2𝜎 2
d) Distribución de Poisson: Es una distribución de probabilidad discreta que expresa, a partir de una frecuencia de ocurrencia media, la probabilidad de que ocurra un determinado número de eventos durante cierto período de tiempo. Concretamente, se especializa en la probabilidad de ocurrencia de sucesos con probabilidades muy pequeñas, o sucesos "raros".
𝜏 𝑘 𝑒 −𝜏 𝑓(𝑘; 𝜏) = 𝑘! Donde: k: Es el número de ocurrencias del evento o fenómeno (la función nos da la probabilidad de que el evento suceda precisamente k veces). λ: Es un parámetro positivo que representa el número de veces que se espera que ocurra el fenómeno durante un intervalo dado.
MONOGRAFÍA SOBRE LA SIMULACIÓN DE MONTE CARLO 30
APLICACIONES PRÁCTICAS DEL MÉTODO MONTE CARLO
Aplicación 1
Una cadena de supermercados es abastecida por un almacén central donde la mercadería llega a este almacén durante la semana en un día particular a partir de las 11:00 de la mañana. Esto quiere decir que la mercadería que se provee puede ser descargada a partir de este horario. Un equipo de tres personas se ocupa de descargar esta mercadería tomando en cuenta que aproximadamente a las 15:00 tendrán un tiempo de media hora para tomar su almuerzo. El salario por hora que reciben este personal es de 25 $. El almacén debe procesar alrededor de unas quince descargas diarias, entendiendo que los camiones disponibles cuando terminen de descargar, irán a traer otra carga. La descarga debe terminar en teoría a las 20:00, debiéndose pagar horas extra si se pasa de este horario; el salario extra del personal sube a 30 $ por hora. El costo de espera del camión es de 100 $ por hora. Los tiempos y probabilidades de llegada y de servicio, se muestran en los cuadros Figura 3 Figura 4
MONOGRAFÍA SOBRE LA SIMULACIÓN DE MONTE CARLO 31
Mediante una simulación de las 15 descargas, estimar los parámetros relevantes para ver el comportamiento semanal de las descargas. Solución: Variables exógenas N = El número de clientes a simular, en este caso 15 S = El número de estaciones en paralelo, en este caso uno TAi = Tiempo de arribo del i-ésimo cliente TSi = Tiempo de servicio para el iésimo cliente CE = Costo horario de espera de un cliente CS = Costo salarial horario CX = Costo de Horas extra sobre las 20:00
Variables de estado TECi = Tiempo de Espera del i-ésimo cliente TESi = Tiempo de Espera del i-ésimo servidor TTEC = Tiempo Total de Espera para el cliente en la cola TTES = Tiempo total de espera para el servidor o canal TTA = Tiempo Total de Arribo o llegadas TTS = Tiempo Total de Servicio NCi = Longitud de cola en el i-ésimo cliente (Longitud de la línea) TX = Tiempo extra excedido sobre las 20:00
MONOGRAFÍA SOBRE LA SIMULACIÓN DE MONTE CARLO 32
Parámetros λ= Tasa media de arribos o llegadas μ= Tasa media de servicios 1/λ= La media del tiempo entre arribos 1/λ= La media del tiempo de Servicio Variables endógenas ωq = El Tiempo Esperado de Espera en la Cola ω = El Tiempo Esperado de Espera en el Sistema (cola + servicio) Lq = El número esperado de clientes en la cola L = El número esperado de clientes en el sistema (cola + servicio) ρ = Tasa de ocupación del sistema de colas Fórmulas TTA = ∑ 𝑇𝐴𝑖 TTS = ∑ 𝑇𝑆𝑖 Γ = N- 1/ (TTA) υ = N/ TTS Lq = ∑
𝑁𝐶 𝑁
TTEC = ∑ 𝑇𝐸𝐶 Wq = TTEC/N TTES = ∑ 𝑇𝐸𝑆 W = Wq + 1/ υ TX = TT -20:00
MONOGRAFÍA SOBRE LA SIMULACIÓN DE MONTE CARLO 33
E(CE) = W * CE * N / 60 E(CS) = CS * TT *S E(CX) = TX*CX E(CT) = E(CE) + E(CS) + E(CX)
En las gráficas se distribuye los números pseudoaleatorios tanto de los tiempos entre llegadas y los tiempos de servicios a través de un generador de números aleatorios y después son representados a través de una función de Poisson..
MONOGRAFÍA SOBRE LA SIMULACIÓN DE MONTE CARLO 34
Una vez establecido los elementos del modelo matemático, se debe desarrollar un procedimiento de simulación que puede ser aplicado después en un programa de computador, sea en un lenguaje de propósitos especiales o en un lenguaje de alto nivel. El procedimiento sigue los siguientes pasos: 1. Generar un número random para simular el tiempo de servicio del primer cliente que empieza a ser atendido a las 11:00. Con ese número aleatorio distribuido entre 0 y 1 encontrar en la tabla de distribución acumulada el tiempo de servicio. 2. Con el tiempo de servicio simulado determinar el tiempo de terminación del servicio (11:50). 3. Acumular la longitud de la línea de espera. 4. Generar un número random y simular el tiempo entre llegadas, para el segundo cliente, en la distribución acumulada del tiempo entre llegadas. 5. Calcular la nueva hora de llegada. 6. Poner el reloj de inicio del servicio de acuerdo al horario de terminación del servicio anterior. 7. Generar un random y simular otro tiempo de servicio en la distribución acumulada. 8. Determinar el tiempo de finalización del servicio. 9. Calcular y determinar el tiempo de espera sea para los encargados o para el cliente simulado. 10. Acumular la línea si corresponde. 11. Repetir desde el paso 4.
MONOGRAFÍA SOBRE LA SIMULACIÓN DE MONTE CARLO 35
Se pasa a determinar las constantes de los tiempos de espera y de servicio para poder hallar las demás variables. Los parámetros y resultados que se pueden obtener de acuerdo a las identidades definidas en la formulación del modelo, son: El tiempo promedio de arribo al sistema y la tasa media de arribo:
MONOGRAFÍA SOBRE LA SIMULACIÓN DE MONTE CARLO 36
Los resultados obtenidos por la simulación son: El tiempo promedio de arribo al sistema es de 41.07 minutos.
MONOGRAFÍA SOBRE LA SIMULACIÓN DE MONTE CARLO 37
El tiempo promedio de servicio es 36.67 minutos. El tiempo de espera en la cola es de 26.33 minutos. El costo esperado de espera es de 658.25 dólares. El costo esperado de servicio es de 120 dólares. El costo esperado total es de 1453.25 dólares.
Aplicación 2 Se desea conocer la demanda diaria de un comercio alimenticio, donde elaboran emparedados. Por medio de la distribución de probabilidad del método de Montecarlo, en un periodo de 30 días.
Tabla 1 Demanda
Frecuencia
Probabilidad de ocurrencia
Probabilidad acumulada
41
5
5/30=0.17
0.17
45
10
10/30=0.33
0.50
48
6
6/30=0.20
0.70
52
4
4/30=0.13
0.83
56
5
5/30=0.17
1.00
MONOGRAFÍA SOBRE LA SIMULACIÓN DE MONTE CARLO 38
Aplicando los pasos en la tabla. El primer paso en identificar la demanda que recibe por días. El siguiente paso es construir otra columna con la sumatoria consecutiva de cada ocurrencia de los valores.
Tabla 2 Demanda
Frecuencia
Probabilidad de ocurrencia
Probabilidad acumulada
Interval os
41
5
5/30=0.17
0.17
1-17
45
10
10/30=0.33
0.50
17-50
48
6
6/30=0.20
0.70
50-70
52
4
4/30=0.13
0.83
70-83
56
5
5/30=0.17
1.00
83-100
En esta tabla se hace presente el paso 3, que trata de colocar los intervalos de los números aleatorios, simplemente se colocan los números empezando por el 01 hasta el valor de la probabilidad acumulada. Y después se sigue con el otro valor comenzando por número en el que se quedó. Una manera simple de ver la simulación es mediante esta simplificación del ejemplo en un periodo de 10 días. Por último se emplean los pasos 4 y 5 en la tabla que continua se busca un número aleatorio en la tabla 1 expuesta en el paso 4. La cual es la siguiente: Se escoge un valor cualquiera empezando de la esquina superior izquierda (estos valores varían de 0-100 pues representan porcentajes y fueron obtenidos a mano). Después se compara el
MONOGRAFÍA SOBRE LA SIMULACIÓN DE MONTE CARLO 39
número aleatorio obtenido con el intervalo de la tabla 2, para verificar en que intervalo cae finalmente se colocara el valor de la demanda en la tercera columna. Tabla 3 Número de día
Número aleatorio
Demanda diaria acumulada
1
88
56
2
14
41
3
90
56
4
21
45
5
13
41
6
49
45
7
34
45
8
62
52
9
78
52
10
12
41
Total de demanda en 10
464
días Demanda promedio
464/10=46.4
Por ejemplo para el primer día se escogió el número 88 y este porcentaje corresponde al 5to intervalo por tanto se le asigna su valor de su demanda a la tabla y asi se realiza para los demás.
MONOGRAFÍA SOBRE LA SIMULACIÓN DE MONTE CARLO 40
Por último se saca la demanda esperada que se demuestra por la siguiente fórmula:
Demanda esperada=
( probablidaddeunidadesi) x(demandadeunidadesi) i 1
= (.17x41)+ (.33x45)+ (.20x48)+ (.13x52)+ (.17x56)= 47.7 La demanda esperada en las mayorías de sus ensayos será similar a la demanda promedio.
Aplicación 3 En la imagen se muestra un círculo dentro de un cuadrado, estimar el valor de π usando el Método de Monte Carlo.
Figura 13 Sol: En primer lugar, se empieza a
generar un pseudo generador de
números aleatorios en el programa Excel y compararemos estos números con dardos.
Uniformes en [0,1] → rand (
MONOGRAFÍA SOBRE LA SIMULACIÓN DE MONTE CARLO 41
Uniformes en [a,b]
x = a + (b − a)*rand()
Se establece que 1 es el valor
máximo tomado y como solo
puede tomar valores discretos la función de probabilidad, entonces 1 es el valor cuando el dardo definido anteriormente se encuentra dentro del círculo y 0 en el caso contrario. A continuación se presenta los resultados: (Ver Figura 14)
Figura 14 Utilizando el método de comparando con la proporción cuadrado se obtiene que:
Monte Carlo y luego de áreas entre el círculo y el
MONOGRAFÍA SOBRE LA SIMULACIÓN DE MONTE CARLO 42
Se obtiene la estimación aproximada ya que el total fue 30 000 solo se tuvo un error de aproximación del 1/√30000 ≈ 0, nada que afecte al cálculo.
Aplicación 4 La compañía PcSA comercia equipo informático. El equipo de la compañía encargado del diseño de productos ha desarrollado un prototipo de una impresora portátil de alta calidad. Esta nueva impresora tiene un potencial para ganarse un porcentaje importante del mercado. Los análisis preliminares financieros y de mercadeo han llevado a establecer un precio de venta y un presupuesto para los costos administrativos y de publicidad para el primer año. Precio de venta = 70.000 colones por unidad Costos administrativos = 160 millones de colones Costos de publicidad = 80 millones de colones, Sin embargo, el costo de mano de obra directa, el costo de componentes y la demanda del primer año de la impresora no se conocen con exactitud y por lo tanto se consideran las entradas probabilísticas del modelo. Ahora bien, el comportamiento de estas entradas se debe describir mediante distribuciones de probabilidad. De acuerdo con
MONOGRAFÍA SOBRE LA SIMULACIÓN DE MONTE CARLO 43
experiencias previas, se han hecho las siguientes mejores estimaciones de los valores anteriores, a saber: 15.000 = costo de mano de obra directa, 30.000 = costo de componentes, 20.000 = demanda del primer año. Estos valores formarán el escenario básico para la empresa PcSA. Se requiere, además, un análisis del potencial de utilidades de la impresora durante su primer año. Para ello ponemos: C1 = costo de mano de obra por unidad. C2 = costo de componentes por unidad. X = demanda del primer a ñ o Por lo tanto, el modelo se puede escribir como: Utilidad = (70.000- C 1 - C 2 )X - 240.000.000 Si sustituimos los mejores valores estimados, se tiene la siguiente proyección de las utilidades Utilidad = (70.000-15.000-30.000) 20.000-240.000.000= 260.000.000 Observemos que este escenario es atrayente, pero qué pasaría si los estimados anteriores no ocurren tal y como se espera. Supongamos que la empresa cree que los costos de mano de obra pueden oscilar de 10.000 hasta 22.000 colones por unidad, el costo de componentes de 25.000 hasta 35.000, y la demanda del primer a ño puede resultar de 9. 000 hasta 28.500 unidades. En realidad, debemos evaluar dos escenarios más: uno pesimista y otro optimista. Para el escenario pesimista tenemos la utilidad proyectada: Utilidad = (70.000-22.000-35.000) 9.000-240.000.000 = -123.000.000
MONOGRAFÍA SOBRE LA SIMULACIÓN DE MONTE CARLO 44
Es decir, se tiene una pérdida proyectada de 123 millones de colones. En cambio, para el escenario optimista se proyecta la siguiente ganancia: Utilidad = (70.000-10.000-25.000) 28.500-240.000= 757.500.000 Se puede concluir que, por el análisis anterior, las utilidades anteriores pueden estar en un rango desde una pérdida de 123 millones a una utilidad de 757.000.000, con un valor de escenario base de 260.000.000 dado por . Se pueden analizar otros escenarios que PcSA desee considerar. Sin embargo, la dificultad en este tipo de análisis es que no especifica cuál es la probabilidad de cada uno de los distintos valores de utilidad o de pérdida. De hecho, no se tiene ninguna idea de la probabilidad de una pérdida. PROCESO DE SIMULACIÓN Lo que haremos ahora será similar a desarrollar muchos escenarios de “qué pasaría si”, generando de manera aleatoria valores para las distintas entradas probabilísticas del problema, con la ventaja de que nos va a permitir tener un juicio sobre la probabilidad de los posibles valores de utilidad o de pérdida. Ahora necesitamos generar valores para las entradas probabilísticas que sean representativas de lo que pudiéramos observar en la práctica. Para generar estos valores, necesitamos saber cuál es la distribución de probabilidad de cada entrada probabilística como se indicó al principio. Supongamos que ciertos análisis realizados por PcSA han llevado a considerar las siguientes distribuciones de probabilidad: Costos de mano de obra directa Este costo va de 10.000 hasta 22.000 por unidad, quedando descrito por la tabla 1.
MONOGRAFÍA SOBRE LA SIMULACIÓN DE MONTE CARLO 45
Costo de componentes El costo de componentes va de 25.000 hasta 35.000 por unidad siguiendo una distribución uniforme. Sabemos que este costo depende en general de la economía, de la demanda y de políticas de precios de los proveedores.
Demanda del primer año Esta demanda queda descrita por la distribución de probabilidad normal, donde el valor medio esperado es de 14.500 unidades y la desviación estándar es de 4.000 unidades. Ahora para simular el problema de PcSA se deben generar valores para estas tres entradas probabilísticas y calcular la utilidad resultante. Después se debe generar otro juego de valores para las mismas entradas probabilísticas, calcular un segundo valor para la utilidad y así sucesivamente. Se continúa el proceso hasta que estemos seguros de que se han realizado suficientes ensayos para poder tener una buena imagen de la distribución de los valores que toma de utilidad. Este proceso de generar las entradas probabilísticas y de calcular el valor del resultado se conoce como simulación. Observemos que el precio de venta, el costo administrativo y el costo de publicidad, se conservan fijos en toda la corrida de simulación. Para la simulación se pueden desarrollar mediciones de interés, por ejemplo, en particular estamos interesados en calcular: a) la utilidad promedio y b) la probabilidad de una pérdida Como las mediciones de estos resultados tienen que ser significativas, los valores de las entradas probabilísticas tienen que ser representativos de lo que es probable que ocurra al
MONOGRAFÍA SOBRE LA SIMULACIÓN DE MONTE CARLO 46
introducir la nueva impresora en el mercado. Veamos la capacidad de cómo generar estos valores representativos para las distintas entradas probabilísticas.
Números aleatorios y la generación de valores de entradas probabilísticas Los números aleatorios generados por computadora se eligen al azar en el intervalo de 0 a 1, pero sin incluir a 1. Como cada número generado por computadora tiene la misma probabilidad, se dice que están distribuidos de manera uniforme en el intervalo [0,1]. Colocando =RAND() o =ALEATORIO() en una celda de Excel, se producirá un número aleatorio entre 0 y 1. Generación para la distribución de probabilidad discreta Comenzaremos por mostrar cómo generar un valor para el costo de mano de obra directa por unidad. Se asigna un intervalo de números aleatorios a cada valor posible del costo de mano de obra directa, de forma que la probabilidad de generar un número aleatorio en el intervalo sea
MONOGRAFÍA SOBRE LA SIMULACIÓN DE MONTE CARLO 47
igual a la probabilidad del costo de mano de obra directa correspondiente. En la tabla de costo de mano de obra se muestra la manera de hacerlo. Para lograr generar números aleatorios en Excel siguiendo una distribución discreta, se va a Análisis de Datos en Herramientas y se escoge generación de números aleatorios, luego en el cuadro de diálogo se marca en la casilla de número de variables: 1 ó 5, dependiendo el número de columnas escogidas donde se colocarán los números, en la casilla de Número de números aleatorios: se pone el número de ensayos, en este caso 70, donde dice distribución, se escoge discreta porque se tiene la distribución ya dada por la tabla anterior, la cual se debe especificar en la celda que dice: valor y probabilidad del rango y finalmente se escoge una celda para el rango de salida. Otra posibilidad es usar la función BUSCARV, la cual hace la misma función anterior sin tener que usar los menús anteriores. Lo anterior se realiza pues como los números aleatorios tienen una misma probabilidad, así los analistas pueden por tanto asignar rangos de números aleatorios a valores correspondientes de entradas probabilísticas, de manera que la probabilidad de cualquier valor de entrada al modelo de simulación sea idéntica a la probabilidad de su aparición en el sistema real. Por tanto, ahora la probabilidad de generar un número aleatorio en cualquier intervalo es igual a la probabilidad de obtener el valor correspondiente del costo de mano de obra directa, por lo que, para generar un valor aleatorio para el costo de mano de obra directa, generaremos un número aleatorio entre 0 y 1. Si el número aleatorio es mayor a 0,0, pero inferior a 0,3, se define el costo de mano de obra directa igual a 10.000. Si el número aleatorio es mayor a 0,3, pero
MONOGRAFÍA SOBRE LA SIMULACIÓN DE MONTE CARLO 48
inferior a 0,6, estableceremos el costo de mano de obra directa igual a 16.000 y así sucesivamente. Generación de valores para el costo de componentes Como su distribución de probabilidad es distinta a la del costo de mano de obra directa, procederemos de manera diferente en la generación de los valores. Como su distribución es uniforme (esto es válido para cualquier distribución de probabilidad uniforme), se utiliza la siguiente relación entre el número aleatorio y el valor asociado del costo de componentes, la cual se obtiene a partir del método de la transformada inversa: Costo de componentes = a + r(b-a), en donde r= número aleatorio entre 0 y 1 con distribución uniforme a= valor más pequeño para el costo de componentes del costo de componentes Para nuestro caso, a = 25.000 y b=35.000; por tanto el costo de componentes está dado por la ecuación: Costo de componentes = 25.000 + r(35.000-25.000) = 25.000 + 10.000r. Poniéndolo en el lenguaje de Excel, se tendría la fórmula: Costo de componentes = 25.000 + 10.000 * aleatorio( ). Supongamos ahora que se tiene el número aleatorio 0,2680, en este caso el valor del costo de componentes que se genera es: 25.000 + 10.000* 0,2680 = 27.680. Si en el siguiente ensayo se genera un número aleatorio igual a 0,5871; entonces, el costo de componentes sería 30.871 y así sucesivamente. Generación de valores para la demanda del primer año
MONOGRAFÍA SOBRE LA SIMULACIÓN DE MONTE CARLO 49
Como la demanda tiene una distribución normal con media ∝=14.500 y desviación estándar σ=4.000. El procedimiento para generar números aleatorios a partir de una distribución normal no se explicará debido a su complejidad matemática. Sin embargo, los paquetes de simulación por computadora y principalmente las hojas de cálculo poseen una función que genera valores al azar a partir de una distribución de probabilidad normal, lo único que se necesita es introducir el valor medio y la desviación estándar. En el caso de Excel, colocamos la siguiente fórmula en una celda para obtener el valor de una entrada probabilística que está distribuida normalmente: =NORMINV(RAND( ), µ=media, σ=desviación estándar) Para nuestro caso en particular, tendríamos: =NORMINV(RAND( ), µ=14.500, σ=4.000) o =DISTR.NORM.INV(ALEATORIO ( ), µ=14.500, σ=4000)
NOTA: Se puede observar que números aleatorios inferiores a 0,5 generan valores de la demanda por debajo de la media y números aleatorios superiores a 0,5 generan valores de la demanda por encima de la media. Así, el número aleatorio 0,5000 debe generar una demanda de 14.500 Ejecución del modelo de simulación El paso por seguir es realizar los cálculos de las respectivas utilidades: Cada uno de los ensayos en la simulación involucra generar valores al azar para las entradas probabilísticas (costo de mano de obra directa, costo de componentes y demanda del primer año) y después calcular la
MONOGRAFÍA SOBRE LA SIMULACIÓN DE MONTE CARLO 50
utilidad. La corrida de simulación queda concluida cuando se haya llevado a cabo un número satisfactorio de ensayos Contenidos de las celdas de los costos, la demanda y la utilidad: - Costo de mano de obra: =BUSCARV(ALEATORIO( ); $A $4: $C$8, 3, verdadero) - Costo de componentes: = 25.000 + 10.000*ALEATORIO( ) - Distribución de la demanda: =DISTR.NORM.INV (ALEATORIO ( ), 14.500, 4.000) - Utilidad: = (70,000 -B12 -C12)*D12- 200.000.000 (En referencia a la fila 12 de la siguiente tabla). Las fórmulas anteriores se introducen en la fila correspondiente al primer ensayo, posteriormente se realiza un “copy” en cada columna hasta el número deseado de ensayos, en este caso 70. Las funciones BUSCARV y DISTR. NORM.INV se localizan en las funciones estadísticas de fx. La siguiente tabla nos muestra cómo proceder para nuestro problema con una simulación de 70 ensayos. Usted puede realizar 2000 ensayos para obtener un cuadro más realista. Recuerde que de muestra a muestra los resultados difieren, precisamente por el error de muestreo. Podemos observar que para esta muestra de 70 utilidades, tenemos que la probabilidad de pérdida es de un 7,1%. La repetición del proceso de simulación con distintos valores de entradas probabilísticas es parte esencial de cualquier simulación. A través de ensayos repetidos, la administración empezará a comprender lo que pudiera ocurrir cuando el producto se introduce en el mercado. Vemos que en el caso de la simulación los valores generados para las entradas probabilísticas aparecen con las mismas posibilidades que se esperaría ocurriera en la práctica. De hecho, un ensayo no aporta una comprensión completa de los niveles posibles de utilidad o de pérdida, por
MONOGRAFÍA SOBRE LA SIMULACIÓN DE MONTE CARLO 51
tanto se recomienda correr la simulación para un número relativamente grande de ensayos como una forma de obtener resultados útiles.
MONOGRAFÍA SOBRE LA SIMULACIÓN DE MONTE CARLO 52
MONOGRAFÍA SOBRE LA SIMULACIÓN DE MONTE CARLO 53
MONOGRAFÍA SOBRE LA SIMULACIÓN DE MONTE CARLO 54
Interpretación de los resultados de la simulación Los resultados obtenidos nos van a ayudar a comprender mejor el potencial de utilidad o de pérdida. Por tanto, se recomienda realizar un histograma de la utilidad simulada y obtener además las correspondientes estadísticas descriptivas para el número de ensayos pedidos en la simulación, en estas últimas se puede incluir el número de pérdidas (para calcular la probabilidad de una pérdida), la utilidad mínima y la utilidad máxima. Con estos datos se toman las decisiones adecuadas. Recordemos que los estudios de simulación permiten una estimación objetiva de la probabilidad de una pérdida, lo que es un aspecto de importancia en el análisis de riesgo.
MONOGRAFÍA SOBRE LA SIMULACIÓN DE MONTE CARLO 55
Es claro que con la simulación se obtiene mucha mayor información. Así, por ejemplo, aunque los escenarios pesimista y optimista son posibles, puede suceder que en una corrida de 1 000 simulaciones, estos sean poco probables. Por otra parte, si por ejemplo se tiene una probabilidad de pérdida de 0,071, la cual puede ser aceptable para la administración, dado que se tiene una probabilidad de que la utilidad sea beneficiosa. De lo contrario, PcSA puede realizar nuevas investigaciones de mercado antes de decidir la introducción del producto. En cualquier caso, los resultados de la simulación deben ser una ayuda para llegar a una decisión apropiada.
MONOGRAFÍA SOBRE LA SIMULACIÓN DE MONTE CARLO 56
Para evaluar el riesgo correspondiente del proyecto, se usó las estadísticas descriptivas, además se puede utilizar la tecla F9 para realizar otra simulación completa de PcSA. En este caso, la hoja de cálculo volverá a calcularse y se incluirá un nuevo conjunto de resultados de simulación. Cualquier resumen, medidas o funciones de los datos que se hubieran incorporado anteriormente a la hoja de cálculo se actualizarán de manera automática. Para realizar la estadística descriptiva y su histograma, primero se debe congelar o fijar la columna de las utilidades; esto se consigue marcando las 70 utilidades obtenidas y luego proceder así: copiar / copiar / pegado especial / pegar / valores. A continuación presentamos la estadística descriptiva de la simulación anterior; esto se consigue en Análisis de datos que se encuentra en Herramientas de Excel. Observemos que la utilidad menor es de -105 280 031,8 y la utilidad superior es de 557 753 867,4. Además, la utilidad promedio es de 158 312 474,2, con una desviación estándar bastante grande de 132 220 387,9. También, como destacamos antes, se debe realizar un histograma de los resultados de la simulación; debajo del cuadro de la estadística descriptiva, aparece el cuadro de frecuencia realizado por Excel y que proporciona el siguiente gráfico (Herramientas / Análisis de datos / Histograma):
MONOGRAFÍA SOBRE LA SIMULACIÓN DE MONTE CARLO 57
Los intervalos de confianza también proporcionan información valiosa, en este caso Excel nos dice que el nivel de confianza es:
Por tanto, el intervalo de confianza para esta simulación será [126.785.645,2- 189.839.303,2] Es decir, podemos tener un 95% de confianza en que la verdadera utilidad esperada está en algún punto entre 126.785.645,2 y 189.839.303,2, siendo nuestra mejor aproximación 158.312.474,2. Si se desea más precisión, se deben realizar más de 70 ensayos para dar una mejor estimación del rendimiento esperado, pero incluso con un mayor número de ensayos puede haber alguna diferencia entre el promedio simulado y el rendimiento esperado real.
MONOGRAFÍA SOBRE LA SIMULACIÓN DE MONTE CARLO 58
Observamos que con la simulación se obtiene más información que con los escenarios; qué pasaría si incluso escenarios pesimistas y optimistas podrían tener pocas probabilidades de que ocurrieran en la realidad, lo cual nos da mucha información para un buen análisis de riesgo; se puede además observar cuáles son los valores de utilidad más probables. Si queremos realizar un número grande de ensayos en Excel, digamos 2000 ensayos, esta tarea puede convertirse en una actividad tediosa y aburrida. Para compensar lo anterior y evitar llenar hojas de trabajo con muchos datos innecesarios, hay disponibles en el mercado dos tipos de software orientados a Excel que minimizan estos trabajos: ®CRYSTALL BALL y ®CRYS, los cuales aplicaré en posteriores trabajos. Finalmente, en aquellos casos en que se tenga un modelo analítico para describir el problema, es mejor usar este que la simulación. Sin embargo, en los problemas donde se presenta riesgo e incertidumbre, es recomendable el uso de la simulación.
MONOGRAFÍA SOBRE LA SIMULACIÓN DE MONTE CARLO 59
CONCLUSIONES
El método Monte Carlo es muy exitoso debido al empleo del azar de una forma determinada para la resolución de múltiples problemas matemáticos complejos que no se puedan resolver analíticamente. Además, este método es aplicable para cualquier tipo de problema ya sea determinístico o estocástico, lo cual lo dota de multidisciplinario. Asimismo, el Método Monte Carlo es una arma muy poderosa para la predicción de resultados de un sistema modelado, por ende sería un buen predictor de cómo la economía de un gobierno se comportaría respecto a un gobierno.
MONOGRAFÍA SOBRE LA SIMULACIÓN DE MONTE CARLO 60
REFERENCIAS
Azarang M., Garcia. Simulación y análisis de modelos estocásticos E. Mc. Graw Hill. México Eppen, F/ Gould, G/ Schmidt, C.P/ Moore, J/ Weatherford, L.”Investigación de operaciones en la ciencia administrativa”. Prentice Hall. México. 2000. Ing. José Martín Velásquez Vargas. Tesis: Estimación de pérdidas por sismo en edificios peruanos mediante Curvas de Fragilidad analíticas. Azofeifa, Carlos E. Aplicación de la Simulación Monte Carlo en el cálculo del riesgo usando Excel Tecnología en Marcha. Vol. 17 N˚ 1. Bonate, Peter. (2001). A Brief Introduction to Monte Carlo Simulation. Clinical pharmacokinetics. Robert L. Harrison. Introduction To Monte Carlo Simulation.AIP Conf Proc. Author manuscript; available in PMC 2011 Jan 1. Shirley Ho.Tesis: Introduction to Monte Carlo. Princeton University, New York. 2000 EPPEN, G.D.; GOULD, F.J. (2000). Investigación de Operaciones en la Ciencia Administrativa. Ed. Pearson. México. RIOS INSUA, David; RIOS INSUA, Sixto (2000). Simulación, métodos y aplicaciones. Ed. Alfa Omega. Colombia. HILLIER; LIEBERMAN (2002). Investigación de Operaciones. Ed. McGraw Hill; 7ª Ed. EEUU.