INSTITUTO TECNOLOGICO DE TAPACHULA
Alumnos: Vázquez Miranda William Samuel Rodríguez Escobar Cristian Alberto Urbina Santiz Jorge Raúl Quiñonez Aguilar Jesús Alberto Samorano Lopez Leny Fabiola Catedrático: MILTON CARLOS HERNANDEZ RAMIREZ
Asignatura: Simulación
Números pseudoaleatorios
Semestre: 5° Carrera: Ingeniería en Sistemas Computacionales
Lugar y Fecha: Tapachula Chiapas, a 5 de noviembre de 2013
1
INDICE Introducción------------------------------------------------------------------------------------------3 2.1 Métodos de generación de números Pseudoaleatorios------------------------------5
2.2 Pruebas estadísticas.--------------------------------------------------------------------------6
2.2.1 De uniformidad. (Chi cuadrada, kolmogorov Smimov).--------------------------------6
2.2.2 De aleatoriedad. (Corridas arriba y debajo de la media y longitud de corridas)-11
2.2.3 De independencia. (Autocorrelación, prueba de huecos, de poquer y de Yule)-13
2.3 Método de Monte Carlo----------------------------------------------------------------------20
2.3.1 Características Método de Monte Carlo.-------------------------------------------------22
2.3.2 Aplicaciones Método de Monte Carlo.----------------------------------------------------26
2.3.3 Solución de problemas Método de Monte Carlo.---------------------------------------27
2
NÚMEROS PSEUDOALEATORIOS. En los experimentos de simulación es necesario generar valores para las variables aleatorias representadas estas por medio de distribuciones de probabilidad. Para poder generar entradas estocásticas (probabilísticas) para un modelo de simulación, se debe contar con un generador de números pseudoaleatorios. Con estos y métodos de generación de variables aleatorias, se pueden simular las entradas incontrolables para un modelo de simulación. Inicialmente los números aleatorios se generaban en forma manual o mecánica utilizando técnicas como ruedas giratorias, lanzamientos de dados, barajas. También existen métodos aritméticos que permiten generan un gran conjunto de números aleatorios, pero el advenimiento de la computadora ha permitido crear generadores que permitan generar de manera sucesiva todo los números aleatorios que se requieran. Un número pseudoaleatorio no es más que el valor de una variable aleatoria x que tiene una distribución de probabilidad uniforme definida en el intervalo (0, 1). Se sabe que la función de densidad f(x) de una variable aleatoria x con una distribución de probabilidad uniforme en el intervalo [a, b] es:
La función acumulativa F(x), que representa la probabilidad de que las variable aleatoria x sea menor o igual a un valor específico de x está dada por:
3
La figura 6, muestra la función de densidad y acumulativa para dicha variable aleatoria.
El valor esperado y la varianza de una distribución de probabilidad uniforme son respectivamente.
Al definir la función de densidad de la distribución de probabilidad uniforme en el intervalo [0, 1], una variable aleatoria R tendría una función de densidad f(R) y una función acumulada F(R), dadas por:
4
Los valores de la media y la varianza, están dados por:
La variable aleatoria R es continua y debe ser estadísticamente independiente. Finalmente para que para que un conjunto de números sean considerados aleatorios deben cumplir las siguientes características: • Deben estar uniformemente distribuidos. • Deben ser estadísticamente independientes. • Su media debe ser estadísticamente igual a ½. • Su varianza debe ser estadísticamente igual a 1/12. • Deben ser reproducibles. Propiedades de los números pseudoaleatorios. Es deseable que los números pseudoaleatorios uniformes posean las siguientes características: 1. Uniformemente distribuidos. 2.
Estadísticamente independientes.
3.
Reproducibles.
4.
Periodo largo.
5.
Generados mediante un método rápido.
6. Generados mediante un método que no requiera mucha capacidad de almacenamiento de la computadora.
2.1. MÉTODOS PSEUDOALEATORIOS.
PARA
GENERAR
NÚMEROS
Métodos Manuales: son los métodos más simples y lentos, ejemplo de estos métodos son lanzamientos de monedas, dados, cartas y ruletas. Los números producidos por estos métodos cumplen las condiciones estadísticas mencionadas anteriormente, pero es imposible reproducir una secuencia generadas por estos métodos. 5
Tablas de números aleatorios: estos números se pueden generar por medio de una hoja de cálculo o por cualquier generador de cualquier lenguaje de programación razón por la cual su comportamiento es totalmente determinístico. Mediante el computador digital: existen tres métodos para producir aleatorios mediante un computador:
números
• Provisión externa. • Generación interna a través de un proceso físico aleatorio. • Generación por medio de una regla de recurrencia. Métodos aritméticos para generar números pseudoaleatorios. Métodos de Cuadrados Medios: el procedimiento de obtención de pseudoaleatorios con este tipo de generador es el siguiente:
números
• Se define una semilla. • Se eleva la semilla al cuadrado. • Dependiendo de la cantidad de dígitos que se desea tenga el número pseudoaleatorio, se toman de la parte central del número resultante en el paso anterior el número de dígitos requeridos. Si no es posible determinar la parte central, se completa el número agregando ceros al principio o al final.
2.2 PRUEBAS ESTADÍSTICAS. Los números pseudoaleatorios producidos mediante un programa de computadora no son aleatorios debido a que tales números están completamente determinados por los datos iníciales y tienen una precisión limitada. Sin embargo, en la medida en que esos números pseudoaleatorios pasen determinadas pruebas estadísticas, pueden considerárseles como verdaderos números aleatorios. Las siguientes pruebas son de las más usadas para la comprobación de la aleatoriedad. 2.2.1 DE UNIFORMIDAD (CHI CUADRADA, KOLMOGOROV-SNIMOV) CHI-CUADRADA La prueba Chi-Cuadrada en lugar de medir la diferencia de cada punto entre la muestra y la desviación verdadera, checa la desviación del valor esperado.
6
Donde n es el número de intervalos de clase (ejemplo: Oi es el número observado en la clase iva, y Ei es el número esperado en cada clase iva, y n es el número de clases. Para una distribución uniforme, E i el número en cada clase está dado por;
Para clases igualmente espaciadas, donde N es el número total de observaciones. Puede ser mostrado que la distribución de la muestra Chi-Cuadrada esta aproximadamente a la distribución Chi-Cuadrada con n-1 grados de libertad. Ejemplo: Use la prueba Chi-Cuadrada con =0.05 para probar si los datos dados a continuación en la tabla 1 están uniformemente distribuidos.
7
Haciendo 10 intervalos de 0 a 1 con incrementos de .1 (de igual longitud) tenemos la tabla siguiente:
El valor de X2 en el apéndice de tablas es X2 calculada=3.4. Esto comparado con el valor crítico X2 0.05,9=16.9. Debido a que X2 calculada < que el valor de X2 0.05,9 de la tabla, la hipótesis Nula de que no existe diferencia entre la distribución de la muestra y la distribución uniforme se Acepta. SMIRNOV-KOLMOGOROV Esta es otra prueba de bondad y ajuste. Surgió en 1939. Kolmogorov y Smirnov supusieron que la distribución de probabilidad que se encontraba a prueba era continua y que se conocía la media y la varianza de la población. La prueba se emplea para probar el grado de concordancia entre la distribución de datos empíricos de la muestra y alguna distribución teórica específica.
8
Esta prueba sirve para verificar o negar la hipótesis que un conjunto de observaciones provienen de una distribución. La estadística D que se utiliza en esta prueba es una medida de la diferencia máxima observada entre la distribución empírica y la teórica supuesta. D es una variable aleatoria. Se utiliza esta prueba para verificar o negar que un conjunto de números pseudoaleatorios tienen una distribución uniforme en el intervalo cerrado [0,1]. Estos tests son de tipo no paramétrico para diferencias entre dos distribuciones totales o acumulativas. El test uní-muestral se refiere a la concordancia entre una distribución acumulativa observada de valores de una muestra y una función de distribución continua especificada; es decir, se trata de una prueba de bondad de ajuste. Para muestras pequeñas, debe usar Kolmogorov-Smirnov o cuando tenemos que combinar clases adyacentes a fin de usar la (ji-cuadrada). Para muestras grandes, la prueba chi cuadrado es poderosa (n>=100) la selección del número de clases es importante, ya que esta determina los grados de libertad de la prueba, y mientras más grados de libertad puede usar uno, más discriminadora será la prueba. El estadístico de prueba está dado por la diferencia existente entre la frecuencia observada relativa y la frecuencia esperada relativa: Estadístico de prueba = Valor absoluto (Frecuencia acumulada observadaFrecuencia acumulada teórica) Estadístico de prueba = Valor absoluto (Fn(x)-Fo(x)) PROCEDIMIENTO. 1. Formular la hipótesis nula, H0. Teniendo en cuenta que los números que se van a generar provienen de una distribución uniforme. 2. Se selecciona una muestra de tamaño n de números pseudoaleatorios n. 3. Se hallan los parámetros de acuerdo a la distribución que se esté utilizando y demás datos que sirvan de base para la realización de la prueba. Ej.: para el caso de una distribución normal se deben hallar los parámetros respectivos (Media, desviación estándar) y otros datos de utilidad. 4. Se debe calcular la función de distribución acumulada para después hallar las frecuencias respectivas. 5. Antes de poder hallar el estadístico de prueba se debe hallar la frecuencia observada y la frecuencia relativa de cada uno de los intervalos establecidos de acuerdo al rango. 9
6. Se aplica la ecuación D= Frecuencia observada relativa-Frecuencia esperada relativa para hallar la discrepancia de las mismas o error estadístico. 7. Posteriormente, se halla el estimador Smirnov-Kolmogorov que es: Valor máximo entre todos los valores hallados para cada intervalo. En Excel sería =Máx. [Frecuencia observada relativa-Frecuencia esperada relativa]. 8. Se hallan también los grados de libertad de acuerdo a la distribución estadística utilizada. A su vez se establece un nivel de significancia de acuerdo al planteamiento. 9. Con base a lo anterior se consulta la tabla de límites de aceptación para la prueba de Kolmogorov-Smirnov para un tamaño de muestra n y un determinado nivel de riesgo alfa, Si el estimador de la prueba es menor al valor buscado en la tabla se acepta H0 o hipótesis nula, en caso contrario se rechaza. Ejemplo: En este ejemplo se usa la prueba KS para examinar bajo un nivel de significancia de a=0.05 si un conjunto de datos representa números aleatorios (por ejemplo esta la distribución uniforme entre 0 y 1). Suponga que cinco datos son dados: 0.53, 0.35, 0.03, 0.94, y 0.22 Solución. Para la distribución Uniforme la fdp es F(x)= 1/(b-a) a≤x≤b Para este caso particular a=0 y b=1. Por lo tanto F(x)=x. Ahora se ordenan los valores en forma ascendente y se realizan los cálculos relativos. La tabla siguiente resume los cálculos realizados:
De acuerdo a los cálculos, D = Max (0.27, 0.14) = 0.27. El valor crítico de KS de la tabla en el apéndice de tablas para un tamaño de 5 y un nivel de significancia de 0.05 es 0.565. Debido a que D es menor que este valor crítico, la hipótesis de que los datos dados pertenecen a una distribución Uniforme es aceptada.
10
2.2.2 PRUEBAS ESTADÍSTICAS DE ALEATORIEDAD. (CORRIDAS ARRIBA Y DEBAJO DE LA MEDIA Y LONGITUD DE CORRIDAS). PRUEBA DE LAS CORRIDAS: Existen dos versiones de la prueba de las corridas: la prueba de corridas arriba y abajo del promedio y la prueba de corridas arriba y abajo. Prueba de corridas arriba y abajo del promedio: La prueba de corridas arriba y abajo del promedio es un caso ligeramente modificado de la prueba de la distancia en la cual α=0 y β=0.5. En esta versión de la prueba de las corridas, una secuencia de números pseudoaleatorios U 1,…Un es generada. En seguida una secuencia binaria es obtenida, en la cual el i th término es 0 si UI < 0.5 y 1 si UI>0.5. Una vez obtenida la secuencia binaria, el siguiente paso es determinar la cantidad de veces que una misma longitud de corrida se repite (frecuencia observada de la corrida de longitud i). Una sucesión de i ceros (unos), enmarcada por unos (ceros) en los extremos representa una corrida de longitud i. El número total esperado de corridas y el número esperado para cada tamaño de corrida, se obtienen las siguientes expresiones: E (total de corridas) = N+1/2 FEi = (N-i+3)/2i+1 Estas frecuencias esperadas son comparadas con las observadas a través de una distribución chi-cuadrada y una decisión sobre la aleatoriedad de los números pseudoaleatorios generados es tomada.
PRUEBA DE CORRIDAS ARRIBA Y DEBAJO DE LA MEDIA Este procedimiento consiste en determinar una secuencia de unos y ceros de acuerdo a la comparación de cada número ri que cumpla con la condición de ser mayor a 0.5 (en el caso de los unos) o ser menor a 0.5 (en el caso de los ceros). Luego se determina el número de corridas coy los valores de n0 y n1 Valores que se emplean: co= Número de corridas en la secuencia n0= Cantidad de ceros en la secuencia S 11
n1= Cantidad de unos en la secuencia de S n = Cantidad de números El n se halla de la siguiente manera:
Posteriormente se calcula el valor esperado, la varianza del número de corridas y el estadístico Z0 con las siguientes ecuaciones: Valor esperado:
Varianza del número de corridas:
El estadístico:
Para saber si el estadístico Z0 está fuera del intervalo se emplea la siguiente fórmula:
Si la condición anterior se cumple, entonces se concluye que los números evaluados son independientes, de lo contrario se rechaza al conjunto.
12
2.2.3 PRUEBAS ESTADÍSTICAS DE INDEPENDENCIA. (AUTOCORRELACIÓN, PRUEBA DE HUECOS, PRUEBA DEL PÓQUER, PRUEBA DE YULE). PRUEBA DE AUTOCORRELACIÓN Correlación es la relación recíproca entre dos o más cosas (elementos). A veces un grupo de números generados pueden parecer aleatorios, pero existe una relación entre cada cierto número de ellos a partir de alguno específico. Amplitud de autocorrelación: Es la distancia que existe entre los números de la lista que tiene la relación entre sí. Se da cada n-ésimo número aleatorio e inicia en el elemento i. Esta prueba se aplica con la suposición de los números aleatorios tiene una distribución uniforme e independiente sobre el intervalo de 1 a 0. Conceptos y parámetros que usamos en auto correlación Para analizar la correlación general para todos los pares sucesivos de números aleatorios se utiliza la estadística: Densidad de probabilidad
Dónde: N es el total de números en toda la serie; Tamaño de la muestra. i es el primer número donde empieza la amplitud de autocorrelación. m es la amplitud de la autocorrelación. M es el entero mayor tal que i+ (M+1)*m
Cumpliéndose la condición: i + ( M + 1 ) m < M
13
Desviación estándar de la autocorrelación
La estadística para determinar la significancia de la autocorrelación para la secuencia propuesta de M+1 números es:
Z significancia de la autocorrelación que tiene una distribución Normal, con media cero y una varianza de uno, bajo la suposición de independencia. Nivel de significancia Si se define el nivel de significancia por medio de a y Z 1 - a /2 el valor de Z hace que:
Para deter minar la autoc orrelación se establecen las siguientes Hipótesis; Hipótesis Nula 14
Los números aleatorios están correlacionados (No son Aleatorios) Hipótesis Alternativa Los números aleatorios No están correlacionados (Sí son aleatorios) Criterio de rechazo Entonces, Y si
si:
Se rechaza la hipótesis de aleatoriedad.. Se acepta la hipótesis de aleatoriedad.
Ejemplo 1 Tenemos la Siguiente serie de Números:
A la primera vista, estos números pueden parecer aleatorios. No obstante, al examinar de cerca estos números se ve que existe una relación clara entre cada sexto número, a partir del segundo. Cada uno de estos números varía en magnitud sucesivamente de muy grande a muy pequeño.
PRUEBAS DE HUECOS La prueba de huecos (GAP) es usada para asegurar que la recurrencia de cada dígito particular en un flujo de números suceda con un intervalo aleatorio. Se pueden usar dos pruebas para comparar estos intervalos con la longitud esperada de los huecos: La prueba Chi-Cuadrada (Ȥ2) y la prueba Kolmogorov – Smirnov (KS) es entonces usada para comparar La prueba Kolmogorov – Smirnov (KS) Para determinar si los números aleatorios generados cumplen con las propiedades especificadas (uniformidad e independencia) se tendrán las hipótesis siguientes : H0 si Dcalculada < Dconfiabilidad; se aprueba que los dígitos están ordenados aleatoriamente. H1 si Dcalculada > Dconfiabilidad; se rechaza que los dígitos están ordenados aleatoriamente. 15
La prueba de huecos se utiliza para determinar la significancia de los intervalos entre la repetición de cierto dígito. Si el dígito k va seguido por x dígitos distintos de k, antes de que vuelva a parecer k, se dice que existe un hueco de tamaño x. Por ejemplo:
Se puede tomar cualquier números aleatorio; en este caso se toma el número cero, el cual aparece 13 veces y por ende habrá 12 huecos. El primero de longitud 2, el segundo de 19, el tercero de 8, etc. Otro ejemplo tomamos el número cuatro, el cual aparece 15 veces y tendrá 14 huecos. El primero de longitud 16, el segundo de 12, el tercero de 5, etc. Para fines de esta prueba, nos interesa la frecuencia con la que se presentan los diversos huecos. Para una secuencia dada de dígitos, anotamos el número de veces que aparecen los huecos de longitudes 0, 1, 2,..... Podemos aplicar este procedimiento a un dígito simple entre 0 y 1. Después de tomar nota de la frecuencia con que aparece cada hueco, comparemos la frecuencia acumulativa relativa (Sx) observada con la frecuencia acumulativa teórica. Suponiendo que los dígitos están ordenados aleatoriamente, la distribución de frecuencias acumulativas relativas está dada por:
16
PRUEBA DE PÓQUER La prueba POKER se utiliza para analizar la frecuencia con la que se repiten los dígitos en números aleatorios individuales. Para determinar si los números aleatorios generados cumplen con las propiedades especificadas (uniformidad e independencia) se tendrán las hipótesis siguientes: H0 si X2 confiabilidad > £ (Oi – Ei)2 / Ei; se aprueba que los dígitos están ordenados al azar. H1 si X2 confiabilidad < £ (Oi – Ei)2 / Ei; se rechaza que los dígitos están ordenados al azar. Se utiliza para analizar la frecuencia con la que se repiten los dígitos en números aleatorios individuales. Por ejemplo, si nos ocupamos de números aleatorios de cinco dígitos, nos interesara la frecuencia con que ocurre lo que sigue en los números individuales: 1.- Los cinco son diferentes. 2.- Hay exactamente un par. 3.- Dos pares diferentes. 4.- Tres dígitos iguales. 5.- Tres dígitos iguales y un par. 6.- Cuatro dígitos iguales. 7.- Cinco dígitos iguales. Por supuesto, el número de esas combinaciones que se pueden dar depende del número dígitos que constituyen cada uno de los números aleatorios. Para aplicar la prueba del póquer: a) Escogemos primeramente un nivel de significancia, a, y enumeramos el grado de repetición de los dígitos. b) A continuación, calculamos la probabilidad de aparición de cada una de esas combinaciones. c) Luego, se examina la frecuencia con que se presenta cada combinación en la secuencia de números estudiados.
17
d) Posteriormente, se puede comparar la frecuencia observada con que aparece cada combinación con la frecuencia esperada, mediante la prueba de la ji cuadrada. Para comprobar que los datos pertenecen a una distribución Uniforme, se debe de cumplir la condición de que X2 Calculada < x2 a/1,g.l.. Donde x2 a/2,g.l se obtiene de la tabla de la distribución Ji cuadrada, con un nivel de significancia Į y y los grados de libertad g.l. = No. de parámetros de la distribución de probabilidad a probar menos l. (en nuestro caso estamos probando la uniformidad y la distribución uniforme no tiene parámetros ) Como ejemplo, supóngase que tenemos que aplicar la prueba de póquer a N números aleatorios de cinco dígitos. Calcularemos la probabilidad de aparición de cada una de esas combinaciones, bajo la suposición de que los dígitos se presentan de una manera completamente aleatoria.
18
Para obtener el número de veces que se puede esperar cada una de esas combinaciones, se multiplica cada probabilidad por N. Por supuesto, el número de esas combinaciones que se pueden producir depende del número de dígitos que constituyen cada uno de los números aleatorios. PRUEBA DE YULE O X2 La prueba de X2, como todas las pruebas estadísticas, asume que la Hipótesis nula es cierta y realiza el siguiente razonamiento: si los dos fármacos tienen idéntica eficacia, lo que sabemos es que en toda la población se han curado el 52% de los pacientes (104/200), por lo que en el caso del fármaco nuevo deberíamos haber encontrado 52 pacientes que mostrasen mejoría al haber estudiado a 100 pacientes. De la misma manera, en el caso del fármaco clásico deberíamos haber obtenido éxito en 52 de los 100 pacientes. A estos valores se les denomina «esperados» en contraposición a los valores «observados» en el experimento. Para calcular estos valores esperados se multiplica el total de fila por el total de la columna y se divide por el total general. En este caso para calcular los pacientes que deberíamos esperar se curaran con el fármaco nuevo multiplicamos 104 por 100 y los dividimos por 200. En una tabla como esta (2 x 2) el resto de los esperados sale por diferencia. La prueba de X2 consiste en comprobar si la discrepancia entre los valores observados y los valores esperados es pequeña (en cuyo caso no podríamos
19
afirmar las diferencias), o es lo suficientemente grande como para ratificar nuestra sospecha inicial. Esta discrepancia se mide mediante la fórmula de Pearson:
Con el fin de poder tomar una decisión referente a la eficacia de los fármacos deberemos comprobar si nuestro resultado encontrado puede ser justificado o no por el azar. Para ello deberemos comparar el valor calculado mediante la fórmula de X2 y un valor teórico que nos encontraremos en la tabla de X2 en función de los grados de libertad que tengamos. Estos grados de libertad se calculan multiplicando el número de filas menos 1 por el número de columnas menos 1.
2.3 MÉTODO DE MONTECARLO. El método de Monte Carlo es un método no determinístico o estadístico numérico usado para aproximar expresiones matemáticas complejas y costosas de evaluar con exactitud. El método se llamó así en referencia al Casino de Montecarlo (Principado de Mónaco) por ser “la capital del juego de azar”, al ser la ruleta un generador simple de números aleatorios. El nombre y el desarrollo sistemático de los métodos de Monte Carlo datan aproximadamente de 1944 y se mejoraron enormemente con el desarrollo de la computadora. El uso de los métodos de Monte Carlo como herramienta de investigación, proviene del trabajo realizado en el desarrollo de la bomba atómica durante la segunda guerra mundial en los Álamos. Este trabajo conllevaba la simulación de problemas probabilísticos de hidrodinámica concernientes a la difusión de neutrones en el material de fusión, la cual posee un comportamiento eminentemente aleatorio. En la actualidad es parte fundamental de los algoritmos de trazado de rayos para la generación de imágenes sintéticas. Los primeros experimentos de simulación se realizaron en el año 1940 en EEUU bajo el nombre de análisis Montecarlo. Los pioneros fueron Von Neumann y Ulam que publicaron un artículo intitulado "The MonteCarlo method" en 1949. El método en si ya era conocido en estadística, disciplina donde muchos problemas se resuelven utilizando muestras aleatorias (de hecho, aplicando este método).
20
Entonces podemos definir el método Montecarlo como el método numérico de simulación que permite resolver problemas matemáticos mediante la simulación de variables aleatorias.
Descripción del método de Montecarlo Existen 5 pasos ideales a seguir para el método. 1. Establecer distribuciones de probabilidad. La idea inicial es la generación de valores para las variables que componen el modelo a efectuar. Existen una gran variabilidad de ejemplos donde se llega anotar este punto, algunos de ellos son: el tiempo de descompostura de una máquina, la demanda de un inventario sobre una base diaria o semanal, el tiempo de servicio, etc. Y una manera fácil de establecer una distribución de probabilidad de una variable es a través de examen histórico. La frecuencia relativa para cada resultado de una variable se encuentra al dividir la frecuencia de la observación entre el número total de observaciones. 2. Construir una distribución de probabilidad acumulada para cada variable. Aquí se tiene que convertir una distribución de probabilidad regular a una distribución de probabilidad acumulada. Esto quiere decir que la probabilidad acumulada para cada nivel de demanda no es más que la suma del número en la columna de la probabilidad agregada a la probabilidad acumulada anterior. 3. Establecer intervalos de números aleatorios. En este paso se debe asignar un conjunto de q represente a cada valor posible. Estos están establecidos como intervalos de números aleatorios que surgieron un proceso aleatorio (tomando el número de dígitos requeridos). 4. Generación de números aleatorios. Estos números se pueden generar de dos maneras: la primera es, si se tiene un problema grande y el proceso involucra miles de ensayos, lo conveniente es utilizar algún software especializado para generarlos; la segunda, si la simulación se tiene que hacer a mano, los números se pueden seleccionar en una tabla establecida de números aleatorizados. Existe una tabla para esta última manera.
21
En esta tabla los números aleatorios se leen de arriba hacia abajo, comenzando por la esquina superior izquierda.
5. Simular el experimento. No es más q poner en práctica la simulación de dicho experimento, mediante varios ensayos para poder concluir correctamente, ya que al hacer pocos ensayos podríamos comer errores que perjudicarían el experimento o en el peor de los casos echarlo a perder.
2.3.1 PROPIEDADES Y CARACTERÍSTICAS IMPORTANTES DEL M.M.C. 1) Algoritmo de estructura muy sencilla. Como regla se elabora primero un programa para la realización de una prueba aleatoria (una muestra, por ejemplo: escoger un punto aleatorio en una superficie, y comprobar si ese punto pertenece o no a una figura de la superficie). Esta prueba se repite N veces de modo que cada experimento sea independiente de los restantes, y se toma la media de todos los resultados de los experimentos. 2) El error del valor obtenido como regla proporcional. 22
El error del valor obtenido es como regla proporcional a la magnitud s 2 / N siendo s2 la varianza (constante) y N el número de pruebas. De esta forma, para disminuir el error 10 veces deberemos aumentar N (volumen de trabajo) 100 veces. Es de notar que es imposible alcanzar una elevada exactitud, por eso el Método Monte Carlo resulta especialmente eficaz en la solución de problemas en los que se necesita conocer los resultados con una exactitud del 5 al 10% (intervalo de confianza 95%, 97,5%). La exactitud de los resultados se puede mejorar con técnicas de reducción de varianza, sin tener que aumentar el volumen de trabajo (N). Un mismo problema puede ser resuelto utilizando distintas variantes del método, es decir mediante la simulación de distintas variables aleatorias. El método es aplicable en situaciones de diversa índole: a) Problemas aleatorios diversos, orientados a eventos o no. Se resuelven creando un modelo probabilístico artificial, que cumpla con las leyes de probabilidad que se dan en el sistema real. Ejemplos: • • •
estudio de la demanda de energía eléctrica en un cierto período: depende de factores puramente aleatorios, como el clima juegos de azar estudio de la cantidad de barcos llegados a un puerto por día
b) Problemas matemáticos determinísticos. Cuando los problemas determinísticos son imposibles de resolver analíticamente o muy complicados se puede llegar a una solución aproximada mediante el uso de un modelo artificial cuyas funciones de distribución y densidad satisfagan las relaciones funcionales del problema determinístico. Ejemplos: • cálculo de integrales múltiples • ecuaciones diferenciales de orden mayor que dos. Por ello se puede hablar del MMC como un método universal de resolución de problemas matemáticos.
23
Utilicemos el método para calcular el área de un cuadrado de lado <1. Planteamos un experimento aleatorio tal que colocamos una tabla como en la figura:
Y hacemos que alguien con los ojos vendados tire dardos a la tabla. Los dardos van a perforar la tabla en N puntos aleatorios. ¿Cómo podemos estimar el área del cuadrado S a partir de esos puntos? Nos fijamos cuántos puntos están dentro de S (sean N'); supongamos que N'=5, siendo N=40. Entonces la estimación del área de S está dada por N'/N=5/40=1/8=0,125, siendo el valor exacto en este dibujo 0,3*0,3=0,09. Nótese que el área buscada cumple la relación N'/N (independiente de la forma del área incógnita) y que cuanto mayor sea N más nos vamos a acercar a la relación S/1. Para que este método de calcular el área tenga validez, los puntos aleatorios deben estar distribuidos en forma uniforme en la superficie total, y deben ser obtenidos en forma independiente. Cálculo de π Veremos, a modo de ejemplo, como calcular una aproximación del valor π, mediante el método Montecarlo (este problema tiene soluciones eficientes en forma analítica o numérica). 1) Tomamos un círculo de radio 1 centrado en el origen, sabemos que el área del cuarto de círculo inscrito en el ortante positivo es π /4. 2) Sorteamos puntos en el ortante positivo de lado 1 y lo hacemos obteniendo dos valores, uno para x (abscisa) y otro para y (ordenada) cada vez, obteniendo un punto (x,y). 24
3) Contamos cuantos puntos de los sorteados caen dentro del área del cuarto de círculo (In) y cuántos fuera (Out), sabiendo que si x2+y2>1 el punto está fuera, y si no dentro. 4) El valor estimado del área que queremos hallar es In/(In+Out), y ese valor será aproximadamente el de π /4, por lo que p será aproximadamente igual a 4* In/(In+Out) (en este caso, N=In+Out). Esta forma de calcular π es relativamente lenta y poco precisa, pero muestra la forma de utilizar Montecarlo, que en el caso de otras constantes es el único método disponible. Justificación teórica Sea X una v.a. con esperanza E(X) = m y varianza Var(X) = s². Tomo una sucesión de n v.a. Xi independientes y con igual distribución, siendo E(Xi) = m y Var(Xi) = s². Por el teorema Central del Límite la v.a. Z = X1 + X2 + X3 + .... + Xn se aproxima (y es asintóticamente igual) a una v.a. con distribución normal N(nm, ns²). Aplicando la "regla de las 3s", tenemos que para una v.a. Y de distribución N(a, s²):
Siendo fY (t) la función de densidad de la v.a. Y, por lo que
Aplicando esto a la V.A. Z tenemos
25
Lo que significa que podemos estimar m, es decir la esperanza o valor medio de la v.a. X, calculando el promedio de las distintas muestras obtenidas: ,
Sabiendo que con probabilidad muy cercana a 1, el error de este promedio está acotado por la cifra 3s/√N. Esto sugiere que para que el método tenga un buen resultado N debe ser grande y s pequeña, por lo que es importante saber cuál es el valor de la varianza obtenida, con ello sabemos cuál es la dispersión de las muestras obtenidas. La varianza s2 se estima con el siguiente cálculo:
Se debe tener especial cuidado en que todas las N corridas sean independientes entre sí, para asegurar que los valores Xi son muestras de v.a. independientes y que por lo tanto estamos dentro de las hipótesis del teorema central del límite.
2.3.2 APLICACIONES Diseño de reactores nucleares Cromo dinámica cuántica Radioterapia contra el cáncer Densidad y flujo de tráfico Evolución estelar Econometría Pronóstico del índice de la bolsa Prospecciones en explotaciones petrolíferas Diseño de VLSI Física de materiales Ecología Criptografía 26
Valoración de cartera de valores Programas de ordenador Métodos cuantitativos de organización industrial 2.3.3 SOLUCIÓN DE PROBLEMA. Ejemplo Se desea conocer la demanda diaria de un comercio alimenticio, donde elaboran emparedados. Por medio de la distribución de probabilidad del método de Montecarlo, en un periodo de 30 días.
Aplicando los pasos en la tabla. El primer paso en identificar la demanda que recibe por días. El siguiente paso es construir otra columna con la sumatoria consecutiva de cada ocurrencia de los valores.
En esta tabla se hace presente el paso 3, que trata de colocar los intervalos de los números aleatorios, simplemente se colocan los números empezando por el 27
01 hasta el valor de la probabilidad acumulada. Y después se sigue con el otro valor comenzando por número en el que se quedó. Una manera simple de ver la simulación es mediante esta simplificación ejemplo en un periodo de 10 días.
del
Por último se emplean los pasos 4 y 5 en la tabla que continua se busca un numero aleatorio en la tabla 1 expuesta en el paso 4. Después se compara el numero aleatorio obtenido con el intervalo de la tabla 3, a verificar en que intervalo cae se colocara el valor de la demanda en la tercer columna.
Por último se saca la demanda esperada que se demuestra por la siguiente fórmula:
= (.17x41)+ (.33x45)+ (.20x48)+ (.13x52)+ (.17x56) = 47.7 La demanda esperada en las mayorías de sus ensayos será similar a la demanda promedio. 28
29
BIBLIOGRAFIA
http://es.scribd.com/doc/51960661/Numeros-Pseudoaleatorios http://www.itescam.edu.mx/principal/sylabus/fpdb/recursos/r92011.PDF http://es.scribd.com/doc/111374197/simulacion
30