.2 OPTIMIZACIÓN La humanidad hace tiempo que busca, o profesa buscar, mejores maneras de realizar las tareas cotidianas de la vida. A lo largo de la historia de la humanidad, se puede observar la larga búsqueda de fuentes más efectivas de alimentos al comienzo y luego de materiales, energía y manejo del entorno físico. Sin embargo, relativamente tarde en la historia de la humanidad, comenzaron a formularse ciertas clases de preguntas generales de manera cuantitativa, primero en palabras y después en notaciones simbólicas. Un aspecto predominante de estas preguntas generales era la búsqueda de lo "mejor" o lo "óptimo". Generalmente, los gerentes buscan simplemente lograr alguna mejora en el nivel de rendimiento, es decir, un problema de "búsqueda de objetivo". Cabe destacar que estas palabras normalmente no tienen un significado preciso Se han realizado grandes esfuerzos por describir complejas situaciones humanas y sociales. Para tener significado, esto debería escribirse en una expresión matemática que contenga una o más variables, cuyos valores deben determinarse. La pregunta que se formula, en términos generales, es qué valores deberían tener estas variables para que la expresión matemática tenga el mayor valor numérico posible (maximización) o el menor valor numérico posible (minimización). A este proceso general de maximización o minimización se lo denomina optimización. La optimización, también denominada programación matemática, sirve para encontrar la respuesta que proporciona el mejor resultado, la que logra mayores ganancias, mayor producción o felicidad o la que logra el menor costo, desperdicio o malestar. Con frecuencia, estos problemas implican utilizar de la manera más eficiente los recursos, tales como dinero, tiempo, maquinaria, personal, existencias, etc. Los problemas de optimización generalmente se clasifican en lineales y no lineales, según las relaciones del problema sean lineales con respecto a las variables. Existe una serie de paquetes de software para resolver problemas de optimización. Por ejemplo, LINDO o WinQSB resuelven modelos de programas lineales y LINGO, MATLAB y What'sBest! resuelven problemas lineales y no lineales. 1.2.1 Objetivo de la Optimización La Programación Matemática, en general, aborda el problema de determinar asignaciones óptimas de recursos limitados para cumplir un objetivo dado. El objetivo debe representar la meta del decisor. Los recursos pueden corresponder, por ejemplo, a personas, materiales, dinero o terrenos. Entre todas las asignaciones de recursos admisibles, queremos encontrar la/s que maximiza/n o minimiza/n alguna cantidad numérica tal como ganancias o costos. El objetivo de la optimización global es encontrar la mejor solución de modelos de decisiones difíciles, frente a las múltiples soluciones locales. Optimizar es sinónimo de buscar lo mejor, también alcanzar la ganancia máxima o tener la pérdida mínima. El hombre a lo largo de su historia ha intentado siempre
proyectarse hacia la cumbre o alcanzar el éxito en sus actividades, sean estas empresariales, científicas o políticas. En todas ellas las técnicas de optimización han formalizado y cuantificado, mediante procedimientos matemáticos, la forma de alcanzar lo mejor en una circunstancia o problema bien definido. El objetivo de la optimización es por lo tanto, seleccionar la mejor decisión posible para un conjunto dado de circunstancias sin tener que enumerar todas las posibilidades. En los años recientes el asunto de optimización ha madurado y se ha usado ampliamente en numerosas aplicaciones, por ejemplo, las operaciones de refinación de petróleo, las rutas para la aviación comercial, mezclado de alimentos y trayectorias de proyectiles. Los métodos de optimización aprovechan la ventaja de la estructura matemática del problema para encontrar los mejores valores más eficazmente; y el tamaño de los problemas a resolver han seguido el crecimiento en la capacidad de la computadora, sobre todo en el caso de programación lineal.
1.3 OPTIMIZACIÓN DE PROCESOS La optimización de procesos consiste en encontrar un valor óptimo (el mejor según el criterio aplicado) para una función dada o condiciones óptimas para un proceso dado. En tal sentido la optimización de procesos abarca el diseño óptimo incluyendo la selección de la mejor alternativa entre varias opciones de diseño y la operación óptima del proceso, en donde se busaca las condiciones de operación que den el mejor resultado según el criterio de medida de la bondad del proceso. En ambos casos, antes de que un óptimo sea determinado correctamente, debemos seleccionar un criterio de optimización. Este puede ser una variable del proceso, tal como, el rendimiento de un producto por unidad de volumen de reactor, el costo mínimo de producción, etc Sobre la base del criterio de optimización, se desarrolla luego una función objetivo o función retorno la cual relaciona el criterio de optimización a los parámetros dominantes. La meta de la optimización es maximizar o minimizar la función objetivo, según el caso. El problema de optimización ocurre en los casos donde uno tiene que seleccionar entre dos o más características cuantitativas afectando las variables de proceso diferentemente una en contra de la otra. Por ejemplo, la eficiencia de proceso puede ser equilibrada en contra del rendimiento específico, calidad en contra de la cantidad, inventario de productos en contra de su ventas, productividad en contra de gastos, etc. Con respecto a los procesos automáticamente controlados o los sistemas, la optimización es considerada como consistente en dos etapas, estática y dinámica. La optimización estática tiene como su meta desarrollar y realizar un modelo optimo para el proceso en cuestión. La optimización dinámica busca el desarrollar y realizar sistema optimo de control para el proceso.
Dependiendo de la naturaleza de los modelos matemáticos elegidos, pueden ser usados diferentes métodos de optimización matemática. Muchos de ellos buscan maximizar o minimizar la función objetivo.
1.4 FORMULACIÓN DE PROBLEMAS DE OPTIMIZACIÓN Como se ha visto anteriormente son requeridos tres componentes básicos para optimizar un proceso industrial: Un modelo matemático del proceso, un modelo económico del proceso y un procedimiento de optimización. También, las restricciones en los materiales, equipo de proceso, mano de obra, etc. debe satisfacerse según lo especificado en el modelo del proceso. La Fig. 1-1 es un diagrama que ayuda situar la práctica industrial en perspectiva relacionando el proceso y modelos económicos y los dos niveles de optimización. La optimización de planta encuentra las mejores condiciones de operación para una planta compuesta de unidades de proceso que fabrican cantidades especificadas de varios productos para aumentar al máximo las ganancias de la compañía dentro de las restricciones establecidas por la disponibilidad de materias primas y cómo estas materias primas pueden transformarse en la planta. La optimización de la planta usualmente aproxima las unidades individuales del proceso en una manera relativamente simple para obtener una respuesta satisfactoria en un tiempo razonable. Esto requiere que las condiciones óptimas de operación de las unidades individuales de proceso sean conocidas, y estos resultados ser usados en la optimización de la planta para tener la operación de la planta con el máximo beneficio. Así mismo, debido a la complejidad de las grandes plantas industriales, los modelos individuales del proceso normalmente son simplificados usando las ecuaciones de la simulación para mantener los esfuerzos de programación por computadora y los costos de computación en un nivel razonable. Sin embargo, con las unidades individuales de proceso es posible usar modelos más detallados para determinar más precisamente las condiciones de operación óptimas, por ejemplo, temperaturas, presiones, razones de reciclo, etc. para tener el costo de operación mínimo conocido como una función de estas variables.
Fig. 1-1 Diagrama simplifica do de la practica Industrial para la Optimización de Plantas y procesos
Como se muestra en la Fig. 1-1, las ecuaciones de simulación son obtenidas de los modelos del proceso (ver Modelamiento y Simulación de Procesos del mismo autor). El procedimiento es para desarrollar modelos precisos basados en los fundamentos de termodinámica, cinética y fenómenos de transporte. Esto normalmente conduce a modelos de procesos los cuales representan con precisión los cambios físicos y químicos que toman lugar sobre una gama amplia de condiciones. Sin embargo, estos modelos usualmente son más complicados en la forma matemática y pueden requerir la solución de ecuaciones diferenciales. Consecuentemente, estos modelos de procesos son usualmente empleados sobre el rango de operación del proceso, y es desarrollada la simulación (regresión) de las ecuaciones de una forma matemática simplificada, la cual es entonces usada con el método de optimización para la optimización de la planta. Sin embargo, puede no ser necesario pasar por la etapa de simulación de las ecuaciones si la ecuación que describe las principales variables, es decir, las únicas que afectan la operación económica del proceso o la planta, no es complicada. Aún cuando la optimización abarca diferentes campos, consideremos el caso de un proceso industrial en el cual el objetivo es maximizar las utilidades, para lo cual partiendo de que:
Utilidades = Ventas – Costos de operación (1.1) Como nuestro objetivo es maximizar los costos, la ecuación, Ec. (1.1) será nuestra función objetivo. Considerando que en el proceso productivo solamente se puede manejar las variables relacionadas a los costos de operación, los cuales son el principal componente de costos, podemos formular una función que describa los costos de operación y ahora nuestra función objetivo en forma simplificada será: Costo total de operación = Costo de materia prima + Costo de inversión (1.2) o CT = C1 + C2 (1.2b) C1 = Costo de materia prima C2= Costo de inversión De la Ec. (1.1), podemos ver que minimizando los costos se maximiza las utilidades, por lo que nuestro problema se transforma en este caso a un problema de encontrar el costo mínimo (minimización) Cabe indicar que generalmente existen otros componentes costos de operación adicionales a los indicados en la Ec. (1.2). Para ilustrar las consideraciones dadas veamos el siguiente ejemplo: Ejemplo 1.1
Se desea producir 100 gmol de R por hora a partir de una alimentación que consiste de una solución saturada de A (CAo= 0,1 gmol/lit.). La reacción es la siguiente: A ------------ R
rR = 0,2 CA (k = 0,2 hr -1) y debe tener lugar en un reactor CSTR (Reactor continuo tipo tanque agitado) DATOS: - El costo de reactante a la concentración dada es $0.50/gmol de A
- El costo de un reactor CSTR incluyendo instalación como auxiliares e instrumentación es $ 0,01 /h-lit Qué tamaño de reactor, caudal de alimentación y conversión se deben usar en una operación óptima? Cuál es el costo unitario de R?
SOLUCION En este caso las variables que podemos usar para modelar el proceso son: la conversión (x), el caudal de alimentación (FA), la concentración de entrada (CAo), la concentración de salida (CA) y el volumen del reactor (V), el tiempo espacial ()o velocidad espacial (sv), pero debemos considerar que unas son el producto de la relación entre variables, así la concentración de salida puede describirse en términos de la concentración de entrada y la conversión, el tiempo espacial y la velocidad espacial en términos del caudal de alimentación y el volumen del reactor, etc. a) Fijamos el factor a optimar: la conversión (x) b) Debemos encontrar un modelo o modelos que relacionen el factor a optimar con los componentes de costos. - El costo de materia prima (C1) estará dado por: C1 = gmol de A x Costo por grmol de A Por modelamiento matemático: grmol de A = R/x - Costo de inversión (C2)está dado por: C2 = V x Costo por unidad de volumen del reactor Por modelamiento matemático partiendo de la ecuación de balance de materiales para un CSTR obtenemos:
A menudo, la tarea más difícil es obtener un modelo satisfactorio del proceso. Para una mayor discusión ver el texto sobre Modelamiento y Simulacion de Procesos del mismo autor
Reemplazando los componentes del costo total en la Ec. (1.2b) se tiene:
(1.3) La Ec. (1.3) es la función objetivo para el problema 1.1. El siguiente paso es seleccionarse un procedimiento de optimización qué localice el valor de la conversión para obtener el costo mínimo. Estos procedimientos se listan en el punto siguiente.
1.5 ÁREAS Y MÉTODOS DE OPTIMIZACIÓN Las dos áreas de la teoría de optimización son la programación matemática y los métodos variacionales, como se muestra en la Fig. 1-2. Así mismo, son listadas un número de técnicas bajo cada una de éstas áreas. En la programación matemática, el objetivo es localizar un mejor punto x (x1,x2,...xn) el cual optimice (maximice o minimice) el modelo económico del proceso. En los métodos variacionales, el objetivo es localizar la función óptima la cual maximice o minimice el modelo económico. Un ejemplo de un problema de optimización para cada división es dado en la figura. Generalmente, los métodos de programación matemática son aplicables a problemas del estado estacionario, y los métodos variacionales son para problemas dinámicos. Los métodos de programación matemática son de dos tipos y son referidos como métodos directos e indirectos. Los métodos directos, como los métodos de búsqueda multivariable y la programación lineal, van de un punto de partida a través de valores consistentemente mejorados del modelo económico para llegar al óptimo. Los métodos indirectos, tal como los métodos analíticos y programación lineal, resuelven un conjunto de ecuaciones, y la solución del conjunto de ecuaciones puede ser el óptimo del modelo económico. Por ejemplo, en los métodos analíticos el conjunto de ecuaciones algebraicas se establece por diferenciación del modelo económico con respecto a cada variable independiente y haciendo las ecuaciones resultantes igual a cero. Los métodos analíticos se llaman también la teoría clásica de máximos y mínimos que se preocupan por encontrar los puntos extremos de una función. Este tema se discute en el Capítulo 2 para problemas de optimización con restricciones o sin restricciones. Como una aplicación de la teoría clásica de máximos y mínimos se estudia la optimización de plantas en el Capítulo 3. En este punto, la optimización será de gran ayuda para planificar la producción de unidades individuales de proceso y de la planta en su conjunto.
Al aplicar las técnicas de optimización se obtiene una serie de resultados, los cuales deben ser analizados para tomar la mejor decisión considerando los aspectos prácticos e intangibles de cada caso particular. Esto se discute en el Capítulo 4. La programación lineal requiere que el modelo económico y el juego de ecuaciones de restricción sean lineales, y el Método Simplex es el algoritmo que localiza el óptimo empezando en un punto de partida factible (la base inicialmente factible) como se discute en el Capítulo 5. La programación geométrica puede ser considerada una extensión de los métodos analíticos dónde el modelo económico y las restricciones son los polinomios, y se construye un problema dual que puede ser significativamente más fácil de optimizar que el problema original o primitivo. En la programación cuadrática, el modelo económico es una ecuación cuadrática y las ecuaciones de restricción son lineales. Usando métodos analíticos, este problema puede convertirse a un problema de programación lineal y puede resolverse por el Método Simplex. Para la programación convexa, el modelo económico es una función cóncava, y las ecuaciones de restricción son funciones convexas, y puede considerarse como parte de los métodos analíticos generales y muestra que debe ser localizado un óptimo global. La programación dinámica usa una serie de optimizaciones parciales aprovechando la fase de la estructura del problema y es eficaz para la asignación del recurso y optimización a través del tiempo como es discutido en el Capítulo 7. La programación no lineal o métodos de búsqueda multivariable, como son llamados la teoría y los algoritmos, deben comenzar en un punto de inicio factible y moverse hacia el óptimo en etapas de valores mejorados del modelo económico. El algoritmo descrito en el Capítulo 6 ha sido efectivo para la optimización de procesos industriales, y está basado en la teoría del Capítulo 2.
1.6 MÉTODO DE ATAQUE En la solución de problemas de optimización, la estructura y complejidad de las ecuaciones para el modelo económico y las restricciones para el proceso o planta son muy importantes, ya que la mayoría de procedimientos de programación matemática se aprovechan de la ventaja de la forma matemática de estos modelos. Ejemplos son la programación lineal, donde el total de ecuaciones deben ser lineales, y la programación geométrica, donde todas las ecuaciones deben ser polinomios. Consecuentemente, es extremadamente importante, tener en mente la capacidad de las diferentes técnicas de optimización cuando se están formulando los modelos económicos y de los procesos. Por ejemplo, si una representación satisfactoria de la economía y la operación del proceso pueden ser obtenidas usando solamente ecuaciones lineales, puede aplicarse la poderosa técnica de programación lineal, y este método garantiza que se encuentra el óptimo global. Sin embargo, si se tiene que
acudir a las ecuaciones no lineales para representar la economía y la operación del proceso, puede ser necesario usar un método de búsqueda multivariable para localizar el optimo. Desafortunadamente, estas técnicas de búsqueda solamente encuentran puntos que están bien cerca del punto de partida, y ello no acarrea ninguna garantía de que se haya encontrado el máximo o mínimo global o local. La Fig. 1.3, muestra una aproximación simplificada a como enfocar los problemas de optimización, y esta incorpora algunas ideas las cuales deben recordarse cuando sean estudiadas las técnicas particulares de optimización. También, esta da algunas razones para el orden en el cual son presentadas las técnicas. Al inicio, es necesario determinar si el problema requiere un punto óptimo o función. Si es un punto, es aplicable la programación matemática; y si es una función óptima, los métodos variacionales. Continuando con la programación matemática. Si la ecuación para el modelo económico es relativamente simple y no hay restricciones aplicables (modelo del proceso), es posible localizar el óptimo por diferenciación del modelo económico con respecto a las variables independientes, haciendo estas ecuaciones iguales a cero, y resolviendo para el óptimo. Sin embargo, si existen restricciones, y normalmente las hay, pero las ecuaciones son relativamente simples, puede ser usado el método de los multiplicadores de Lagrange. Esto convierte al problema con restricciones a un problema sin restricciones, y puede usarse los procedimientos previos para problemas sin restricciones.
Fig. 1.3 Método de Ataque Simplificado para Problemas de Optimización Ahora, si el problema tiene un número grande de variables independientes y la precisión necesaria para los modelos económicos y del proceso pueden ser obtenidos con ecuaciones
lineales, puede ser usada la programación lineal. Sin embargo, si se requieren ecuaciones no lineales y los polinomios son suficientes, puede ser posible determinar el óptimo rápida y fácilmente usando programación geométrica (1).
No habiendo tenido éxito a este punto, puede ser factible aprovecharse la de la etapa de estructura del problema y aplicar la programación dinámica con una serie de optimizaciones parciales. Sin embargo, si no se tiene éxito será necesario acudir a técnicas de búsqueda multivariable y buscar los mejores valores sin tener una garantía de encontrar el óptimo global.
1.7 DISEÑO OPTIMO Y ESTRATEGIAS DE DISEÑO Un diseño óptimo está basado en las mejores y más favorables condiciones. En casi la mayoría de los casos, estas condiciones optimas pueden finalmente reducirse a consideraciones de costos o beneficios. De esta manera, un diseño óptimo podría basarse en condiciones que den el menor costo por unidad de tiempo o el máximo beneficio por unidad de producción. Cuando se cambia una variable de diseño, a menudo se encuentra que unos costos aumentan mientras que otros disminuyen. Bajo estas condiciones, el costo total puede pasar a un mínimo o a un valor particular de la variable de diseño, y este valor podría considerarse como el óptimo.
Fig. 1-4 Ilustración del principio básico de un diseño óptimo Un ejemplo ilustrando los principios de un diseño económico óptimo se presenta en la Fig. 1-4. En este caso simple, el problema es determinar el espesor óptimo de aislamiento para una instalación de tubería dada. A medida que el espesor de aislamiento se incrementa, los
costos fijos anuales incrementan, el costo por pérdidas de calor disminuye, y los demás costos permanecen constantes. Entonces, como se muestra en la Fig. 1-4, la suma de los costos debe ser mínima para el espesor óptimo de aislamiento. Aun cuando las consideraciones de costos y los balances económicos son la base de la mayoría de los diseños óptimos, hay situaciones donde otros factores diferentes a los costos pueden determinar las condiciones más favorables. Por ejemplo en la operación de un reactor catalítico, una temperatura de operación óptima puede existir para cada tamaño de reactor debido a las limitaciones de equilibrio y velocidad de reacción. Esta temperatura particular podría estar basada en el máximo porcentaje de conversión o en la máxima cantidad de producto por unidad de tiempo. Finalmente, sin embargo, los costos variables deben ser considerados, y el desarrollo de un diseño óptimo de operación es meramente una etapa en la determinación de un diseño económico óptimo. 1.7.1 Costos incrementales El aspecto de costos increméntales es cubierto en detalle en el texto de Ingeniería Económica del mismo autor, Cáp. 7 (Rentabilidad, inversiones alternativas y reemplazos). Las consideraciones sobre costos increméntales muestran que un diseño final recomendable no necesariamente corresponde al diseño económico óptimo, debido a que el retorno incremental sobre la inversión adicional puede ser inaceptable antes de que se alcance el punto óptimo.[1] Sin embargo los valores óptimos pueden usarse como una base para iniciar el análisis del costo incremental. 1.7.2 Consideraciones intangibles y prácticas Los diferentes métodos matemáticos para determinar las condiciones óptimas, son presentadas en este texto, presentando una base teórica de las condiciones que mejoren los requerimientos. Sin embargo, factores que no pueden ser fácilmente cuantificados o consideraciones prácticas pueden cambiar la recomendación final a otra diferente de la condición óptima teóricamente correcta. Por lo tanto, la determinación de una “condición óptima”, como se describe en este texto, sirve como un punto base para un análisis de costo o diseño, y esto puede a menudo cuantificarse en una forma matemática especifica. A partir de este punto, el ingeniero debe aplicar su criterio para tomar en cuenta otros factores prácticos importantes, tales como el retorno sobre la inversión o el hecho que equipo comercial es a menudo disponible en intervalos discretos de tamaño. Como un ejemplo de consideraciones prácticas, considerar el caso donde un ingeniero ha hecho una estimación del diámetro óptimo de tubería necesaria para manipular un flujo dado basándose en minimizar los costos debido a las cargas fijas (inversión inicial) y de bombeo (costo de operación). El resultado matemático muestra que el diámetro interior optimo es 2,54 pulg. Basándose en los costos para tubería estándar de acero (# de cédula 40). Los diámetros nominales de tubería disponibles comercialmente en este rango son 2½ pulg. (de ID 2,469 pulg.) y 3 pulg. (de ID 3,069 pulg.). El ingeniero podría probablemente recomendar inmediatamente una tubería de diámetro nominal de 2 ½ pulg. sin calcular el retorno sobre la inversión de los diferentes tamaños disponibles. Esta aproximación podría normalmente ser aceptable porque las estimaciones están necesariamente incluidas en los
cálculos de optimización y por el hecho que una inversión para tubería representa solamente una pequeña porción de la inversión total. Los factores intangibles pueden tener un efecto sobre el grado de credibilidad que pueden tener los resultados calculados para las condiciones optimas. Quizás el optimo esté basado en un precio de venta asumido para el producto del proceso, o puede ser que este involucrada una evaluación preliminar en la cual no se ha definido con seguridad la ubicación de la planta. Obviamente para casos de este tipo, un análisis de las condiciones optimas pueden dar solamente una idea general de los resultados actuales que podrían ser obtenidos en el trabajo final, y no es razonable ir a los limites extremos de precisión y exactitud para hacer recomendaciones. Aún para el caso de un diseño final detallado, los intangibles, tal como la licitación final de varios contratistas para la construcción, pueda hacerlo no práctico gastar una cantidad grande de esfuerzo haciendo demasiados refinamientos en la estimación de condiciones optimas
1.8 PROCEDIMIENTO GENERAL PARA DETERMINAR LAS CONDICIONES OPTIMAS El primer paso en el desarrollo de un diseño óptimo es determinar que factores deben ser optimizados. Factores típicos podrían ser el costo total por unidad de producción o por unidad de tiempo, beneficios, cantidad de producto final por unidad de tiempo, y porcentaje de conversión. Una vez determinada la base, es necesario desarrollar relaciones mostrando como las diferentes variables involucradas afectan al factor escogido. Finalmente estas relaciones son combinadas gráficamente, analíticamente o numéricamente para dar las condiciones optimas deseadas. Los métodos analíticos usados para combinar estas relaciones, y encontrar las soluciones son: Maximización y minimización, programación geométrica, programación lineal, técnicas de búsqueda de variables simples, procedimientos de optimización de multivariable, programación dinámica y cálculo de variaciones.
En los siguientes capítulos se hará una breve discusión sobre estas técnicas analíticas, su aplicación a procesos y la aplicación a los mismos de las técnicas numéricas usando MATLAB para encontrar la mejor solución.
CAPITULO II
TEORÍA CLÁSICA DE MÁXIMOS Y MÍNIMOS 2.1 INTRODUCCIÓN La teoría clásica de máximos y mínimos (métodos analíticos) se preocupa por encontrar el máximo o mínimo, es decir los puntos extremos de una función. Nosotros buscamos para encontrar los valores de las n variables independientes x1,x2,...xn de una función donde esta alcance los puntos máximo o mínimo. Antes de comenzar con el desarrollo de la matemática para localizar estos puntos extremos, de una función, permítanos examinar la superficie de una función de dos variables independientes, f (x1, x2), que podrían representar al modelo económico de un proceso. Esto ayudará a visualizar la localización de los puntos extremos. Un modelo económico es ilustrado en la Fig. 2-1(a) donde el contorno de la función esta representado por las líneas curvas Una sección transversal de la función a lo largo de la línea S a través de los puntos A y B se muestra en Fig. 2-1(b). La Fig. 2-1(c) se da la primera derivada de f (x1, x2) a lo largo de la línea S a través de los puntos A y B.
a) Mapa topológico
b) Sección transversal de f (x1 , x2) a lo largo de la línea S entre los puntos A y B
c) Primera derivada de f a lo largo de la línea S entre los puntos A y B Fig. 2-1 (a), (b) y (c) En este ejemplo, el punto A es un máximo global en la región y está localizado en el tope de una cresta pronunciada. Aquí la primera derivada es discontinua. Un segundo pero pequeño máximo esta localizado en el punto B (un máximo local). En el punto B las primeras derivadas parciales de f (x1, x2) son cero, y B es llamado un punto estacionario. No es necesario para puntos estacionarios ser un máximo o un mínimo como es ilustrado por el punto estacionario C, un punto silla. En este ejemplo, el mínimo no ocurre en el interior de la región, pero sobre los limites en los puntos D y E (mínimos locales). Para determinar el mínimo global, es necesario comparar el valor de la función en estos puntos. En esencia, el problema de determinar el beneficio máximo o el costo mínimo para un sistema usando la teoría clásica deviene en localizar todos los máximos o mínimos locales, y luego comparando los valores individuales, para determinar el máximo ó mínimo global. El ejemplo ha ilustrado para ver los lugares donde están: 1. los puntos estacionarios (primeras derivadas son cero) 2. los límites 3. las discontinuidades en la primera derivada
Cuando la función y sus derivadas son continuas, los puntos extremos locales ocurrirán a los puntos estacionarios en el interior de la región. Sin embargo, no es necesario que todos los puntos estacionarios sean puntos extremos locales, desde que también pueden ocurrir los puntos de silla.
2.2 MÉTODOS ANALÍTICOS SIN RESTRICCIONES 2.2.1 Condiciones necesarias y Suficientes para determinar puntos extremos
Basándonos en la intuición geométrica a partir del ejemplo previo, podemos entender el famoso teorema de Weierstrass' (11,12) el cual garantiza la existencia de máximos y mínimos. Este establece: Cualquier función la cual es continua en un dominio cerrado posee un valor máximo y un valor mínimo ya sea en el interior o en los limites del dominio.
Este teorema nos dice que no se requiere que la función tenga derivadas continuas para que exista un máximo o un mínimo. El siguiente teorema ubica los puntos extremos en el interior de la región explorada. Una función continua de n variables alcanza un máximo o un mínimo en el interior de una región, solo en los valores de las variables para los cuales las n derivadas parciales son iguales a cero simultáneamente (puntos estacionarios), o en puntos en los cuales una o más de estas derivadas no existe (es decir es discontinua).
Este teorema incluye solo los puntos interiores; el único método por lo general aplicable que toma en cuenta el contorno y discontinuidades, es el de comparar directamente el valor de la función en cada uno de estos puntos. Analíticamente, los puntos estacionarios se pueden encontrar resolviendo en forma simultánea las n ecuaciones algebraicas, resultantes de hacer las n derivadas parciales igual a cero. Estas ecuaciones también se deben examinar para determinar los puntos en donde existan discontinuidades, realizándose esto por inspección. 2.2.2 Evaluación de Máximo y Mínimo Local (Condiciones Suficientes)
Como se ha visto, no es necesario que todos los puntos estacionarios sean máximos o mínimos locales, ya que puede haber puntos de inflexión o puntos de montura. Se debe desarrollar las condiciones que permitan determinar el tipo de punto estacionario, es decir, si es máximo o mínimo. Se desarrollarán las condiciones suficientes para los casos de una, dos y n variables independientes. Una vez localizados los máximos y mínimos locales, es necesario comparar individualmente cada punto para determinar los valores máximo y mínimo absolutos. 2.2.3 Condiciones Suficientes para Una Variable Independiente
Para desarrollar el criterio que establece si un punto estacionario es un máximo o mínimo local, empezamos realizando una expansión por serie de Taylor alrededor del punto estacionario xo. f (x) = f (xo) + f '(xo) (x - xo) + ½ f ''(xo) (x - xo)2 + términos de alto orden , donde
Se sabe que f '(xo) = 0 por definición del punto estacionario. Ahora, seleccionamos x suficientemente cerca de xo de manera que los términos de orden superior a f ''(xo) sean despreciables comparados a los términos de segundo orden. Como la primera derivada es cero en el punto estacionario, la ecuación anterior se transforma en: f (x) = f (xo) + ½ f " (xo) (x - xo) (2-1) Nosotros podemos determinar si xo es un máximo o mínimo local examinando los valores de f "(xo), ya que (x - xo)2 es siempre positivo. Si f "(xo) es positivo, entonces los términos ½ f "(xo) (x xo)2 serán siempre adicionados a f (xo) en la Ec. (2-1) para que x tome valores que sean menores que el mayor valor de xo. Para este caso f (xo) es un mínimo local. Esto es resumido a continuación: ___________________________________________________________ Si f ''(xo) > 0 entonces f (xo) es un mínimo f ''(xo) < 0 f (xo) es un máximo f ''(xo) = 0 no esta definido ______________________________________________________________ Si la segunda derivada evaluada en xo es cero, es necesario examinar las derivadas de más alto orden. En general si f ''(xo) = ... = f n-1(xo) = 0, la serie de expansión de Taylor deviene en f (x) = f (xo) +(1/n!) f (n)(xo) (x - xo)n (2-2) Si n es par, entonces (x - xo)n es siempre positivo, y el resultado es:
________________________________________________________________ Si f (n)(xo) > 0 entonces f (xo) es un mínimo f (n)(xo) < 0 f (xo) es un máximo ________________________________________________________________ Si n es impar entonces (x - xo)n cambia de signo a medida que x se mueve de x < xo hasta x > xo, y entonces es un punto de inflexión. Estos resultados pueden ser resumidos en el siguiente teorema(1). Si a un punto estacionario la primera y posiblemente algunas de las derivadas más altas desaparecen, entonces el punto es o no es un punto extremo, mientras la primera derivada no desaparezca las demás pueden ser de orden par o impar. Si es par, es un máximo o un mínimo según como la derivada sea negativa o positiva.
La prueba de este teorema sigue la discusión dada anteriormente. El ejemplo siguiente ilustra los principios discutidos. Ejemplo 2-1
Localizar los puntos extremos de las dos funciones siguientes: a) f (x) = x4/4 - x2/2 f '(x) = x3 - x = x(x2 - 1) = x(x - 1)(x+1) = 0 Los puntos estacionarios son x = 0, 1, -1 f "(x) = 3x2 - 1 f "(0) = -1 maximo f "(1) = 2 minimo f "(-1) = 2 minimo
b) f (x) = x5 f '(x) = 5x4 = 0 El punto estacionario es x = 0 f "(x) = 20x3 f "(0) = 0 f "'(x) = 60x2 f "'(0) = 0 no puede hacerse ninguna declaración f (4)(x) = 120x f (4)(0) = 0 f (5)(x) = 120 f (5)(0) = 120 no es impar, y el punto estacionario es un punto de inflexión. 2.2.4 Condiciones Suficientes para Dos Variables Independientes Para desarrollar el criterio para el máximo o mínimo local para un punto estacionario xo(x10, x20) de una función de dos variables, puede hacerse una expansión por serie de Taylor alrededor de este punto. f (x1, x2) = f (x10, x20) + f 'x 1 (x1-x10) + f 'x 2 (x2-x20) + ½[f ''x1 x1 (x1-x10)2 + 2f ''x1 x2 (x1-x10)(x2-x20) (2-3)
+ f ''x2 x2 (x2-x20)2] + términos de alto orden donde los subíndice x1 y x2 indican diferenciación parcial con respecto a estas variables y evaluación en el punto estacionario. Nuevamente seleccionando f (x1, x2) suficientemente cerca a f (x10, x20) de tal manera que los términos de alto orden se hacen despreciables comparados a los términos de segundo orden. Así mismo, las primeras derivadas son cero en el punto estacionario. Entonces la Ec.(2-3) puede ser escrita en forma matricial como:
En notación matriz-vector la ecuación anterior puede ser escrita como f (x) = f (xo) + ½[(x - xo)T Ho (x - xo)] (2-5) donde Ho es la matriz de las segundas derivadas parciales evaluadas en el punto estacionario xo y es llamada matriz Hessiana.
El término entre corchetes de la Ec. (2-5) es llamado una forma diferencial cuadrática, y f (xo) será un mínimo o un máximo de acuerdo si este término sea siempre positivo o siempre negativo. Basado en este concepto, puede mostrarse (1) que si se aplican los siguientes resultados xo es un máximo o un mínimo. Si ellos no se dan, xo puede ser un punto de silla y este no es un mínimo ni un máximo.
Una ilustración de los resultados anteriores se da en ejemplo 2-2. El término entre corchetes de la Ec. (2-5) es un ejemplo de una forma cuadrática. Será necesario describir una forma cuadrática brevemente antes de dar las condiciones suficientes para los máximos y mínimos para las n variables independientes. 2.2.5 Señal de una Forma Cuadrática
Para realizar un análisis similar para una función con más de dos variables independientes, es necesario determinar lo que se llama la señal de la forma cuadrática. La forma cuadrática general (1) es escrita como:
donde aij son los componentes de la matriz simetrica A, es decir, aij = aji. Resulta (1) que podemos determinar si Q siempre es positivo o negativo, para todo los valores finitos de xi y xj, evaluando las señales de Di, el determinante de las submatrices principales de A.
Los resultados importantes que se usarán subsecuentemente son:
Si Di > 0 para i = 1,2,...n entonces: A es positivo definido y Q(A,x) > 0 Si Di < 0 para i = 1,3... y Di > 0 para i = 2,4,... entonces: A es negativo definido y Q(A,x) < 0 Si Di es ninguno de estos, entonces: Q(A,x) y depende de los valores de xi y xj.
2.2.6 Condiciones suficientes para N Variables Independientes El resultado de las dos secciones previas puede ser extendido al caso de n variables independientes considerando la expansión por la serie de Taylor para n variables independientes alrededor del punto estacionario xo:
Nuevamente seleccionando x suficientemente cerca a xo, así los términos de alto orden se hacen despreciables comparados a los términos de segundo orden. Así mismo, las primeras derivadas son cero en el punto estacionario. Entonces, la Ec. (2-8) puede ser escrita en notación matriz-vector como:
f (x) = y(xo) + ½(x - xo)T Ho (x-xo) (2-9) donde x es el vector columna de las variables independientes, y Ho, la matriz de las segundas derivadas parciales evaluadas en el punto estacionario xo, en la matriz Hessiana. Esta es la misma ecuación que la ecuación (2-5), la cual fue escrita para dos variables independientes.
El segundo término del lado derecho de la Ec. (2-9) es llamado una forma cuadrática diferencial como se muestra enseguida. Q[ Ho, (x-xo)] = (x-xo)T Ho (x-xo) (2-11) La Ec. (2-11) corresponde a la Ec. (2-6) de la sección previa, y las determinantes de las submatrices principales de Ho definidas a continuación corresponden a la Ec. (2-7).
Podemos ahora usar el mismo procedimiento en la evaluación del carácter de los puntos estacionarios para n variables independientes. Por ejemplo, si el término conteniendo la matriz Hessiana es siempre positivo para perturbaciones de las variables independientes alrededor del punto estacionario, entonces el punto estacionario es un mínimo local. Para esta forma diferencial cuadrática siempre será positivo, la |Ho| > 0 para i = 1,2,...n. El
mismo razonamiento puede ser aplicado para el máximo local, y los resultados para estos dos casos son resumidos a continuación:
mínimo si
|Hoi|
y(xo) es un > 0 para i = 1,2,...,n
y(xo) es un máximo si |Hoi| < 0 para i = 1,3,5,... | Hoi| > 0 i = 2,4,6,...
Si ocurren ceros en lugar de algunos números positivos o negativos en la prueba anterior (forma cuadrática semi-definida), entonces la información es insuficiente para determinar el carácter del punto estacionario (1). Como se discute en Avriel (10) los términos de alto orden pueden ser examinados, o puede hacerse una exploración local. Si no se reúne la prueba (forma cuadrática indefinida), el punto puede ser un máximo o un mínimo (1). El teorema siguiente propuesto por Cooper (7) resume estos resultados. Este establece: Si y(x) y sus dos primeras derivadas parciales son continuas, entonces una condición suficiente para que y(x) tenga un mínimo (máximo) relativo at xo, cuando dy(xo)/dxj = 0, j = 1,2, ...n, es que la matriz Hessiana sea positiva definida (negativa definida). La prueba de este teorema emplea los argumentos similares a aquéllos dados anteriormente. 2.2.7 Aplicación al diseño de procesos En los procesos industriales, son muchos los casos en los cuales el factor siendo optimizado es una función de una simple variable. El procedimiento entonces es muy simple. Considerar el ejemplo mostrado en la Fig. 1-4, donde es necesario obtener el espesor de aislamiento el cual de el menor costo total. La principal variable involucrada es el espesor del aislamiento, y pueden desarrollarse relaciones mostrando como esta variable afecta al costo total. Se dispone de costo para la adquisición e instalación de aislamiento, y puede estimarse el tiempo de vida del servicio. Entonces puede desarrollarse una relación dando el efecto del espesor de aislamiento sobre las cargas fijas, de manera similar se puede obtener una relación mostrando los costos debido a las pérdidas de calor como función del espesor de aislamiento, a partir del costo de vapor, propiedades del aislamiento y consideraciones de transferencia de calor. Los demás costos tales como mantenimiento y gastos de la planta, pueden asumirse independientes del espesor de aislamiento.
Las dos relaciones de costos obtenidas pueden ser expresadas en una forma simplificada
similar a la siguiente: Cargas fijas = (x) = ax + b (a)
donde a, b, c, y d son constantes y x es la variable común (espesor de aislamiento) El método gráfico para determinar el espesor óptimo de aislamiento es mostrado en la Fig. 1-4. El espesor óptimo de aislamiento es encontrado en el punto del costo mínimo sobre la curva obtenida graficando los costos variables totales versus el espesor de aislamiento.
La pendiente de la curva de costos variables totales es cero en el punto de espesor óptimo de aislamiento. Luego usando la Ec. (c), se puede encontrar analíticamente el valor óptimo derivando el CT con respecto a x , igualando a cero y resolviendo para x.
Si el factor que se está optimizando (CT) no tiene un valor máximo o un mínimo, la solución para la variable independiente indicará esta condición dando un resultado imposible, tal como infinito, cero o la raíz cuadrada de u un número negativo. Para determinar si el valor de x mostrado en la Ec. (e) corresponde a un punto óptimo o a un punto de inflexión se aplica: Si la segunda derivada de la Ec. (c), evaluada en el punto dado, es mayor que cero corresponde a un mínimo, corresponde a un máximo si es menor que cero y corresponde a un punto de inflexión si es igual a cero. Un método alternativo para determinar el tipo de punto involucrado es calcular valores del factor siendo optimizado a puntos ligeramente grandes y ligeramente pequeños que el valor óptimo de la variable dependiente.
La segunda derivada de la Ec. (c) es
Si x representa una variable tal como el espesor de aislamiento, este valor debe ser positivo; entonces, si c es positivo, la segunda derivada en el punto óptimo debe ser mayor que cero, y (c/a)1/2 representa el valor de x en el punto donde los costos variables totales son mínimos. Ejemplo 2-2 El diagrama de flujo de un proceso simple es mostrado en la Fig. (2-2) donde el hidrocarburo alimentado es mezclado con reciclo y comprimido antes de ser pasado a un reactor catalítico. El producto y el material no reaccionado son separados por destilación, y el material no reaccionado es reciclado. La presión, P, en psi y la razón de reciclo, R, deben ser seleccionadas para minimizar el costo total anual para la velocidad de producción requerida de 107 libras por año. La alimentación es realizada bajo presión a un costo anual de $1000P, mezclada con la corriente de reciclo, y alimentada al reactor a un costo anual de $4 x 109/PR. El producto es removido en un separador a un costo de $105R por año, y el material no reaccionado es reciclado con un compresor de recirculación el cual consume $1.5 x 105R anualmente. Determine la presión de operación, la relación de reciclo, y el costo anual óptimos, y demuestre que el costo es un mínimo.
Fig 2.2 Diagrama de flujo de un proceso simple, según Wilde(2) Solución analítica La ecuación que da el costo total de operación es: C ($/yr.) = 1000P + 4 x 109/ P R + 2.5 x 105R
Derivando parcialmente la ecuación de C con respecto a P y R e igualando a cero se tienen dos ecuaciones algebraicas para ser resueltas para P y R. C/P = 1000 - 4 x 109 / R P2 = 0 C/R = 2.5 x 105 Resolviendo simultáneamente se tiene
-
4
x
109
/
P
R2
=
0
P = 1000 psi y R = 4 Reemplazando para determinar el correspondiente costo total de operación se tiene C = $ 3 x 106 por año C (P,R) es un mínimo si
Efectuando la apropiada diferenciación parcial y evaluando en el punto estacionario ( P = 1000, R = 4) se tiene
Por lo tanto, el punto estacionario es un mínimo ya que ambas determinantes son positivas. Solución numérica Usando MATLAB Para probar, crear un archivo-M costo.m que define una función de dos variables, x(1) y x(2) function f = costo(x) f = 1000*x(1)+4*(10^9)/(x(1)*x(2))+(2.5*(10^5))*x(2);
Luego en la ventana principal, dar las siguientes ordenes:
>> x0 = [500,2]; % Supuesto inicial >> options = optimset('LargeScale','off'); >> [x,fval,exitflag,output] = fminunc(@costo,x0,options);
Cuando los valores iniciales están en la dirección correcta se obtiene la siguiente respuesta: Optimization terminated successfully: Current search direction is a descent direction, and magnitude of directional derivative in search direction less than 2*options.TolFun >>
Los valores de las variables se obtienen ingresando x >> x x = 1.0e+003 * 1.0000 0.0040
Lo cual significa que: x(1) = P = 1000 x(2) = R = 4 Y el valor de la función (costo mínimo) se obtiene con la orden fval >> fval fval = 3.0000e+006
El costo mínimo Cmin = 3 x 106 $/año La orden output da más detalles sobre la optimización. Para fminunc, incluye el número de iteraciones en iterations, el número de evaluaciones de la función en funcCount, el tamaño de paso final en stepsize, una medida de optimalidad de primer orden (la cual en este caso sin restricciones es la norma infinita de la gradiente a la solución) en firstorderopt, y el tipo de algoritmo usado en algorithm. >> output output = iterations: 7 funcCount: 46
stepsize: 0.9531 firstorderopt: 0.0931 algorithm: 'medium-scale: Quasi-Newton line search' >> Usando UNTSIM: Seleccionamos del Menú principal: Optimización - Funciones Multivariable - Mínimo sin Restricciones, con lo que tenemos en la ventana principal: Copyright 2002 UNT MSc. Luis Moncada All rights reserved OPTIMIZACION NO LINEAL SIN RESTRICCIONES, ENCUENTRA EL MINIMO DE UNA FUNCION MULTIVARIABLE, COMENZANDO CON UN SUPUESTO INICIAL Y ENCONTRANDO UN MINIMO LOCAL Las vaiables se denotan por: x(1), x(2),... Ingrese funcion: '1000*x(1)+4*(10^9)/(x(1)*x(2))+(2.5*(10^5))*x(2)' Inicio de busqueda Valores iniciales: [500, 2] RESULTADO DE LA OPTIMIZACION --------------------------------------------1.- El optimo de la variable es = 1000 1.- El optimo de la variable es = 4 2.- El optimo de la funcion es = 3e+006 >>
Nota: Las letras rojas son la información que debemos suministrar
2.4 FUNCIÓN OBJETIVO CON RESTRICCIONES A este punto las variables independientes podrían asumir algún valor. En la actualidad, los valores de las variables independientes están limitados ya que ellos normalmente representan cantidades físicas tal como proporciones de flujo, temperaturas, presiones, capacidades de unidad de proceso y recursos disponibles. Por consiguiente, hay restricciones sobre las variables, si nada más del hecho que ellos deben ser no-negativos. En muchos casos ellos se limitan dentro de los límites dictados por el equipo de proceso y relacionados por las ecuaciones tales como los balances de material. Las restricciones en las variables pueden ser en forma de ecuaciones y desigualdades.
Se desarrollarán los métodos para localizar los puntos estacionarios de funciones (los modelos económicos) sujetas a las restricciones de igualdad (por Ej., ecuaciones de balance de materia y energía), y se darán ejemplos que ilustran las técnicas. Las restricciones de desigualdad pueden ser convertidas a restricciones de igualdad, y entonces pueden aplicarse
los procedimientos para restricciones de igualdad con algunas consideraciones adicionales
Balance de materiales: F – (D + B) = 0 (restricción de igualdad) Limite superior sobre la velocidad de alimentación: F 50 000 barriles por día (restricción de desigualdad)
Fig. 2.3 Ilustración de restricciones de igualdad y desigualdad Ilustraremos la conversión de una restricción de desigualdad a una restricción de igualdad usando un ejemplo simple para ayudar a visualizar el concepto de variables de holgura. La Fig. 2-3 es un ejemplo de una restricción de igualdad y una restricción de desigualdad para una columna de destilación. El balance de materiales el cual dice que la velocidad de alimentación a la columna debe igualar la suma de los productos del tope y los productos del fondo al estado estacionario es la restricción de igualdad. El límite superior en la capacidad de la columna de destilación que se fijó cuando el equipo fue diseñado, es la restricción de desigualdad. Esta restricción de desigualdad puede convertirse a una restricción de igualdad agregando una variable de holgura S como S2 para asegurar que se ha agregado a la ecuación un número positivo. F + S2 = 50,000 (2-13) El término holgura es usado para representar la diferencia entre el límite óptimo y superior en la capacidad. Representa el exceso, no usado, o la holgura en la capacidad de la unidad del proceso. Por ejemplo, si Fopt = 30,000 barriles por día; entonces S2 = 20,000 barriles por día, una holgura de 20,000 barriles por día; y se dice que la restricción esta libre, es decir, se mantiene la desigualdad. Si Fopt = 50,000 barriles por día entonces no hay holgura, y la restricción se dice está apretada, es decir, se mantiene la igualdad. Esto será discutido con más detalle en el Capítulo siguiente. Así mismo, si existiese un límite menor en F, por ejemplo, F> 10,000, se aplicaría el mismo procedimiento excepto que S2 se substraería de F. La ecuación sería F - S2 = 10,000, y S se
llama una variable sobrante.
Ahora podemos establecer un problema general de optimización con n-variables independientes y m restricciones de igualdad donde el objetivo es optimizar (maximizar o minimizar) el modelo económico y(x) sujeto a m ecuaciones de restricción fi (x). optimizar: y(xi,x2,...xn) (2-14) sujeta a: fi(x1,x2,...,xn) = 0 (2-15) para i - 1,2,...m Debe haber menos restricciones de igualdad que variables independientes para poder optimizar y(x), es decir, n > m. Si m = n los valores de los xj son singularmente determinados, y no hay ningún problema de optimización. También si m> n, se dice que el problema esta sobredeterminado (sobre especificado), porque hay más ecuaciones que incógnitas. No hay ningún problema de optimización para este caso. Hay tres métodos analíticos para determinar los puntos óptimos de la función y(x1,x2,...,xn) de n variables independientes sujeta a m ecuaciones de restricción fi(x1,x2,...,xn) = 0. Estos son: sustitución directa, solución por variación restrictiva y método de los multiplicadores de Lagrange. Encontraremos que la substitución directa no siempre puede usarse, y el método de multiplicadores de Lagrange será uno de los más frecuentemente usados. 2.4.1 Sustitución Directa Esta simplifica los medios para resolver las ecuaciones de restricción para las variables independientes y para sustituir las ecuaciones de restricción directamente en la función a ser optimizada. Esto dará una ecuación (modelo económico) con (n-m) incógnitas, y poder aplicar las técnicas previas para optimización sin restricciones.
Desafortunadamente, esto no es siempre posible para llevar a cabo la manipulación algebraica requerida para estas sustituciones cuando las ecuaciones de restricción son algo complicadas. Consecuentemente, es necesario acudir a los siguientes métodos: 2.4.2 Variación de Restricción Este método (3,14) es usado con poca frecuencia, pero proporciona una base teórica para métodos numéricos de búsqueda multivariables importantes, tales como el generalizado de gradiente reducida. Este es ilustrado mejor para el caso de dos variables independientes considerando el ejemplo mostrado en la Fig. 2-4. Hay un mínimo local del sistema restringido al
punto A y un máximo local al punto B. El máximo del sistema sin restricción está en C.
Fig. 2.4 Bosquejo de una función de beneficio y(x1,x2) y una ecuación de restricción f(x1,x2) = 0 En el punto A la curva y(x1,x2) = 1 y la curva f(x1,x2) = 0 son tangentes y tienen la misma pendiente. Esto hace que los cambios diferenciales, dx1 y dx2, produzcan el mismo cambio en las variable dependientes y(x1,x2) y f(x1,x2). Esto puede ser expresado como:
Necesitaremos las derivadas totales de f e y para combinar con la Ec. (2-16) para obtener el resultado final. Usando los primeros términos en una serie de expansión de Taylor para f e y se tiene:
En el mínimo, punto A, y en el máximo, punto B, dy es igual a cero; y las restricciones son satisfechas, es decir, f = 0 y df = 0.
Combinando las Ecs. (2-16) y (2-17) da el siguiente resultado.
Esta es una ecuación algebraica, y debe ser resuelta en combinación con la ecuacion de restricción para localizar los puntos estacionarios. Debe recordarse en este caso que y/x1 y y/x2 no son necesariamente cero. Estas sin embargo, son cero en el caso sin restricción en el punto C. Esta técnica se ilustra con el siguiente ejemplo. Después se dará la extensión al caso general para n variables independientes. Ejemplo 2-3 Encontrar los puntos estacionarios de la siguiente función usando el método de variación de restricción optimizar: y(x) = x1 x2 sujeta a: f(x) = x21 + x22 - 1 = 0 <----- Es una restricción no lineal Solución analítica Las primeras derivadas parciales son:
Reemplazando en la Ec.(2-18) se tiene x2 2x2 - x1 2x1 = 0 o x22 - x12 = 0 La cual es resuelta simultáneamente con la ecuación de restricción x12 + x22 - 1 = 0 El resultado es: x1 = + (½)½ y x2 = + (½)½ Para los valores de las variables independientes en los puntos estacionarios.
Solución Numérica Usando MATLAB Paso 1. Escribimos un archivo m para la función objetivo denominado dostres.m function f = dostres(x) f = x(1)*x(2);
Paso 2. Escribimos un archivo.m para la restricción denominado confun.m function [c, ceq] = confun(x) % Restricciones no lineales c = []; % de desigualdad ceq = [-1 + (x(1)^2) + (x(2)^2)]; % de igualdad
Paso 3. Invocamos a la rutina de optimización con restricciones: >> x0 = [-0.1,0.1]; >> options = optimset('LargeScale','off'); >> [x,fval]=fmincon(@dostres,x0,[],[],[],[],[],[],@confun,options)
Cuando la búsqueda términa, se tiene la siguiente respuesta: Optimization terminated successfully: Search direction less than 2*options.TolX and maximum constraint violation is less than options.TolCon Active Constraints: 1 <--------Una restricción activa (efectiva) x = -0.7071 0.7071 fval = -0.5000
Restricción efectiva. Se dice que una restricción es efectiva en un punto, si este la satisface con igualdad Usando UNTSIM Seleccionamos del Menú Principal: Optimización - Funciones Multivariable- Mínimo con restricciones. Obteniendo la siguiente respuesta en la ventana principal: Copyright 2002 UNT MSc. Luis Moncada All rights reserved
ESTE PROGRAMA REALIZA LA OPTIMIZACION DE FUNCIONES CON DOS O MAS VARIABLES CON RESTRICCIONES LINEALES DE DESIGUALDAD, IGUALDAD LIMITES PARA LAS VARIABLES Y RESTRICCIONES NO LINEALES Ingrese funcion: 'x(1)*x(2)' Cuantas restricciones lineales de desigualdad tiene?: 0 Cuantas restricciones lineales de igualdad tiene?: 0 Hay limites para los valores de la variables si(1) no (0): 0 Cuantas restricciones no lineales tiene?: 1 Modifique la funcion CONFUN de acuerdo a sus restricciones
En el editor de archivos.m ingresamos la restricción
%INGRESE SUS RESTRICCIONES function [c, ceq] = confun(x) % AQUI NO HAGA NINGUN CAMBIO %SOLAMENTE MODIFIQUE LOS VALORES ENTRE CORCHETES DE c y ceq % Restricciones no lineales de desigualdad c = []; % Restricciones no lineales de igualdad ceq = [-1 + (x(1)^2) + (x(2)^2)]; % GUARDE LOS CAMBIOS, CIERRE EL EDITOR Y VAYA A LA VENTANA PRINCIPAL
Luego volvemos a la ventana principal Inicio de busqueda Valores iniciales: [-0.1,0.1] Optimization terminated successfully: Magnitude of directional derivative in search direction less than 2*options.TolFun and maximum constraint violation is less than options.TolCon Active Constraints: 1 RESULTADO DE LA OPTIMIZACION --------------------------------------------1.- El optimo de la variable es = -0.707104 1.- El optimo de la variable es = 0.70711 2.- El optimo de la funcion es es = -0.5 >>
que viene a ser el mínimo ( 1 punto estacionario). El otro punto estacionario debe corresponder al máximo el cual se encuentra cuando los dos valores de las variables son iguales ya sea positivos o negativos. Por lo tanto los puntos estacionarios corresponden a valores de:
x1 = 0.7071 y x2 = 0.7071 En general estamos interesados en encontrar los puntos estacionarios de una función y(x1, x2,..., xn) sujeta a m ecuaciones de restricción fi(x1, x2, ..., xn) = 0 donde i = 1, ...m, y n > m. El mismo razonamiento aplicado en el espacio (n +1) dimensional como se aplicó anteriormente al espacio tridimensional, resulta las siguientes ecuaciones:
El conjunto de ecuaciones dado en la Ec. 2.19 puede resolverse para (n-m) ecuaciones para ir con las m ecuaciones de restricción a localizar los puntos estacionarios. Las (n-m) ecuaciones correspondientes a la Ec. 2.18 del caso de dos variables independientes pueden escribirse en términos de (n-m) determinantes Jacobianos los cuales son:
Un total de n ecuaciones son resueltas para los puntos estacionarios, es decir las (n-m) ecuaciones generadas por la Ec. (2-20) y las m ecuaciones de restricción. Una deducción de estos resultados es dada por Beveridge y Schechter(6). Esto involucra usar la regla de Cramer y eliminar las dxi's. Similares resultados también son dados para este caso general en el texto de Wilde y Beightler (4). Sin embargo, se usa una nomenclatura diferente, y los resultados son extendidos a la inclusión de Multiplicadores de Lagrange. Para ilustrar el uso de los determinantes Jacobianos, considerar el siguiente ejemplo, que obtiene la Ec.(2-18).
Ejemplo 2-4 optimizar: y(x1,x2) sujeta a : f(x1, x2) = 0 Para este problema existen dos variables independientes (n=2) y una restricción (m=1), por lo tanto se requiere la evaluación de un determinante Jacobiano.
Expandiendo da la siguiente ecuación:
Esta es igual a la Ec.(2-18) la cual fue resuelto con la ecuación de restricción para los valores de x1 y x2 en el punto estacionario en el Ejemplo 2-3.
2.4.3 Multiplicadores de Lagrange El método más frecuentemente usado para restricciones es empleando los multiplicadores de Lagrange. La técnica será presentada usando dos variables independientes y una ecuación de restricción para ilustrar los conceptos. Luego el procedimiento será extendido al caso general de n variables independientes y m ecuaciones de restricción. Para el caso de dos variables independientes, tenemos: Optimizar: y(x1, x2) (2-22) Sujeta a : f(x1, x2) = 0 Mostraremos como surgen los multiplicadores de Lagrange y como un problema con restricciones puede ser convertido a un problema sin restricciones. La función beneficio y la ecuación de restricción son expandidas en una serie de Taylor. Luego, usando los términos de primer orden se tiene:
Esta forma de la ecuación de restricción será usada para eliminar dx2 en la función beneficio. Resolviendo para dx2 se tiene:
Este ecuación se reemplaza en la ecuación para dy y se obtiene:
y rearreglando se tiene:
Ahora podemos definir como el valor de [–y/x2 / f/x2] en el punto estacionario de la función restringida. Esta razón de derivadas parciales es una constante en el punto estacionario, y la ecuación anterior puede escribirse como
En el punto estacionario dy = 0, y esto da:
Ahora si L es definido como L = y + f, se tiene:
Esta es una de las condiciones necesarias para localizar los puntos estacionarios de una función sin restricción L la cual es construida a partir de la función beneficio y(x1,x2) y la
ecuación de restricción f(x1,x2) = 0. Ahora las mismas manipulaciones pueden ser repetidas para obtener las demás condiciones necesarias:
por lo tanto, el problema con restricciones puede ser convertido a un problema sin restricciones mediante la formación de la función Lagrangiana, o aumentada, y resolviendo este problema por los métodos previamente desarrollados de establecer las primeras derivadas parciales iguales a cero. Esto dará dos ecuaciones para resolver para las tres incógnitas x1, x2 y en el punto estacionario. La tercera ecuación a ser usada es la ecuación de restricción. El hecho de que el multiplicador de Lagrange es tratado algunas veces como otra variable ya que L / da la ecuación de restricción. El ejemplo usado para variación de restricción será usado para ilustrar estas ideas.
Ejemplo 2-5: Encontrar los puntos estacionarios para el siguiente problema con restricción usando el método de los multiplicadores de Lagrange. Optimizar: y(x) = x1x2 Sujeta a : f(x) = x12 + x22 1 La función Lagrangiana o aumentada es formada como se muestra a continuación.
=
L(x1, x2, ) = x1x2 + (x12 + x22 Las ecuaciones siguientes son obtenidas al hacer las primeras derivadas parciales igual a cero.
0
1)
L/x1 = x2 + 2x1 = 0 L/x2 = x1 + 2x2 = 0 L/= x12 + x22 - 1 = 0 Resolviendo simultáneamente las ecuaciones anteriores se tienen los siguientes puntos estacionarios: maximo : x1 = (½)½ , x2 = (½)½ , = -½ x1 = -(½)½ , x2 = -(½)½ , = - ½ minimo : x1 = (½)½ , x2 = -(½)½ , = ½
x1 = -(½)½, x2 = (½)½ , = ½ El tipo de punto estacionario, es decir, máximo, mínimo o montura fue determinado por inspección para este problema. Condiciones suficientes para problemas con restricciones se discutiran subsecuentemente en este capítulo. El desarrollo de la función Lagrangiana para el caso de n variables independientes y m ecuaciones de restricción es una extención directa del caso de dos variables independientes y una ecuación de restricción, y Avriel (10) da una concisa derivación de este resultado. (Ver problema 2-14) La función Lagrangiana o aumentada, es formada igual que el caso anterior, y para cada ecuación de restricción existe un multiplicador de Lagrange. Esto se muestra a continuación: optimizar: y(x) x = (x1, x2 ,..., xn)T (2-23) sujeta a : fi(x) = 0 para i = 1,2,...,m donde n > m La función Lagrangiana, o aumentada es formada del problema con restricción com sigue:
Para localizar los puntos estacionarios de un problema con restricción, las primeras derivadas parciales de la función Lagrangiana con respecto a los xj's y i 's son igualadas a cero (condiciones necesarias). Existen (n + m) ecuaciones para ser resueltas para las (n + m) incógnitas: n - xj's y m - i's. Se dice algunas veces que el método de los multiplicadores de Lagrange requiere más trabajo que el método de variación de restricción, ya que un adicional de m ecuaciones tienen que resolverse para los valores de los multiplicadores de Lagrange. Sin embargo, se obtiene valiosa información adicional a partir del conocimiento de los valores de los multiplicadores de Lagrange, como se ha visto. El siguiente ejemplo simple da una comparación entre las tres técnicas.
Ejemplo 2-6 Para el proceso dado en el Ejemplo 2-2 (2), es necesario mantener el producto de la presión y la razón de reciclo igual a 9000 psi. Determinar los valores óptimos de la presión y razón de reciclo y el costo mínimo dentro de esta restricción por sustitución directa, variación de la restricción, multiplicadores de Lagrange y un método de búsqueda numérica usando MATLAB Nuevamente, el problema es minimizar C
C = 1000P + 4 x 109/PR + 2.5 x 105R Sin embargo, C está sujeta a la siguiente ecuación de restricción. PR = 9000 Sustitución Directa: Despejando la restricción anterior para P y reemplazando en la función objetivo se tiene: C = 9 x 106/R + (4/9) x 106 + 2.5 x 105R Haciendo dC/dR = 0 y resolviendo se tiene: R = 6 y P = 1500 psi.
El correspondiente costo es: C = 3.44 x 106 El cual es mayor que el sistema sin restricción, como se esperaba. Variación de la restricción: Las ecuaciones a ser resueltas para este caso son:
La primera ecuación se simplifica a: P = 250R La cual, cuando se resuelve simultáneamente con la segunda ecuación da los mismos resultados como en sustitución directa. Multipliocadores de Lagrange: La función Lagrangiana o aumentada es: L = 1000P + 4 x 109/PR + 2.5 x 105R + (PR - 9000) Encontrando las derivadas parciales de L con respecto a P, R, y e igualando a cero se tiene:
1000 - 4 x 109/P2R + R = 0 2.5 x 105 - 4 x 109/PR2 + P = 0 PR - 9000 = 0
Resolviendo las ecuaciones anteriores simultáneamente, se tienen los mismos resultados que los dos métodos anteriores, y el valor para el multiplicador de Lagrange. P = 1500, R = 6, = -117.3
2.4.4 Interpretación Económica de los Multiplicadores de Lagrange Los valores de los Multiplicadores de Lagrange en el óptimo proporciona información adicional e importante. Si las ecuaciones de restricción son escritas con parámetros bi en el lado derecho, los multiplicadores de Lagrange dan el cambio en la función beneficio con respecto a estos parámetros, es decir, y/bi. Muchas veces, los lados derechos de las ecuaciones de restricción representan la disponibilidad de materias primas, demanda para productos, o capacidades de unidades de proceso. Consecuentemente, es importante conocer como la solución óptima es afectada por cambios en disponibilidad, demanda, y capacidades. Como veremos, en programación lineal dónde estos cambios se analizan por el análisis de sensibilidad, los Multiplicadores de Lagrange se dan con los nombres "imagen de precios " y "actividad dual". La siguiente derivación breve obtiene el resultado que y/b = - para el caso de una restricción y dos variables independientes, y la extensión a m ecuaciones de restricciones con n variables independientes es comparable. optimizar: y(x1, x2) (2-33) sujeta a : f(x1, x2) = b
Primero, podemos obtener la ecuación siguiente a partir de la función beneficio por la regla de cambio.
También, podemos obtener la siguiente ecuación a partir de la ecuación de restricción escrita como f - b = 0 mediante la regla de cambio.
Luego la ecuación de la restricción es multiplicada por el Multiplicador de Lagrange y adicionada a la ecuación de la función beneficio para dar:
Los valores de L/x1 y L/x2 son cero en el punto estacionario (condición necesaria), y consecuentemente y/b = -l. De esta manera, el cambio en la función beneficio y con respecto al lado derecho de la restricción b es igual al negativo del multiplicador de Lagrange. De otro lado, resultados similares pueden obtenerse para el caso de n variables independientes y m ecuaciones de restricción para obtener el siguiente resultado usando un procedimiento y argumentos similares(7).
En la sección siguiente, veremos que los Multiplicadores de Lagrange son también un factor clave en el análisis de problemas con restricciones de desigualdad. 2.4.5 Restricciones de desigualdad Una complicación adicional se tiene cuando al buscar el valor óptimo de una función beneficio o costo son incluidas restricciones de desigualdad. Aunque se usa el mismo procedimiento, será necesario considerar dos casos para cada ecuación de restricción de desigualdad. Un caso es cuando el Multiplicador de Lagrange es cero, y el otro es cuando el Multiplicador de Lagrange no es cero. Esto será ilustrado mejor por el siguiente ejemplo con una ecuación de restricción de desigualdad como se muestra a continuación. Optimizar: y(x) (2-38) Sujeta a : f(x) 0
Como se ha descrito previamente, el procedimiento consiste en adicionar una variable de holgura xs como xs2 y a partir de la función Lagrangiana: L(x, ) = y(x) + [ f(x) + xs2 ] (2-39) Luego las primeras derivadas parciales con respecto a los xi's, xs, y son igualadas a cero para tener un conjunto de ecuaciones y ser resueltas para los puntos estacionarios. Para ilustrar esta complicación, la ecuación obtenida de la variable de holgura es:
El resultado da dos casos, es decir, ya sea = 0 y xs 0, o 0 y xs = 0. Si = 0 y xs 0 aparece la desigualdad, y la restricción se dice es "floja", "pasiva" o "inactiva". Si 0 y xs = 0 aparece la igualdad, y la restricción se dice es "ajustada" o "activa". El siguiente ejemplo ilustra esta situación usando una modificación del proceso simple dado anteriormente. Ejemplo 2-8 Para el proceso la función de costo es: C = 1000P + 4 x 109/PR + 2.5 x 105 R Sin embargo, consideremos ahora que C esta sujeta a la restricción dada por la ecuación de desigualdad: PR 9000 Adicionando la variable de holgura S, como S2, y formando la función Lagrangiana: L = 1000P + 4 x 109/PR + 2.5 x 105 R + (PR + S2 - 9000) Haciendo las primeras derivadas parciales de L con respecto a P, R, S, y iguales a cero dan las siguientes cuatro ecuaciones:
Los dos casos son 0, S = 0 y = 0, S 0. para el caso de 0, S = 0 se mantiene la igualdad PR = 9000 es decir, la restricción es activa. Esta fue la solución obtenida en el Ejemplo 26, y el resultado es: C = $3.44 x 106 por año P = 1500 psi R = 6 = -117.3 Para el caso de = 0, S 0, la restricción es una desigualdad, es decir, inactiva. Esta fue la solución obteneida para el Ejemplo 2-2 y el resultado es: C = $3.0 x 106 por año P = 1000 psi R = 4 S = (5000)½ El ejemplo anterior tenia solamente una restricción de desigualdad y dos casos a considerar. Sin embargo, con varias restricciones de desigualdad la localización de los puntos estacionarios puede consumir mayor tiempo, para las posibilidades debe investigarse exhaustivamente. Un procedimiento para esta evaluación ha sido dado por Cooper (7) y Walsh (8) como sigue: Resolver el problema de optimización: y(x), ignorando las restricciones de desigualdad, es decir teniendo todas las variables de holgura positivas. Designa esta solución xo. Si xo satisface las restricciones como desigualdades, se ha encontrado un óptimo. Si una o más restricciones no son satisfechas, seleccionar una de las restricciones a ser una igualdad, es decir, activa (la variable de holgura para esta restricción es igual a cero), y resolver el problema. Llamar a esta solución x1. Si x1 Satisface el total de las restricciones se ha encontrado un óptimo. Si una o más restricciones no son satisfechas, repetir el paso 2 hasta que todas las desigualdades hayan sido tratadas en su turno como una restricción de igualdad (variable de holgura igual a cero).
Si el paso 3 no produce un óptimo, seleccionar combinaciones de dos restricciones de desigualdad a la vez a ser igualdades y resolver el problema. Si una de estas soluciones satisface todas las restricciones, se ha encontrado un óptimo. Si el paso 4 no da un óptimo, seleccionar combinaciones de tres restricciones de desigualdad a la vez a ser igualdades, y resolver el problema. Si una de estas soluciones satisface todas las restricciones, se ha encontrado un óptimo. Si no probar combinaciones de cuatro restricciones de desigualdad a la vez a ser igualdades, etc. Aplicar el procedimiento anterior, asumiendo que el punto estacionario localizado es un máximo o un mínimo del problema con restricciones. Sin embargo, existe una posibilidad que varios puntos estacionarios sean localizados; algunos podrían ser puntos máximos, otros mínimos y otros montura. En el Problema 2-6 fueron encontrados cuatro puntos estacionarios; dos puntos fueron máximo, uno un mínimo y uno montura. También, a partir de la Ec. (2-40) para cada restricción de desigualdad donde se mantiene la estricta desigualdad, las variables de holgura son positivas, y el Multiplicador de Lagrange es cero. Para cada restricción de desigualdad donde aparece la igualdad, la variable de holgura es cero, y el Multiplicador de Lagrange es diferente de cero.
En la sección siguiente son descritas condiciones necesarias y suficientes para problemas con restricción para determinar el carácter de los puntos estacionarios. Esto será similar y una extensión de la discusión previa para problemas sin restricción. 2.4.6 Método de Ascenso de la Pendiente Una posterior aplicación del método de los multiplicadores de Lagrange es el desarrollo del método de ascenso o (descenso) de pendiente para una función a ser optimizada. Este resultado será evaluado cuando se discutan los métodos de búsqueda. Para ilustrar la dirección de ascenso de pendiente, se muestra una representación geométrica en la Fig. 2-5. Para obtener la dirección de ascenso de pendiente, debemos encontrar el valor máximo de dy, con y(x1,x2,...xn) siendo una función de n variables. Así mismo. Existe una ecuación de restricción relacionando dx1, dx2, ... dxn y ds como se muestra en la Fig. 2-5 para dos variables independientes.
Fig. 2-5 Representación geométrica de la dirección de ascenso de la pendiente El problema es: El problema es:
Para obtener el valor máximo de dy, se forma la función Lagrangiana como sigue:
Diferenciando L con respecto a las variables independientes dxj e igualando a cero se tiene:
Estas n ecuaciones son resueltas simultáneamente con la ecuación de restricción para los valores de dxj. Resolviendo se tiene:
Y resolviendo para dxj:
El término entre corchetes no es función de j, y consecuentemente dxj es proporcional a y/xj. El signo positivo indica la dirección del ascenso de pendiente y el signo negativo indica la dirección de descenso de pendiente. Si se usa una constante k para representar el término entre corchetes en la Ec. (2.29), esta ecuación puede ser escrita como:
Si se usa una aproximación por diferencias finitas para dxj = (xj - xjo) y y/xj es evaluada a xo, entonces la siguiente ecuación da la línea gradiente.
Esta ecuación puede ser escrita en notación vectorial en términos de la gradiente de y evaluada a xo,y (xo), como: x = xo + ky ( xo ) (2-32)
Si se usa el signo positivo, el movimiento es a lo largo de la línea en la dirección de ascenso de pendiente, y si se usa el signo negativo entonces el movimiento es a lo largo de la línea en
dirección de descenso de pendiente. El siguiente ejemplo ilustra el método de ascenso de pendiente para una función simple.
Ejemplo 2-7: Encontrar el mínimo a lo largo de la dirección de pendiente descendente de la función dada a continuación iniciando en el punto xo = (1,1). y = x12 + x22 Línea gradiente (pendiente descendente): x = xo - ky(xo) o para dos variables independientes
Evaluando las derivadas parciales en el punto de inicio (1,1)
La línea gradiente es x1 = 1 - 2k x2 = 1 - 2k Sustituyendo la línea gradiente en la función a ser minimizada da: y = (1 - 2k)2 + (1 - 2k)2 = 2(1 - 2k)2 Evaluando dy/dk localizaremos el mínimo a lo largo de la línea gradiente, es decir:
y k = ½ es el punto estacionario Los valores correspondientes de x1 y x2 son x1 = 1 - 2(½) = 0 x2 = 1 - 2(½) = 0 Resulta que el mínimo a lo largo de la línea de pendiente también es el mínimo para la función en este problema, porque es la suma de cuadrados. El método de la pendiente ascendente es la base de varias técnicas de búsqueda. Debe notarse que cuando se trata con sistemas físicos, la dirección de pendiente ascendente (descendente) puede ser solamente una dirección de paso ascendente (descendente) dependiendo de las escalas usadas para representar las variables independientes. Esto es discutido e ilustrado por Wilde (5), y Wilde & Beightler (4).
2.5 CONDICIONES NECESARIAS Y SUFICIENTES PARA PROBLEMAS CON RESTRICCIONES Las condiciones necesarias han sido desarrolladas por Kuhn y Tucker (14) para un problema general de optimización no lineal con restricciones de igualdad y desigualdad. Este problema escrito en términos de minimizar y(x) es: Minimizar: y(x) (2-41) Sujeto a: fi(x) 0 para i = 1, 2, ..., h (2-42) fi(x) = 0 para i = h+1, ..., m (2-43) donde y(x) y fi(x) son los valores reales de las funciones dos veces continuamente diferenciables. Cualquier valor de x que satisfaga las ecuaciones de restricciones (2-42) y (2-43) es denominado una posible solución al problema en la teoría de Kuhn-Tucker. Entonces para localizar los puntos que pueden ser potencialmente mínimos locales de la ecuación (2-41) y satisfacer las ecuaciones de restricción (2-42) y (2-43), son usadas las condiciones necesarias de Kuhn-Tucker. Estas condiciones son escritas en términos de la función Lagrangiana para el problema la cual es:
donde los xn+i's son las variables remanentes (variables de holgura) usadas para convertir las restricciones de desigualdad a igualdades Las condiciones necesarias para un mínimo bajo restricciones son dadas por el teorema siguiente: (7,8,10,14). En razón a minimizar y(x) sujeta a fi(x)0, i = 1,2, ..., h y fi(x) = 0, i = h+1, ..., m, las condiciones necesarias para la existencia de un mínimo relativo a x* son:
Examinando estas condiciones, el primer paso es establecer las primeras derivadas de la función Lagrangiana con respecto a las variables independientes x1, x2, ..., xn e igualar a cero para localizar el punto, x* de Kuhn-Tucker. La segunda y tercera condiciones son repetir las ecuaciones de restricción de igualdad y desigualdad, las cuales deben satisfacer a las ecuaciones de igualdad y desigualdad las cuales deben ser satisfechas al mínimo del problema con restricción. La cuarta condición es otro camino para expresar ixn+i = 0, i = 1, 2, ..., h a partir del establecimiento de las derivadas parciales de la función Lagrangiana con respecto a las variables de holgura e igualar a cero. Ya sea i 0 y xn+i = 0 (la restricción es activa) o i = 0 y xn+i 0 (restricción es inactiva). Luego, el producto de Multiplicador de Lagrange y la ecuación de restricción establecido igual a cero es equivalente a la declaración, y esta es llamada la condición de holgura complementaria (15). La quinta condición proviene de examinar la ecuación (2-37), es decir, y(x*)/bi = i. El argumento es que a medida que bi es incrementada la región de restricción es agrandada; y esta no puede resultar en un alto valor para y(x*), el mínimo en la región. Sin embargo esto podría resultar en un valor bajo de y(x*); y correspondientemente y(x*)/bi podría ser negativo, es decir, a medida que bi aumenta, y(x*) podría disminuir. Entonces, si y(x*)/bi es negativo, el Multiplicador de Lagrange i debe ser positivo para satisfacer la ecuación (2-37). Esta condición es denominada una calificación de restricción, como se discutirá más adelante. Para la sexta condición, ha sido mostrada por Bazaraa y Shetty (15) que el Multiplicador de Lagrange asociado con las restricciones de igualdad son irestringidas en el signo; y por lo tanto no hay un argumento comparable a uno dado anteriormente sobre los Multiplicadores de Lagrange asociados con las restricciones de desigualdad.
Para el problema de maximizar y(x) sujeta a restricciones de igualdad y desigualdad, el problema es como sigue: Maximizar: y(x) (2-46) Sujeta a fi(x) < 0 for i = 1, 2, ..., h (2-47) fi(x) = 0 for i = h+1, ..., m (2-48)
Para este problema, las condiciones de Kuhn-Tucker son:
Estas condiciones son las mismas que las dadas para minimización dadas por la ecuación (2-45), excepto que la desigualdad es reservada para los Multiplicadores de Lagrange en la quinta condición. Así mismo, las restricciones de desigualdad son escritas como menor o igual a cero por conveniencia en la discusión subsiguiente sobre condiciones suficientes. El siguiente ejemplo ilustra las condiciones necesarias de Kuhn-Tucker para un problema simple.
Ejemplo 2-9: Localizar los cinco puntos de Kuhn-Tucker del siguiente problema, y determinar este carácter , es decir, máximo, mínimo o punto silla. optimizar: y = x1x2 sujeta a: x1 + x2 < 1 -x1 + x2 < 1 -x1 - x2 < 1
x1 - x2 < 1 Un diagrama de las ecuaciones anteriores es dado en la Figura 2-6. La función siendo optimizada es la clásica función de punto silla la cual es restringida por planos.
Figura 2-6 Diagrama de Optimización para problema 2-9 El primer paso en el procedimiento es localizar los puntos estacionarios ignorando las restricciones de desigualdad , es decir, 1 =2 =3 =4 = 0. Si este punto satisface las restricciones como desigualdades, puede haber sido encontrado un óptimo. Para este problema:
El punto de Kuhn-Tucker es xo (0,0), y evaluando este carácter mediante las condiciones de suficiencia sin restricciones da el siguiente resultado.
El punto xo(0,0) es un punto silla, y las restricciones son satisfechas. Procediendo al paso dos, una ecuación de restricción a la vez es seleccionada, y el carácter del punto de the Kuhn-Tucker es determinado. Comenzando con la primera ecuación de restricción como una desigualdad, es decir, 10 y considerando las otras tres como desigualdades, es decir, 2 = 3 = 4 = 0, dan la siguiente función ecuación para la función Lagrangina
Resolviendo da: x1 = ½, x2 = ½, = -½ y(½, ½) = ¼ El signo del Multiplicador de Lagrange es negativo, y por las condiciones necesarias de the Kuhn-Tucker, el punto puede ser un máximo, ya que las demás restricciones son satisfechas como desigualdades. El procedimiento es repetido para las otras tres ecuaciones de restricción, cada una considerada individualmente como una igualdad. Los resultados para los puntos de KuhnTucker son resumidos en la siguiente tabla: y : ¼ -¼ ¼ -¼ 0 x1: ½ -½ -½ ½ 0 x2: ½ ½ -½ -½ 0 : -½ ½ -½ ½ 0 Carácter: max min max min silla El carácter de cada uno de los puntos estacionarios se basa en las condiciones necesarias de Kuhn-Tucker. Examinando la Figura 2-5, podemos confirmar este carácter.
Sin embargo, calificaciones de restricción y condiciones suficientes son necesarias para dar un método general, y esto es discutido a continuación. En los teoremas desarrollados por Kuhn y Tucker (14), las ecuaciones de restricción deben satisfacer ciertas condiciones en los puntos de the Kuhn-Tucker, y estas condiciones son denominadas calificaciones de restricción. Como es dado por Bazaraa y Shetty (15), existen varias formas de calificaciones de restricción; y también, según Gill et. al. (16), es importante para restricciones no lineales. Esta es la condición que las gradientes que las ecuaciones de restricción en el punto de Kuhn-Tucker sea linealmente independiente. Esta calificación de restricción es requerida por las condiciones necesarias dadas por las ecuaciones (2-45) y (2-49). Como un ejemplo, Kuhn y Tucker(14) construyeron las ecuaciones de restricción: f1 = (1 - x1)3 - x2 > 0, f2 = x1 > 0, f3 = x2 > 0 Estas no satisfacen las condiciones al punto x2* = 1 y x2* = 0. A este punto f1 = [-3(1 x1)2, -1] = (0,-1), f2 = (1,0) y f3 = (0,1) no es linealmente independiente. La condición necesaria no puede sostenerse a un punto como este, y Kuhn y Tucker (14) dan argumentos que esta calificación de restricción es requerida para asegurar la existencia de los Multiplicadores de Lagrange en el punto óptimo. La comprobación de las calificaciones de restricción para un problema general de programación no lineal es casi una tarea imposible según Avriel (10). Él establece que afortunadamente en la práctica de calificación de restricción normalmente se mantiene, y es justificable usar la existencia de los multiplicadores de Lagrange como una base para tener las condiciones necesarias, dando argumentos de que la calificación de restricción es requerida para asegurar la existencia de los Multiplicadores de Lagrange.
2.6 APLICACIÓN A LA INGENIERÍA QUÍMICA En esta sección discutiremos algunos problemas relacionados a la ingeniería química y su solución usando el concepto de máximos y mínimos tanto mediante técnicas analíticas como numéricas. 2.6.1 Determinación de valores óptimos con dos variables independientes. La siguiente ecuación muestra el efecto de las variables x e y sobre el costo total para una operación particular:
Determine los valores de x e y que den el costo total mínimo
Solución analítica
En el punto óptimo,
Resolviendo simultáneamente para los valores óptimos de x e y x = 16 y = 20 Valor mínimo de CT: CT = 2,33(16) +11900/(16)(20) +1,86(20) + 10 CT = 121,6 Se puede verificar para tener la certeza de que los valores encontrados representan las condiciones del costo mínimo. Si:
Efectuando la apropiada diferenciación parcial y evaluando en el punto estacionario ( x = 16, y = 20) se tiene
Sustituyendo en M
Por lo tanto, el punto estacionario es un mínimo ya que ambas determinantes son positivas. Las condiciones optimas deben ocurrir en un punto de costo mínimo. Solución Numérica Usando MATLAB: Para probar, crear un archivo-M costo.m que define una función de dos variables, xey function c = costo(v) x = v(1); y = v(2); c = 2.33*x + 11900/(x*y) + 1.86*y + 10;
Ahora, encontrar un mínimo para esta función usando x = 0,1 y = 0,1 como los valores iniciales: >> v = [0.1 0.1]; >> a = fminsearch('costo', v) a = 15.9753
20.0121
Esto quiere decir que el mínimo ocurre cuando x = 15,9753 y = 20,0121 CT = 121,667
Usando el simulador UNTSIM Seleccionamosdel Menú principal: Optimización- Funciones multivariables - Mínimo sin restricciones y obtenemos la siguiente respuesta: Copyright 2002 UNT MSc. Luis Moncada All rights reserved OPTIMIZACION DE FUNCIONES MULTIVARIABLES SIN RESTRICCIONES, INICIA LA BUSQUEDA EN LOS VALORES INICIALES Y ENCUENTRA UN MINIMO LOCAL Las vaiables se denotan por: x(1), x(2),... Ingrese funcion: '2.33*x(1) + 11900/(x(1)*x(2)) + 1.86*x(2) + 10' Inicio de busqueda Valores iniciales: [.1 .1] RESULTADO DE LA OPTIMIZACION --------------------------------------------1.- El optimo de la variable es = 15.9753 1.- El optimo de la variable es = 20.0121 2.- El optimo de la funcion es es = 121.667
Aún cuando en este caso se llega numéricamente a una solución consistente, en otros casos es necesario colocar restricciones para los valores de las variables o límites inferiores y/o superiores 2.6.2 Optimización de un CSTR El costo de operación de un CSTR es dado por la siguiente ecuación:: CT = Cf CAo q + CmV El costo total de oprtación CT ($/hr) es la suma del costo de la alimentación, Cf CAoq, y el costo de mezclado, CmV. Los valores para el reactor son los siguientes: Cf = $5.00/lb-mol de A, costo de alimentación CAo = 0.04 lb-mol/ft3, concentración inicia; de A. q = caudal volumétrico de alimentación al reactor en ft3/hr. Cm = $0.30/hr-ft3, costo de mezclado V = volumen del reactor en ft3
Nosotros estamos interesados en obtener el costo de operación mínimo y los valores óptimos de caudal de alimentación, q; volumen de reactor, V; y concentración en el reactor, CA. En el reactor toma lugar la siguiente reacción de primer orden. A B Donde la velocidad de formación de B, rB está dada por r = kCA donde k = 0.1hr-1. a. Si se están produciendo 10 lb-mol de B por hora, dar las las dos ecuaciones de restricción de balance de materiales, las cuales restringen los valores de las variables independientes. (No hay B en la corriente de alimentación). b. A partir de la función Lagrangiana y efectuando la apropiada diferenciación para obtener el conjunto de ecuaciones que pueden ser resueltas para los valores óptimos de las variables independientes. Cuantas ecuaciones y variables se obtienen? c. Resolver para el valor óptimo de volumen del reactor, V; caudal de alimentación, q; y concentración de A en el producto, CA. Solución analítica a. Balance de materiales para A Balance de materiales para B acum. = entrada – salida acum. = entrada – salida 0 = CAoq – (rAV + qCA) 0 = CAoq + rBV – qCB o 0 = CAoq – kCAV – qCA 0 = 0 + kCAV – 10 o (CAo – CA)q = kCAV 0 = kCAV – 10 Las ecuaciones de restricción son: (CAo – CA)q – kCAV = 0 10 – kCAV = 0
b. Formando la función Lagrangiana CT = CfCAoq + CmV + 1 [(CAo – CA)q - kCAV] + 2(10 – kCAV) Diferenciando se tiene:
Existen cinco variables: q, V, CA, 1, 2; y cinco ecuaciones. Resolviendo simultáneamente usando las ecuaciones 2 y 3, se tiene: 2. CmV – 1kCAV – 2kCAV = 0 3. –1qCA – 1kCAV – 2kCAV = 0 -----------------------------------CmV – 1qCA = 0 1 = – CmV/qCA Reemplazando en ecuación 1 para 1, se tiene: CfCAo – (CmV/qCA)( CAo – CA) = 0 De la ecuación 4, se obtiene V/q como:
Reemplazando
Resolviendo para CA: CAo – CA = MCA CAo = MCA + CA = CA(M+1)
Luego conociendo CA de la ecuación 5 da:
Conociendo CA y V de la ecuación 4 se tiene:
Reemplazando
Solución Numérica Usando MATLAB El costo total es: CT = Cf CAoq + CmV de las ecuaciones de balance de materiales, se tiene:
Reemplazando q y V en la ecuación de costo total ( y haciendo CA = x), así como remplazando los valores numéricos, tenemos la función de costo total: CT = f = (2/(0.04 – x)) + 0.3/x (función de una sola variable) Para el caso de optimización de funciones de una variable, el procedimiento es el siguiente: 1. Creamos una función objetivo en línea >> f = inline('(2/(0.04-x))+30/x');
2. Luego invocamos la rutina fminbnd y en este caso damos un intervalo para la variable que es la concentración de A la cual debe estar entre 0 (conversión total) y 0.04 (no hay conversión) >> x = fminbnd(f, 0, 0.04)
Obteniendo la siguiente respuesta: x = 0.0318
Valor de CA para tener un costo total mínimo
El costo total mínimo se evalua con la orden: >> y = f(x) y = 1.1873e+003
Los demas valores se obtienen con los reemplazos respectivos.
Usando el simulador UNTSIM Seleccionamos del Menú principal: Optimización - Funciones de una variable - Mínimo en un intervalo fijo; obteniendo la siguiente respuesta: Copyright 2002 UNT MSc. Luis Moncada All rights reserved OPTIMIZACION DE FUNCIONES MONOVARIABLES EN UN INTERVALO FIJO *************************************** Ingrese funcion: '(2/(0.04-x))+30/x' Intervalo de busqueda Limite inferior: 0 Limite superior: 0.04 --------------------------------------------1.- El optimo de la variable es = 0.0317799 2.- El optimo de la funcion es = 1187.3
2.6.3 Tres Reactores en Paralelo La alimentación total a tres reactores químicos en paralelo es 1100 libras por hora. Cada reactor está operando con diferente catalizador y diferentes condiciones de temperatura y presión. La función beneficio de cada reactor tiene la velocidad de alimentación como la variable independiente, y los parámetros en la ecuación son determinados por el catalizador y condiciones de operación. Las funciones beneficio para cada reactor son dadas a continuación. P1 = 0.2F1 - 2(F1/100)2 P2 = 0.2F2 - 4(F2/100)2 P3 = 0.2F3 - 6(F3/100)2 Determine el beneficio máximo y la alimentación óptima a cada reactor. Solución analítica
max: P = 0.2F1 - 2(F1/100)2 + 0.2F2 - 4(F2/100)2 + 0.2F3 - 6(F3/100)2 sujeta a : F1 + F2 + F3 = 1100 La función Lagrangian es: L(F1, F2, F3 , ) = 0.2F1 - 2(F1/100)2 + 0.2F2 - 4(F2/100)2 + 0.2F3 - 6(F3/100)2 +(F1 + F2 + F3 - 1100)
F1 = 2F2 o 2F2 = 3F3 y F1 + ½ F1 + 1/3 F1 = 1100 Reemplazando y resolviendo se tiene: F1 = 600 F2 = 300 F3 = 200 F1 + F2 + F3 = 1100
P = 0.2(1100) - 2(6)2 - 4(3)2 - 6(2)2 P = 88
CAPITULO III OPTIMIZACIÓN DE PLANTAS 3.1 LA GRAFICA DEL PUNTO DE EQUILIBRIO PARA PLANIFICAR LA PRODUCCIÓN Y SU SIGNIFICANCIA PARA ANÁLISIS OPTIMO Al considerar los costos totales o beneficios en la operación de una planta, uno de los factores que tiene un efecto importante sobre los resultados económicos durante la vida económica es la fracción de capacidad a la cual opera la planta. Si la planta está sobredimensionada u opera a baja capacidad, algunos costos, tales como materias primas y mano de obra, serán disminuidos, pero los costos por depreciación y mantenimiento continúan esencialmente en el mismo valor aun cuando la planta no este operando a su capacidad total.
Fig. 3-1 Gráfica del punto de equilibrio Hay una relación entre la vida económica, capacidad de producción, y precio de venta. Es deseable operar a una capacidad que permita una utilización máxima de los costos fijos
mientras se pueda vender el producto y utilizar la capacidad de producción para dar el mejor resultado económico. La Fig. 3-1 muestra gráficamente como la cantidad de producción afecta los costos y beneficios. Los costos fijos permanecen constantes mientras que el costo total, sí como las utilidades incrementan con el incremento de la capacidad de producción. El punto donde el costo total de producción es igual a los ingresos representa el punto de equilibrio, y la capacidad de producción debe ser mayor que la capacidad correspondiente al punto de equilibrio 3.2 PRODUCCIÓN OPTIMA OPERACIÓN DE PLANTAS Los mismos principios usados para desarrollar un diseño óptimo pueden aplicarse para determinar las condiciones más favorables en la operación de una planta de manufactura. Una de las variables mas importantes en plantas de manufactura es la cantidad de producto producido por unidad de tiempo. La velocidad de producción depende de muchos factores, tales como el número de horas de operación por día, por semana, o por mes; la carga puesta sobre el equipo; y las ventas posibles. A partir de un análisis de los costos involucrados bajo situaciones diferentes y considerando otros factores afectando a la planta particular, es posible determinar una velocidad de producción optima o llamada tamaño económico de lote. Cuando un ingeniero de diseño realiza un diseño total de la planta, ordinariamente el estudio se basa en una capacidad de producción dada para la planta. Antes de que la planta sea puesta en operación, sin embargo, algunos de los factores originales de diseño serán cambiados, y la capacidad de producción óptima puede variar considerablemente de la “capacidad de diseño”. Por ejemplo, suponer que una planta ha sido diseñada originalmente para la producción por lotes de un producto orgánico sobre la base de un “batch”cada 8 horas. Antes de que la planta sea puesta en operación, se obtienen los costos de los procesos actuales, y se hacen pruebas operando con varios procesos. Se encuentra que la mayor producción por mes puede obtenerse si se reduce el tiempo por “batch”. Sin embargo, cuando se usa un tiempo mas corto por “batch”, se requiere mas mano de obra, el porcentaje de conversión de materiales disminuye, y los costos de potencia y vapor aumentan. Aquí esta un caso en el cual puede usarse un balance económico para encontrar la velocidad de producción optima. Aun cuando el ingeniero de diseño puede haber basado sus recomendaciones originales en un tipo similar de balance económico, las condiciones de precio y mercado no permanecen constantes, por lo tanto el estudio económico debe hacerse periódicamente. El siguiente análisis indica el método general para determinar la velocidad de producción optima o tamaño de lote. El costo total de producto por unidad de tiempo puede dividirse en dos clasificaciones de costos de operación y costos de organización. Los costos de operación dependen de la velocidad de producción e incluyen gastos para mano de obra directa, materias primas, potencia, calor, suministros, e ítem similares los cuales son una función de la cantidad de material producido. Los costos de organización se deben a gastos para personal directivo, equipo físico, y otros servicios o facilidades las cuales no dependen de la cantidad producida. Los costos de organización son independientes de la capacidad de producción.
Es conveniente considerar los costos de operación sobre la base de una unidad de producción. Cundo se hace esto, los costos de operación pueden dividirse en dos tipos de gastos como sigue: 1. Mínimo gasto para materias primas, mano de obre, potencia, etc., que permanece constante y debe ser pagado por cada unidad de producción tanto como la cantidad producida de material. 2. Gastos extras debido al incremento de la cantidad de producción. Estos gastos extras son conocidos como costos de sobreproducción. Ejemplos de costos de superproducción son costos extras causados por consumo extra de potencia, requerimientos adicionales de mano de obre, o disminución en la eficiencia de conversión. Los costos de superproducción pueden a menudo representarse como sigue: Costos de superproducción por unidad de producción = mPn (3.1) donde P = velocidad de producción tal como unidades totales de producción por unidad de tiempo. m = constante n = constante Designando h como los costos de operación los cuales permanecen constantes por unidad de producción y OC como los costos de organización por unidad de tiempo, el costo total por unidad de producción es:
Las siguientes ecuaciones para varios tipos de costos o beneficios se basan en la Ec. (3.2):
donde CT = costo total de producto por unidad de tiempo
r = beneficio por unidad de producción R’= beneficio por unidad de tiempo s = precio de venta por unidad de producción 3.2.1 Producción óptima para costo mínimo por unidad de producción A menudo es necesario conocer la velocidad de producción a la cual se tiene el costo de producción mínimo sobre la base de una unidad de material producido. La producción óptima debe ocurrir cuando dcT /dP = 0. Una solución analítica para este caso puede obtenerse de la Ec. (3.2), y la producción óptima Po dando el costo mínimo por unidad de producción se encuentra como sigue:
La producción óptima mostrada en la Ec. (3.7) podría, desde luego, dar el beneficio máximo por unidad de producción si el precio de venta permanece constante. 3.2.2 Producción óptima para máximo beneficio total por unidad de tiempo. En la mayoría de negocios, la cantidad de dinero ganada en un período de tiempo dado es mucho mas importante que la cantidad de dinero ganada por cada unidad de producto vendido. Entonces, se debe reconocer que la producción para beneficio máximo por unidad de tiempo puede diferir considerablemente de la producción para el costo mínimo por unidad de producción. La Ec. (3.5) presenta la relación básica entre costos y beneficios. Una gráfica de beneficio por unidad de tiempo versus producción pasa por un máximo. Luego esta ecuación puede usarse para encontrar analíticamente un valor de la producción óptima. Cuando el precio de venta permanece constante, la producción que de el beneficio máximo por unidad de tiempo es:
Ejemplo 3.1 Determinación de beneficios a producción óptima Una planta produce refrigeradores a razón de P unidades por día. Los costos variables por refrigerador se han encontrado a ser $47,73 + 0,1P1,2. Las cargas fijas totales diarias
son $1750, y todos los demás costos son constantes e iguales a $7325 por día. Si el precio de venta por refrigerador es 4173, determine: (a) El beneficio diario para una producción que de el mínimo costo por refrigerador. (b) El beneficio diario a una producción que de el beneficio diario máximo (c) La producción en el punto de equilibrio Solución (a) Costo total por refrigerador = cT = 47,73 + 0,1P 1,2 + (1750 + 7325)/P Producción para costo mínimo por refrigerador,
Po = 165 unidades por día para el mínimo costo por unidad Beneficio diario para la producción que de el mínimo costo por refrigerador
(b) Beneficio diario es:
Producción para beneficio máximo por día,
Po = 198 unidades por día para beneficio diario máximo Beneficio diario con una producción que da beneficio diario máximo (c) Beneficio total por día en el punto de equilibrio
Resolviendo la ecuación anterior para P, Pen el punto de equilibrio = 88 unidades /día 3.3 CONDICIONES OPTIMAS EN OPERACIONES CÍCLICAS Muchos procesos son llevados a cabo en operaciones cíclicas las cuales involucran periodos cortos para descargar, limpiar y recarga. Este tipo de operaciones ocurre cuando el producto es obtenido por un proceso “batch” o cuando la velocidad de producción disminuye con el tiempo, tal como la filtración en una unidad de discos. En una verdadera operación “batch” no se obtiene producto durante el periodo de parada. En operaciones cíclicas semicontinuas, se obtiene producto continuamente mientras que la unidad esta en operación, pero la cantidad disminuye con el tiempo. Por lo tanto en operaciones “batch” o semicontinuas, la variable de tiempo total requerido por ciclo debe ser considerado cuando se determina las condiciones optimas. El análisis de operaciones cíclicas puede llevarse a cabo convenientemente usando como base el tiempo por ciclo. Cuando se hace esto, pueden desarrollarse relaciones similares a las siguientes para expresar todos los factores, tales como costo total anual o producción anual:
El ejemplo siguiente ilustra el método general para determinar las condiciones optimas en una operación “batch”. Ejemplo 3.2 Determinación de las condiciones para el costo total mínimo en una operación “batch” Un compuesto orgánico se esta produciendo mediante una operación “batch”en la cual no se obtiene nada de producto hasta que se termina el “batch”. Cada ciclo consiste del tiempo de operación necesario para la reacción completa además de un tiempo total de 1,4 h para descargar y cargar. El tiempo de operación por ciclo es igual a h, donde Pb son los Kg. de producto obtenidos por “batch”. Los costos de operación durante el periodo de operación son $20 por hora, y los costos durante el periodo de descarga y carga son $15 por hora. Los costos fijos anuales para el equipo varían con el tamaño del “batch” de acuerdo a:
Las cargas de inventario y almacenamiento pueden despreciarse. Si es necesario, la planta puede ser operada 24 h por día durante 300 días por año. La producción anual es 1 millón de Kg. de producto. A esta capacidad, los costos de materia prima y misceláneos, otros que los ya mencionados, ascienden a $260 000 por año. Determinar el tiempo por ciclo para condiciones de costo total mínimo por año. Solución
El costo total anual es un mínimo cuando d(costo total anual)/dPb = 0. Efectuando la diferenciación, igualando el resultado a cero, y resolviendo para Pb se tiene: Pb, para costo óptimo = 1630 Kg. por “batch” Este mismo resultado podría haberse obtenido graficando el costo total anual versus Pb y determinando el valor de Pb al punto de costo total anual mínimo. Para condiciones de costo total anual mínimo y una producción de 1 millón de kg/año: Tiempo por ciclo = (1,5)(1630)0,25 + 1,4 = 11 h
Luego para condiciones de costo anual mínimo y una producción de 1 millón de kg/año, podría no usarse todo el tiempo disponible para operación y no operación. 3.3.1
Operaciones cíclicas semicontinuas
Las operaciones cíclicas semicontinuas son con frecuencia encontradas en la industria química, y el ingeniero de diseño debe entender los métodos para determinar el tiempo óptimo
por ciclo en este tipo de operaciones. Aun cuando se obtiene producto continuamente, la velocidad de producción disminuye con el tiempo debido a las incrustaciones, recolección de subproductos, reducción de la conversión y eficiencia, o causas similares. Esto deviene en la necesidad de cortar periódicamente la operación en razón de restaurar las condiciones iniciales para tener altas velocidades de producción. El tiempo óptimo por ciclo puede ser determinado para condiciones tales como la producción máxima por unidad de tiempo o el costo mínimo por unidad de producción. Formación de incrustaciones en evaporación
Durante el tiempo que un evaporador está en operación, a menudo se depositan sólidos sobre el área de transferencia, formando incrustaciones. La formación continua de incrustaciones causa un incremento gradual de la resistencia al flujo de calor y, consecuentemente, una reducción en la velocidad de transferencia de calor y la velocidad de evaporación si se mantiene la misma diferencia de temperatura como fuerza impulsora. Bajo estas condiciones, la unidad de evaporación debe ser parada y limpiada después de un tiempo óptimo de operación, y los ciclos son entonces repetidos. La formación de incrustaciones ocurre en la misma extensión en los diferentes tipos de evaporadores, pero es de particular importancia cuando la mezcla alimentada contiene un material disuelto que tiene una solubilidad inversa. El término solubilidad inversa indica que la solubilidad disminuye a medida que la temperatura de la solución aumenta. Para un material de este tipo, la solubilidad es menor cerca de la superficie de transferencia de calor donde la temperatura donde la temperatura es mas alta. Por lo tanto, cualquier sólido cristalizando cerca de la superficie de transferencia de calor formará incrustaciones sobre esta superficie. Las sustancias más comunes para formar incrustaciones son sulfuro de calcio, hidróxido de calcio, carbonato de sodio, sulfato de sodio y sales de calcio de ciertos ácidos orgánicos. Cuando ocurre la formación de incrustaciones, el coeficiente total de transferencia de calor puede ser relacionado al tiempo que el evaporador ha estado en operación por la ecuación de la línea recta
donde a y b son constantes para una operación dada y U es el coeficiente total de transferencia de calor en cualquier tiempo de operación b desde el inicio de la operación Si esto no se puede determinar los coeficientes de transferencia y las constantes mostradas en la Ec. (3.12), puede usarse cualquier cantidad que sea proporcional al coeficiente de transferencia de calor. Por lo tanto, si todas las condiciones excepto la formación de incrustaciones son constantes, la velocidad de alimentación, velocidad de producción, y velocidad de evaporación pueden cada una representarse de manera similar a la Ec. (3.12). Cualquiera de
estas ecuaciones puede ser usada como una base para encontrar las condiciones optimas. El método general es ilustrado a continuación, donde se emplea la Ec. (3.12) como base. Si Q representa la cantidad total de calor transferido en el tiempo de operación b, y A y t representan el área de transferencia de calor y la diferencia de temperatura respectivamente, la velocidad de transferencia de calor en cualquier instante es:
La velocidad instantánea de transferencia de calor varia durante el tiempo de operación, pero el área de transferencia de calor y la diferencia de temperatura permanecen esencialmente constantes. Entonces, la cantidad total de calor transferido durante un tiempo de operación b, puede determinarse integrando la Ec. (3.13) como sigue:
Tiempo por ciclo para cantidad máxima de calor transferido. La ecuación (3.15) puede usarse como una base para encontrar el tiempo por ciclo el cual permita la máxima cantidad de calor transferido durante un periodo dado. Cada ciclo consiste de un tiempo de operación (o ebullición) de b h. Si el tiempo por ciclo para descargar, limpiar, y recargar es c, el tiempo total en horas por ciclo es t = b +c .Luego, designando al tiempo total usado para la operación actual de descarga, limpieza y recarga como H, el número de ciclos durante H h = H/(b +c).
Fig. 3-2 Determinación del tiempo óptimo de operación para máxima cantidad de calor transferido en un evaporador con formación de incrustaciones.
La cantidad total de calor transferido durante H h = QH = (Q/ciclo) x (ciclos/H h) Entonces,
Bajo condiciones ordinarias, la única variable en la Ec. (3.16) es el tiempo de operación b. un gráfica de la cantidad total de calor transferida versus b muestra un máximo en el valor óptimo de b. La Fig. 3-2 presenta una gráfica de este tipo. El tiempo óptimo del ciclo también puede obtenerse derivando la Ec. (3.16) con respecto a b igualando a cero y resolviendo para b. El resultado es
El tiempo óptimo de ebullición está dado por la Ec. (3.17) mostrando el plan necesario para permitir la cantidad máxima de calor transferido. Debe usarse todo el tiempo disponible para operación, descarga, limpieza y recarga. Para condiciones constantes de operación, este mismo plan dará también la máxima cantidad de alimentación consumida, producto obtenido y liquido evaporado. Un tercer método para determinar el tiempo óptimo por ciclo es conocido como el método tangencial para encontrar las condiciones óptimas, y es aplicable a muchos tipos de operaciones cíclicas. Este método es ilustrado para condiciones de tiempo de limpieza (c) constante en la Fig. 3-3, donde se grafica la cantidad de calor transferido versus el tiempo de limpieza. La curva OB está basada en la Ec. (3.15). La cantidad promedio de calor transferido durante un ciclo completo es Q/(b +c).
Fig. 3-3 Método tangencial para encontrar el tiempo óptimo de operación para máxima cantidad de calor transferido en evaporador con formación de incrustaciones. Cuando la cantidad total de calor transferido durante un número de ciclos repetidos es un máximo, la cantidad promedio de calor transferido por unidad de tiempo debe también ser un máximo. El tiempo óptimo por ciclo, entonces, ocurre cuando Q/(b +c) es un máximo. La línea recta CD’ en la Fig. 3-3 comienza a la distancia equivalente a c sobre el lado izquierdo del origen de la grafica. La pendiente de esta línea recta es Q/(b +c), con los valores de Q y b determinados por el punto de intersección entre la línea CD’ y la curva OB. El valor máximo de Q/(b +c) ocurre cuando la línea CD es tangente a la curva OB, y el punto de tangencia indica el valor óptimo del tiempo de ebullición por ciclo para condiciones de cantidad máxima de calor transferido. Tiempo por ciclo para costo mínimo por unidad de calor transferido. Existen muchas circunstancias diferentes las cuales pueden afectar al costo mínimo por unidad de calor transferido en una operación de evaporación. Un caso simple y comúnmente dado será considerado. Se puede asumir que se dispone de una unidad de evaporación de capacidad fija, y que cada día debe manejarse una cantidad definida de alimentación y evaporación. El costo total para limpieza y cargas de inventario se asume constante sin importar cuanto tiempo usado para ebullición. El problema es determinar el tiempo por ciclo, el cual permita la operación a menor costo total.
El costo total incluye (1) cargas fijas sobre el equipo y perdidas de calor, (2) vapor, materiales, y costos de almacenamiento los cuales son proporcionales a la cantidad de alimentación y evaporación, (3) desembolsos para mano de obra directa durante la operación de evaporación actual, y (4) costos de limpieza. Como el tamaño del equipo y las cantidades de alimentación y evaporación son fijos, los costos considerados en (1) y (2) son
independientes del tiempo por ciclo. Entonces, el tiempo óptimo por ciclo puede encontrarse minimizando la suma de los costos para limpieza y mano de obra directa durante la operación. Si Cc representa los costos para una limpieza y Sb son los costos de mano de obra directa por hora durante la operación, los costos variables totales durante H h de tiempo de operación y limpieza debe ser
Las Ecs. (3.16) y (3.18) se pueden combinar para dar
El valor óptimo de b para costo total mínimo puede obtenerse graficando CT versus b o derivando la Ec. (3.19) con respecto a b igualando a cero y resolviendo para b. El resultado es
La Ec. (3.20), muestra que el tiempo óptimo por ciclo es independiente de la cantidad requerida de calor transferido QH. Por lo tanto se debe hacer una revisión para tener el tiempo óptimo por ciclo exacto para mínimo costo permitiendo la cantidad requerida de calor transferido. Esto puede hacerse fácilmente usando la siguiente ecuación, la cual se basa en la Ec. (3.16):
donde H’es el tiempo total disponible para la operación, descarga, limpieza y recarga. Si t es igual o mayor que b,opt + c , puede usarse el tiempo óptimo de ebullición indicado por la Ec. (3.20), y la producción requerida puede obtenerse a condiciones de costo mínimo. El tiempo óptimo por ciclo determinado por los métodos precedentes puede no ajustarse al programa da operación adecuado. Afortunadamente, como se muestra en las Figs. 3-2 y 3-3, los puntos óptimos usualmente ocurren donde una variación considerable en el tiempo por ciclo tiene pequeño efecto sobre el factor que esta siendo optimizado. Entonces es posible, ajustar el tiempo por ciclo para elaborar un programa de operación adecuado sin causar muchas variaciones en los resultados finales.
Las aproximaciones descritas en las secciones precedentes pueden ser aplicadas para diferentes tipos de operaciones cíclicas semicontinuas. Una ilustración mostrando como el mismo razonamiento es usado para determinar los tiempos óptimos por ciclo para operaciones en filtros prensa se presenta en el Ejemplo 3.3.
Optimización de un Filtro Prensa Ejemplo 3-3 Tiempo por ciclo para máxima cantidad de producción de un filtro prensa de placas y armazón. Exámenes con un filtro prensa de placas y armazón, operando a presión constante, muestran que la relación entre el volumen de producto filtrado y el tiempo de operación puede representarse por:
donde Pf = pies cúbicos de producto filtrado en un tiempo de filtrado de f h.
La torta formada en cada ciclo debe ser lavada con una cantidad de agua igual a la dieciséis ava parte del volumen de filtrado por ciclo. La velocidad de lavado permanece constante e igual a un cuarto de la velocidad de filtrado al final de la filtración. El tiempo requerido por ciclo para desmontar, descargar, y volver a montar es 6 h. Bajo estas condiciones donde se aplica la información precedente, determinar el tiempo total por ciclo necesario para permitir la máxima salida de filtrado durante cada 24 h. Solución
Haciendo f = horas de tiempo de filtrado por ciclo Filtrado obtenido por ciclo = Pf, ciclo = 150(f + 0,11)1/2 pies3. Caudal de filtrado obtenido al final del ciclo es
Tiempo para lavado = (volumen de agua de lavado)/ (velocidad de lavado)
Filtrado en pies3 obtenidos/24 h es
La Ec. (1) describe el tiempo total por ciclo en función del tiempo de filtrado La Ec. (2) describe la cantidad de filtrado en función del tiempo de filtrado La solución se encuentra de la manera siguiente: - Determinar el tiempo de filtrado para obtener la máxima cantidad de filtrado usando la Ec. (2) - Reemplazar en la Ec. (1), el valor encontrado del tiempo de filtrado para obtener el tiempo total por ciclo.
La solución puede hacerse usando diferentes métodos de los cuales presentaremos dos.
4.3 TRANSFERENCIA DE CALOR (FLUJO OPTIMO DE AGUA DE ENFRIAMIENTO EN UN CONDENSADOR) Si un condensador, con agua como medio de enfriamiento, es diseñado para llevar a cabo una operación dada, el agua de enfriamiento puede hacerse circular en gran cantidad con un cambio
pequeño en su temperatura o en pequeña cantidad con un cambio grande en su temperatura. La temperatura del agua afecta la diferencia de temperaturas como fuerza impulsora para la transferencia de calor. El uso de una cantidad grande de agua, entonces, causara una disminución en la cantidad de área necesaria para la transferencia de calor y como resultado una disminución en la inversión inicial y cargas fijas. De otro lado, el costo para el agua aumentará a medida que se use mayor cantidad de agua. Un balance económico entre las condiciones alto flujo de agua – menor área de transferencia y bajo flujo de agua – mayor área de transferencia, indica que el flujo óptimo de agua de enfriamiento ocurre en el punto de costo total mínimo para agua de enfriamiento y cargas fijas para equipo.
Considerando el caso general en el cual se debe remover calor de un vapor condensando a una razón dada designada por q Btu/h. El vapor condensa a una temperatura constante de t oF, y el agua de enfriamiento es suministrada a una temperatura de t1 oF. Se aplica la siguiente notación adicional: w = flujo de masa de agua de enfriamiento, lb/h Cp = capacidad calorífica del agua de enfriamiento, Btu/(lb)(oF) t2 = temperatura del agua saliendo del condensador, oF U = coeficiente total de transferencia de calor, considerado constante y determinado para las condiciones optimas. Btu/(h)(pie2)(oF) A = área de transferencia de calor, pies2
tlm = diferencia de temperaturas media logarítmica (fuerza impulsora ) en el condensador, oF Hy = horas de operación del condensador por año, h/año Cw = costo del agua de enfriamiento, asumido directamente proporcional a la cantidad de agua usada,† $/lb CA = costo por pie2 de área de transferencia del intercambiador instalado, $/pie2 KF = cargas fijas anuales incluyendo mantenimiento, expresado como una fracción del equipo completamente instalado. La cantidad de calor transferido en Btu por hora puede expresarse como:
Las condiciones de diseño establecen los valores de q , t1, y la capacidad calorífica del agua ordinariamente puede ser asumida igual a 1 Btu/(lb)(oF). Entonces la Ec. (4.20) muestra que el caudal de agua de enfriamiento es fijo si la temperatura del agua saliendo del condensador (t2), se mantiene constante. Bajo estas condiciones, el flujo óptimo de agua de enfriamiento puede encontrarse directamente a partir del valor óptimo de t2. El costo anual para agua de enfriamiento es wHyCw. De la Ec. (4.20),
las cargas fijas anuales para el condensador son AKFCA, y el costo total anual para agua de enfriamiento más las cargas fijas es
Sustituyendo A dado en la Ec. (4.19),
La única variable en la Ec. (4.23) es la temperatura del agua de enfriamiento saliendo del condensador. El caudal óptimo de agua de enfriamiento ocurre cuando el costo total anual es mínimo. Por lo tanto, la temperatura de salida correspondiente puede encontrarse diferenciando la Ec. (4.23) con respecto a t2 (o de manera más simple con respecto a t’ – t2) e igualando el resultado a cero. Cuando se hace esto, se obtiene el siguiente resultado:
(4.24)
Fig. 4-1 Solución de la Ec. (4.24) El valor óptimo de t2 puede encontrarse a partir de la Ec.(4.24) por una solución de prueba y error, y luego puede usarse la Ec. (4.20) para determinar el flujo óptimo de agua de enfriamiento. La solución por prueba y error se puede eliminar usando la Fig. 4-1, la cual es una gráfica de la Ec. (4.24). Ejemplo 4-1 Flujo óptimo de agua de enfriamiento en un condensador Un condensador para una unidad de destilación debe diseñarse para condensar 5000 lbs (2268 kg) de vapor por hora. La temperatura efectiva de condensación para el vapor es 170 oF (350 K). El calor de condensación para el vapor es 200 Btu/lb (4,65 x 105 J/kg). El agua de enfriamiento está disponible a 70 oF (294 K). El costo del agua de enfriamiento es $0,06 por 1000 gal ($5,30 por 1000 m3). El coeficiente total de transferencia de calor a las condiciones óptimas puede tomarse como 50 Btu/(h)(pie2)(oF) (284 J/m2 . s. K). El costo para el intercambiador instalado es $21 por pie cuadrado de área de transferencia de calor (4226 por metro cuadrado de área de transferencia de calor) y las cargas fijas anuales incluyendo mantenimiento son 20 por ciento de la inversión inicial. La capacidad calorífica del agua puede asumirse constante e igual a 1 Btu/(lb)(oF) (4,2 kJ/kg . K). Si el condensador debe operar 6000 h/año, determinar el flujo de agua de enfriamiento en libras por hora y en kilogramos por hora para las condiciones económicas optimas.
Solución U = 50 Btu/(h)(pie2)(oF) Hy = 6000 h/año KF = 0,20 CP = 1,0 Btu/(lb)(oF) CA = $21 /pie2
La temperatura óptima de salida puede obtenerse mediante una solución de prueba y error de la Ec. (4.24) o usando la Fig 4-1. De la Fig. 4-1, cuando la abcisa es 0,514
donde t’ = 170 oF t1 = 70 oF t2,opt = 128 oF De la Ec. (4.20), a las condiciones económicas optimas,
CAPITULO V LA PROGRAMACIÓN LINEAL El término programación en Programación Lineal (PL), no se refiere a programación para la computadora, sino a algún procedimiento a seguir en un plan. La programación lineal fue desarrollada en el año 1947, antes de la aparición de la computadora, cuando George B. Dantzig estableció una generación en las matemáticas de los problemas de planificación y programación de la producción, el avance de la programación lineal se ha desarrollado paralelo al de la computadora y hoy día problemas con varios miles de variables independientes y ecuaciones de restricción pueden ser resueltos fácilmente. Esta técnica se ha aplicado a la optimización de refinerías y plantas químicas, mezclas de alimentos para ganado, planeamiento de las rutas de aviación y utilización de la tripulación, problemas de transporte y distribución, en general, en la optimización de problemas de estrategia integral. La aplicación de la programación lineal ha sido fructífera cuando existe un gran número de alternativas interrelacionadas y la mejor política es en absoluto obvia. A menudo, una pequeña mejora en la solución, da como resultado una gran variación en la utilidad real. Un caso típico es el de una refinería de petróleo, donde los flujos son muy grandes, cualquier cambio en estas variables, en el plazo de un año, puede significar grandes variaciones en las utilidades de la planta. 5.1 INTERPRETACIÓN GEOMÉTRICA Y CONCEPTOS GENERALES Como el nombre lo indica, todas las ecuaciones de un modelo que hagan uso de programación lineal deben ser lineales. Aunque esta restricción es severa, son muchos los problemas que pueden ser llevados a este contexto. En la formulación de programación lineal, la ecuación que determina la ganancia o el costo de la operación se denomina función objetivo. Debe tener la forma de una suma de términos lineales. Las ecuaciones que describen las limitaciones bajo las cuales el sistema debe operar son las restricciones. Todas las variables deben ser no negativas, es decir, cero o positivas. La mejor forma de mostrar lo anterior, es a través de un ejemplo que ilustre el método y aporte algo acerca de la geometría del problema. Ejemplo 5.1 Una compañía fabrica dos tipos de motores pequeños con combustible sólido. Con el motor A, gana $3 por motor y con el motor B gana $4 por motor. Dispone de 80 h por semana para producirlos y en los procesos se requieren: 4h para A y solo 2 h para B. Sin embargo, debido a lo peligroso del material usado, son necesarias 5 h de preparación y limpieza para el motor B y 2 h para A. el tiempo de preparación total disponible es 120 h por semana. Determinar el número de
cada clase de motores a producir que dé como resultado máxima ganancia. Solución
La función objetivo es: Maximizar: 3A + 4B ganancia Las ecuaciones de restricción son: 4A + 2B 80 tiempo de procesamiento 2A + 5B 120 tiempo de preparación. Si se fabrican solamente motores tipo A, existe una limitación en el tiempo de procesamiento 80/4 = 20 lo que da como ganancia $60
Fig. 5.1 Función objetivo y restricciones del Ejemplo 5.1 Si se fabrican solo motores tipo B, la restricción es el tiempo de preparación 120/5 = 24 con una ganancia de $96. sin embargo existe una solución que es la óptima y es posible apreciarla en la Fig. 9.9. En esta figura se muestran las ecuaciones de restricción y la región factible para las variables. Cualquier solución fuera de esta región viola alguna de las restricciones. De modo que la solución debe existir en o dentro del contorno formado por las líneas: tiempo de preparación y tiempo de procesamiento y los ejes A, B; ya que A y B deben ser no negativos. Esta zona cerrada se denomina región posible. La función objetivo se muestra para P = 96, que es una de las rectas
en la familia de líneas. P = 3A + 4B
En este lugar geométrico P puede variar siempre que el valor de las variables se mantenga en la región posible. Al aumentar P se aprecia que el valor máximo se alcanza en el vértice donde A = 10 y B = 20 lo que da como resultado P = $110. 5.2 FORMULACIÓN GENERAL DEL PROBLEMA DE PROGRAMACIÓN LINEAL
Existen varias formas de presentar las relaciones matemáticas generales aplicables al problema de programación lineal. Una de ellas es la forma algebraica Función objetivo (a)
Optimizar (maximizar o minimizar) Z = c1x1 + c2x2 + . . . + cnxn (5.1) xi = variables del problema xi 0 (condición inherente) i = 1, 2, . . ., n Ecuaciones de restricción
La F O está sujeta a restricciones: a11x1 + a12x2 + . . . + a1nxn b1 a11x1 + a12x2 + . . . + a1nxn b1 (5.2) .. ..
..
a11x1 + a12x2 + . . . + a1nxn b1 Esto es, las fuentes son limitadas. Se buscan los valores de xi que optimicen la función objetivo. Los coeficientes ci reciben el nombre de coeficientes de costo. Los valores de las variables xi deben satisfacer las ecuaciones de restricción. Generalmente, hay más incógnitas que
ecuaciones, es decir, n > m y algunos de los valores de las xi se pueden especificar arbitrariamente (por lo general cero). Por ejemplo en un proceso químico, las variables independientes pueden ser flujos y las ecuaciones de restricción pueden ser balances de materia y energía en los procesos de la planta. El segundo tipo general de restricción especifica que todas las actividades deben tener un valor positivo. x1 0 El problema puede plantearse en forma más compacta como:
La notación vectorial es otro método para expresar el problema anterior: optimizar c . x sujeta a x 0 Ax b donde x = (x1, x2, . . ., xn) b = (b1, b2, . . ., bn) c = (c1, c2, . . ., cn)
Para obtener la solución óptima de este problema, el conjunto de desigualdades se
transforma en igualdades, introduciendo variables de holgura. Esto da como resultado un conjunto de ecuaciones con más variables independientes que ecuaciones, para poder resolverlas, algunas tendrán que ser especificadas arbitrariamente. Para cumplir con el marco matemático de la programación lineal, estas variables además deben hacerse igual a cero. La solución de las ecuaciones de restricción, ahora igualdades, con igual número de variables diferentes de cero como ecuaciones que tiene el problema, da como resultado la solución básica. El resto de las variables son iguales a cero. Una solución básica posible es una solución de las ecuaciones de restricción en la cual todas las variables distintas de cero son positivas. La base es el conjunto de variables distintas de cero. Se verá más adelante que el óptimo de la función objetivo es una solución básica posible. Esto se determina usando el método simplex de programación lineal. Ejemplo 5.2
Suponga que una planta procesadora de gasolina recibe cada semana una cantidad fija de materia prima para gasolina. Esta última se procesa en dos tipos de gasolina de calidad regular y Premium. Estas clases de gasolina son de alta demanda; es decir, se tiene garantizada su venta y se obtiene diferentes utilidades para la compañía. Sin embargo su producción involucra ambas restricciones, tiempo y almacenaje en sitio. Por ejemplo, sólo una de las clases se puede producir a la vez, y las instalaciones están abiertas solamente 8 horas por semana. Además, existe un límite de almacenamiento para cada uno de los productos. Todos estos factores se enlistan abajo (observar que una tonelada métrica, o ton, es igual a 1 000 kg): Producto Prémium 3 11 m /tonelada
Recurso Regular Disponibilidad del recurso 3 Materia prima para la 7 m /tonelada 77 m3 /semana gasolina Tiempo de producción 10 hr/tonelada 8 hr/tonelada 80 hr/semana Almacenamiento 9 toneladas 6 toneladas Aprovechamiento 150/tonelada 175/tonelada Desarrollar una formulación de programación lineal para maximizar las utilidades de esta operación
Solución El ingeniero que opera esta planta debe decidir la cantidad a producir de cada gasolina para maximizar las utilidades. Si las cantidades producidas cada semana de gasolina regular son designadas x1 y x2, respectivamente, la ganancia total se puede calcular como: Ganancia total = 150 x1 + 175 x2
o escribirla como una función objetivo en programación lineal, Maximizar Z = 150 x1 + 175 x2 Las restricciones se pueden desarrollar en una forma similar. Por ejemplo, el total de gasolina cruda utilizada se puede calcular como Total de gasolina utilizada = 7 x1 + 11 x2 Este total no puede exceder el abastecimiento disponible de 77 m3/semana, así que la restricción se puede representar como 7 x1 + 11 x2 ≤ 77 las restricciones restantes se pueden desarrollar en una forma similar, la formulación total resultante para la PL está dada por Maximizar Z = 150 x1 + 175 x2 (maximizar la ganancia) Sujeta a 7 x1 + 11 x2 ≤ 77 (restricciones de materiales) 10 x1 + 8 x2 ≤ 80 (restricciones de tiempo) x1 ≤ 9 (restricciones de almacenaje “regular”) x2 ≤ 6 (restricciones de almacenaje “prémium”) x1 , x2 ≥ 0 (restricciones positivas)
Observar que el conjunto de Ecuaciones anterior constituye la formulación completa de PL. Las explicaciones en los paréntesis de la derecha se han incluido para clarificar el significado de cada ecuación 5.3 SOLUCIÓN GRÁFICA
Debido a que las soluciones gráficas están limitadas a dos o tres dimensiones, tienen utilidad practica limitada. Sin embargo son muy útiles para demostrar algunos conceptos básicos que resaltan las técnicas algebraicas generales usadas para resolver problemas con grandes dimensiones en la computadora. Para un problema en dos dimensiones, como el del ejemplo 5.2, la solución espacial se define como un plano con x1 medida a lo largo de la abcisa y x2, a lo largo de la ordenada. Como las
restricciones son lineales, se pueden trazar sobre este plano como líneas rectas. Si el problema de PL se formula adecuadamente (es decir, si tiene una solución), estas líneas restrictivas delinearán una región, llamada el espacio de solución factible, englobando todas las posibles combinaciones de x1 y x2 que obedecen las restricciones y, por lo tanto, representan soluciones factibles. La función objetivo para un valor particular de Z se puede trazar como otra línea recta y sobrepuesta en este espacio. El valor de Z puede entonces ser ajustado hasta que esté en el máximo valor, mientras todavía toca el espacio factible. Este valor de Z representa la solución óptima. Los valores correspondientes de x1 y x2, donde Z toca el espacio de solución factible, representan los valores óptimos para las actividades. El ejemplo siguiente deberá ayudar a clarificar el procedimiento Ejemplo 5.3 Desarrolle una solución gráfica para el problema de procesamiento de gasolina que se derivó en el ejemplo 5.2: Maximizar Z = 150 x1 + 175 x2 Sujeta a 7 x1 + 11 x2 ≤ 77 (1) 10 x1 + 8 x2 ≤ 80 (2) x1 ≤ 9 (3) x2 ≤ 6 (4) x1 ≥ 0 (5) x2 ≥ 0 (6) Se ha numerado las restricciones para identificarlas en la siguiente solución gráfica. Solución
Primero, se pueden trazar las restricciones sobre el espacio de solución. Por ejemplo, se puede formular la primera restricción como una línea al reemplazar la desigualdad por un signo de igual y resolver para x2:
(a)
(b) Fig. 5-2 Solución gráfica del problema de programación lineal, a) Las restricciones definen un espacio de solución factible. b) La función objetivo se puede incrementar hasta que se alcance el valor más alto que cumpla con todas las restricciones. Gráficamente, se mueve hacia arriba y a la derecha hasta que toca el espacio factible en un solo punto óptimo.
Así, como en la Fig. 5-2a, los valores posibles de x1 y x2 que obedecen dicha restricción se hallan por debajo de esta línea (la dirección es designada por la gráfica y por la pequeña flecha). Las otras restricciones se pueden evaluar en forma similar, como sobrepuestas sobre la Fig. 5-2a. Observe como estas encierran una región donde todas se encuentran. Este es el espacio de solución factible (el área ABCDE en la gráfica). Además de definir el espacio factible, la Fig. 5-2a, también proporciona un conocimiento adicional. En particular se puede ver que la restricción 3 (almacenamiento de gasolina regular) es “redundante”. Esto es, el espacio de solución factible no resulta afectado si fuese suprimida. Después, se puede agregar la función objetivo a la gráfica. Para hacer esto se debe escoger un valor de Z. Por ejemplo, para Z = 0 la función objetivo es ahora
0 = 150 x1 + 175 x2 o resolviendo para x2
Como se muestra en la Fig. 5-2b, ésta presenta una línea punteada interceptando el origen. Ahora, puesto que estamos interesados en maximizar Z, se puede aumentar esta a digamos 600, y la función objetivo es
Así, incrementando el valor de la función objetivo, la línea se mueve lejos del origen. Como la línea todavía está dentro del espacio de solución, nuestro resultado es aún factible. sin embargo, por la misma razón, todavía hay espacio para mejorarlo. Por tanto, Z se puede seguir aumentando hasta que un incremento adicional lleve la función objetivo más allá de la región factible. como se muestra en la Fig. 5-2b, el valor máximo de Z corresponde a 1400 aproximadamente. En este punto, x1 y x2 son casi igual a 4,9 y 3,9, en forma respectiva. Así, la solución gráfica indica que si se producen estas cantidades de gasolinas, se alcanzara una máxima utilidad de casi 1 400. Además de determinar los valores óptimos, el procedimiento gráfico proporciona conocimientos adicionales en el problema. Esto se puede apreciar al sustituir de nuevo las soluciones en las ecuaciones restrictivas. 7(4,9) + 11(3,9) 77
10(4,9) + 8(3,9) 80 4,9 9 3,9 6 En consecuencia, como queda también claro en la gráfica, producir la cantidad óptima de cada producto nos lleva directamente al punto donde se encuentran las restricciones de las fuentes(1) y del tiempo (2). Tales restricciones se dice que están enlazadas. Además, la gráfica también hace evidente que ninguna de las restricciones de almacenamiento (3) y (4) actúan como una limitante. Tales restricciones se conocen como no enlazadas. Esto nos lleva a la conclusión práctica de que, para este caso, se puede aumentar las utilidades ya sea con un incremento en el abastecimiento de fuentes (la gasolina cruda) o en el tiempo de producción. Además, esto indica que el aumento del almacenamiento podría no tener impacto sobre las utilidades. El resultado obtenido en el ejemplo anterior es uno de los cuatro posibles resultados que por lo general se pueden obtener en un problema de programación lineal. Estos son: 1. Solución única. Como en el ejemplo, la función objetivo máxima interpreta un solo punto. 2. Solución alterna. Suponga que la función objetivo del ejemplo tuviera coeficientes, de tal forma que fueran paralelos precisamente a una de las restricciones. En nuestro problema ejemplo, una forma en la cual esto podría ocurrir, sería que las utilidades fueran cambiadas a $140/ton y $220/ton. Entonces más que un solo punto, el problema podría tener un número infinito de óptimos correspondientes a un segmento de línea (ver Fig. 5-3a) 3. Solución no factible. Como en la Fig. 5-3b, es posible que el problema esté formulado de tal manera que no exista solución factible. esto puede deberse a que se trata con un problema sin solución o a errores en la formulación del problema. Lo último puede resultar si el problema está tan sobre restringido que ninguna solución puede satisfacer todas las restricciones. 4. Problema sin límite. Como en la Fig. 5-3c, esto usualmente significa que el problema está bajo restringido y, por tanto, con finales abierto como para el caso de la solución no factible, puede a menudo surgir de errores cometidos durante la especificación del problema.
Fig. 5-3 Además de una sola ecuación óptima (por ejemplo Fig. 4-2b), existen otros tres resultados posibles de un problema de programación lineal: a) alternativa óptima, b) solución no factible y c) de resultado sin limites.
Ahora supongamos que nuestro problema involucra una solución única. El procedimiento gráfico podría seguir una estrategia numerativa para dar con el máximo. De la Fig. 5-2, debería quedar claro que siempre ocurre el óptimo en uno de los puntos esquina donde se encuentran dos restricciones. Tal punto se conoce de manera formal como un punto extremo. Así, fuera del número infinito de posibilidades en el espacio de decisión y enfocándonos sobre los puntos extremo, claramente se reducen las opciones posibles. Además, se puede reconocer que no todo punto extremo es factible; esto es, satisfacer todas las restricciones. Por ejemplo, observar que el punto F en la Fig. 5-2a es un punto extremo, pero no es factible. Si nos limitamos a puntos extremos factibles, se reduce el campo factible todavía más.
Por último, una vez que se ha identificado todos los puntos extremo factibles, el que ofrezca el mejor valor de la función objetivo representará la solución óptima. Se podría encontrar esta solución óptima mediante la exhaustiva (e ineficiente) evaluación del valor de la función objetivo en cada punto extremo factible. en la siguiente sección se analiza el método simples, que ofrece una estrategia preferible que representa en forma gráfica un rumbo acelerativo a través de la secuencia de puntos extremos factibles para arribar al óptimo de una manera extremadamente eficiente.
.5.2 Uso del paquete LINDO Ejemplo 4.5 Una planta química puede producir 2 tipos de productos A y B a partir de 3 materias primas diferentes m1, m2 y m3. las proporciones de materias primas para la fabricación de A es 4:5:3 y las correspondientes para B son 5:2:8. los ingresos netos para los productos A y B son uA = $5/lb y uB = $3/lb.
Los “stocks” de materia prima son: S1 = 1000 lbs, S2 = 1000 lbs y S3 = 1200 lbs para cada uno de los tipos disponibles. Determinar la capacidad de producción de A y B que brinden el ingreso neto máximo.
Solución Planteo
Producto A Producto B
1.- Variables: x1 = lbs de A (x1 > 0) x2 = lbs de B (x2 > 0) 2.- Función objetivo: INGRESOS Z Maximizar: Z = 5 x1 + 3x2 3.- Las restricciones son: 4x1 + 5x2 1000 5x1 + 2x2 1000 3x1 + 8x2 1200 4.- Enunciado: Maximizar Z = 5 x1 + 3x2 Sujeta a las restricciones 4x1 + 5x2 1000 5x1 + 2x2 1000 3x1 + 8x2 1200
m1 m2 4 5 5 2 1000 1000
m3 3 8 1200
U : $/lb 5 3
5.- Introduciendo las variables de holgura para transformar las inecuaciones de las restricciones a ecuaciones 4x1 + 5x2 + x3 = 1000 5x1 + 2x2 + x4 = 1000 3x1 + 8x2 + x5 = 1200 Variables de holgura: x3 , x4 y x5 La solución se encuentra de la siguiente manera: 1. Escribir el problema denotando MAX (para maximizar) o MIN (para minimizar) MAX 5x1 + 3x2 2. Dar las restricciones SUBJECT TO 4x1 + 5x2 <= 1000 5x1 + 2x2 <= 1000 3x1 + 8x2 <= 1200 3. Encontrar la solución dando la orden: Solve NO LIKELY SOURCES OF ERROR WERE FOUND LP OPTIMUM FOUND AT STEP 2 OBJECTIVE FUNCTION VALUE 1) 1058.823 VARIABLE VALUE REDUCED COST X1 176.470581 0.000000 X2 58.823528 0.000000
ROW SLACK OR SURPLUS DUAL PRICES 2) 0.000000 0.294118 3) 0.000000 0.764706 4) 200.000000 0.000000 NO. ITERATIONS = 2 RANGES IN WHICH THE BASIS IS UNCHANGED: OBJ COEFFICIENT RANGES VARIABLE CURRENT ALLOWABLE COEF INCREASE DECREASE X1 5.000000 2.500000 2.600000 X2 3.000000 3.250000 1.000000 RIGHTHAND SIDE RANGES ROW CURRENT ALLOWABLE RHS INCREASE DECREASE 2 1000.000000 100.000000 199.999985 3 1000.000000 250.000000 200.000000 4 1200.000000 INFINITY 200.000000 La aplicación del método da el siguiente resultado: Valor máximo de la función objetivo = 1058.823 Valores óptimos de las variables: X1 = 176.470581 X2 = 58.823528