MATEMÁTICAS APLICADAS EN INGENIERÍA QUÍMICA
Heberto Tapias García Luz Amparo Palacio Santos
Universidad de Antioquia Medellín Marzo de 2009
MATEMÁTICAS APLICADAS EN INGENIERÍA QUÍMICA Por
Heberto Tapias García Profesor del Departamento en Ingeniería Química Luz Amparo Palacio Santos Profesora del Departamento en Ingeniería Química
Universidad de Antioquia Medellín Marzo de 2009
PRÓLOGO En su ejercicio profesional, un ingeniero tiene que resolver los problemas con los conocimientos existentes o sin ellos. Cuando se dispone de una aproximación teórica para dar cuenta de los fenómenos que subyacen en los sistemas que interviene el ingeniero, la matemática le ofrece un lenguaje simbólico para construir un modelo o sistema sustituto con el cual se puede obtener información sobre el comportamiento del sistema real. Pero también la matemática le provee al ingeniero herramientas y métodos para resolver los modelos matemáticos fenomenológicos y generar modelos matemáticos a partir de datos empíricos obtenidos directamente de la experimentación de prototipos o de la operación de sistemas reales. La matemática en ingeniería es un instrumento con el cual el profesional busca la solución a esos problemas cotidianos, es así como la matemática promueve lenguaje para construir modelos de los sistemas reales, nos da la posibilidad de organizar la realidad en un sistema abstracto, etc. Sin embargo, la matemática además de instrumental es también formal, es decir, el conocimiento de la matemática nos educa para hacer abstracción, nos ayuda a organizar, a ser rigurosos. Este libro presenta herramientas y estrategias matemáticas de gran aplicabilidad a problemas de ingeniería química. Los cinco capítulos que lo conforman tienen una sustentación teórica, algoritmos, fórmulas, ejemplos aplicados, en algunos casos ejercicios puramente matemáticos, problemas propuestos y bibliografía. Se necesita en algunos capítulos que el lector conozca suficientemente bien toda la fenomenología de los procesos químicos y el diseño de equipos. Por ejemplo, en el capítulo de modelación es preciso manejar los conceptos de fenómenos de transferencia de masa, transferencia de calor y cantidad de movimiento. Por otro lado, hay algunos requerimientos mínimos en el área de las matemáticas para que quien aborde el libro pueda comprenderlo, por ejemplo, el cálculo diferencial, cálculo integral y las ecuaciones diferenciales. Los temas abordados en cada capítulo se planearon teniendo en cuenta las necesidades matemáticas que un estudiante de ingeniería química de último semestre debe integrar para tener un buen desempeño laboral. El primer capítulo trata sobre la modelación de procesos, la estrategia a seguir para conseguir representar la realidad por medio de algoritmos matemáticos y datos de propiedades, condiciones iniciales, condiciones finales, etc. El segundo capítulo tiene que ver con la conceptualización de las diferencias finitas y ecuaciones en diferencias, las cuales son aplicadas principalmente en procesos químicos que se realizan en etapas, o sea, no continuos. El tercer capítulo comprende diferentes métodos numéricos para ser utilizados en casos donde los métodos analíticos no son aplicables; abordándose aquí temas como la solución
i
de ecuaciones no lineales, de sistemas lineales y no lineales, interpolación y aproximaciones, diferenciación, integración y solución de ecuaciones diferenciales. La optimización no lineal con aplicaciones en ingeniería química es tratada en el cuarto capítulo; se trabaja con funciones objetivo univariable y multivariable, ambas con restricciones y sin ellas. En el capítulo final se aborda el tratamiento estadístico de datos experimentales, de gran importancia en ingeniería química, especialmente para conocer con determinada certeza la validez de los datos obtenidos experimentalmente.
ii
1
CAPÍTULO I MODELACIÓN MATEMÁTICA DE SISTEMAS EN INGENIERÍA QUÍMICA TABLA DE CONTENIDO
1.1. Análisis en Ingeniería Química ........................................................................ 2 1.2. Modelación de procesos y sistemas ................................................................ 5 1.2.1. Representación esquemática .................................................................... 6 1.2.2. Variables fundamentales ........................................................................... 6 1.2.3. Variables características ........................................................................... 8 1.2.4. Volumen de control.................................................................................... 8 1.2.5. Ecuaciones básicas ................................................................................... 9 1.2.6. Relaciones específicas o constitutivas..................................................... 10 1.2.7. Variables dependientes y parámetros ...................................................... 11 1.3. Problemas propuestos.................................................................................. 19 1.4. Bibliografía .................................................................................................... 21
2
CAPITULO I. MODELACIÓN MATEMÁTICA DE SISTEMAS EN INGENIERÍA QUÍMICA
1.1. Análisis en Ingeniería Química En la solución de problemas y el desarrollo de sistemas de procesos químicos o bioquímicos, el ingeniero químico se ve enfrentado a tener que realizar algún tipo de análisis para la formulación de alternativas y selección de alguna propuesta de solución. Para llevar a cabo estos análisis es necesario que el ingeniero formule correctamente el problema u objeto de análisis y lo interprete con la ayuda de los conocimientos disponibles: leyes, principios, teorías, paradigmas, etc. Es decir, necesita identificar inequívocamente los fenómenos y procesos presentes en el sistema objeto de análisis, y utilizar las herramientas disponibles para generar la información requerida y aproximaciones a la solución de los problemas enfrentados. En el análisis moderno de los sistemas y procesos objetos de estudio de la ingeniería química, generalmente se recurre a la modelación matemática fenomenológica. Esta modelación es posible en aquellos sistemas y procesos en los que se tienen conocimientos sobre los fenómenos que intervienen y para los cuales se han elaborado teorías y generado relaciones matemáticas para describirlos. El modelo matemático generado, constituido por un conjunto de ecuaciones diferenciales, en diferencias finitas y algebraicas, en algunos casos puede resultar difícil de manipular; y aunque pueda resolverse fácilmente, en ocasiones es recomendable el uso de juicios ingenieriles y aproximaciones razonables para reducirlo a uno menos complejo, que para los propósitos prácticos suministre una solución de ingeniería confiable de acuerdo con los datos disponibles. Pero aún, habiéndose reducido la complejidad del modelo, la solución del problema matemático puede enfrentarse a la limitación de la existencia de técnicas analíticas para la manipulación del modelo, lo que conduciría a recurrir a transformaciones del sistema de ecuaciones para ajustarlo a las formas estandarizadas, o utilizar las técnicas numéricas como métodos de aproximación a la solución rigurosa. El análisis significa examinar un sistema para identificar sus elementos constitutivos, relaciones y estructura, con el propósito de conocer sus características y funcionamiento. El interés del análisis de sistemas en ingeniería química se enfoca en el entendimiento de cómo se comportan variables como presión, temperatura, composición y flujos, que caracterizan su comportamiento, en relación con los parámetros y variables de entrada del sistema que son controlables. Esa comprensión que se obtiene del sistema ofrece la posibilidad de usar modelos para simular su comportamiento, sin intervención en el sistema real, cambiando parámetros y condiciones de variables, para decidir sobre las
3 transformaciones que deben introducirse en los sistemas existentes para obtener un comportamiento deseado, o para diseñar y generar uno completamente nuevo. Es amplio el ámbito de problemas y variados los objetivos en donde resulta de utilidad el análisis en ingeniería química. La investigación y desarrollo de procesos, el diseño, mejoramiento y optimización de procesos, operaciones y equipos, son áreas en donde con mayor frecuencia se realizan estudios analíticos; y en cualquiera de ellas, los problemas objeto de análisis generalmente involucran fenómenos de transferencia de cantidad de movimiento, transferencia de calor, transferencia de masa y cinética química. Particularmente en el desarrollo y diseño de procesos, la evaluación de las alternativas y la toma de decisiones se realizan en forma sistemática, mediante un proceso lógico secuencial que involucra tres grandes fases: la síntesis del proceso, el análisis del proceso y la optimización. En la primera fase, la síntesis del proceso, se genera una propuesta de proceso, su diagrama de flujo y la selección del tipo de operaciones unitarias que lo conforman. El análisis del proceso se hace con base en esta configuración y en los cálculos de balance de masa y energía, la selección del tipo de equipo, y el dimensionamiento y el costeo de ellos. Finalmente se lleva a cabo la optimización para la decisión óptima sobre los valores de condiciones de operación del proceso y las especificaciones de los equipos. El análisis de sistemas en ingeniería química es un proceso sistemático que entre sus etapas involucra la descripción matemática del sistema, la manipulación del modelo matemático, la comparación de los resultados suministrados por el modelo con la situación real y el estudio cuidadoso de las limitaciones del modelo para efectos de la toma de decisiones de acuerdo con el objetivo último del análisis. Este proceso puede organizarse como una secuencia lógica de las siguientes etapas generales: 1. Definición del problema 2. Teoría 3. Modelo matemático 4. Algoritmo 5. Soluciones 6. Análisis de la solución La primera etapa, la definición del problema, es una de las más importantes porque es la que define el objetivo del análisis. Normalmente este objetivo está asociado a un requerimiento de información sobre el comportamiento del sistema para efectos de su diseño, transformación, control o cualquiera otra situación relacionada con el sistema. Son muchos los objetivos posibles del análisis, los cuales pueden estar asociados a problemas o necesidades como:
¿Qué proceso en particular debe usarse para producir un producto químico específico?.
4
¿Qué tipo de equipo y qué tamaño es necesario para una operación unitaria?.
¿Cuáles son las condiciones de operación que maximizan la producción de un producto?
¿Cómo deben manipularse las variables de control de un proceso o equipo para mantenerlo en las condiciones de operación deseadas?.
¿Cuál es la operación de separación viable económicamente para recuperar una sustancia de una mezcla conocida?.
¿Cuáles son los factores que controlan la distribución de productos y rendimiento en un reactor?.
En la solución de cualquiera de esos problemas señalados es conveniente especificar cuál es la información que se requiere sobre el sistema y para que se requiera esta información. La segunda etapa es una definición o búsqueda de la teoría que explica el fenómeno o conjunto de fenómenos presentes en el sistema bajo análisis. Generalmente esta teoría existe, pero en caso contrario, la solución del problema requiere inicialmente de una investigación, en la que deben formularse hipótesis o postularse una teoría y constatar su validez mediante la comparación de resultados experimentales con una solución obtenida con un modelo matemático construido con base en esta teoría. En el desarrollo de esta etapa se requiere una habilidad especial para identificar los fenómenos presentes en el sistema objeto de análisis y la forma como interactúan, para comprender el comportamiento global del sistema y poderlo expresar en términos matemáticos. Esta es la etapa crucial en el análisis en ingeniería química. Una vez conocida la teoría, el problema se convierte en un problema matemático mediante la definición de variables y parámetros y la construcción de un modelo matemático ensamblado con el conjunto de relaciones o ecuaciones entre parámetros y variables asociadas a características del sistema objeto de análisis. Las variables pueden clasificarse como variables de entrada al modelo y las variables de salida. Las variables de entrada son aquellas que deben ser normalmente especificadas antes de que pueda resolverse el modelo u operarse el proceso o sistema real. Estas variables típicamente involucran ratas de flujo de corrientes de entrada o salida del proceso, composiciones, temperaturas y presiones de estas corrientes. Las variables de salida son las variables realmente desconocidas - variables dependientes y parámetros - cuyos valores se obtienen como soluciones del modelo matemático. El algoritmo de solución o procedimiento de solución del problema matemático está constituido por el conjunto de etapas secuenciales de operación sobre el modelo
5 para obtener los valores de las variables desconocidas. La ejecución de las operaciones especificas y detalladas en el algoritmo proveen una solución del problema. Esta solución es posible obtenerla mediante técnicas analíticas, cuando existen estos procedimientos y los modelos no son ni muy extensos ni muy complejos, o a través de métodos numéricos para modelos extensos y complejos o para los cuales no existen las técnicas analíticas de solución. Ambos procedimientos se pueden desarrollar manualmente, pero hoy es posible generar la solución del problema matemático con el uso del computador como herramienta y con aplicaciones como MATLAB, POLYMATH o mediante la traducción del algoritmo en un programa utilizando un lenguaje especifico de programación como FORTRAN, PASCAL, BASIC, C++ u otro. En otros casos, la solución se obtiene directamente, sin necesidad de la elaboración del modelo matemático, recurriendo a simuladores comerciales como: UNIOPT, CHEMCAD, SUPERPRO DESIGNER, entre otros.
1.2. Modelación de procesos y sistemas El análisis teórico y la elaboración del modelo matemático constituyen el corazón del análisis en ingeniería química. Los modelos matemáticos como representación simbólica del sistema real permiten, a través de su manipulación, interactuar virtualmente con los sistemas reales para comprender y predecir su comportamiento. Ellos no sólo se utilizan para el diseño, operación y control de procesos y equipos, sino que también se usan en el análisis de problemas y fallas, en la optimización de sistemas y equipos, y en el entrenamiento de personal de operación cuando se incorporan en simuladores. Los modelos matemáticos permiten describir el comportamiento de los sistemas en estado estacionario o en su dinámica, y sólo aquellos sistemas que puedan ser analizados teóricamente y modelados matemáticamente son susceptibles de solucionar con aproximaciones analíticas y racionales para obtener información de una manera expedita y económica. Esta es la ventaja y el poder del análisis en ingeniería química. Y aquellos sistemas que no puedan ser objeto de estas aproximaciones deben estudiarse con modelos reales al nivel de laboratorio o planta piloto, ya sea para construir alguna teoría sobre su comportamiento o para obtener suficiente información experimental para simular su comportamiento con herramientas como las redes neuronales que no requieren de una comprensión de los fenómenos o procesos que subyacen en el comportamiento de los sistemas reales. Para el desarrollo del modelo matemático puede seguirse un procedimiento general constituido por las etapas secuenciales que se muestran en el diagrama de flujo de la figura 1.
6 1.2.1. Representación esquemática La representación esquemática del sistema en un modelo gráfico se usa para mostrar los elementos constitutivos del sistema real, su estructura, las interrelaciones de dichos elementos y las relaciones o conexiones del sistema con su entorno. En esta representación las corrientes de entrada y salida de masa y energía al sistema suelen representarse con flechas, acompañadas de los símbolos que identificarán estas corrientes y las correspondientes variables de caracterización de la corriente (flujo, presión, temperatura y composición). Cuando el sistema objeto de análisis es un proceso químico o bioquímico, el sistema se representa mediante diagramas de bloques, o diagramas de flujo de proceso con símbolos convencionales para los equipos. En el caso de equipos u otro tipo de sistema, la representación debe ser lo más ilustrativa posible de la configuración real del sistema. 1.2.2. Variables fundamentales Las variables fundamentales son los atributos más generales de la materia que sufren cambios dentro del sistema, para los cuales existen principios de conservación. Los sistemas objeto de estudio de la ingeniería química involucran procesos en los que la materia sufre transformaciones físicas, químicas o bioquímicas para la modificación de su naturaleza, composición o contenido energético. Por lo tanto, los atributos que se usan como variables fundamentales para estos sistemas son la masa, la energía y la cantidad de movimiento; ya que los cambios de estas variables son los que informan sobre el comportamiento de dichos sistemas. Y son estos atributos generales los que permiten caracterizar los sistemas o informar sobre su estado y trayectorias evolutivas en su comportamiento. En un sistema en particular se utilizará una variable fundamental para su descripción matemática, si ese atributo o característica sufre cambio o transformación en los procesos que se presentan en el sistema, y si se está interesado en conocer el comportamiento especifico de esta variable o de una de sus variables características asociadas.
7
Representación esquemática del sistema Selección de las variables fundamentales Selección de las variables dependientes de caracterización
Selección de un volumen de control apropiado
Verificación del volumen de control Hay un valor único para las variables de caracterización en el volumen de no control? si
no
Generación de las ecuaciones básicas del modelo
Se usan todos los principios de conservación?
no Son suficientes si las ecuaciones?
Modelo matemático completo
si Utilizar una relación específica
Figura 1. Etapas en la modelación de un sistema (tomado de Russell, T.W., Denn, M.M., John Wiley & Sons, New York, 1972)
8 1.2.3. Variables características Normalmente los valores de las variables fundamentales no se pueden medir o conocer directamente sino indirectamente a través de otras variables. Son estas otras variables las que aparecerán en las ecuaciones y relaciones que conformarán el modelo matemático. Las variables características son las que realmente pueden medirse y agruparse para determinar el valor de las variables fundamentales. El valor de todas las variables características en cualquier momento y en cualquier punto del sistema determina el estado del sistema, y por lo tanto, se les conoce también como variables que determinan el estado del sistema y que son distintas de las variables de estado definidas en termodinámica. La masa, la energía y la cantidad de movimiento pueden cuantificarse o caracterizarse con variables como: densidad, concentración, presión, temperatura, velocidad, entre otras. En la selección de las variables de caracterización, que se van a utilizar para la formulación del modelo, conviene especificar cuáles se usarán para cuantificar cada una de las variables fundamentales seleccionadas en la descripción matemática del sistema. 1.2.4. Volumen de control El volumen de control es una región del sistema que se elige para hacer la contabilidad de las variables fundamentales mediante los principios de conservación y generar así las ecuaciones básicas del modelo. El volumen de control apropiado para la generación de ecuaciones puede ser todo el volumen del sistema, independientemente de las fases que lo integren y de los cambios de las variables características con la posición. Estos volúmenes macros se usan normalmente para establecer relaciones entre las entradas y salidas del sistema en estado estacionario. El volumen de control apropiado puede ser también una parte del sistema, o el volumen de una fase o una región finita o infinitesimal de ella, cuando se requiere obtener más ecuaciones básicas del modelo. Para efectos de la selección del volumen de control apropiado en una fase, es conveniente especificar cuál variable de caracterización -íntimamente asociada a cada variable fundamental- se va a usar para verificar si el volumen de control elegido es apropiado o no para efectos de la aplicación de los principios de conservación. Esta especificación se hace teniendo en cuenta que a cada variable fundamental está íntimamente ligada una variable o unas variables de caracterización. A la masa están íntimamente asociadas medidas de concentración como las fracciones molares o másicas, las concentraciones absolutas molares o másicas; a la energía, la temperatura, la presión, la velocidad; y a la cantidad de movimiento, la velocidad.
9 Un volumen de control apropiado en una fase puede elegirse por ensayo y error, cuando no se tiene experiencia en el proceso de modelación matemática. Se considera apropiado un volumen de control elegido, comprobando que efectivamente las variables características especificadas para esta verificación tengan, en un instante dado, el mismo valor en cualquier punto dentro del volumen de control. Cuando alguna de esas variables características no cumpla esta condición en el volumen de control, debe elegirse otro, hasta que se cumpla la condición de constancia en los valores de ellas. En la búsqueda de un volumen de control apropiado es conveniente iniciar con un volumen de control finito, el cual puede coincidir con el volumen total de la fase, continuar luego con volúmenes semifinitos, luego infinitesimales, y por último con un punto como opción final. Este procedimiento es aplicable en sistemas sólidos y fluidos en reposo o con flujo en régimen laminar. Un caso especial lo constituyen aquellos sistemas en los que se presenta flujo turbulento. En estos sistemas no se pueden usar volúmenes infinitesimales, sino semifinitos como mínimo, en virtud de que no es posible conocer valores puntuales de las variables características, por las fluctuaciones que tienen ellas con el tiempo, aún en estado estacionario. En estos casos la contabilidad de la masa, la energía y la cantidad de movimiento se realiza con valores promedios de las variables características asignados al volumen de control apropiado. En la elección del volumen de control apropiado debe tenerse en cuenta también que las superficies de control del volumen sean normales a las líneas de flujo de las entidades (masa, energía o cantidad de movimiento) que fluyen hacia o desde el volumen de control. Son volúmenes de control apropiados, por ejemplo, el volumen de la masa reaccionante en un reactor de tanque agitado perfectamente mezclado; un disco de espesor diferencial y el mismo diámetro del reactor en un reactor tubular con flujo turbulento; y un anillo coaxial con el reactor, de espesor y altura infinitesimal, en un reactor tubular real con flujo laminar. En la figura 2 se muestran ejemplos de volúmenes de control. 1.2.5. Ecuaciones básicas Una vez se tenga un volumen de control apropiado se pueden escribir las ecuaciones básicas del modelo. Ellas son relaciones que involucran las variables características y parámetros con las variables independientes que denotan tiempo y posición espacial en el sistema. Las ecuaciones básicas resultan de la aplicación de los principios de conservación de masa, conservación de energía y de conservación de cantidad de movimiento. Esta contabilidad podrá hacerse para todas las variables fundamentales que se usarán en la descripción del sistema y en todos los volúmenes de control que puedan elegirse. En principio, pueden elegirse tantos volúmenes de control como fases haya presentes en el sistema.
10
F1, z1, T1
nA,y+dy nA,x
nA,x+dx
dy y x
nA,y dx
F2, z2, T2
(d)
(a)
R F, c, T
F + dF, c + dc, T + dT
(b) z
dz
nA,r+dr dr nA,r
r nA,z
R nA,z+dz
(c) z dz
Figura 2. Ejemplos de volúmenes de control: (a) Finito en un tanque agitado, (b) semifinito en un reactor tubular con flujo turbulento, (c) infinitesimal en un reactor tubular con flujo laminar y (d) en la masa de líquido retenido sobre un plato de contacto gas-líquido 1.2.6. Relaciones específicas o constitutivas Si las ecuaciones básicas no son suficientes para completar el modelo matemático, porque existen más variables dependientes y parámetros desconocidos que
11 ecuaciones, entonces se recurre a las relaciones específicas o constitutivas para completar el modelo. Las relaciones específicas o constitutivas son ecuaciones empíricas que relacionan variables características, o ecuaciones derivadas de teorías o leyes aplicables a los fenómenos que se presentan en el sistema. Pueden tener una forma sugerida por una teoría, pero también tendrán parámetros experimentales. Se pueden obtener empíricamente o totalmente sobre bases teóricas, por ejemplo, aplicando las leyes de la conservación a escala molecular y utilizando la mecánica cuántica y la estadística. O bien, obtenerse por una combinación lógica de cualquiera de los métodos anteriores. Estas relaciones son específicas para los sistemas. Entre estas relaciones se tienen, por ejemplo, una ecuación de estado, relaciones termodinámicas, una ecuación que relaciona una propiedad como la conductividad térmica o la viscosidad con variables características como la concentración y la temperatura, una ecuación de velocidades de reacción, o ecuaciones para la densidad de transferencia de masa, de transferencia de energía en forma de calor, o de transferencia de cantidad de movimiento. Hay que tener precaución en la elaboración del modelo de que sólo aparezcan sistemas de ecuaciones linealmente independientes. 1.2.7. Variables dependientes y parámetros Para la contabilidad de variables en el modelo matemático deben diferenciarse las variables independientes de las variables dependientes. En esta contabilidad, para determinar si el modelo está completo, sólo se tienen en cuenta el número de variables dependientes que sean desconocidas. El tiempo y las variables que denotan posición en el espacio, constituyen las variables independientes del modelo. Los flujos de masa, de energía y de cantidad de movimiento, las medidas de concentración, las temperaturas, las presiones y las velocidades, entre otras, son denominadas variables dependientes, en virtud de que sus valores pueden depender de la posición y el tiempo y sólo se conocerán cuando se resuelva el modelo. Dentro de estas variables dependientes algunas suelen denominarse parámetros, porque hacen referencia a propiedades fisicoquímicas, a características de las configuraciones geométricas de los sistemas o a otros atributos. Algunos parámetros están predeterminados por la naturaleza química del sistema y por otras condiciones de los procesos como el régimen de flujo y la geometría. Son parámetros: las constantes de velocidad de reacción, los coeficientes de transferencia de masa y calor, los factores de fricción, la conductividad térmica, la viscosidad, la difusividad, los calores de vaporización y otras propiedades fisicoquímicas. Unos son geométricos como una longitud, un área o un volumen y otros son parámetros empíricos que aparecen en relaciones específicas que
12 describen el comportamiento de dispositivos, de componentes de los sistemas o equipos como los coeficientes de una válvula, la altura equivalente de plato teórico, la eficiencia de plato, la relación de reflujo mínimo o el número mínimo de etapas de separación.
Ejemplo 1: Formule un modelo matemático para un vaporizador de un líquido puro. Representación esquemática y condiciones de operación En la gráfica se ilustra un sistema vaporizador de forma cilíndrica. El calentamiento se hace con vapor de H2O saturado a la presión Ps. El recipiente tiene un volumen total Vo y diámetro D. Se asumirá que el líquido y el vapor se mantienen en equilibrio y que el calentamiento se hace esencialmente a través de la fase líquida. Fv Po Cv2 Pv
Vapor de agua
s
mv
Control presión
T Ts
h mH2O
FL Cv1
Variables dependientes fundamentales Las variables fundamentales para la descripción del comportamiento del sistema son la masa y la energía en virtud de que se presentan fenómenos de transferencia de masa y de calor. Especificación de las variables características
13 Para la masa las variables características son los flujos másicos, la densidad del líquido y la densidad del vapor; y para la energía la presión, la temperatura y el nivel del líquido.
Volúmenes de control Los volúmenes de control apropiado son tres (tantos como fases hay presentes en el sistema): el volumen de la fase líquida, el volumen de la fase de vapor del líquido y el volumen del vapor en la chaqueta de calentamiento. En los tres volúmenes de control se cumple la constancia de las variables características, densidad y temperatura; solo la presión tiene variación en la fase líquida, pero se considerará despreciable esta variación para efectos de la selección del volumen de control. Ecuaciones básicas del modelo Aplicando los principios de conservación de masa y de energía en los tres volúmenes de control se obtienen las siguientes ecuaciones básicas.
Conservación de masa
d mL dt d mv FV m G dt FL mv
Fase líquida
(1)
Fase gaseosa
(2)
Conservación de energía
q FL H Lo mv HV
d HTL Fase líquida dt
(3)
Ecuaciones específicas o constitutivas Como existen nueve variables dependientes (FL, mV, mL, FV, mG, q, HLo, HV, HTL) en las ecuaciones básicas y solo cuatro ecuaciones, el modelo debe completarse con ecuaciones específicas para el sistema:
D2
h l 4 m RT PV VG G M
mL
(4) (5)
14
D 2
VG Vo
(6)
h 4 PL P
FL CV1
(7)
FV CV2 PV Po
(8)
P PV L gh
(9)
H L C PL (T To )
(10)
HV CPL (T To )
(11)
HTL mL H L q UAT (Ts T )
(12) (13)
AT Dh
(14)
Bo Ts Co C pLo (T1 To )
ln Ps Ao
(15)
H Lo
(16)
C PL a bT
(17)
B0 T C0 a bTo
ln PV A0
(18)
CPLo
(19)
k 1
T Tc
0.38
T H 2 O k H 2 O 1 s TcH O 2 q m H 2O H 2O
(20)
0.38
(21)
(22) Con estas ecuaciones aparecen otras 11 variables dependientes: PV, VG, T, P, CPL,
, AT, Ts, CPlo, mH2O, H2O.
Definición de variables y parámetros
AT Ao, Bo, Co, A, B, C CPL, CPLo CV1, CV2
: Área de transferencia de calor, m2 : Parámetros de la ecuación de Antoine 1 -1 : Capacidades calóricas del líquido, Joule mol- K : Capacidad calórica del líquido alimentado, Joule mol-1 K-1 : Coeficientes de las válvulas de entrada del líquido y de salida del vapor del líquido, mol s-1 Pa -0.5
15
FL FV HLo HL HV h mv mG mH2O M Po PL P PV R Ps
q TL To Ts Tc, TcH2O VG Vo U L H2O
a, b k, kH2O
: Flujo másico de entrada del líquido. mol s-1 : Flujo másico de salida de vapor, mol s-1 : Entalpía del líquido de entrada a T 0, Joule mol-1 : Entalpía del líquido en el recipiente a T, Joule mol-1 : Entalpía del vapor del líquido a T, Joule mol-1 : Altura del nivel del líquido, m : Rata másica de vaporización, mol h-1 : Masa de vapor en la fase gaseosa, mol : Rata de condensado en la chaqueta, m3 s-1 : Peso molecular de la sustancia que se está vaporizando, g mol-1 : Presión en la descarga del vapor, Pa : Presión del líquido de alimentación, Pa : Presión en el fondo del tanque, Pa : Presión en la fase de vapor, Pa : Constante de los gases, Pa m3 mol-1 K-1 : Presión en la chaqueta de calentamiento, Pa : Rata de transferencia de calor, Joule s-1 : Temperatura del líquido de alimentación, K : Temperatura de referencia, K : Temperatura en la chaqueta, K : Temperatura crítica del líquido y del agua, K : Volumen de la fase gaseosa, m3 : Volumen total del recipiente, m3 : Coeficiente de transferencia de calor, Joule s-1 m-2 K-1 -3 : Densidad del líquido a T, g m -1 : Calor de vaporización del líquido, Joule mol : Calor de vaporización del agua a T s, Joule mol-1 : Parámetros de la ecuación para cálculo de la capacidad calórica : Parámetros en la ecuación para el estimado de los calores de -1 vaporización del líquido y del agua, Joule mol
Ejemplo 2: Formule un modelo matemático de un destilador Batch, para una mezcla de tres componentes que va a ser parcialmente separada.
Representación esquemática y condiciones de operación
16
V
yi Control presión
TJ Q
h
T xi
El destilador se calienta por medio de una chaqueta y se mantiene a una temperatura TJ controlando la presión. El flujo de calor de la chaqueta al destilador será:
Q = 5000(TJ -T) El destilador opera a presión atmosférica y se asumirá que los tres componentes forman una mezcla ideal. Variables dependientes fundamentales Las variables fundamentales para la descripción del comportamiento del sistema son la masa y la energía en virtud de que se presentan fenómenos de transferencia de masa y calor. Especificaciones de las variables características Para la masa las variables características son la densidad, altura, diámetro y fracciones molares; y para la energía la presión, la temperatura y el nivel del líquido. Volúmenes de Control Hay tres volúmenes de control: el volumen del líquido en el destilador, el volumen del gas en el destilador y el volumen del vapor en la chaqueta.
Ecuaciones básicas del modelo
Conservación de masa:
17
dmt V dt d 0 m A Vy A dt d 0 mB Vy B dt 0
Fase líquida
(1) (2) (3)
No se plantea la ecuación de conservación de masa en la fase de vapor pues se asume que el vapor que se genera inmediatamente se retira o porque la masa de vapor retenida es prácticamente despreciable.
Conservación de energía: Q
d HTL VHV dt
Fase líquida
(4)
No se plantea una ecuación de conservación de energía en la fase gaseosa porque se consideró que el vapor generado es inmediatamente retirado del vaporizador o porque la masa que permanece retenida es despreciable. Ecuaciones específicas o constitutivas Como existen 9 variables dependientes (V, mA, mB, mt, yA, yB, HTL, HV, Q) en las ecuaciones básicas y sólo cuatro ecuaciones, el modelo debe completarse con ecuaciones específicas para el sistema:
mt
D 2 h 4 M
(5)
m A mt x A mB mt x B w w 1 wA 0 0B 0C A B C M x A M A xB M B xC M C x M wA A A M xB M B wB M xC M C wC M
(6) (7) (8) (9) (10) (11) (12)
18
x A x B xC 1
(13)
HV yi i C pL i T Tr
yA yB yC
(14)
PA0 x A
(15)
P 0 PB x B
(16)
P 0 PC xC
(17)
P y A y B yC 1 AA ln PA0 AA T CA BB ln PB0 AB T CB ln PC0 AC
BC T CC
(18) (19) (20) (21)
CPLA aA bAT
(22)
CPLB aB bBT
(23)
CPLC aC bCT
(24)
T A k A 1 TC A
0.38
(25)
T B k B 1 TC B T C k C 1 TC C
0.38
0.38
HTL mL H L
(26)
(27)
(28)
H L xiCPiLT Tr
(29)
Q 5000TJ T
(30)
Con estas ecuaciones aparecen otras 21 variables dependientes:
wB, wC, P A, P B, P C, xA, xB, xC, yC, A, B, C, CPLA, CPLB, CPLC, T, HL. 0
0
0
, M, wA,
19
Definición de variables y parámetros
mt V xA, xB, xC yA, yB, yC wA,wB, wC HL HV HTL Q D h
A, B, C M MA, MB, MC P0A, P0B, P 0 C
: Moles totales de líquido, mol : Flujo molar de vapor, mol s-1 : Fracción molar de A, B y C en el líquido : Fracción molar de A, B y C en el gas : Fracción peso de A, B y C en el líquido : Entalpía del líquido, Joule mol-1 : Entalpía del gas, Joule mol-1 : Entalpía total del líquido, Joule -1 : Flujo de calor transferido, Joule s : Diámetro del recipiente, m2 : Nivel del líquido, m : Densidad del líquido, gm-3 : Densidad de los componentes A, B y C puros a la temperatura T : Peso molecular promedio del líquido, g mol-1 : Peso molecular de los componentes A, B y C, g/mol : Presión de vapor de A, B y C, Pa
AA, BA, CA AB, BB, CB AC, BC, CC Tr CPLA CPLB CPLC aA, bA
: Constantes de Antoine para el componente A : Constantes de Antoine para el componente B : Constantes de Antoine para el componente C : Temperatura de Referencia, K : Capacidad calórica del componente A líquido, Joule mol-1 K-1 : Capacidad calórica del componente B líquido, Joule mol-1 K-1 -1 -1 : Capacidad calórica del componente C líquido, Joule mol K : Parámetros de la ecuación para el cálculo de la capacidad calórica del componente A aB, bB : Parámetros de la ecuación para el cálculo de la capacidad calórica del componente B a C, b C : Parámetros de la ecuación para el cálculo de la capacidad calórica del componente C A, B , C :Calor de vaporización del líquido para los componentes A, B y C, Joule mol-1 kA, kB, kC : Parámetros en la ecuación para el estimado de los calores de vaporización de los componentes A, B y C , Joule mol-1 TCA, TCB, TCC : Temperatura crítica de los componentes A, B y C, K
1.3. Problemas propuestos 1. Formule un modelo matemático para un intercambiador de calor líquido-líquido en contracorriente (figura 3).
20
Tso
Fs TTi
FT
TTo
TSi
Figura 3. Intercambiador de calor 2. Formule un modelo matemático para una cámara roceadora para desorber amoníaco (figura 4).
Figura 4. Cámara roceadora 3. Desarrolle un modelo matemático para un separador líquido-vapor (figura 5). Antes de entrar al tanque el líquido pasa por un intercambiador de calor. La mezcla está compuesta por tres sustancias. Al sistema se le suministra una carga térmica constante.
21
Vo P T
F1
mG q h VL
Lo
Figura 5. Separador líquido-vapor
1.4. Bibliografía Bequette , B. W., “Process dynamics: modeling, analysis and simulation”, Prentice Hall, New Jersey, 1998. Franks, R., "Modeling and simulation in Chemical Engineering", John Wiley & Sons, New York, 1972. Husain, A.,“Chemical process simulation”, John Wiley & Sons, New York, 1986. Rice, R., Duong, D., “ Applied mathematics and modeling for chemical engineers”, Wiley, New York, 1995. Russell, T.W., Denn, M.M., "Introduction to Chemical Engineering analysis", John Wiley & Sons, New York, 1972. Smith, C., Pike, R., Murril, P., "Formulación and optimización of mathematical models", International texbook Company, Scranton,1970. Tapias, H., Palacio, L. A., “Modelación y análisis de sistemas en Ingeniería Química”, Ingeniería Química, Julio/Agosto, 2001.
CAPÍTULO II DIFERENCIAS FINITAS Y ECUACIONES DE DIFERENCIA TABLA DE CONTENIDO 2.1. Diferencias finitas ...........................................................................................23 2.1.1. El operador diferencia ..............................................................................23 2.1.2. Reglas generales del cálculo de diferencias ............................................25 2.2. Diferencias en funciones especiales ...............................................................26 2.3. Funciones factorial y polinomio factorial ........................................................27 2.3.1. Función factorial ......................................................................................27 2.3.2. Polinomio factorial...................................................................................29 2.3.3. El operador traslación ..............................................................................30 2.3.4. Notación suscrita para una función ..........................................................32 2.4. Operaciones sumas .......................................................................................33 2.4.1. El operador suma.....................................................................................33 2.4.2. Reglas generales de sumatoria ................................................................33 2.4.3. Sumatoria de funciones especiales ..........................................................34 2.4.4. Teorema fundamental .............................................................................34 2.5. Ecuaciones de diferencias ..............................................................................35 2.5.1. Solución de la ecuación diferencia ..........................................................37 2.5.2. Ecuaciones de diferencias lineales .........................................................38 2.5.3. Ecuaciones de diferencias lineales homogéneas .....................................39 2.5.3.1. Soluciones linealmente independientes .............................................39 2.5.4. Ecuaciones de diferencias lineales homogéneas con coeficientes constantes .........................................................................................................40 2.5.4.1. Caso 1: Todas las raíces son reales y diferentes .............................41 2.5.4.2. Caso 2: Algunas de las raíces son números complejos ....................41 2.5.4.3. Caso 3: Algunas de las raíces son iguales ........................................43 2.5.5. Ecuaciones de diferencias lineales no - homogéneas ..............................47 2.5.6. Métodos para encontrar soluciones particulares ......................................48 2.5.6.1 Método de los Coeficientes Indeterminados .......................................48 2.5.6.2 Método de los Operadores Inversos ...................................................51 2.5.7. Ecuaciones de diferencia no lineales .......................................................62 2.5.7.1 Soluciones gráficas ............................................................................62 2.5.7.2 Soluciones analíticas .........................................................................66 2.6. Ecuaciones diferenciales - diferencias ............................................................74 2.6.1.Transformación de Laplace .......................................................................74 2.6.2. Transformadas elementales .....................................................................75 2.6.3. Transformadas inversas ..........................................................................76 2.6.3.1. Método de la Integral de Convolución...............................................76 2.6.3.2. Método de los Residuos ...................................................................77 2.7. Problemas propuestos...................................................................................86 2.8 Bibliografía ......................................................................................................87
23
CAPITULO II. DIFERENCIAS FINITAS Y ECUACIONES DE DIFERENCIAS Los procesos químicos que involucran separación, purificación y reacciones químicas, generalmente utilizan unidades que desarrollan su operación en una serie de etapas. Estos tipos de procesos se analizan mediante el cálculo etapa por etapa, por métodos gráficos y en algunos casos mediante la solución de ecuaciones de diferencias. 2.1. Diferencias finitas 2.1.1. El operador diferencia El operador diferencia denota la diferencia que experimenta una función cuando hay un cambio finito en la variable independiente. Dada una función f x definida en el conjunto de los números reales, se define un operador , llamado operador diferencia, por:
f x f x h f x h: Número positivo llamado desplazamiento
Ejercicio 1: Encontrar la diferencia finita de 2 x 3 2
2 x 2 3x 2 x h 3 x h 2 x 2 3x 2
2 x 2 4 xh 2h 2 3x 3h 2 x 2 3x 4 xh 2h 2 3h El operador 2 es el operador diferencia de orden dos, y está definido como:
2 f x f x 2h 2 f x h f x A esta fórmula puede llegarse aplicando el operador diferencia a la primera diferencia de la función f x :
24
2 f x f x f x h f x
f x h f x f x 2h f x h f x h f x f x 2h 2 f x h f x
En general, el operador diferencia de orden n,
n, está definido por la fórmula:
n f x n1 f x n r n 1 f x n r h r 0 r
n n f x nh - f x n 1h ... 1 f x 1 n n! r r! n r !
Coeficientes binomiales. Número de combinaciones de n objetos, tomados de r en r.
Esta receta puede obtenerse aplicando sucesivamente el operador diferencia n veces a la función f x , o sea:
n f x n 1 f x n 2 f x n 2 veces f x Ejercicio 2: Encontrar la diferencia de orden 3 a la función x 1 4
3 r 3 3 x 4 1 1 f x 3 r h , f x x 4 1 r 0 r 3 3 3 3 f x 3h f x 2h f x h f x 0 1 2 3 3! 3! 3! 3! f x 3h f x 2h f x h f x 3!0! 2!1! 1!2! 0!3!
25
f x 3h 3 f x 2h 3 f x h f x f x x4 1 4 4 4 x 3h 1 3 x 2h 1 3 x h 1 x 4 1 3 4 24 xh 36h
2.1.2. Reglas generales del cálculo de diferencias
1. f x g x f x g x 2. f x f x ; = cte
3. f x g x f xg x g x hf x = g xf x f x hg x
= f xg x g xf x f xg x f x g xf x f xg x 4. g x g x g x h
Lim d D , se puede observar que si las relaciones anteriores dx x 0 x se dividen por x y se toma el límite cuando x 0 , se obtienen las reglas de Como
diferenciación homólogas.
Ejercicio 3: Encuentre la regla de la derivada para un producto de funciones f x g x a partir de la regla 3.
Lim f x g x Lim f x g x Lim g x h f x x 0 x 0 x 0 x x x Lim g x h f x = f x Dg x h0 h
26
f x Dg x g x Df x D f x g x 2.2. Diferencias en funciones especiales
1. C 0
3. e e e 1 2. b x b x bh 1 rx
rx
rh
4. senrx 2sen rh cos r x h 2 2
5. cosrx 2sen rh sen r x h 2 2
6. ln x ln 1 h
x
7. log b x log b 1 h
x
Si se dividen estas relaciones por x h y se toma límite cuando x 0 se obtienen las correspondientes derivadas. Ejercicio 4: Encuentre la regla para la derivada de la función e sección 2.2. (diferencia de funciones especiales).
rx
a partir de la regla 3 en la
Lim e rx Lim rx e rh 1 L' Hôpital Lim rx rh de rx e e .re x 0 x h0 h0 dx h
= re rx D e rx Ejercicio 5:
Halle la diferencia del monomio factorial 10x
10 x 3 3.10.x 2 h 30hxx h
3
27 Debido a la cercana relación del operador diferencia con el operador derivada, se podría pensar que es posible desarrollar un cálculo análogo al cálculo diferencial, así mismo es posible obtener las fórmulas del cálculo diferencial a partir del cálculo análogo si h o x se aproximan a cero. Ya que h se toma como una constante dada, con un valor finito, contrario a una variable que se puede aproximar a cero, hay que referirse a tal cálculo como cálculo de diferencias finitas. 2.3. Funciones factorial y polinomio factorial 2.3.1. Función factorial La función factorial generalizada está definida como:
f x
m
f x f x h f x 2h... f x m 1h
f x m
1 f x h f x 2h ... f x mh
f x 0 1 cuando h 0 : f x
m
f x
m
f x m f x m Ejercicio 6:
Expanda como productos de factores las funciones x x 2 2 2 2
x
x
x
2
x
2
x x x h x h
2
2
y x x 2
2
1 x h x h x 2h x 2h 2
2
En el caso particular en que f(x) = x, entonces se obtiene el monomio factorial:
x m x x h x 2h... x m 1h
x 0 1 m 1, 2, 3,...
Se origina el nombre factorial, ya que en el caso especial en que x = m y h = 1 se tiene que:
mm mm 1m 2...2.1 m!
28
x m
1 1 x hx 2h...x mh x mhm
Las funciones factoriales se convierten en monomios cuando el desplazamiento se hace cero:
h 0 : x m x m x m x m Ejercicio 7: Exprese como un producto de factores x
3
y x
3
x3 xx h x 2h 1 x 3 x h x 2hx 3h
La función factorial
x m tiene un polinomio equivalente dado por la fórmula: x
m
m
skm x k h m k k 1
donde:
skm : Son números Stirling de primera clase Estos números pueden generarse mediante la siguiente fórmula recursiva:
s km1 s km1 mskm donde
smm 1; skm 0 para k 0, k m 1, m 0 Ejercicio 8: Encuentre el polinomio equivalente para x
3
29
x 3 x 3 3x 2 h 2 xh2
Si se intenta buscar una fórmula en diferencias finitas para un monomio análoga a la derivada Dx m mxm 1 se obtiene:
xm
x m x h x m . Una x h m
comparación rápida nos conduce a establecer la poca semejanza que hay entre las dos, por esto se introduce la función factorial
mx m
análoga a la derivada:
x x
m 1 ,
x m para
obtener una fórmula
por lo tanto, una diferencia en funciones
especiales es:
x m mxm1h
2.3.2. Polinomio factorial Si p es un entero positivo, un polinomio factorial de grado p se define como:
a0 x p a1 x p1 ...a p donde a0 0 y
El monomio fórmula:
a1 , a2 , ..., a p
xm
son constantes.
también tiene un polinomio factorial equivalente dada por la m
x m S km x k h m k k 1
donde:
S km : Son números Stirling de segunda clase Estos números pueden generarse mediante la siguiente fórmula recursiva:
S km1 S km1 kSkm donde
30
S mm 1; S km 0 para k 0, k m 1, m 0 Ejercicio 9: Encuentre el polinomio factorial equivalente para x
3
x 3 x 3 3x 2 h x 1h 2 2.3.3. El operador traslación El operador traslación desplaza el valor de una función f(x) al valor de la función en la variable independiente incrementada en un desplazamiento h. Dada una función f(x), el operador traslación E se define como:
Ef x f x h Ejercicio 10:
Encuentre el valor de E 4 x x
2
E 4 x x 2 4 x h x h
2
4 x 4h x 2 2 xh h 2 n En general, el operador E traslada el valor de una función f x al valor de la
función en la variable independiente incrementada en n desplazamientos h.
E n f x f x nh Se puede demostrar que:
E 1 Se usa el número 1 en lugar de la letra I, para denotar el operador identidad u operador unidad. Esta relación es extraordinariamente importante porque con frecuencia permite simplificar expresiones en función de un operador al escribirlas en función del otro, utilizando para ello manipulaciones algebraicas ordinarias.
31 También se puede demostrar que:
Ef x = ehD f x a partir de la serie de Taylor
f a x a f x f a f a x a ... 2! 2
Serie de Taylor:
Si a x h
f x h f x f x h
f x h 2 ... 2!
df ( x) d 2 f x Df x , f ' ' x D 2 f x , 2 dx dx 2 h f x h f x hDf x D 2 f x 2! como : Ef x f x h
Si se reemplaza f x
h2 D 2 h3 D3 entonces, Ef x 1 hD ... f x 2! 3! Desarrollo de la función exponencia l : e x 1 x Ef(x) = e hD f x
x 2 x3 ... 2! 3!
Puede demostrarse la fórmula para el operador n aplicado a la función f(x), que aparece en la página 30, a partir de la relación entre el operador y el operador E.
n n n n n n E 1 E n E n1 E n2 E n3 ... 1 1 2 3 n n n n n f ( x ) E n E n1 E n2 E n3 ... 1 f x 1 2 3 n n E n f x E n1 f x ... 1 f x 1 n n n f x f x nh f x n 1h ... 1 f x 1 n r n -1 f x n r h r 0 r
32
Ejercicio 11: Realice el ejercicio 2 usando el operador traslación.
3 x 4 1 E 1 x 4 1 3
E 3 3E 2 3E 1 x 4 1
x 3h 1 3 x 2h 1 3 x h 1 x 4 1 4
4
4
24 xh3 36h 4 2.3.4. Notación suscrita para una función Si f x es una función discreta se puede hacer la transformación x a kh , con
a
y h como constantes, donde la variable es k, entonces la notación y f x equivale a:
yk f a kh k: número de desplazamientos desde el punto base ( x a ), a partir del cual se empieza a medir el desplazamiento. En la figura 1 se representa esquemáticamente la transformación a la notación suscrita.
x
xo a
x1 a+h
k
0
1
f(x)
f(xo) f(a)
f(x1) f(a+h)
yk
y0
y1
x2 a+2h 2
x3 a+3h
xn a+nh
3
n
f(x2) f(x3) f(a+2h) f(a+3h) y2
y3
f(xn) f(a+nh) yn
Figura 1. Representación esquemática de la notación suscrita.
33 De esta notación se sigue entonces que:
yk yk 1 yk yk yk 1 En general: n n n r n n y k 1 y n k r y n k y n k 1 ... r 0 r 0 1
que se obtiene a partir de la fórmula de la página 30 reemplazando f x n r h en notación suscrita, yk n r , teniendo en cuenta que x a kh .
E n yk yk n 2.4. Operaciones sumas 2.4.1. El operador suma Llamamos Σ el operador suma y Σf(x) la suma indefinida de f x . El operador Σ es el operador inverso de que se representa como 1 , de forma análoga a -1 como lo es el operador D (operador integral) del operador D (derivada). Por definición 1 es un operador tal que:
1 hf x f x h c x 1 f x f x c1 x donde c(x) y c1(x) son constantes periódicas, tal que c(x+h) = c(x). 2.4.2. Reglas generales de sumatoria 1.
f x g x f x g x
2.
f x f x
3.
f x g x f x g x g x hf x
34 Estas fórmulas se podrían escribir usando 1 en vez de Σ. Las dos primeras indican que Σ o 1 es un operador lineal. 2.4.3. Sumatoria de funciones especiales 1.
2.
1
x
m
x h
1
en notación suscrita
,
x m1 m 1h m 1;
3.
m 1 px q px q m 1 ph
4.
bx b b h 1
5.
e rx
6.
7.
m
k 1
en notación suscrita
k
m
k m1 m 1
; m 1
x
e rx e rh 1
senrx
cos rx
cos r x h
2
2
2sen rh
senr x h
2
2
2sen rh
Estas fórmulas también se pueden escribir con 1 en lugar de Σ. Es clara la analogía de las anteriores fórmulas con las integrales correspondientes si se multiplican las sumas por h = x. La relación entre el cálculo de sumas y el cálculo integral se expresa con el siguiente teorema:
Lim f x h C x f x dx C h 0
2.4.4. Teorema fundamental
35 La suma definida de f(x) desde x = a hasta x = a+nh con desplazamientos de valor h está denotada por: a n1h
a nh
f x f a f a h ... f a nh 1 f x a a
en notación suscrita se expresa: n
y k 0
k
1 yk
n 1 0
Esta relación es denominada el teorema fundamental del cálculo de suma, de manera análoga a la existencia del teorema fundamental del cálculo integral. Este teorema establece que la suma es equivalente a la función obtenida de la operación -1f(x) evaluada en el límite superior de la sumatoria más un desplazamiento, menos el valor de esa misma función evaluada en el límite inferior de la sumatoria.
Ejercicio 12: 8
2 x 4 , h 2
Resuelva la siguiente suma:
2
8
2x
4
2
2 x 5 5h
10
2
2 x 5 10
10
2
1 5 1 10 2 5 10 8 6 4 2 2 0 2 4 6 5 5
3840 768 5
Prueba: 2 x 4 22 4 4 4 6 4 8 4 8
2
22 0 2 4 4 2 0 2 6 4 2 0 8 6 4 2 768
2.5. Ecuaciones de diferencias Por analogía con una ecuación diferencial, una ecuación diferencia es una relación de la forma
36
y 2 y n y F x, y , , 2 ,..., n 0 x x x o también:
G x, f x, f x h,..., f x nh 0
en notación suscrita:
H k , yk , yk 1 ,..., yk n 0
donde:
y f x ó yk f a kh es una función conocida u objeto. La ecuación diferencia escrita en notación suscrita puede escribirse también en términos del operador E.
H k , yk , yk , 2 yk ,..., n yk 0 Si la ecuación diferencia es una ecuación que sólo posee términos lineales de la variable dependiente y sus diferencias, se dice que es lineal. Es decir, si la relación sólo involucra términos lineales de los elementos
y , y , y ,..., y 2
k
k
yk , yk 1 , yk 2 ,..., yk n .
n
k
k
ó
Si aparecen productos de la forma y k y k 1 o sus diferencias son de grados dos, se dice que la ecuación es de segundo grado. El grado de una ecuación en diferencias finitas es el máximo grado de la variable dependiente, o de cualquiera de sus términos en la ecuación. El orden de la ecuación diferencia es la sustracción entre el argumento más grande y el más pequeño para la función. Por ejemplo en la ecuación diferencia el orden es k n k n y en H yk , yk 1 , yk 2 ,..., yk n
H1 yk 1 , yk 2 ,..., yk n es k n k 1 n 1.
Ejercicio 13: Transforme la ecuación yk 3 5yk 2 6yk 1 3yk 0 en términos del operador E. Esta ecuación se puede escribir como:
3
5 2 6 3 yk 0
ó
yk 0
37 donde:
3 5 2 6 3 2.5.1. Solución de la ecuación diferencia La solución de una ecuación diferencia es cualquier función que satisface la ecuación. Una solución general en una ecuación diferencia de orden n es una solución que tiene n constantes arbitrarias. Una solución particular es una solución obtenida a partir de la solución general mediante la asignación de constantes periódicas particulares.
2 y y 3 2 y 4 x2 Por ejemplo, la ecuación 2 x x ó
f x 2h 3h 2 f x h 2h 2 3h 1 f x 4h 2 x 2
ó
yk 2 3h 2 yk 1 2h 2 3h 1 yk 4h 2 x 2 tiene como solución general:
y f x C1 x1 2h
x
h
C2 x1 h
x
h
2 x 2 6 2h x 7
y una solución particular se obtiene cuando:
2x C1 x 2 4hsen h 2x C2 x 5 h 2 1 cos h Para determinar las n constantes arbitrarias de una ecuación diferencia de orden n se deben conocer n condiciones de fronteras independientes para la función desconocida.
38 2.5.2. Ecuaciones de diferencias lineales Una clase importante de ecuaciones de diferencias son las ecuaciones de diferencias lineales. Una ecuación diferencia lineal de orden n es una ecuación diferencia que tiene la forma:
a0 k n yk a1 k n1 yk ... an k yk Rk donde a0 k 0 Esta ecuación también puede escribirse como
a k 0
n
a1 k n1 ... an k yk Rk ó
yk R k
donde el operador lineal está dado por:
a0 k n a1 k n1 ... an k Un
caso
particular importante surge cuando los coeficientes a0 k , a1 k , ..., an k son constantes; es decir independientes de k. En dicho
caso, la ecuación es una ecuación diferencia lineal de orden n con coeficientes constantes.
Ejercicio 14: Determine qué tipo de ecuación diferencia es cada una de las siguientes:
E
3
5E 2 6 E 3 y k 0
Esta es una ecuación diferencia lineal con coeficientes constantes
2k 1
2
3k 4 yk 4k 2 3k
Esta es una ecuación diferencia lineal con coeficientes variables.
yk yk 1 yk21
39 Esta es una ecuación diferencia no - lineal. 2.5.3. Ecuaciones de diferencias lineales homogéneas Son ecuaciones de diferencias lineales donde
Rk 0
y k 0 Aquellas ecuaciones donde R k 0 se clasifican como no - homogéneas
yk R k 2.5.3.1. Soluciones linealmente independientes Un conjunto de n funciones f1 k , f 2 k , ..., f n k son linealmente independientes si y solo si el determinante:
f 1 0
f 1 1 .... f 1 n 1
f 2 0
....
f 2 1 .... .... .... f 2 n 1 ....
f n 0
f n 1 0 .... f n n 1
Este determinante es conocido como el CASORATI y es análogo al WRONSKIANO para ecuaciones diferenciales. Si f1 k , f 2 k , ..., f n k son soluciones linealmente independientes de la ecuación diferencia homogénea de orden n, la solución general será:
yk C1 f 1 k C2 f 2 k ...Cn f n k Ejercicio 15: Determine si las funciones 2k y 4k son linealmente independientes.
f1 k 2 k , f 2 k 4 k f1 0
f 1 1
f 2 0 f 2 1
1 1 2 4
42 2 0
40
Las funciones son linealmente independientes 2.5.4. Ecuaciones de diferencias lineales homogéneas con coeficientes constantes Si se asume que y k r es solución de la ecuación diferencia lineal homogénea con coeficientes constantes: k
a
n
0
a1 n1 ...an yk 0
al sustituirla en esta ecuación se obtiene:
a0 r n k a1r n k 1 ...an r k 0 que factorizando
rk
se obtiene:
a r 0
n
a1r n1 ...an r k 0
Esta última ecuación se satisface si r es una raíz del polinomio:
a0 r n a1r n1 ...an 0 que se llama la ecuación auxiliar y puede representarse como:
r 0 Esta ecuación tiene n raíces que pueden ser o no diferentes. De esta forma la ecuación homogénea se puede escribir:
a0 r1 r2 ... rn yk 0 La solución de la ecuación homogénea depende entonces de las raíces r1 , r2 , ..., rn , es decir de su naturaleza.
41 2.5.4.1. Caso 1: Todas las raíces son reales y diferentes k
k
k
En este caso r1 , r2 ,..., rn son todas soluciones, múltiplos constantes de estas soluciones serán también soluciones y combinaciones lineales de estas soluciones también lo serán (pues es un operador lineal). Entonces, la solución general de la ecuación homogénea lineal de coeficientes constantes será:
yk c1r1k c2 r2k ...cn rnk Ejercicio 16: Halle las soluciones linealmente independientes de la ecuación diferencia: yk 2 6 yk 1 8 yk 0 y escriba la solución general. La ecuación diferencia puede expresarse en términos del operador E como:
E
2
6E 8 yk 0
y la ecuación auxiliar se obtiene a partir de la función E E 2 6E 8 , reemplazando E por r, entonces se obtiene:
r 2 6r 8 0 que factoriza como: r 2 r 4 0 cuyas raíces son: r 2, r 4 Las dos soluciones linealmente independientes son: 2k y 4k y por lo tanto la solución general será:
yk C1 2k C2 4k 2.5.4.2. Caso 2: Algunas de las raíces son números complejos Si
a0 , a1 , ..., an son reales y existen raíces complejas de la ecuación auxiliar, ellas
deben ser números complejos conjugados. En este caso si i y i k
k
42 son soluciones, entonces K1 i K2 i solución general por el par de raíces complejas. k
k
es una contribución a la
Escogiendo valores apropiados de K1 y K2 la contribución en forma real está dada por:
yk k C1 cos k C2 senk donde:
2 2 θ arctan Ejercicio 17: Resolver R 2 2R 1 5R 0
E
2
2E 5 R 0
La ecuación auxiliar es:
r 2 2r 5 0 r
2 4 20 2 4i 1 2i 2 2
2 2 12 22 5 2 arctan arctan 1.107rad 63.43 1
R R C1 cos R C2 senR
La solución general es:
R 5 C1 cos1.107 R C 2 sen1.107 R R
R 5
R
2
C1 cos1.107 R C 2 sen1.107 R
43 2.5.4.3. Caso 3: Algunas de las raíces son iguales Si se tienen tres raíces iguales r1 = r2 = r3, la contribución de estas tres raíces a la solución general es:
C C k C k r 2
1
2
3
k 1
Si se repiten m raíces reales, entonces la contribución a la solución general será:
C C k ...C k r m1
1
2
m
k 1
donde m n Si un par de raíces complejas se repite m veces, entonces la contribución a la solución general será:
k C1 C2 k ... Cm k m1 cos k C1 C2 k ... Cm k m1 senk Ejercicio 18: Resolver R 2 4R 1 4R 0
E
2
4 E 4 R 0
E 2 E 2 R 0 Ecuación auxiliar:
r 2r 2 0 r1 2; r2 2
R C1r1R C 2 Rr2R R C1 2 R C 2 R 2 R R C1 C 2 R 2 R
Ejemplo 1: Gs lbmoles/h de gas seco que contiene YNp+1 lbmoles de soluto/lbmol de gas seco son alimentadas a la base de una columna de absorción de platos, donde el soluto
44 va a ser despojado del gas por absorción con Ls lbmoles/h de un aceite que se alimenta en el tope de la columna. Si el soluto en el aceite que entra es Xo lbmol/lbmol de aceite, y el soluto en el gas es Y1 lbmol/lbmol de gas; demostrar que el comportamiento del absorbedor puede ser expresado en términos del factor de absorción y el número de etapas ideales está dada por la ecuación de Kremser Brown:
YNp1 Y0 log 1 1 1 A A Y1 Y0 Np log A donde:
A Ls
kGs : Factor de absorción
k : constante o relación de equilibrio; Y kX X , Y : Razones molares del soluto en fase liquida y gaseosa
Ls, Xo
Gs, Yi 1
Xm-1
Ym m
Xm
Ym+1
Np Ls, XNp
Gs, YNp+1
Balance de soluto en el plato m:
Ls X m1 GsYm1 Ls X m GsYm Ls X m X m1 Gs Ym1 Ym
(1)
45
como
Ym kX m X m Ym
Ym1 kX m1 X m1 Ym1
k
k
Sustituyendo X en términos de Y, se obtiene:
Ls Ym Ym1 Gs Ym1 Ym k Ym Ym1
Ym1 Ym A A
Ym1 1 AYm AYm1 0 La ecuación anterior es una ecuación diferencia lineal homogénea con coeficientes constantes, equivalente a:
E 2Ym 1 1 AEYm 1 AYm 1 0 factorizando Ym 1 :
E
2
1 AE A Ym1 0
Esta ecuación es equivalente a:
E
2
1 AE A Ym 0
E AE 1Ym 0 cuya solución general:
Ym C1 C2 Am ; para A 1 Para evaluar C1 y C2 se aplican las condiciones límites.
Y0 C1 C2
46
YNp 1 C1 C2 ANp 1 YNp 1 Y0 C2 ANp 1 1 (2) Análogamente:
Ym C1 C2 Am ; A 1 Condiciones límites:
Y0 C1 C 2 Y1 C1 C 2 A Resolviendo simultáneamente se obtiene:
C1
Y1 AY0 1 A
C2
Y0 Y1 1 A
Y1 AY0 Y0 Y1 m Ym A 1 A 1 A De esta ecuación se tiene:
YNp1
Y1 AY0 Y0 Y1 Np1 A 1 A 1 A
YNp1 1 A Y1 AY0 Y0 Y1 A Np1 YNp1 Y1 Y0 Y1 AA Np YNp1 Y0 A 1 YNp1 Y1 Y0 Y1 A Np YNp1 Y0 A
1
YNp1 Y0 Y1 Y0 Y0 Y1 A Np YNp1 Y0 A
Y0 Y1 A Np YNp1 Y0 1 1
1 AY Y
A
1
0
47
, sacando logaritmo
YNp1 Y0 1 A Np 1 A 1 A Y 1 Y 0
YNp 1 Y0 log 1 1 1 A A Y1 Y0 Np log A Para el caso en que A =1
Ym C1 C2 m Condiciones límites:
Y0 C1 Y1 C1 C2 de donde:
C1 Y0
C2 Y1 Y0
Ym Y0 Y1 Y0 m Para
m Np 1
YNp1 Y0 Y1 Y0 Np 1 YNp1 Y0 Np 1 Y1 Y0 Np
Np
YNp 1 Y0 Y1 Y0
Y1 Y0 YNp 1 Y1
Y1 Y0
2.5.5. Ecuaciones de diferencias lineales no - homogéneas Si Yc k es la solución complementaria (solución de la ecuación homogénea) y
Yp k es alguna solución de la ecuación completa, la solución general para la
ecuación diferencia lineal no - homogénea será:
48
yk Yc k Yp k 2.5.6. Métodos para encontrar soluciones particulares 2.5.6.1 Método de los Coeficientes Indeterminados Este método es útil cuando la función R(k) consiste de términos de cierta forma especial. Correspondiente a cada término presente en R(k) se considera una solución prueba que contiene un número de coeficientes desconocidos que son determinados por sustitución en la ecuación diferencia. Las soluciones prueba para cada caso se muestran en la siguiente tabla. Tabla 1. Soluciones prueba para el método de los Coeficientes Indeterminados Solución prueba
Términos en R(k)
K
sen k ó cosk Polinomio P(k) de grado m
A K A cosk B sen k A0 k m A1k m1 ... Am
K P( k )
k A0 k m A1k m1 ... Am
k sen k ó k cosk
k A cos k B sen k
Si algún término de la solución particular aparece en la solución complementaria debe eliminarse la dependencia lineal multiplicando este término por una potencia positiva de k hasta eliminar la dependencia.
Ejercicio 19: Resolver
yk 1 2 yk 8 yk 1 4k 2 e k
Esta ecuación se puede plantear como:
E 2 yk 1 2 Eyk 1 8 yk 1 4k 2 e k ó
E 2 yk 2 Eyk 8 yk 4k 1 e k 1 2
Solución a la ecuación homogénea:
E 2 yk 1 2 Eyk 1 8 yk 1 0
49
E 2 2 E 8 y k 1 0 E 4E 2yk 1 0 , que es equivalente a E 4E 2 yk 0 Las raíces de la ecuación auxiliar son:
r1 = 4; r2 = -2 yk C1 4k C2 2k ó yk 1 C1 4k 1 C2 2k 1 Solución particular:
yk A0 k 2 A1k A2 be k Sustituyendo en la ecuación:
yk 1 A0 k 1 A1 k 1 A2 be k 1 2
se obtiene:
A0 k 1 A1 k 1 A2 bek 1 2 A0 k 2 A1k A2 bek 2
8 A0 k 1 A1 k 1 A2 bek 1 4k 2 ek 2
Igualando los coeficientes de k2, k, k0 y ek de ambos miembros de la ecuación se obtiene:
9 A2 9 A1 7 A0 0 9 A1 18 A0 0 9 A0 4 8 b e 2 1 e de donde:
A0 4
9
A2 44
81
A1 8
9 e b 2 e 2e 8
La solución particular es:
4 8 44 ek 2 yk 1 k 1 k 1 9 9 81 e 2 2e 8
50
La solución general: k 4 k 12 8 k 1 44 2 e 9 9 81 e 2e 8 k 1 4 8 44 e k2 k 2 9 9 81 e 2e 8
y k 1 C1 4 k 1 C2 2
k 1
y k C1 4 k C2 2
k
Si se sustituye directamente yk, debe transformarse la ecuación diferencia en:
yk A0k 2 A1k A2 bek
E E
2E 8 yk 4k 1 e k 1 2 2E 8yk 4k 2 8k 4 e k e yk 2 2 yk 1 8 yk 4k 2 8k 4 e k 1 2
2
En este caso se obtiene:
A0 k 2 A1 k 2 A2 bek 2 2
2 A0 k 1 A1 k 1 A2 be k 1 8 A0 k 2 A1k A2 be k 4k 2 8k 4 e k e 2
Que igualando los coeficientes de k2, k, k0 y ek de ambos miembros se obtiene:
9 A0 4 A0 4
9
9 A1 8 A1 8
9 2 A0 9 A2 4 A2 44
81 e b e 2 2e 8 e b 2 e 2e 8
Por lo tanto la solución particular es:
4 8 44 e k 1 yk k 2 k 2 9 9 81 e 2e 8 La solución general:
51
y k C1 4 C2 2 k
k
4 2 8 44 e k 1 k k 9 9 81 e 2 2e 8
2.5.6.2 Método de los Operadores Inversos Si se asume que U es la solución particular de la ecuación no - homogénea, entonces:
( E )U R(k ) definiendo 1 ( E ) el inverso de ( E ) , entonces
R(k ) U 1 ( E ) Este método es útil en caso de que R(k) tome las formas especiales indicadas en la siguiente lista: 1.
1 k k ; 0 ; si =0 use la regla 4 E
2.
1 sen k E Escriba:
ó
1 cos k E
eik e ik cos k 2 ik e e ik sen k 2
y use la regla 1
3.
1 1 Pk Pk b0 b1 ... bm m ... Pk E 1 Donde la expansión solamente se hace hasta
m
si
m+1
P(k)=0
La función (1 ) se transforma a una función de la forma 1+Z ó 1-Z, y luego se expande teniendo en cuenta que:
(1+Z) -1= 1 - Z + Z2 - Z3 + Z4…
52
(1-Z) -1= 1 + Z + Z2 + Z3 + Z4…
4.
1 1 k P( k ) k P(k ) , y use regla 3. ( E ) ( E )
Ejercicio 20: 2 Si (1 ) 4 4 expanda
1 como una función de 1
2 (1 ) 4 4 4 1 4 2
2 4 1
4
2 1 1 1 4 (1 ) 4
1
2 2 2 1 1 ... 4 4 4
Ejercicio 21: Resolver
yk 1 2 yk 8yk 1 4k 2 e k
Solución particular:
E
2 E 8 yk 1 4k 2 e k 1 2 k y k 1 2 4k e E 2 E 8 1 1 k 2 4k 2 2 e E 2 E 8 E 2 E 8 2
53
1 1 2 2 4 k 4k 2 E 2 2 E 8 1 21 8
(Regla 3)
1 2 1 2 4k 2 4k 2 1 2 2 2 8 9
1 2 1 9 9
1
4k , expandiendo: 2
1 2 4 1 ... 4k 2 4k 1 9 9 81 2 1 1 4k 2 4k 1 9 9
se deja sólo hasta 2, por que 4k(2) = 0 y 2k(2) =0)
1 1 4 k 2 4 k 1 2 4 k 2 4 k 1 9 81 4 4 k 2 k 1 8k 1 4 9 9 81 4 4 8 k 2 k 1 9 9 81 4 2 8 k k 1 9 81 4 8 k2 9 81
1 ek k E 2 2 E 8 e e2 2e 8
(Regla 1)
Por lo tanto la solución particular es:
4 2 8 ek yk 1 k 2 9 81 e 2e 8 4 8 ek 1 4 2 8 ek 1 2 yk k 1 2 k 2k 1 2 9 81 e 2e 8 9 81 e 2e 8
54
4 2 8 44 e k 1 yk k k 2 9 9 81 e 2e 8 La solución general es:
4 2 8 44 e k 1 y k C1 4 C2 2 k k 2 9 9 81 e 2e 8 k
k
Ejercicio 22:
Resolver E 2 4 E 4 yk 3 2k 5 4k por el método de los Operadores Inversos Solución complementaria:
E 22 yk 0 y k C1 C2 k 2 k Solución particular:
yk
1 3 2k 5 4k E 4E 4 2
Si se usa la regla 1 2 0 , entonces se usa la regla 4 para 2 y la regla 1 para k
4k
1 1 3 5 2 4k 4 E 8E 4 4 4 4 4 k 2 1 5 yk 3 4k 2 4 1 21 1 4
yk 2 k
2
2k 1 5 yk 2 3 4 k 4 4 k 2 5 2 3 4 k 4 4 k 2 5 1 3k 1 4 k 4 4 2 3 k 5 2k 4k 4 2 4
55
3 5 2k k k 1 4k 8 4
3 5 yk k k 12k 4k 8 4 Solución general:
3 5 yk C1 C2 k 2 k k k 12 k 4 k 8 4 3 5 yk C1 2 k C3 k 2 k k 2 2 k 4 k 8 4 Ejercicio 23: Hallar una solución particular de:
E 1 yk
cos k por el método de los
coeficientes indeterminados.
yk A cos k Bsenk
y
yk 1 A cosk 1 Bsen k 1
Remplazando:
A cosk 1 Bsen k 1 A cos k Bsenk cos k Acos k cos senksen Bsenk cos sen cos k A cos k Bsenk cos k
A cos Bsen Acos k Asen B cos Bsenk cos k A cos Bsen A 1
(1)
Asen B cos B 0
(2)
Despejando A de la ecuación (2) se obtiene:
A
Bcos 1 sen
Reemplazando A en la ecuación (1) se obtiene:
Bcos 1cos 1 Bsen 1 sen 2 Bcos 1 Bsen 2 sen
56
B cos 2 2B cos B Bsen 2 sen
B sen 2 cos 2 2 cos 1 sen
B2cos 1 sen B
sen 2cos 1
A
cos 1 sen 2cos 1 sen
A
1 2
La solución particular es:
sen yk 1 cos k senk 2 2cos 1
Ejercicio 24: Resolver: R 2 6R 1 8R 3R 2 5 3 Ecuación Homogénea: 2
R
R2 6R1 8R 0
E
2
6 E 8 R 0
E 2E 4R 0 Ecuación auxiliar:
r 2r 4 0
r1 2; r2 4 Solución homogénea:
R C1 2R C2 4R Utilizando el método de los coeficientes indeterminados se halla la solución particular prueba:
57
R A1R2 A2 R A3 A4 3R Sustituyendo la solución particular prueba en la ecuación diferencia se obtiene:
R 2 6R 1 8R A1 R 2 A2 R 2 A3 A4 3R 2 2
6 A1 R 1 A2 R 1 A3 A4 3R 1 8 A1R 2 A2 R A3 A4 3R 2
3 A1R 2 3 A2 8 A1 R 3 A3 4 A2 2 A1 A4 3R
3 A1 R 2 3 A2 8 A1 R 3 A3 4 A2 2 A1 A4 3 R 3R 2 2 5 3 R 3 A1 3 3 A2 8 A1 0
3 A3 4 A2 2 A1 2 A4 5 A1 1, A2 8 , A3 44 , A5 5 3 9
Su solución particular es:
8 44 R R 2 R 5 3R 3 9
La solución general:
8 44 R C1 2R C2 4R R 2 R 5 3R 3 9
Ejemplo 2: En un proceso químico se alimentan 10.000 lb/h de un líquido puro A al primero de una batería de 2 reactores de tanque agitado de igual tamaño que operan en serie. Si ambos recipientes se mantienen a la misma temperatura constante, tal que toma lugar la reacción k1 k2 A B C
estime el tamaño de los recipientes que darán el máximo beneficio del producto B. Las constantes de velocidad específica son k1 0.1 min 1 y k2 0.05 min 1 a la temperatura de operación y la densidad del fluido es constante e igual a 60 ft 3 lb .
58
En la figura 1 se muestra el esquema de la batería de reactores. CA1n : Concentración de A en el reactor n CB1n : Concentración de B en el reactor n CC1n : Concentración de C en el reactor n
q CA,0
q CA,1
q CA,n-1
V1
V2
1
q CA,N
Vn
2
VN
n
N
Figura 1. Esquema de batería de reactores Balance de masa de A en el reactor n :
qC A ,n1 k1C A ,nV qC A ,n C A ,n1 C A ,n k1θC A donde
V q
,n
V Volumen del reactor
(1)
q Flujo volumétrico
Balance de masa de B en el reactor n :
qCB ,n1 k 2CB ,nV qCB ,n k1C A ,nV CB,n1 CB,n k 2θCB,n k1θC A,n Si
k1 y k2
de (1):
C A,n 1 E 1 C A,n 1 0
(2)
59
1 E 1C A,n 1 0 C A,n K1 1n donde
Ecuación diferencia homogénea (3)
K1 Constante
1
1 1
Reemplazando CA , n en (2)
C B ,n1 C B ,n C B ,n K1 1n
CB ,n 1 1 CB ,n K11
n
(1 ) 1CB,n1 K1 1n
Ecuación diferencia no homogénea
Solución complementaria:
C B,n K 2 2n donde:
K2 = constante
2
1 1
Se halla la solución particular utilizando el método de los operadores inversos:
1 K1 1n n CB ,n 1 K 1 1 1 1 1 E 1 1 n 1 n 1 K1 1 K CB ,n 1 1 1 1 1 1 K1 n CB ,n 1 Solución general para CB,n :
caso 1
60
K 1 n C B ,n K 2 2n 1
(4)
Aplicando condiciones límites:
CA CA ,0 CB CB ,0 0
para n=0
De la ecuación (3):
K1 CA,0 De la ecuación (4):
C K2 A ,0 0 K2
CA ,0
Reemplazando las constantes en (4):
CB , n
CA,0 n 1 n2
Para una batería de dos reactores:
C A,0 2 1 22 2 2 k1C A ,0 1 1 k 2 k1 1 k1 1 k 2
C B ,2
C B ,2
61
dC B ,2 k C k2 k1 2 1 A ,0 3 3 d k 2 k1 1 k 2 1 k1 dC B ,2 0 d
k1 k2 3 1 k1 1 k2 3
21 k 2 1 k1 3
3
3 20 2 1333.33 0 La raíz real de la ecuación anterior es 7.024 min. Esta raíz debe chequearse con la segunda derivada para saber si corresponde a un máximo.
d 2CB ,2 6k1C A ,0 k12 k22 k2 k1 1 k1 4 1 k2 4 d 2 Reemplazando:
7.024 min k 2 0.05 min 1 k1 0.1 min 1
d 2 C B,2 d d 2 C B,2 2
d 2
12C A,0 11.9 10 4 7.5 10 4
0.00528C A,0
El valor de 7.024 min corresponde a un máximo.
CB,2max 0.4053CA,0 104 3 V q ft min 1 7.024 min 19.51 ft 3 3600
62 2.5.7. Ecuaciones de diferencia no lineales Estos tipos de ecuaciones generalmente se originan en la solución de problemas de ingeniería y ellos son difíciles y algunas veces imposibles de resolver. Sin embargo, las ecuaciones no lineales de primer orden se pueden resolver gráficamente, y algunas de segundo orden se pueden resolver por sustituciones. 2.5.7.1 Soluciones gráficas Si se considera la ecuación no lineal:
yn1 yn2 Ayn B 0 Donde A y B son constantes, ésta debe reordenarse de la forma:
yn1 yn2 Ayn B Seleccionando un conjunto de valores para yn, se puede calcular un conjunto correspondiente de valores para yn+1, de tal manera que se puede graficar yn+1 vs yn (ver figura 2). La curva AB representa la ecuación y n1 y n2 Ayn B . Para hallar la solución se construye la recta PQ. Se comienza en la condición de frontera yo y subiendo hasta la curva AB se obtiene el valor de y1. Luego se localiza el punto C en la recta PQ. Desde C se dibuja una línea vertical hasta intersectar la curva AB en D. Las coordenadas de D son (y1, y2). Continuando este procedimiento por pasos hasta N pasos, se puede obtener el valor de yN+1; y también el valor de y correspondiente a cada valor de n. Este método funcionará para todas las ecuaciones de primer orden que se puedan separar en una forma simple tal como la de arriba. El método de Ponchon y Savarit y el método de McCabe-Thiele para determinar composiciones de los diferentes platos de alimentación en una torre de destilación de una mezcla binaria son ejemplos típicos de solución de ecuaciones de diferencias en forma gráfica en Ingeniería Química.
63
yn+1
A
y3
yn+1= yn2-Ayn-B P
7 6
yn+1= yn
5 4 y2
D
3
y1 2 1
C
yn yo
B
1
2 y1
3 4 y2
5
6
7
Q
Figura 2. Solución gráfica de una ecuación diferencia
Ejemplo 3: Se desea esterificar 454 kg/h de alcohol etílico por reacción con 386 kg/h de ácido 3 acético en una batería de reactores CSTR continuos, cada uno de 0.85 m de capacidad y mantenidos a 100°C. Si la relación de equilibrio es tal que se esterifica el 75.2% del ácido, estime el número de reactores necesarios para una conversión del 60%. -4
A 100°C la constante de velocidad de reacción para la esterificación es 4.76x10 l/gmol.min, y para la hidrólisis del éster es 1.63x10-4 l/gmol.min. La densidad de la mezcla reaccionante puede suponerse constante e igual a 865 kg/m3.
CH3COOH + C2H5OH
CH3COOC2H5 + H2O
En la figura 3 se muestra el esquema de la batería de reactores CSTR. Balance de masa para A en el reactor m:
C A,m 1q C A,m q rV
(1)
64 q
q
q
q
A, B
1
m
2
N
q
Figura 3. Esquema de batería de reactores CSTR
Si la reacción es de segundo orden, la velocidad de reacción es:
r k1C ACB k 2CC CD A: CH3COOH
B: C2H5OH
(2)
C: CH3COOC2H5
D: H2O
Reemplazando (2) en (1):
C A,m1q C A,m q k1C AC B k 2CC C D V
C A,m1 C A,m k1C ACB k 2CC CD
V q
(3)
Tiempo de retención en el reactor
Si la concentración del reaccionante B supera inicialmente la de A en la cantidad c, esta diferencia se conservará a través del sistema, de tal manera que en cualquier reactor m, la concentración del reaccionante B es (CA,m + c). Por la estequiometría de la reacción, la concentración de cada producto es CA,0 – CA,m. Entonces:
CA: CA,m
CB: CA,m + c
CC: CA,0 –CA,m
CD: CA,0 –CA,m
Reemplazando estos datos en la ecuación (3):
C A,m 1 C A,m k1C A,m C A,m c k2 C A,0 C A,m 2
(4)
La ecuación (4) es una ecuación diferencia no lineal, que se resolverá gráficamente para determinar el número de reactores necesarios (N).
65
q
454 386 kg / h 0.97 m 3 / h
C A ,0
865 kg / m 3 kg 1 kgmol 1h 386 6.63 kgmol / m 3 3 h 60 kg 0.97 m
Similarmente:
C B ,0 454
kg 1 kgmol 1h 10.17 kgmol / m 3 3 h 46 kg 0.97 m
c C B ,0 C A ,0 10.17 6.63 3.54 kgmol / m 3
V 0.85 m 3 0.88 h 52.6 min q 0.97 m 3 / h
Sustituyendo los anteriores valores en la ecuación (4):
C A,m1 C A,m 4.76 10 4 C A,m C A,m 3.54 1.63 10 4 6.63 C A,m 52.6 2
C A,m1 0.016C A2 ,m 1.202C A,m 0.377
(5)
Se eligen valores arbitrarios de CA,m y se sustituyen en la ecuación (5) para generar la siguiente tabla: Tabla 2. Concentraciones de ácido acético en cada etapa CA,m 2 3 4 5 6
CA,m-1 2.09 3.37 4.69 6.03 7.41
Se grafica CA,m-1 vs CA,m y se trazan las etapas partiendo de una composición del alimento de 6.63 kgmol/m3, hasta que se cumpla con la conversión requerida del 60% (CA,m-1 = 0.4x6.63 = 2.65 kgmol/m3). Según la figura 3: Número de reactores requeridos, N = 7 Concentración final de ácido acético, CA,m = 2.51 (62% conversión)
66
8
6.63
Ácido acético en el alimento
CA,m-1, kgmol/m
3
6 1 2 4 3 4 2.51
7
2
6
5
0 0
2
4
CA,m, kgmol/m
6
8
3
Figura 3. Análisis gráfico de reactores
2.5.7.2 Soluciones analíticas Sólo un número limitado de ecuaciones de diferencias no lineales se pueden resolver analíticamente y es posible porque se transforman en ecuaciones lineales. A continuación se presentan tres ejercicios que ilustran este caso.
Ejercicio 25:
y k y k 1 y k 2 y k y k 1 y k 2 ; pista yk tan uk tan uk tan uk 1 tan uk 2 tan uk tan uk 1 tan uk 2
Resolver:
uk 1 uk 2 uk Solución complementaria:
E
2
r
E 1 k 0 1 1 4 2
67
1 3i 1 r1 , r2 2 2 2 1 3 1, tan -1 4 4
3i 2 3 2 1 3 3
2k 2k k uk 1 C1 cos C2 sen 3 3 Solución particular (método de operadores inversos):
uk
1 1 E2 E 1 1 2 1 1 1
1 1 1 2 uk 2 1 3 3 3 3 3 Solución general:
2k 2k y k tan C1 cos C2 sen 3 3 3
Ejercicio 26: Resolver : 2 yk 1 2 yk 1 ,
pista: yk cos uk
cos u k+1 2 cos 2 u k 1 cos u k+1 cos 2u k
u k 1 2 u k
E 2u k
0
u k C1 2 k
y k cos C2 2 k Ejercicio 27: Resolver:
68 pista: yk uk
2 yk 1 1 yk ,
1
2
y k21 y k2 1 u k 1 u k 1
E 1uk
1
Solución complementaria:
uk C1 1
k
Solución particular (método de operadores inversos):
1 1 1 1 E 1 11 1 1 1 1 1 1 1 1 1 1 2 2 2 2 2 1 2 uk
Solución general:
1 k C1 1 2 1 k yk C1 1 2
uk
Ejercicio 28: Resolver:
yn 2 yn yn 1
2
; pista: sacar logaritmo
log yn 2 log yn 2 log yn 1 xn log yn xn 2 x n 2 xn 1 x n 2 2 x n 1 x n 0
E
2
2 E 1 xn 0
E 12 xn 0
69
xn Co C1n y n 10
Co C1 n
Ecuación de Riccati: Es una ecuación diferencia de segundo grado que frecuentemente aparece en problemas de Ingeniería Química. La ecuación toma la forma:
yn1 yn Ayn1 By n C 0
donde A, B y C son constantes. Esta ecuación se puede convertir en una ecuación diferencia lineal haciendo la siguiente transformación.
yn u n Sustituyendo en la ecuación original
yn1 yn Ayn1 By n C 0
un1 un Aun1 Bun C 0
un1un A un1 B un 2 A B C 0 Escogiendo de tal forma que:
2 A B C 0 Luego dividiendo por un+1un, se obtiene
A 1 B un
1 u n1
1 0
Si se define:
xn
1 un
A xn B xn1 1 0 A xn1 B
1 0 xn B
Ecuación diferencia lineal no homogénea
70 Resolviendo esta última ecuación:
A x n C0 k B n
donde :
k
1 A B 2 n
1 1 A C0 yn A B 2 B
Ejemplo 4: Una solución de benceno y tolueno de 60% en mol de benceno se alimenta continuamente a una columna de destilación (figura 4). Si hay 9 platos entre el ebullidor y el plato de alimentación, y el producto de cabeza contiene 98%, mientras que el producto de cola 2% en mol de benceno; estime la eficiencia global en la zona de despojamiento de la torre. El alimento entra a la torre en el punto de burbuja, la volatilidad relativa del benceno al tolueno puede considerarse constante e igual a 2.3, y la relación de reflujo 3.0.
Balance de benceno en la zona de despojamiento hasta el plato n:
Lxn1 Gyn Wxw
(1)
Como la volatilidad relativa es constante, la relación de equilibrio esta dada por:
yn* xn * 1 yn 1 xn
71
D, xD F, xF yn
xn+1
n yn-1
n
W, xw
Figura 4. Balance de masa en destilador
yn*
xn 1 1xn
(2)
Remplazando (2) en (1):
xn Lxn1 G Wxw 0 1 1 x n Lxn11 1 xn Gxn Wxw 1 1 xn 0
Lxn1 L 1 xn xn1 Gxn Wxw W 1 xn xw 0 G Wxw 1 x Wxw 0 1 xn 1xn xn 1 n 1 L 1 L 1 Llamando:
xn
72
1 1 G Wxw 1 B L 1 Wx w C L 1 A
xn1 xn Axn1 Bxn C 0 La ecuación anterior es la ecuación de Riccati, cuya solución es: n
1 1 A C0 xn A B 2 B Si se supone 100 lbmol de alimento:
100 D W
60 0.98D 0.02100 D D 60.4, W 39.6
G R 1D 241.6 L F RD 281.6 1 1 0.769 1 1.3 B 1.523 C 0.0022 A
Escogiendo de tal forma que:
2 A B C 0
2
0.754 0.0022 0
1 0.757 2 0.003 Remplazando los valores de A, B y 1 se obtiene
73
1 n C0 0.502 131 . xn 0.003 Asumiendo que el ebullidor se comporta como una etapa ideal, se puede evaluar C0, asignando al ebullidor n=0, o sea x0 = 0.02
C0 42.2
1 42.20.502n 1.31 xn 0.003
Para determinar el número de platos ideales en la zona de despojamiento se ubicará primero el plato de la alimentación. Inicialmente se estima nf asumiendo que xnf = 0.60.
1 n 42.20.502 f 1.31 0.6 0.003 log 0.3484 42.2 nf log 0.502 nf = 6.96 Con este estimado se calcula x7 y x6 para decidir en cual de los platos ideales se hace la alimentación.
1
x6
0.003 0.500 42.20.502 6 1.31 1 x7 0.003 0.603 42.20.5027 1.31 Como x7 xf, puede decidirse la alimentación en el plato 6, con esta condición,
E0
nf 100 nrd
6 100 9
66.7%
74 2.6. Ecuaciones diferenciales - diferencias Los procesos químicos que se llevan a cabo por medio de etapas, son analizados con la ayuda de las ecuaciones de diferencias cuando se operan en estado estacionario. Sin embargo, cuando este tipo de procesos está sujeto a un cambio en las condiciones de operación, las composiciones de las corrientes que pasan a través de las etapas cambian con el tiempo. Esto implica la adición de términos diferenciales y la ecuación resultante se llama ecuación diferencial - diferencia. En muchas ocasiones las ecuaciones resultantes no pueden ser resueltas analíticamente y se hace necesario un análisis etapa a etapa con ayuda del computador. Las soluciones analíticas de ecuaciones diferenciales son definidas por la conversión de este tipo de ecuaciones diferenciales por medio de la transformación de Laplace. 2.6.1.Transformación de Laplace El método operacional "La transformación de Laplace" es una técnica mediante la cual una ecuación diferencial ordinaria se convierte en una ecuación algebraica equivalente, para encontrar la solución particular de la ecuación diferencial. Sistema Lineal e(t) Dominio y(t) t
E(s) Transformación directa
Ecuación Diferencial
Dominio s
Y(s)
Ecuación algebraica
Solución general
Solución particular
Solución particular Transformación inversa
y(t)
Y(s)
Q(D)y(t) = e(t)
Figura 5. Transformación de Laplace Como se ilustra en la figura 5 la transformación de Laplace ofrece una alternativa para encontrar la solución particular a una ecuación diferencial. Este procedimiento
75 tiene la ventaja que al convertir la ecuación diferencial en una ecuación algebraica el proceso de solución resulta ser más simple que el requerido en el dominio del tiempo. La transformación de la ecuación diferencial en una ecuación algebraica en el dominio de s utiliza unas reglas conocidas en el dominio del tiempo y luego se obtiene la solución particular (y(t)), mediante la transformación inversa de esta solución en el dominio del parámetro s (Y(s)). En este proceso las condiciones límites se introducen en la ecuación algebraica, antes de encontrar la solución particular, a diferencia del método directo, en donde las condiciones límites se aplican después de obtener una solución general. La transformación de Laplace está definida para una función continua de una variable independiente t, f(t), para todos los valores de t mayores que cero como:
L f t e st f t dt f s 0
donde s es un parámetro lo suficientemente grande que hace convergente la integral en el límite superior.
2.6.2. Transformadas elementales
1. La a / s
s 1 a n! 3.Lt s 2.L e at n
n 1
;para n entero
n 1 ; para n entero1. n 1 s 4.LRf t R f s
5.L f , t s f s f 0
1
Función Gama:
n t n 1e t dt 0
Propiedades:
i.n n 1n 1 ii .n n 1!
;para n entero.
;para n entero negativo o n =0. iii .n iv .n 1 n n 1
76
t 6.L f t dt f s s 0 n! 7.L t n e at s a n 1
8.LSent
9.LCost
, para n entero.
s2 2 s
s2 2
10.LSenht
s2 2
11.LCosht
s s2 2
12.L f t s 2 f s sf 0 f 0
13.L f n t s n f s s n 1 f 0 s n 2 f 0 ... f n 1 0
2.6.3. Transformadas inversas Existen varios métodos para transformar una función del dominio del parámetro s al dominio del tiempo. El método más simple consiste en descomponer la función
f s en términos cuya inversa sea conocida. En algunos casos no es posible
utilizar esta técnica, por lo tanto debe recurrirse a otros métodos como el método de la integral de convolución y el método de los residuos. 2.6.3.1. Método de la Integral de Convolución
Este método consiste en descomponer la función f s como el producto de dos funciones para las cuales se conoce la transformada inversa:
f s g s hs La transformada inversa de
f s se obtiene entonces como: t
f t L1 f s g t h d 0
77 t
g ht d 0
Ejercicio 29: Hallar la transformada inversa de:
1
f s
s s a
2
1 1 g s , h s s s a 2
g t 1, ht te at
t
f t e a d 0
Integrando por partes:
f t udv uv vdu
u
du d e a v a
a
dv e d
e a e a 1 a e d d 2e a a a a 0 0 t
e a
a
t
t
0
teat 1 at 1 e 2 a a2 a
1 teat at 1 e a a2
2.6.3.2. Método de los Residuos Este es el método más poderoso para encontrar la transformada inversa de Laplace. El se encuentra ampliamente explicado en textos clásicos de ecuaciones diferenciales, y en virtud de que el propósito de este texto no es profundizar en detalles matemáticos, solo se presentarán las ecuaciones de utilidad para su aplicación.
78 Cuando f s es analítica2, excepto para singularidades que son únicamente polos3, la transformada inversa está dada por:
f t n t 1
donde n t es el residuo de f s en el polo pn. Los residuos se pueden determinar para un polo simple como:
n t
j pn p n t e pn
donde:
f s
j s s
pn
ds ds s pn
Si pn es un polo múltiple de orden m, entonces: pm
n t e p t Ap n
p 1
t p 1 p 1!
donde:
Ap
1 nm p pn m p !
d m p pn m p n s ds pn
m p n
p 1, 2, ..., m
2
n s s pn m f s
Una función f(z)es analítica, en el campo complejo, cuando solo existe un valor de la función para cada valor de z y existe la primera derivada en todo el dominio de la función. 3 Los polos son los puntos en los cuales el denominador de la función se hace cero y por lo tanto la función es indeterminada o sea que se hace infinita. Un polo es un punto singular removible cuando, si existe un factor que multiplicado por la función la haga analítica. m
z z z0 f z
z0 polo, en caso contrario es “esencial”.
79
Ejercicio 30: Encontrar la transformada inversa de:
f s
1
s s a
2
s 0, s a
Polos:
j s 1 s ss a s s a 2ss a 2
2
Residuo 1 t , es el residuo en el polo s 0 .
j 0 1 0 a 2 1 1 t 2 a Residuo 2 t , es el residuo en el polo múltiple de orden dos,
2 t eat A1 A2 t 1 A1 2 a 1 A2 2 a 2 s s a f s 2
2 a
1 a
1 s2 1 2 a 2 a
2 s
A1
1 a2
1 s
sa
80
A2
1 a
2 t e at
1 t 2 a a
1 teat at f t 1 t 2 t 2 1 e a a Ejemplo 5: Un sistema consiste de N tanques agitados cada uno de volumen v ft3 arreglados en una cascada (figura 6). Si cada tanque inicialmente contiene agua pura y una corriente salina de concentración x0 lbft-3 es alimentada al primer tanque a una rata R ft3h-1, calcular la concentración de salida del último tanque como función del tiempo si la eficiencia de la agitación es del 100%. R Xo
R
1
R
R
n
2
Figura 6. Cascada de tanques agitados Análisis en el tanque n: Balance de masa para la sal:
d vxn dt dx Rx n 1 Rx n v n dt
Rx n 1 Rx n
(1)
Según la regla 5 del acápite 2.6.2:
N
R XN
81
df t L s f s f 0 dt Aplicando la transformada de Laplace (regla 5) a la ecuación (1):
R x n1 s R x n s vs x n s xn 0 En el tiempo t=0 no hay sal, entonces xn(0) = 0
R x n1 s R x n s vsx n s x n vs R R x n 1 0
Ecuación diferencia lineal homogénea
vs RE Rx n 1 0 R r vs R
R x n s A R vs
n
(2)
El valor de A se obtiene a partir de las condiciones límites. 0
R x o s A A R vs Aplicando la regla 1 del acápite 2.6.2:
x o s Lxo
A
xo s
(composición del alimento constante)
xo s
Reemplazando A en la ecuación (2): n
n R xo R xo R 1 1 v x n s xo s R vs s R s v sR s v v n
Para n=N:
n
82
R 1 1 x N s xo v sR s v N
N
Definiendo:
R B xo v
N
y
1 1 x N s B sa s
a
R v
N
(3)
Utilizando las transformadas elementales (reglas 6 y 7):
1 f s s t N 1e at 1 L N N 1! s a
L 0 f t dt t
y aplicándolas a la ecuación (3):
1 1 x N t L1 B N s s a
1 B 0t L1 dt N s a
t N 1e at x N t B dt N 1! t 0
Se resuelve la integral por partes:
u t N 1 du N 1t N 2 dt e at at dv e v a x N t
B t N 1 at N 1 t N 2 at e t e dt N 1! a a 0
Continuando sucesivamente la integración por partes:
83
t N 1e at t N 2 e at e at 1 x N t B 2 ... N N a a a N 1! a N 2! Reemplazando B y a en la ecuación anterior:
N 1 R t v R t t N 2 e v t e N 1! R R v N 2! v
... 2 N 1 N N v R R R v v v R t R t N 1 N 1 R t Rt R t v Rt e v Rt e v v x N x0 1 e e ... v v N 2! v N 1! 2 N 1 Rt Rt R t Rt v v x N xo x o e v 1 ... v N 1! 2!
x N x0 R
N
x N x0 x0 e
R t
N 1
v
Rt v
i 0
te
R t
v
i
i!
Otro método para encontrar xn(t) es el método del residuo: n
x0 R xo R n x n s n s R vs sR vs Polos:
x n s
s=0 s = -R/v
Polo multiple de orden n
j s l s
j s x0 R n l s sR vs
n
nsv n l s R vs 1 R vs Residuo 1(t) para s = 0
e
R t
v
1
84
j 0 xo R n
l 0 R n 1 0 R n x Rn 1 t o n xo R Residuo 2(t) para s = -R / v de orden n
2 t e A1
Rt v
t2 t n1 A 1 A 2 t A 3 ... A n n 1! 2!
1 n21 R v n 1!
2 s s R
x0 R n v sR vsn n
x0 R n s v n x0 2 s 2 R v s n x0 2 s 2 3 R v s n 3! 32 s 4 x0 R v s n 1n1 n 1! n 1 2 s x 0 R n v s
n21 R A1
A2
v
n 1!x
n 1!x0 x0 n 1!
1 n22 R v n 2!
0
n 1n2 n 2! R s x 0 n 1 v s n22 R x0 n 2! R v v n2 2
85
A2
v
x0 n 2 ! R
n 2!
v
A2 x0 R A3
1 n23 R v n 3!
n23 s 1
n 3
n23 R
n 3! x0 R s n2
1 v
n 3!
n 3
R v
v
n
n2
1
n 3
v
x0 R
n
n 3! x0 R n n2 v 1n2 R v
v 1 n 3!x R v A n 3! n 3!x0 R
2
2
3
0
v A x R v
2
x0 R
n 1
n
0
2 t e
Rt v
2 n 1 Rt x0 Rt x0 Rt x0 x0 ... n 1! v v 2! v
x0 e
Rt v
n 1 Rt 1 Rt 2 1 Rt 1 ... n 1! v v 2! v
xn t x0 x0 e
Si n = N
Rt n 1 v
k 0
Rt v
k
k!
x N t x0 x0 e
Rt N 1 v
k 0
Rt v
k
k!
Utilizando el método de la integral de convolución:
86
x0 R n x n s g s hs n sR vs x0 R n g s s
h s
1
vn n sR v 1 n Rt n ht v t n1e v g t x0 R n 1! n t R n 1 v x n t x0 R n 1e v d 0 n 1!
v
x n t x0 R
n
t
n 1e
0
v
R
n 1!
d
2.7. Problemas propuestos 1.
Muestre
que
la
solución
general
de
la
ecuación
diferencia:
y y 3 2 y 4 x 2 está dado por: 2 x x 2
y C1 x 1 2h h C2 x 1 h h 2 x 2 6 2hx 7 , donde C1(x) y C2(x) x
x
tienen periodos igual a h. 2. Resolver a. yn 1 yn n
e.
yn3 2 yn2 yn1 2 yn 0 yn3 5 yn2 8 yn1 4 yn 0 yn2 2 yn1 2 yn 1 yn2 4 yn1 4 yn n cos n
f.
xn xn1 xn2 ; x1 0, x0 1
g.
8xn 6 xn 1 xn 2 2 n
b. c. d.
3. Demostrar que para una extracción líquido - líquido con flujo cruzado donde los solventes son insolubles y la relación de equilibrio es lineal de la forma y’ = mx’, donde x´ y y´ son razones másicas en las fases extractoras y refinadas, se cumple:
87
y 1 x Np x F S m 1
Np
y S m
x yS F m log x yS Np m Np log 1
donde:
mB A
B: Flujo másico de solvente extractor/etapa A: Flujo másico de solvente original
2.8 Bibliografía Jenson, V.G., Jeffreys, G.V. “ Mathematical methods in Chemical engineering”, Academic Press, New York, 1963. Mickley, H.S., Sherwood, T.S., Reed, C.E., "Applied Mathematics in Chemical Engineering". McGraw, New Delhi, 1975. Spiegel, M.R., "Theory and problems of calculus of finite differences and difference equations", McGraw-Hill, New York, 1970.
90
CAPÍTULO III MÉTODOS NUMÉRICOS TABLA DE CONTENIDO 3.1. Solución de ecuaciones no – lineales ............................................................ 91 3.1.1. Ceros reales ........................................................................................... 92 3.1.1.1. Método de la bisección ..................................................................... 93 3.1.1.2. Método de la falsa posición (regula - falsi) ........................................ 96 3.1.1.3. Método de la falsa posición modificado ............................................ 98 3.1.1.4. Método de la secante ......................................................................100 3.1.1.5. Método de Newton ..........................................................................102 3.1.1.6. Método de las sustituciones sucesivas ............................................103 3.1.1.7. Método de Wegstein .......................................................................105 3.1.2. Ceros complejos ....................................................................................106 3.2. Solución de ecuaciones lineales simultáneas ...............................................109 3.2.1. Método de Jacobi...................................................................................110 3.2.2. Método de Gauss - Siedel......................................................................113 3.3. Ecuaciones simultáneas no lineales .............................................................115 3.4. Interpolación y aproximaciones ....................................................................120 3.4.1. Aproximaciones polinomiales .................................................................122 3.4.1.1. Método de Gregory- Newton ...........................................................123 3.4.1.2. Método de Lagrange .......................................................................125 3.4.1.3. Aproximación con puntos base igualmente espaciados ...................127 3.4.2. Aproximación de funciones por el método de los mínimos cuadrados ....129 3.5. Diferenciación numérica ...............................................................................133 3.6. Integración numérica ....................................................................................138 3.6.1. Fórmulas de integración cerradas ..........................................................138 3.6.1.1. Regla trapezoidal.............................................................................138 3.6.1.2. Regla de Simpson ...........................................................................139 3.6.2. Fórmulas de integración abierta .............................................................141 3.7. Solución de ecuaciones diferenciales ordinarias ...........................................144 3.7.1. Método de desarrollo de Taylor ..............................................................145 3.7.2. Método de Euler ....................................................................................147 3.7.3. Métodos de Runge-Kutta .......................................................................148 3.9. Sistemas de ecuaciones diferenciales ordinarias ..........................................150 3.10. Ejercicios propuestos .................................................................................155 3.11. Bibliografía .................................................................................................158
91
CAPÍTULO III. MÉTODOS NUMÉRICOS Los métodos numéricos son métodos en análisis matemático que permiten la solución de un problema en una forma aproximada, por medio de operaciones aritméticas y lógicas, en un número finito de etapas. El conjunto de pasos secuenciales que deben realizarse para alcanzar la solución de un problema determinado se llama algoritmo. Los algoritmos diseñados para la solución de problemas mediante métodos numéricos contemplan la posibilidad de un número infinito de operaciones, de las cuales en la práctica sólo pueden realizarse un número finito. Este hecho hace que la solución no sea exacta y la aproximación dependa del número de etapas de cálculo realizadas. En una solución por métodos numéricos pueden haber involucrados dos tipos de errores en la respuesta
Error de truncamiento Error de redondeo
El error de truncamiento es el error introducido en la aproximación de la solución de un problema matemático por un método numérico en el cual sólo pueden desarrollarse un número finito de etapas de cálculo. El error de redondeo es el error causado por el redondeo resultado de operaciones aritméticas individuales; porque en las máquinas donde se llevan a cabo las operaciones sólo es posible retener un número finito de dígitos. Este error depende de la máquina donde se llevan a cabo dichas operaciones. Se define estabilidad numérica como la inmunidad que posee un algoritmo a la acumulación de errores de redondeo. 3.1. Solución de ecuaciones no – lineales La mayoría de las ecuaciones se originan con términos al lado derecho e izquierdo del signo igual, pero es tradicional sustraer uno de los dos lados de tal forma que conduzca a f(x) = 0. Cuando solo hay una variable independiente, el problema es unidimensional, para lo cual se denomina la solución de esta ecuación como raíces o ceros de la función.
92 3.1.1. Ceros reales Los métodos utilizados para hallar los ceros reales de las ecuaciones f(x) = 0 son métodos que generalmente empiezan con uno o más valores iniciales aproximados o supuestos para las raíces, a partir de los cuales se genera una secuencia x0, x1, xk, que se espera converja a la raíz. Aunque existen métodos numéricos restringidos a polinomios que pueden producir aproximaciones simultáneas a todas las raíces como el método de Graeffe y el algoritmo QD, los métodos que aquí se presentan son generales. La mayoría de los métodos iterativos se pueden escribir en la forma:
xk 1 g xk para una adecuada función g(x) y una aproximación inicial x0. En ciertos métodos es suficiente conocer un intervalo [a,b] en el cual se encuentra la raíz o las raíces. En otros es conveniente estimar o suponer un x0, el cual está suficientemente cercano a la raíz. Se advierte que para hacer la selección de los intervalos iniciales de búsqueda se debe tener en cuenta las siguientes consideraciones: a. Intervalos donde la función tenga el mismo signo en los extremos no necesariamente indican que no existe raíz, sino que también se puede contener una raíz en donde la función es tangente al eje x o múltiples raíces (ver figura 1a y 1b). b. En ocasiones el cambio de signo en el valor de la función en los extremos del intervalo no significa la existencia de una raíz, ya que ese cambio puede ser ocasionado por la presencia de singularidades (ver figura 1c). En todos los métodos se realizan las iteraciones hasta que se obtenga la convergencia deseada, la cual puede ser calculada de las dos siguientes maneras: i.
x xk f xk y k 1 xk 1
ii.
f xk y xk 1 xk
93
f(x)
f(x)
ao
ao
bo
(a)
bo
(b)
f(x)
ao bo
(c)
Figura 1. Ejemplos gráficos de selección de intervalos
3.1.1.1. Método de la bisección Este es el método más simple y consiste en estrechar el intervalo donde se encuentra la raíz, lo cual se determina con la diferencia de signos en la función para los valores extremos del intervalo. Luego se evalúa la función en el punto medio del intervalo y se examina su signo; se usa el punto medio para reemplazar alguno de los dos puntos límites, tal que se conserve la diferencia de signos del valor de la función en los extremos del subintervalo. Dada una función f(x) continua en el intervalo [a0,b0] tal que f(a0)f(b0) 0, la aproximación de la raíz en cada etapa se hace con la fórmula:
xk
ak bk 2
94
Siendo ak y bk los límites del intervalo en cada iteración k, donde está contenida la raíz. La elección del nuevo intervalo se hace de acuerdo con los siguientes criterios: Sí f ak f xk 0
ak 1 ak
y
bk 1 xk
f xk f bk 0
ak 1 xk
y
bk 1 bk
Sí
Figura 2. Representación gráfica del método de la bisección Ejemplo 1: Calcule el volumen molar para el amoníaco gaseoso a una presión de 56 atm y una temperatura de 450 K usando la ecuación de estado de Redlich-Kwong:
P Donde:
RT a V b V V b T
95
R 2T 5 2 c a 0.42747 Pc RT b 0.08664 c Pc P: Presión en atm V: Volumen molar en l/gmol T: Temperatura en K R: Constante de los gases, R = 0.08206 atm.l/(gmol.K) Tc: Temperatura crítica, Tc = 405.5 K para amoníaco Pc: Presión crítica, Pc = 111.3 atm para amoníaco Reemplazando R, Tc y Pc se hallan los valores de las constantes a = 85.635 y b = 0.0259. Estas constantes se sustituyen en la ecuación de estado:
56
0.08206 450 85.635 V 0.0259 V V 0.0259 450
Reorganizando la ecuación queda:
f V 0
36.927 4.0369 56 V 0.0259 V V 0.0259
Esta es una ecuación no-lineal, cuya raíz V desea conocerse. utilizará el método de la bisección.
Para esto se
Para definir el intervalo de búsqueda se calculó el volumen molar usando la ecuación de los gases ideales a 450 K y 56 atm, el volumen molar ideal es 0.6594 l/gmol. Alrededor de este valor se encuentra el volumen real, por lo que se ensayará la búsqueda en el rango entre 0.5 y 1.
Vk ao = 0.5 bo = 1.0
f(0.5) = 6.5363 f(1.0) = -22.0261
ak bk 2 f(ao)f(bo) < 0
Los datos de las iteraciones se tabulan en la tabla 1.
96 El volumen molar para el amoníaco a 56 atm y a 450 K es aproximadamente 0.5698 l/gmol Tabla 1. Iteraciones del ejemplo 1 con el método de la bisección
k 0 1 2 3 4 5 6 7 8 9 10
Vk 0.75 0.625 0.5625 0.5938 0.5782 0.5704 0.5665 0.5685 0.5695 0.57 0.5698
f(Vk) -11.94 -4.2858 0.6196 -1.9467 -0.697 -0.0505 0.2783 0.1092 0.025 -0.017 -0.0002
Tomando como criterio de convergencia
ak 0.5 0.5 0.5 0.5625 0.5625 0.5625 0.5625 0.5665 0.5685 0.5695 0.5695
f Vk 1103 y
bk 1.0 0.75 0.625 0.625 0.5938 0.5782 0.5704 0.5704 0.5704 0.5704 0.57
Vk 1 Vk 110 3 Vk 1
se toma como aproximación del volumen molar el valor 0.5698 l/gmol, pues en la iteración 11 se tiene que f Vk 2 10
4
y
Vk 1 Vk 3.51 10 4 Vk 1
3.1.1.2. Método de la falsa posición (regula - falsi) Este método elige la secante entre los puntos (ao, f(ao)) y (bo, f(bo)), o en general la secante entre los puntos que definen el intervalo actual para determinar la aproximación de la raíz; ésta se toma como el punto donde la línea cruza el eje. Se usa esta aproximación para reemplazar uno de los dos extremos del último intervalo, de tal manera que se conserve el cambio de signo en el valor de la función en los extremos del nuevo intervalo de aproximación. En la figura 3 se representa el proceso iterativo. Dada una función continua f(x) en el intervalo [a0,b0] tal que f a0 f b0 0 ; la aproximación de la raíz en cada etapa se hace con la fórmula:
xk
f bk ak f ak bk f bk f ak
97
xk bk f bk
bk ak f ak f bk
Siendo ak y bk los límites del intervalo en cada iteración k, donde está contenida la raíz.
f(x)
ao
xo
x1
x2 bo
Figura 3. Representación gráfica del método de la falsa posición
La elección del nuevo intervalo se hace de acuerdo con los siguientes criterios: Sí f ak f xk 0
Sí f xk f bk 0
ak 1 xk y bk 1 bk
ak 1 ak y bk 1 xk
Ejemplo 2: Hacer el ejemplo 1, usando el método de la falsa posición.
f V 0
36.927 4.0369 56 V 0.0259 V V 0.0259
98
Vk
f bk ak f ak bk f bk f ak
En la tabla 2 se muestran las iteraciones realizadas. Tabla 2. Iteraciones del ejemplo 2 con el método de la falsa posición
k 0 1 2 3 4 5
ak 0.5 0.5 0.5 0.5 0.5
bk 1.0000 0.6144 0.5744 0.5703 0.5698
Vk 0.6144 0.5744 0.5703 0.5698 0.5698
f(ak) 6.5363 6.5363 6.5363 6.5363 6.5363
f(bk) -22.0261 -3.5155 -0.3842 -0.0399 -0.0041
f(Vk) -3.5155 -0.3842 -0.0399 -0.0041 -0.0004
Tomando los mismos criterios de convergencia usados en el ejemplo 1, se toma como aproximación del volumen molar el valor 0.5698 l/gmol, pues en la sexta búsqueda
f Vk 4 104 y
Vk 1 Vk 0 , valores que son menores que Vk 1
1x10-3 3.1.1.3. Método de la falsa posición modificado El método consiste en disminuir la pendiente de la secante entre el punto fijo y la nueva posición, esto se logra reduciendo el valor de la función del punto fijo a la mitad del valor real, y con estos dos valores se traza la nueva secante. Este procedimiento se puede apreciar gráficamente en la figura 4. Dada una función f(x) continua en el intervalo [a0,b0] tal que f a 0 f b0 0 ; la aproximación de la raíz en cada etapa se calcula con la fórmula:
xk
Gak Fbk GF
Siendo ak y bk los límites del intervalo en cada iteración k, donde está contenida la raíz y G y F son valores que inicialmente se calculan como: G = f(b0) y F= f(a0). La elección del nuevo intervalo se hace de acuerdo con los siguientes criterios:
99
ak 1 ak Sí f ak f xk 0
bk 1 xk
G f xk FF
2
Figura 4. Representación gráfica del método de la falsa posición modificado
ak 1 xk Sí f bk f xk 0
bk 1 bk
F f xk
GG
2
Ejemplo 3: Hacer el ejemplo 1, usando el método de la falsa posición modificado.
f V 0
36.927 4.0369 56 V 0.0259 V V 0.0259
100
Vk
Gak Fbk GF
En la tabla 3 se muestran las iteraciones realizadas. Tabla 3. Iteraciones del ejemplo 3 con el método de la falsa posición modificado
k 0 1 2 3 4 5 6 7 8 9 10 11
ak 0.5000 0.5000 0.5551 0.5551 0.5658 0.5658 0.5687 0.5687 0.5695 0.5695 0.5697 0.5697
bk 1.0000 0.6144 0.6144 0.5799 0.5799 0.5721 0.5721 0.5704 0.5704 0.5699 0.5699 0.5698
Vk 0.6144 0.5551 0.5799 0.5658 0.5721 0.5687 0.5704 0.5695 0.5699 0.5697 0.5698
F G 6.5363 -22.0261 3.2682 -3.5155 1.2597 -1.7578 0.6299 -0.8343 0.3400 -0.4172 0.17 -0.1934 0.0893 -0.0967 0.04465 -0.0468 0.0228 -0.0234 0.0114 -0.0116 0.0057 -0.0058 0.0029 -0.0029
f(Vk) -3.5155 1.2597 -0.8343 0.3400 -0.1934 0.0893 -0.0468 0.0228 -0.0116 0.0057 -0.0029
El volumen molar es aproximadamente: 0.5698 l/gmol. En este ejemplo se tomó el valor 5x10-3 como criterio de convergencia.
3.1.1.4. Método de la secante Este método es muy similar al de la falsa posición, la diferencia radica en que no se requiere que haya cambio de signo en la función para los extremos del intervalo [a0,b0] y se retiene el más reciente de los valores estimados (ver figura 5). La aproximación de la raíz en cada etapa se calcula con la fórmula:
xk 1 f xk xk f xk 1 f xk f xk 1 x k x k 1 x k f x k f x k f x k 1
xk 1 x k 1 x1 a0 y x0 b0
101
f(x)
x2 x1
ao x-1
bo xo
Figura 5. Representación gráfica del método de la secante Este método tiene como desventajas: i. ii.
No converge si en el intervalo elegido existe un punto de inflexión. No converge si en el intervalo existe un máximo o un mínimo.
Ejemplo 4: Hacer el ejemplo 1, usando el método de la secante.
f V 0
36.927 4.0369 56 V 0.0259 V V 0.0259
Vk 1
Vk 1 f Vk Vk f Vk 1 f Vk f Vk 1
En la tabla 4 se muestran las iteraciones realizadas. Tabla 4. Iteraciones del ejemplo 4 con el método de la secante
k -1 0 1 2 3 4 5
Vk 0.5000 1.0000 0.6144 0.5412 0.5717 0.5699 0.5698
f(Vk) 6.5363 -22.0261 -3.5155 2.5086 -0.1583 -0.0067 0.0000
102 Con el mismo criterio de convergencia del ejemplo anterior se tiene como aproximación del volumen molar 0.5698 l/gmol. 3.1.1.5. Método de Newton Este método toma la raíz de la recta tangente en un punto cercano a la raíz buscada, como aproximación de la raíz de la función. Se distingue de los métodos vistos hasta ahora porque requiere de la evaluación de derivada además del valor de la función en cada etapa de aproximación (ver figura 6). Dada una función f(x) continuamente diferenciable y un punto de la función (x0, f(x0)), la aproximación de la raíz en cada etapa se calcula con la fórmula: En este método solo se requiere un valor inicial xo para comenzar las iteraciones.
xk 1 xk
f xk f xk
f(x)
x2 x1
xo
Figura 6. Representación gráfica del método de Newton
Ejemplo 5: Hacer el ejemplo 1, usando el método de Newton.
103
f V 0 f ' V
36.927 4.0369 56 V 0.0259 V V 0.0259 36.927
V 0.0259
2
Vk 1 Vk
4.03692V 0.0259
V V 0.02592
f Vk f Vk
En la tabla 5 se muestran las iteraciones realizadas: Tabla 5. Iteraciones del ejemplo 5 con el método de Newton
k 0 1 2 3 4
Vk 0.5000 0.5555 0.5680 0.5696 0.5698
f(Vk) 6.5363 1.2254 0.1535 0.0168 0.0019
f’(Vk) -117.7371 -98.3495 -94.6535 -94.1877 -94.1366
El volumen molar es aproximadamente: 0.5698 l/gmol, si se toma el mismo valor de 5x10-3 para el criterio de convergencia. 3.1.1.6. Método de las sustituciones sucesivas Dada una f(x) = 0, el método requiere previamente despejar la variable independiente de una manera sencilla en función de ella misma, para obtener una ecuación de la forma x = F(x). El proceso parte de un valor inicial xo para calcular F(xo), y en forma sucesiva genera aproximaciones con la fórmula :
xk 1 F xk El proceso de aproximación sucesiva se ilustra gráficamente en la figura 7. Este método presenta problema cuando F x k
1 en el intervalo de interés.
Ejemplo 6: Hacer el ejemplo 1, usando el método de sustituciones sucesivas.
104
f V 0
36.927 4.0369 56 V 0.0259 V V 0.0259
Despejando V del primer término de la ecuación:
Figura 7. Representación gráfica del método de sustituciones sucesivas
F V
36.927
56 4.0636 / V V 0.0259
0.0259 V
Vk 1 F Vk En la tabla 6 se muestran las iteraciones realizadas. Tabla 6. Iteraciones del ejemplo 6 con el método de las sustituciones sucesivas
k 0 1 2 3 4 5 6 7
Vk 0.5 0.5434 0.5607 0.5668 0.5688 0.5695 0.5697 0.5698
F(Vk) 0.5434 0.5607 0.5668 0.5688 0.5695 0.5697 0.5698 0.5698
105
Como en los ejemplos anteriores también el volumen molar es aproximadamente: V V 0.5698 l/gmol, si se toma 1.0x10-3 como valor para la convergencia en k 1 k Vk 3.1.1.7. Método de Wegstein Este método, como el método de la falsa posición y el de la secante, utiliza una recta secante a una curva para obtener aproximaciones de la raíz (ver figura 8). Pero, requiere de la transformación de la función original f(x) = 0 en una forma similar a como se hace en el método de las aproximaciones sucesivas para obtener F x . La aproximación de la raíz en cada etapa, se obtiene como el valor de x en donde la secante de F(x) en dos puntos intercepta a la línea recta y = x (ver figura 8). La fórmula algorítmica es:
xk 1
xk 1F xk xk F xk 1 xk 1 xk F xk F xk 1
Para comenzar el método se necesitan dos aproximaciones iniciales. Una de ellas puede ser un punto arbitrario x0, y el otro se puede generar utilizando la técnica de aproximaciones sucesivas
Figura 8. Representación gráfica del método de Wegstein
106 Ejemplo 7: Hacer el ejemplo 1, usando el método de Wegstein.
f V 0
36.927 4.0369 56 V 0.0259 V V 0.0259
F V
36.927 0.0259 56 4.0636 / V V 0.0259
Vk 1
Vk 1 F Vk Vk F Vk 1 Vk 1 Vk F Vk F Vk 1
En la tabla 7 se muestran las iteraciones realizadas. Tabla 7. Iteraciones del ejemplo 7 con el método de Wegstein
k 0 1 2 3
Vk 0.5 0.5434 0.5722 0.5698
F(Vk) 0.5434 0.5607 0.5706 0.5698
El volumen molar es aproximadamente: 0.5689 l/gmol
3.1.2. Ceros complejos Método de Newton Dada una función f(x), si sus raíces son complejos de la forma z x iy , la función se puede expresar como:
f z ux , y iv x , y donde:
u x , y 0 para las raíces v x , y 0 Para encontrar las raíces se aplica la fórmula iterativa del método de Newton:
107
zk 1 zk
f zk f zk
Esta fórmula es equivalente a:
vu uu x xk 1 xk 2y u u2 y xk , yk x vux uu y yk 1 yk u2 u2 x y xk , yk donde:
ux
u u ;u y x y
Las fórmulas iterativas equivalentes, para la parte real y la parte imaginaria, pueden demostrarse aplicando el teorema de Cauchy Riemann, que establece que:
u x v y vx u y para una función analítica, es decir que sólo existe un valor de f(z) para un z dado:
df z du idv
u x dx u y dy ivx dx v y dy Como
dz dx idy
f z
f z
df z dz u x dx u y dy i vx dx v y dy dx idy
v y dx u y dy i u y dx v y dy dx idy
108
f z
u y dy idx v y dx idy dx idy
v y dx idy iu y dx idy dx idy
f z vy iu y
u iv z z k Como k 1 v y iu y xk 1 iyk 1 xk iyk
xk , yk
u iv vy iu y
xk iyk
v y2 u y2
uv y vu y v y2 u y2
vu y uu x x k 1 x k 2 u u2 y x vux uu y yk 1 yk 2 u u2 y x
i
uu y vv y v y2 u y2
xk , yk
xk , yk
Ejercicio 1: Hallar las raíces complejas del polinomio: x2 + 2x + 5 Cambiando la variable x por z:
z2 + 2z + 5 = 0
x iy 2x iy 5 ux , y iv x , y 2
109
x 2 y 2 2 x 5 2 xyi 2 yi ux , y ivx , y ux, y x 2 y 2 2 x 5
vx , y 2 xy 2 y ux 2x 2 u y 2 y
vx 2 y vy 2x 2
Utilizando las fórmulas del método de Newton y partiendo del valor inicial:
z 0i
x0 0 y0 1.0
se encuentran los valores presentados en la tabla 8. Tabla 8. Iteraciones del ejercicio 1.
k 0 1 2 3 4
x 0.0 -1.5 -0.85 -1.0034 -0.99999
y 1.0 1.5 1.95 1.9946 2.0000
u 4 2.0 0.22 0.0158 -
v 2 -1.5 0.585 -0.01356 -
ux 2 -1.0 0.3 -6.8 x 10-3 -
uy -2 -3.0 -3.9 -3.9892 -
Soluciones numéricas:
z1 0.99999 2.0i
z2 0.99999 2.0i
Soluciones analíticas:
z1 1.0 2.0i
z2 1.0 2.0i
3.2. Solución de ecuaciones lineales simultáneas Un conjunto de ecuaciones lineales se puede expresar de la siguiente manera:
110
a11 x1 a12 x2 ... a1n xn b1 a21 x1 a22 x2 ... a2 n xn b2
an1 x1 an 2 x2 ... ann xn bn Estas ecuaciones pueden representarse de una forma matricial, así:
AX B donde:
a11 a A 21 an1
a12 a22 an 2
x1 x X 2 xn
a1n a2 n ann
b1 b B 2 bn
3.2.1. Método de Jacobi Este método es iterativo y genera la aproximación a través de un proceso repetitivo de cálculos. El sistema:
a11 x1
a12 x2
...
a1n xn
b1
a21 x1
a22 x2
...
a 2 n xn
b2
...
ann xn
bn
an1 x1
an 2 x2 ...
Se puede transformar en:
x1 b1 a12 x2 ... a1n xn a11
x2 b2 a21 x1 a23 x3 ... a2 n xn a22
xn bn an1 x1 an 2 x2 ... an ,n 1 xn 1 a nn De forma abreviada:
111
n xi bi aij x j j 1 j i
aii
, i 1,2,..., n
A partir de valores iniciales de las variables se calcula el nuevo conjunto de aproximaciones recurriendo al sistema de ecuaciones transformadas. El algoritmo puede expresarse como:
xi ,k 1
n bi aij x j ,k aii j 1 j i
, i 1, 2, ..., n
Para que este método converja, se requiere que el valor absoluto de cada valor en la diagonal sea mayor que la suma de los valores absolutos de los restantes elementos en la misma fila: n
aii aij j 1 j i
El criterio de convergencia puede expresarse como:
xi ,k 1 xi ,k , i 1, 2, ..., n Ejemplo 8: Realice los balances de materia en estado estable para el tren de separación que se muestra en la figura 9 y calcule los flujos molares para D1, D2, B1 y B2 si se alimentan 100 kgmol/min. Utilice para ello el método de Jacobi. Realizando el balance de masa resulta el siguiente sistema de ecuaciones:
112
0.5D1 0.3B1 0.1D2 0.05B2 20 0.2 D1 0.6 B1 0.1D2 0.15B2 25 0.1D1 0.05B1 0.65D2 0.1B2 35 0.2 D1 0.05B1 0.15D2 0.7 B2 20 D1
20% xileno 25% estireno 35% tolueno 20% benceno
B1 D2
B2
50% xileno 20% estireno 10% tolueno 20% benceno
30% xileno 60% estireno 5% tolueno 5% benceno 10% xileno 10% estireno 65% tolueno 15% benceno
5% xileno 15% estireno 10% tolueno 70% benceno
Figura 8. Tren de separación para xileno, estireno, tolueno y benceno
113
20 0.3B1 0.1D2 0.05B2 0.5 25 0.2 D1 0.1D2 0.15B2 B1 0.6 35 0.1D1 0.05B1 0.1B2 D2 0.65 20 0.2 D1 0.05B1 0.15D2 B2 0.7 D1
Se inician las iteraciones partiendo de valores iniciales D1 = B1 = D2 = B2 = 25. Los resultados se muestran en la tabla 9: Tabla 9. Iteraciones para el ejemplo 8 con el método de Jacobi
k 0 1 2 3 4 5 6 7 8 9 10 11 12 13
D1 25.00 17.50 15.98 14.38 14.06 13.64 13.66 13.55 13.59 13.55 13.57 13.55 13.56 13.56
B1 25.00 22.92 24.89 25.36 25.92 25.90 26.04 25.99 26.04 26.02 26.04 26.02 26.03 26.03
D2 25.00 44.23 47.19 47.56 47.82 47.77 47.84 47.80 47.83 47.81 47.83 47.82 47.82 47.82
B2 25.00 14.29 12.46 12.12 12.46 12.46 12.59 12.56 12.60 12.58 12.60 12.59 12.59 12.59
D1 = 13.56 kgmol/h, B1 = 26.03 kgmol/h, D2 = 47.82 kgmol/h, B2 = 12.59 kgmol/h 3.2.2. Método de Gauss - Siedel Es también un método iterativo, que a diferencia del método de Jacobi, en el que las nuevas aproximaciones se calculan todas a partir de un mismo conjunto de valores precedentes, en este caso, los valores que se van obteniendo para cada variable son inmediatamente involucrados en el cálculo de la variable siguiente. El algoritmo puede expresarse como:
114
n xi bi aij x j j 1 j i
aii
,i 1,2,...,n
La aproximación en cada etapa se puede expresar algorítmicamente como: i 1 n xi ,k 1 bi aij x j ,k 1 aij x j ,k aii j 1 j i 1
Este método y el de Jacobi exigen una configuración especial del sistema de ecuaciones, de tal forma que aii 0 . Al igual que en el método de Jacobi, para que este método converja, se requiere que el valor absoluto de cada valor en la diagonal sea mayor que la suma de los valores absolutos de los restantes elementos en la misma fila: n
aii aij j 1 j i
Ejemplo 9: Realice el ejemplo 8 utilizando el método de Gauss-Siedel. Se utilizan las misma ecuaciones y los mismos valores de partida, la diferencia radica en que el valor aproximado para cada variable se calcula con los ya computados. En la tabla 10 se presentan las iteraciones. Tabla 10. Iteraciones para el ejemplo 9 con el método de Gauss - Siedel
k 0 1 2 3 4 5 6 7 8
D1 25.00 17.50 14.48 13.45 13.48 13.55 13.56 13.56 13.56
B1 25.00 25.42 26.27 26.14 26.04 26.03 26.03 26.03 26.03
D2 25.00 45.35 47.75 47.87 47.83 47.82 47.82 47.82 47.82
B2 25.00 12.04 12.33 12.60 12.61 12.59 12.59 12.59 12.59
D1 = 13.56 kgmol/h, B1 = 26.03 kgmol/h, D2 = 47.82 kgmol/h, B2 = 12.59 kgmol/h
115 3.3. Ecuaciones simultáneas no lineales Método de Newton-Raphson Es el método de Newton aplicado a un sistema de ecuaciones. Si se tiene un sistema:
f1 X 0 f2 X 0
fN X 0
donde X es un vector columna definido por las variables x1 , x2 ,..., x N :
x1 x2 t X x1 , x2 ,..., x N xN Se hace una expansión de Taylor de cada una de las funciones en las cercanías de un vector X k , y tomando únicamente los términos con primeras derivadas. En general, la función de Taylor se escribe de la siguiente manera:
f " a h 2 f ' " a h3 f x f a h f a f ' a h 2! 3! Aplicando a la función
f X k 1
N f X 1 k f1 X k 1 f1 X k x j j 1 x j N f X 2 k f 2 X k 1 f 2 X k x j j 1 x j
116
N f X N k f N X k 1 f N X k x j j 1 x j
Se toma como aproximación en cada etapa que f i X k 1 0 , entonces:
f1 X k x 1
f X x1 1 k x N f1 X k xN
f 2 X k f X x1 2 k x N f 2 X k x1 xN
f N X k f X x1 N k x N f N X k x1 xN
la jacobiana del sistema:
Llamando X k
Xk
k
f1 X k
x1 fN X k
x1
f1 X k x2 fN X k x2
f1 X k
fN X k xN
xN
es el vector de los incrementos:
k x1 , x2 ,..., x N t y
es el vector con los valores de las funciones en la etapa k.
f Xk
t f X k f1 X k , f 2 X k ,..., f N X k
El sistema de ecuaciones que contiene a X k
es un sistema de ecuaciones
lineales, donde las variables están definidas por el vector
k , la matriz de
117
coeficientes es la matriz jacobiana X k
y los términos independientes los
define el vector f X k .
X k k f X k Con estas definiciones y con un vector de solución aproximado:
t X 0 x0 , x1 ,..., x N el proceso iterativo de aproximaciones sucesivas a la solución del sistema está dado por la ecuación recursiva:
X k 1 X k k El procedimiento iterativo es el siguiente: 1.
Escribir las ecuaciones en la forma apropiada, f i X 0 .
2.
Hallar la matriz jacobiana X .
3.
Inicializar X X 0 , para cada etapa de aproximación.
3.1. Evaluar las componentes del vector f X k y la matriz X k . 3.2. Calcular
k resolviendo el sistema de ecuaciones lineales definidas por:
1 X k k f X k ó k X k f X k 3.3. Calcular la nueva aproximación como:
X k 1 X k k
3.4. Volver a 3.1. hasta que se haya alcanzado el grado de convergencia deseado. La convergencia se puede definir como:
ik 1 , i 1,2,..., N que puede combinarse con:
fi ( X k ) 2 , i 1,2,..., N Ejemplo 10: Las siguientes reacciones toman lugar en un reactor batch de volumen constante y en fase gaseosa:
118
A+B C+D B+C X+Y A+XZ Halle las concentraciones de cada uno de los componentes si las constantes de equilibrio para cada reacción son K1 = 1.06, K2 = 2.63 y K3 = 5. Tome como valores de partida CA0 = CB0 = 1.5 y CD0 = CX0 = CZ0 = 0. Las constantes de equilibrio para cada reacción son:
K1
CC CD C AC B
K2
C X CY C B CC
K3
CZ C AC X
Por la estequiometría de las reacciones resultan las siguientes cuatro ecuaciones:
C A C A 0 C D CZ CB CB 0 CD CY CY CD CC CZ CY C X En la solución del problema se utiliza el método de Newton-Raphson y se usa como criterios de convergencia ik 3 10 3 , i 1,2,...,7 y
f i X k 110 4 , i 1,2,...,7
El sistema de ecuaciones que se genera es:
f1 X 1.06 x1 x2 x3 x4 0 f 2 X 2.63 x2 x3 x5 x6 0 f 3 X 5 x1 x5 x7 0 f 4 X x1 x4 x7 1.5 0 f 5 X x2 x4 x6 1.5 0 f 6 X x3 x4 x6 0 f 7 X x 6 x5 x 7 0
f X k f1 X k
f2 X k
x1 : C A x2 : C B x3 : CC x4 : C D x5 : C X x6 : CY x7 : C Z
f3 X k
f4 X k
f5 X k
f6 X k
t f 7 X k
119
1.06 x2 0 5 x5 Xk 1 0 0 0
1.06 x1
x4
x3
0
0
2.63x3
2.63x2
0
x6
x5
0
0
0
5 x1
0
0
0
1
0
0
1
1 1
0
1
0
0 1
0
1
0
0
0
1
1
0 0 1 1 0 0 1
t X 0 1.5 1.5 0 0 0 0 0 t f X 0 2.385 0 0 0 0 0 0
k 1 X k f X k k 1 X 0 f X 0 0 0.727 0.773 0 0.386 0.046 0.386 0.341 X1 X 0 0
t
Se sigue este proceso en forma iterativa encontrándose que X 5 X 4 . El resumen de los resultados se muestra en la tabla 11. En virtud de que se cumplieron los dos criterios de convergencia se acepta como solución del sistema:
X 5 0.4207 0.2429 0.1536 0.7053 0.1778 0.5518 0.3740 , o sea: CA = 0.474, CB = 0.251, CC = 0.254, CD = 0.498, CX = 0.223, CY = 0.751, CZ = 0.528
120 Tabla 11. Iteraciones para el ejemplo 10 con el método de Newton-Raphson k 1 2 3 4 5 k 1 2 3 4 k 1 2 3 4 5
x1 0,773 0,455 0,454 0,476 0,474
x2 0,727 0,315 0,230 0,255 0,251
x3 0,000 0,034 0,194 0,253 0,254
x4 0,386 0,576 0,538 0,496 0,498
x5 0,045 0,140 0,224 0,221 0,223
x6 0,386 0,609 0,732 0,749 0,751
x7 0,341 0,469 0,508 0,528 0,528
1
2
3
4
5
6
7
-0,32 0,00 0,02 0,00 f1 0,596 0,133 0,006 0,003 0,000
-0,41 -0,08 0,02 0,00 f2 -0,018 -0,058 -0,046 0,004 0,000
0,03 0,16 0,06 0,00 f3 -0,165 -0,150 0,000 0,000 0,000
0,19 -0,04 -0,04 0,00 f4 0,000 0,000 0,000 0,000 0,000
0,09 0,08 0,00 0,00 f5 0,000 0,000 0,000 0,000 0,000
0,22 0,12 0,02 0,00 f6 0,000 0,000 0,000 0,000 0,000
0,13 0,04 0,02 0,00 f7 0,000 0,000 0,000 0,000 0,000
3.4. Interpolación y aproximaciones Los usos más frecuentes de aproximación de funciones son: i. Reemplazar funciones complicadas por algunas más simples para realizar operaciones más fácilmente, tales como: diferenciación o integración, o porque se necesita hacer aproximaciones de funciones que no pueden ser evaluadas estrictamente con operaciones aritméticas, tales como: senx , ln( x) ,
erf x
2
0 e t dt , x e z Z x 1 dZ , cuando se utilizan en programas 0 x
2
de computadores. ii. Para interpolación en tablas, o sea, para evaluar una función en algún punto no tabulado, cuando se conocen valores de la función en un conjunto de puntos tabulados. Las aproximaciones más comunes de funciones son aquellas que tienen combinaciones lineales de funciones simples de algún tipo.
121 n
f x g x ai gi x i 0
f x a0 g0 x a1 g1 x ... an g n x Los tipos de funciones g i x más utilizados son: a. Monomiales:
g k x x k Las combinaciones lineales de funciones monomiales producen las funciones polinomiales:
f x g x a0 a1 x a2 x 2 ... an x n n
f x g x ai xi i 0
b. Trigonométricas:
g k x ak coskx bk senkx Las combinaciones lineales de funciones trigonométricas generan las series de Fourier.
f x g x a0 a1 cos x ... an cos nx b1senx ...
bn sen nx
n
n
k 1
k 1
f x a0 ak cos kx bk sen kx c. Exponenciales:
g k x e bk x Las combinaciones lineales de funciones exponenciales generan:
122
f x g x ao eb0 x a1eb1x ... an ebn x n
f x ak ebk x k 0
También pueden polinomiales.
hacerse
aproximaciones
racionales
con
las
funciones
a0 a1 x ... an x n Pn x f x g x b0 b1 x ... bm x m Pm x De todas las aproximaciones anteriores las más utilizadas son las aproximaciones polinomiales.
3.4.1. Aproximaciones polinomiales Todos los métodos para hallar la función polinomial a una función, parten del criterio de que para evaluar los coeficientes de Pn x se requiere que:
Pn xi f xi , i = 0, 1, 2,..., n Utilizando este criterio se pueden evaluar los coeficientes de la función polinomial, partiendo de un conjunto de puntos de la función
x , f x , x , f x , ... , x , f x 0
0
1
1
n
n
y estableciendo un sistema de
n+1 ecuaciones lineales simultáneas para calcular los respectivos coeficientes
a0 , a1 , ... , an .
a0 a1 x0 a2 x02 ... + an x0n f x0 a0 a1 x1 a2 x12 ... + an x1n f x1 a0 a1 xn a2 xn2 ... + an xnn f xn
Existen métodos especiales desarrollados para evaluar los coeficientes dependiendo de sí los puntos base son igualmente espaciados o no. Entre estos se encuentran el método de Gregory-Newton, método de Lagrange y el método con puntos base igualmente espaciados.
123 3.4.1.1. Método de Gregory- Newton En este método no se requiere que los puntos base estén igualmente espaciados y utiliza la diferencia finita dividida como una aproximación de las derivadas de la función. La diferencia finita dividida de primer orden relativa a los argumentos x , x0 se denota de la siguiente manera:
f x, x0
f x f x0 x x0
x x0
Diferencia finita dividida
f x0 f x0
0
f x1 f x0 f x1 , x0 x1 x0 f x2 , x1 , x0
1
f x2 , x1 f x1 , x0 x2 x0
f xn , xn1 , , x0
f xn , , xn1 , x1 f xn1 , , x0 x n x0
Se puede demostrar que: n
f xi
i 0
x x
f xn , xn 1 , ... ,x0
n
j i
f xn , xn 1 , ... ,x0
i
Orden
j
f x0 x0 x1 x0 x2 ... x0 xn
f x1 ...+ x1 x0 x1 x2 ... x1 xn f xn xn x0 xn x1 ... xn xn1
2
n
124
La fórmula fundamental de Newton establece la forma general del polinomio de interpolación de una función.
f x Pn x Rn x en la que:
Pn x a0 a1 x x0 a2 x x0 x x1 ... +an x x0 x x1 ... x xn1 n
R n x f x, xn , xn1 , ... ,x0 x xi i 0 n
Rn x f xn1 , xn , xn 1 , ..., x0 x xi i 0
Si se reemplaza x x0 en Pn x , se obtiene:
f x0 a0 f x0 reemplazando x x1 en
a1
f x , se obtiene:
f x1 f x0 f x1 , x0 x1 x0
En general:
an f xn , xn1 ,..., x0 Ejemplo 11: Estime el calor específico del aluminio a 90 K si se conocen los datos que se muestran en la tabla 12: Tabla 12. Calor específico del aluminio a diferentes temperaturas
T, K Cp, kJ/kgK
10 0.0014
20 0.0089
60 0.214
80 0.357
100 0.481
125 Para resolver el problema se usa el método de Gregory-Newton y se hallan las diferencias finitas divididas de primer a cuarto orden (d1, d2, d3 y d4), tal como se muestra en la tabla 13. Tabla 13. Diferencias finitas divididas del ejemplo 11.
T, K 10 20 60 80 100
Cp, kJ/kgK 0.0014 0.0089 0.214 0.357 0.481
d1 7.5x10-4 5.13x10-3 7.15x10-3 6.2x10-3
d2 8.76x10-5 3.37x10-5 -2.38x10-5
d3 -7.7x10-7 -7.2x10-7
d4 5.66x10-10
T0 = 10
a0 C p T0 0.0014
a1 C p T1 ,To 7.5 10 4 a2 C p T2 ,T1 ,To 8.76 10 5 a3 C p T3 ,T2 ,T1 ,To 7.7 10 7
a4 C p T4 ,T3 ,T2 ,T1 ,To 5.66 10 10
C p T a0 a1 T T0 a2 T T0 T T1 a3 T T0 T T1 T T2 a4 T T0 T T1 T T2 T T3
Para T = 90 K:
C p 90 0.0014 7.5 10 4 90 10 8.76 10 5 90 1090 20 7.7 10 7 90 1090 2090 60 5.66 10 10 90 1090 2090 6090 80 0.424 3.4.1.2. Método de Lagrange Este método no requiere que los puntos base estén igualmente espaciados. La forma de Lagrange para el polinomio de interpolación está dada por:
126 n
Pn x Li x f xi i 0
donde:
x x j j 0 xi x j j i n
Li x
Li x
, i 0 ,1 ,..., n
x x0 ...x xi 1 x xi 1 ...x xn xi x0 ...xi xi 1 xi xi 1 ...xi xn
Ejercicio 2: Encontrar la aproximación polinomial utilizando el método de Lagrange para la función que se presenta en la tabla 14. Tabla 14. Función del ejercicio 2
i 0 1 2 3
x 2 3 -1 4
f(x) 1 2 3 4
L0 x
x 3x 1x 4 1 x 3x 1x 4 13 2 6
L1 x
x 2x 1x 4 1 x 2x 1x 4 14 1 4
L2 x
x 2x 3x 4 1 x 2x 3x 4 3 4 5 60
L3 x
x 2x 3x 1 1 x 2x 3x 1 215 10
127
1 1 1 x 3 x 1 x 4 x 2 x 1 x 4 x 2 x 3 x 4 6 2 20 2 x 2 x 3 x 1 5
f x
3.4.1.3. Aproximación con puntos base igualmente espaciados Escribiendo la fórmula fundamental de Newton en términos de las diferencias finitas divididas o cocientes incrementados:
f x f x0 x x0 f x1 , x0 x x0 x x1 f x2 , x1 , x0 ...
x x0 x x1 ... x xn1 f xn ,..., x0 x x0 x x1 ... x xn f x, xn , xn1,..., x0 Como:
x1 x0 h x 2 x 0 2h x3 x0 3h x n x0 nh f x1 , x0
f x1 f x0 f x0 h f x0 f x0 x1 x0 h h
2 f x0 f x2 , x1 , x0 2h 2 En general:
n f x0 f xn , xn1 ,..., x0 n !h n Así, el polinomio de interpolación o extrapolación se puede escribir como:
128
f x0 2 f x0 Pn x f x0 x x0 x x0 x x1 ... h 2h 2 n f x0 x x0 x x1 ... x xn 1 n !h n Si se define x x0 h
x x0 h
x x1 x x0 h x x0 h h h h 1 x x2 h 2 x xn h n El polinomio de interpolación se transforma en:
Pn f x0 f x0
1
2 f x0 ...
2! 1 2 ... n 1 n f x0 n!
Ejemplo 12: Utilizando los datos de la tabla 15 estime la presión de vapor de amoníaco a 167F.
Tabla 15. Presión de vapor del amoníaco a diferentes temperaturas
Temperatura (F) Presión (lb/in²)
70 80 90 100 110 120 130 140 128.8 153.0 180.6 211.9 247.0 286.4 330.3 379.1
De la tabla anterior se calculan los siguientes datos (tabla 16) de diferencia:
129 Tabla 16. Diferencias finitas del ejemplo 12
T 70 80 90 100 110 120 130 140
P 128.8 153.0 180.6 211.9 247.0 286.4 330.3 379.1
P
²P
³P
24.2 27.6 31.3 35.1 39.4 43.9 48.8
3.4 3.7 3.8 4.3 4.5 4.9
0.3 0.1 0.5 0.2 0.4
Como los puntos por debajo de 110F tienen hasta la tercera diferencia y se desea aproximar a un polinomio de grado 3, se tomará esta temperatura como temperatura base para estimar la presión de vapor. La ecuación de interpolación será:
PT PT0 PT0
1 2!
2 PT0
1 2 3!
3 PT0
donde:
T T0 h 167 F T0 110 F h 10 F 5.7
P167 247 5.7 39.4
5.7 4.7 5.7 4.7 3.7 4.5 0.4 538.46 lb 2 in 2 1 2 3
3.4.2. Aproximación de funciones por el método de los mínimos cuadrados El método se apoya en la minimización de la suma del cuadrado del error dado por la función a la que se está aproximando la función original. 2 Q yi Yˆi N
i 1
130 donde:
y i : son los valores de la función original. Yˆi : son los valores obtenidos con la función propuesta como aproximación. Los parámetros o coeficientes que aparecen en la fórmula Yˆi se ajustan o determinan minimizando la función error Q. Esta minimización es posible realizarla analíticamente para algunas formas sencillas de la función Yˆi Cuando la función Yˆ es de forma polinomial:
Yˆ a0 a1 x a2 x 2 ... an x n Los parámetros a k se obtienen a partir de la relación:
Q 0 , k 0 ,1 , ... , n ak
n Q N yi a0 a1 xi ... an xi ak 1 ak
2
Para el caso en que n=3, las ecuaciones que se producen son: 2 3 a0 a1 xi a2 xi a3 xi yi
a0 xi a1 xi a2 xi a3 xi yi xi 2
3
4
a0 xi a1 xi a2 xi a3 xi yi xi
2
a0 xi a1 xi a2 xi a3 xi yi xi
3
2
3
3
4
4
5
5
6
Este sistema de ecuaciones lineales simultáneas en ai se resuelve por cualquier método. Una expresión de este sistema en forma matricial es:
AS P AS P
131 En términos generales para un polinomio de grado n:
N xi A xin
xi .......... ........ xin
2 n 1 x .......... ........ x i i n 1 2n x .......... ..... x i i yi ao yx a1 i i P S n yi xi an
En el caso en que Yˆ tenga una forma como:
a Yˆ b x Las ecuaciones que resultan para evaluar los parámetros a y b son no lineales
Q a 2 y i a b xi
1 b x i
Q a 2 y i b b xi
a 2 b x i
0 0
De donde:
a yi b x i
1 b xi
a y i b x i
0
1 2 b xi
0
Estas dos ecuaciones pueden resolverse utilizando el método de NewtonRaphson.
Ejemplo 13:
132 Use los datos de la tabla 17 para hallar la función de aproximación para la capacidad calórica media del n-propano. Use como temperatura de referencia 25C (298.15 K). La capacidad calórica media está definida como: T
C p dT
Cp
Tref
T Tref
Tabla 17. Capacidad calórica del n-propano a diferentes temperaturas
No.
Temperatura, K
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18
50 100 150 200 273.15 300 400 500 600 700 800 900 1000 1100 1200 1300 1400 1500
Capacidad calórica, kJ/kgK 34.06 41.30 48.79 56.07 68.74 73.93 94.01 112.59 128.59 142.67 154.77 163.35 174.60 182.67 189.74 195.85 201.21 205.89
*Capacidad calórica media, kJ/kgK 54.86 60.43 65.78 70.92 77.95 83.08 89.64 97.88 105.50 112.56 119.12 125.25 131.00 136.43 141.61 146.61 151.47 156.28
* Estos datos fueron calculados con el método de mínimos cuadrados que se describe abajo.
Si se usa el método de los mínimos cuadrados y una función de aproximación de tercer grado, se debe resolver el siguiente sistema de ecuaciones:
133 2 3 a0 a1 xi a2 xi a3 xi yi
a0 xi a1 xi a2 xi a3 xi yi xi 2
3
4
a0 xi a1 xi a2 xi a3 xi yi xi
2
a0 xi a1 xi a2 xi a3 xi yi xi
3
2
3
3
4
4
5
5
6
Reemplazando los valores de las sumatorias obtenidas a partir de los datos de la tabla 17:
18a0 12473a1 12499611a2 1.44 10 4 a3 2269 12473a0 12499611a1 1.44 1010 a2 1.78 1013 a3 2055432 12499611a0 1.44 1010 a1 1.78 1013 a2 2.3 1016 a3 2263844180 a0 1.44 1010 1.78 1013 a1 2.3 1016 a2 3.05 1019 a3 2.72 1012 Resolviendo este sistema de ecuaciones resulta:
a0 13.762
a1 0.2647
a2 0.00015
a3 4.16 108
La ecuación para Cp será entonces:
C p 13.7652 0.2647T 0.00015T 2 4.16 108 T 3
14626.11 13.7652T 0.1324T 2 0.00005T 3 1.04 10 8 T 4 C p T T 298.15 Con esta ecuación se hallan los valores de la capacidad calórica media que se presentan en la última columna de la tabla 17.
3.5. Diferenciación numérica La diferenciación numérica o aproximación de la derivada por un método numérico se puede llevar a cabo mediante los siguientes métodos:
134 1.
Derivando el polinomio de aproximación: Si f x Pn x
2. 2.1.
f ' x Pn ' x
Aproximando la tangente a la secante, para hallar la primera derivada. Si la derivada se evalúa en uno de los puntos extremos del intervalo (ver figura 9):
f x n
f x n 1 f x n x n 1 x n
2.2. Si la derivada se evalúa en el punto medio del intervalo (ver figura 10):
f C
f xn1 f xn xn1 xn
donde:
C
xn 1 xn 2
f(xn) f(xn+1)
xn
xn+1
Figura 9. Derivada evaluada en uno de los puntos extremos
135
f(xn) f(xn+1)
xn
C
xn+1
Figura 10. Derivada evaluada en el punto medio del intervalo 3. Aproximación con diferencias finitas. El teorema de Taylor establece que:
1 2 hn n f a h f a hf a h f a + D f a 2 n! 2 3 hD hD ... f a =1 hD 2 3! como:
Ef x0 f x0 h
2 2 hD hD f a h Ef a 1 hD ... f a 2 3 ! 2 3 hD hD E 1 1 hD ... 2 3 !
1+ e hD hD= ln 1 Expresando el logaritmo natural como una serie y despejando D; se obtiene una ecuación que relaciona la primera derivada con diferencias finitas:
136
1 1 1 1 D= 2 3 4 ... h 2 3 4 Si se eleva al cuadrado ambos términos, se obtiene una relación de la segunda derivada con diferencias finitas.
D2
1 h2
11 4 5 5 2 3 ... 12 6
Ejemplo 14: Halle la densidad del vapor de amoníaco a 110 y 167º F con los datos del ejemplo 12. El calor latente del amoníaco es 544 BTU/lb Para encontrar la densidad del vapor se usará la ecuación de Clausius Clapeyron:
dP dT T VG VL Asumiendo que el volumen VL es despreciable con respecto a VG, se tiene:
1 T dP VG dT
Como:
D
1 1 1 1 2 3 4 ... h 2 3 4
Entonces:
T 1 1 PT 2 PT 3 PT ... h 2 3
Para hallar la densidad a 110ºF se deben obtener los valores P( T ), 2 P( T ), etc (tabla 16).
627R BTU 10 R 544 lb
1 1 lbf 39.4 4.5 0.4 in 2 2 3
137
627 37.28 lb 10 544 5.402 ft 3
0.795
lb ft 3
Para hallar la densidad a 167ºF se deben obtener los valores P( T ), 2 P( T ), etc, y extrapolar estos valores de la misma manera como se extrapoló P(T).
PT PTo 2 PTo
1
2! PT PTo PTo 6.78 2
2
3 PTo 70.4
3
3 PT 3 PTo 0.4 627R 1 1 lbf 70.4 6.78 0.4 2 BTU 2 3 in 10R 544 lb
627 67.14 lb 10 544 5.402 ft 3
1.43
lb ft 3
Si se estima esta densidad con la ecuación de los gases ideales, se observa una diferencia del orden del 5% del valor obtenido con datos experimentales respecto al valor del modelo ideal.
P RT 538.46
1545
1.36
lbf in 2
lbf ft 627 R lbmol R lb ft 3
lb in 2 17 144 2 lbmol ft
138
3.6. Integración numérica b
La evaluación de una integral definida
f x dx ,
por métodos matemáticos es
a
generalmente difícil o imposible cuando f x no se ajusta a los casos tratables, o su manipulación se hace muy engorrosa para convertirla a una forma integrable analíticamente. Se presentan entonces dos alternativas para evaluar la integral: 1. Hallar una función
g x , que sea formalmente integrable, como una
aproximación de f x . 2. Hallar la integral numéricamente por algún método a partir de valores generados por la función original f x . Los métodos de integración numérica normalmente usados pueden clasificarse en dos tipos:
Fórmulas de Newton-Cotes que usan valores de la función en puntos base igualmente espaciados.
Fórmulas de cuadratura Gaussiana que emplean puntos base desigualmente espaciados determinados por ciertas propiedades de polinomios ortogonales.
En este libro solo se presentan las fórmulas de integración con puntos base igualmente espaciados, las cuales se dividen en cerradas y abiertas. Las fórmulas de integración cerradas usan información acerca de f x sobre los límites de integración y las fórmulas abiertas no requieren de información acerca de f x en los límites de integración. En ambos casos la integral es evaluada por la aproximación
a f x dx a pn x dx b
b
3.6.1. Fórmulas de integración cerradas 3.6.1.1. Regla trapezoidal
xn x0 f xn f x0 n1 f xi f x dx n 2 i 1 x0
xn
139
Esta fórmula aproxima la función intervalos de espaciamiento:
f x a un polinomio de primer grado en
x n x0 h n
El área bajo la curva en cada subintervalo es aproximada por el trapezoide formado al sustituir la curva por su secante trazada entre los puntos extremos de la curva. Luego, la integral es aproximada por la suma de todas las áreas trapezoidales 3.6.1.2. Regla de Simpson Las fórmulas de Newton-Cotes compuestas, basadas en polinomios de interpolación cuadráticos y cúbicos se denominan reglas de Simpson. Para el subintervalo (x0, x2) la integral aproximada con esta regla está dada por: x x h 2 x f x dx x h ax bx c dx 2
1
0
1
a b 6 x12 h 2h3 4 x1h 2ch 3 2 ah 2 bh hc 6 x1 2h 2 6 x1 6 3 3 3 h a6 x12 2h 2 b6 x1 6c 3 h ax12 2 x1h h 2 ax12 2 x1h h 2 bx1 h bx1 h c c 4ax12 4bx1 4c 3 h 2 2 ax1 h bx1 h c ax1 h bx1 h c 4 ax12 bx1 c 3 h f x1 h 4 f x1 f x1 h 3 h f x 0 4 f x1 f x 2 3
En general, para todo el intervalo de integración la receta de Simpson establece que:
140 n2 n 1 2 x x xn n 0 f x0 f xn 2 f xi 2 f x2i 1 x0 f x dx 3n i 1 i 0
Esta ecuación se aplica cuando n es par, o sea número de puntos base impar
Forma generalizada: Se puede hacer la aproximación de la función f x a un polinomio de grado n en subintervalos.
f x f x 0 h f x 0 f x 0
1... n 1 f x 0
1 2!
2 f x 0 ...
n
n! donde:
x x0 h
ba h
a f x dx a Pn x dx h 0 Pn x0 h d b
b
2 3 2 2 4 3 2 3 f ( x0 ) ............ h f ( x0 ) f ( x0 ) f ( x0 ) 6 24 6 2 4 6
Ejemplo 15: En la tabla 18 se muestra la capacidad calórica del grafito a presión constante para temperaturas que van desde 300 K a 1100 K. Tabla 18. Capacidad calórica del grafico a diferentes temperaturas.
T, K Cp, cal/g.K
300 400 500 600 700 800 900 2.066 2.851 3.496 4.03 4.43 4.75 4.98
1000 5.14
1100 5.27
Determine el calor de absorción (q) cuando se calienta un gramo de grafito desde 300 a 1100 K.
141 1100
q m C p T dT 300
Para hallar la integral de esta ecuación se utiliza: a). Regla Trapezoidal: Tn
C p T dT
T0
Tn T0 n
C p Tn C p T0 n1 C p Ti 2 i 1
1100 300 5.27 2.066 29.677 3334.5 8 2
q 1g 3334.5
cal 3334.5cal g
b). Regla de Simpson: n2 n 1 2 Tn T0 Tn T0 C p T dT 3n C p T0 C p Tn 2 C p Ti 2 C p T2i1 i 1 i 0
1100 300 2.066 5.27 59.354 33.542 3341.1 3 8
q 1g 3341.1
cal 3341.1cal g
3.6.2. Fórmulas de integración abierta Si el número de puntos base en el subintervalo de integración es n 1 se hace una aproximación a un polinomio de grado n 2 ó menor. b b a f x dx a Pn2 x dx h0 Pn2 x0 hd
donde:
142
x x0 h
y
b a , o número de subintervalos de amplitud h h
Pn2 x0 αh Pn2 x1 α 1h f x1 α 1f x1 +...+
b
a
Si
α-1α- 2...α-n+2 n-2 f x 1 n-2!
α 1α 2 2 f x 2!
1
2 3 3 2 2 f x dx h f x1 f x1 f x1 ... 2 6 4
2
x x02 f x dx 2hf x1
El área o integral se aproxima al área de un rectángulo de altura f(x1) y amplitud 2h. x 3 3 x f x dx h 3 f x1 2 f x 2 2 f x1 3
Si
3
0
3h f x1 f x 2 2
El área o integral se aproxima al área de un rectángulo con altura igual a la media de f(x1) y f(x2) y amplitud 3h Si
4
Si
5
Si
6
4h 2 f x1 f x2 2 f x3 3 x5 5h x0 f xdx 24 11 f x1 f x2 f x3 11 f x4
x4 x0 f x dx
x6 x0 f x dx
3h 11 f x1 14 f x2 26 f x3 14 f x4 11 f x5 10
Ejemplo 16: En la tabla 19 se muestra el análisis acumulativo por tamizado para una arena.
Tabla 19. Análisis acumulativo por tamizado de una arena.
143
Dp, cm
0.4 0.33 0.24 7 0 0.1 0.2
0.1 6 0.3
0.1 0.08 0.06 0.04 0.03 0.02 Colector 2 0.4 0.5 0.6 0.7 0.8 0.9 1.0
Determine la superficie específica de las partículas, sabiendo que:
Aw
6 1.0 d p 0 Dp
Donde: Dp: Diámetro de la partícula : Fracción acumulada : Factor de forma: 1,2 p: Densidad de las partículas: 2.7 g/cm3 Para calcular la superficie específica, utilizando métodos numéricos primero se debe calcular la función f = 1/Dp (tabla 20). En este problema no hay dato para el límite superior de la integral, o sea, para =1.0, por lo tanto el método más adecuado sería el de integración abierta. Se dividirán los datos en tres subintervalos: 1
0.4
0.7
1
0
0
0.4
0.7
f d f f f α4
α3
α3
Tabla 20. Cálculo de f() para el ejemplo 16
i 0 1 2 3 4 5 6 7 8 9 10
Dp 0.47 0.33 0.24 0.16 0.12 0.08 0.06 0.04 0.03 0.02 Colector
0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1.0
f() = 1/Dp 2.128 3.03 4.167 6.25 8.333 12.5 16.667 25 33.3 50 -
144
4h 3h 3h f d 3 2 f f 2 f 2 f f 2 f f 1
1
0
2
3
5
6
8
9
4 0.1 3 0.1 2 3.03 4.167 2 6.25 12.5 16.67 3 2 3 0.1 33.3 50.0 2 18.799
Aw
6 1.2 18.799 50.13 2.7
3.7. Solución de ecuaciones diferenciales ordinarias Una ecuación de la forma:
dy d 2 y dny F x, y, , 2 ,..., n 0 dx dx dx se define como una ecuación diferencial. Debido a que una ecuación diferencial ordinaria de orden n se puede expresar como un sistema de ecuaciones diferenciales de primer orden, definiendo n 1 variables, los métodos numéricos se desarrollan para ecuaciones de primer orden. Los errores involucrados en una solución numérica de ecuación diferencial se clasifican en: error de truncamiento y error de redondeo. El error de truncamiento incluye un error local y un error de propagación. En la selección de un algoritmo de solución de una ecuación diferencial debe tenerse en cuenta la estabilidad. Se dice que una solución es inestable cuando los errores introducidos en alguna etapa de cálculo se propagan sin límite a través de los cálculos subsecuentes. Inestabilidad inherente: Está asociada con la ecuación que se está resolviendo y las condiciones iniciales, pero no depende del método utilizado. Inestabilidad parcial: Depende de la ecuación, las condiciones iniciales y el método. Los algoritmos comunes para resolver una ecuación diferencial ordinaria, con condiciones iniciales específicas, están basadas en las siguientes aproximaciones:
145
1. Directa o indirectamente se usa la expansión de Taylor de la función objetivo yx . 2. Usan fórmulas de integración abiertas o cerradas. La variedad de procedimientos pueden ser clasificados en forma general en dos grupos, los métodos llamados de una etapa y los métodos de múltiples etapas. Los métodos de una etapa permiten el cálculo de y i 1 dada la ecuación diferencial e información en xi solamente, esto es un valor de y i . Los métodos de múltiples etapas requieren además valores y j y/o la derivada en otros valores x j fuera del intervalo de integración en consideración xi , xi 1 .
Una desventaja del método multi-etapa es que requiere información adicional a la que se dispone normalmente, para comenzar el procedimiento. Generalmente solo se conocen condiciones iniciales, pero pueden usarse métodos de una etapa para obtener la información adicional. Otra dificultad del método multi-etapa es que es muy difícil cambiar el tamaño de etapa cuando se está en el desarrollo de los cálculos.
3.7.1. Método de desarrollo de Taylor Un método de aproximación de la solución de primer orden, consiste en expresar la solución y x a partir de un punto inicial x 0 por medio del desarrollo de Taylor. Dada la ecuación diferencial:
dy F x, y , 0 dx o dy f x,y dx La función y(x) puede expresarse alrededor de un punto base (x0, y(x0)) usando la fórmula de Taylor como:
h2 y x y x0 h y x0 hf x0 , y x0 f x0 , y x0 2! h3 f x0 , y x0 ... 3!
146 donde :
f x , y
df x , y d 2 y ; y así sucesivamente para las derivadas superiores 2 dx dx
A partir de la aproximación de Taylor se puede entonces definir el algoritmo para encontrar el valor de la función en xi 1 desde xi , usando como fórmula recursiva:
h2 h n n 1 y xi 1 y xi h y xi hf xi , y xi f xi , y xi ... f xi , y xi 2! n! El error de truncamiento, en este caso, es de orden h valor:
n 1
y está acotado por el
h n1 et M n 1! donde:
M f ( n ) , y
max
en xi , xi1
Ejercicio 3: Resuelva la siguiente ecuación diferencial:
y' x y ,
x0 0
y0 0
x f 0.5
Solución analítica: y e x x 1
dy f x , y dx
f x , y x y
h2 yxi 1 yxi hf xi , yxi f ' xi , yxi 2! d 2 y df x, y dy f ' x, y 2 1 1 x y dx dx dx Si h 0.1 y xi 1 yxi 0.1 f xi , y xi 0.005 f ' xi , y xi Aplicando estas ecuaciones se construye la tabla 21. Tabla 21. Iteraciones del ejercicio 5.
147
k 0 1 2 3 4 5
x 0 0.1 0.2 0.3 0.4 0.5
y 0.0000 0.0050 0.0210 0.0492 0.0909 0.1474
f(x,y) 0.0000 0.1050 0.2210 0.3492 0.4909 -
f'(x,y) 1.0000 1.1050 1.2210 1.3492 1.4909 -
yexacto 0 0.0052 0.0214 0.0499 0.0918 0.1487
Al comparar el valor de la solución exacta con el valor aproximado hallado con el método, no se observa un diferencia significativa.
3.7.2. Método de Euler Cuando en el método de desarrollo de Taylor solo se conservan los dos primeros términos, el método se denomina de Euler. En este caso la solución sigue la línea tangente a y x en x i , y la fórmula recursiva se reduce a:
yxi1 yxi h yxi hf xi , yxi 2
El error de truncamiento cometido por el método es de orden h , (error local).
h2 et f , y 2! donde: xi xi 1
Ejercicio 4: Resuelva el ejercicio 5 por el método de Euler
dy f x , y dx
f x , y x y
yxi1 yxi hf xi , yxi Si h 0.1 y xi 1 y xi 0.1 f xi , y xi Aplicando estas ecuaciones se construye la tabla 22
148 Tabla 22. Iteraciones del ejercicio 6
k 0 1 2 3 4 5
x 0 0.1 0.2 0.3 0.4 0.5
y 0.0000 0.0000 0.0100 0.0310 0.0641 0.1105
f(x,y) 0.0000 0.1000 0.2100 0.3310 0.4641 -
y exacto 0 0.0052 0.0214 0.0499 0.0918 0.1487
En este caso al comparar la solución exacta con la aproximación puede observarse una diferencia significativa entre los valores. 3.7.3. Métodos de Runge-Kutta Como la solución de una ecuación diferencial por medio de la aproximación de Taylor no es práctica porque deben retenerse en el algoritmo las derivadas de orden mayor, es posible desarrollar un procedimiento de una etapa que utilice evaluaciones de la primera derivada y que arroja resultados equivalentes en precisión a las fórmulas de orden mayor de Taylor. Estos algoritmos son llamados métodos de Runge-Kutta. Las aproximaciones de segundo, tercer, y cuarto orden, es decir aproximaciones con precisiones equivalentes a expansiones de Taylor que retienen términos en h 2 , h 3 y h 4 respectivamente, requieren de estimaciones de f x , y en dos, tres y cuatro valores en el intervalo xi , xi 1 . Todos los métodos de Runge-Kutta tienen algoritmos de la forma:
yi 1 yi h xi , yi , h
es llamada la función incremental, que es simplemente una aproximación para f x , y en el intervalo xi , xi 1 . La evaluación de esta función tiene mucha donde
manipulación de ecuaciones algebraicas en el desarrollo de las fórmulas de orden alto. En el algoritmo para la fórmula de Runge-Kutta de orden 3, la función incremental tiene la forma
ak1 bk 2 ck3
149 donde k1 , k 2 , k3 son aproximaciones de la primera derivada en varios puntos en el intervalo de integración xi , xi 1 . En este caso:
k1 f xi , yi
k 2 f xi ph , yi phk1
k3 f xi rh , yi shk 2 r s hk1
Para
determinar
las
constantes
a , b , c , p , r y s se debe expandir
k1 , k 2 y k 3 en series de Taylor. En general:
f x l , y m f x, y l m f x, y y x 1 l m ... n 1! x y
n 1
f x, y
Para hallar los valores de las constantes se pueden tomar arbitrariamente dos valores para dos de ellas y se obtienen las demás, planteando las ecuaciones algebraicas al igualar los respectivos coeficientes de las potencias de h entre la fórmula de Runge-Kutta y la expansión de Taylor del mismo orden. Se han desarrollado varias fórmulas de acuerdo a los parámetros escogidos, siendo las más comunes, la universal y la regla de los tres octavos. La fórmula más utilizada es la universal, en la que los coeficientes toman los siguientes valores:
a =
1 6
b =
p =
1
r = 1
2
2
3
c =
1 6
s = 2
Con estos valores el algoritmo de orden 3 de Runge-Kutta toma la forma:
yi 1 yi k1 = f xi ,yi
h k1 4k2 k3 6
1 1 k 2 = f xi h,yi hk1 2 2 k3 = f xi h,yi 2hk 2 hk1
150
Ejercicio 7: Resuelva el ejercicio 5 por el método de Runge-Kutta de 3er orden
dy f x , y dx
f x , y x y
y xi 1 y xi
h k1 4k 2 k3 6
Si h 0.1 y xi 1 y xi
0.1 k1 4k 2 k3 6
k1 f xi , yi xi yi
1 1 1 1 k2 f xi h , yi hk1 xi h yi hk1 xi yi 0.051 k1 2 2 2 2 k3 f xi h, yi 2hk2 hk1 xi h yi 2hk2 hk1 xi yi 0.11 2k2 k1 Aplicando estas ecuaciones se construye la tabla 23 Tabla 23. Iteraciones del ejercicio 7
k 0 1 2 3 4 5
x 0 0.1 0.2 0.3 0.4 0.5
y 0.0000 0.0052 0.0214 0.0498 0.0918 0.1487
k1 0.0000 0.1052 0.2214 0.3498 0.4918 0.6487
k2 0.0500 0.1604 0.2825 0.4173 0.5664 0.7311
k3 0.1100 0.2267 0.3557 0.4983 0.6559 0.8300
y exacto 0 0.0052 0.0214 0.0499 0.0918 0.1487
Se observa con este método que se obtiene una mejor aproximación de la solución numérica en relación con los métodos anteriores. 3.9. Sistemas de ecuaciones diferenciales ordinarias Para resolver ecuaciones diferenciales ordinarias por métodos numéricos, se reduce el sistema a un sistema de n ecuaciones diferenciales simultáneas de primer orden, redefiniendo las variables que sean necesarias para eliminar las
151 derivadas de orden mayor. Luego al sistema de n ecuaciones diferenciales ordinarias de primer orden se aplica en paralelo el algoritmo seleccionado. Ejercicio 6: Resuelva la siguiente ecuación diferencial:
d2y dy a a2 y p x 1 dx 2 dx Realizando una transformación:
w
dy dx
dw a1w a2 y p x dx dy w f x , y , w dx dw p x a1w a2 y g x , y , w dx
1 2
El algoritmo para una aproximación en xi 1 usando el Método de Runge-Kutta en este ejercicio sería: 1. Evaluar k1
k1 y k1w 2. Evaluar
k2 y
= f xi , yi , wi wi
= g xi , yi , wi p xi a1 wi a 2 yi
k2
h h h =f xi , yi k1 y , wi k1w 2 2 2 h =wi p xi a1wi a2 yi 2
152
k2 w
h h h =g xi , yi k1 y , wi k1w 2 2 2 h h h =p xi a1 wi k1w a2 yi k1 y 2 2 2 h h =p xi a1 wi p xi a1wi a2 yi 2 2 hh h aa2 2yyi i wi p xi a1wi a2 yi 2 22
3. Evaluar
k3 y
k3 = f xi h , yi 2hk 2 y hk1 y , wi 2hk 2 w hk1w
= wi 2hk 2 w hk1w
k3w
= g xi h , yi 2hk 2 y hk1 y , wi 2hk 2 w hk1w = p xi h a1 wi 2hk 2 w hk1w a2 yi 2hk 2 y hk1 y
4. Evaluar
yi 1 wi 1
yi 1 , wi 1 h yi k1 y 4k 2 y k3 y 6 h =wi+ k1w 4k 2 w k3w 6
Ejemplo 17: Un proceso biológico involucra el crecimiento de biomasa a partir de sustrato. El balance de materia en el proceso batch produce:
dB kBS dt K S
dS 0.75kBS dt KS
Donde B y S son las concentraciones respectivas de biomasa y sustrato. La -6 cinética de las reacciones es tal que k = 0.3 y K = 10 en unidades consistentes. Cuáles son las concentraciones de B y S en un tiempo tf = 16, si a t0 = 0 S = 5.0 y B = 0.05.
153
Se va a utilizar el método de Runge-Kutta de 3er orden para resolver este sistema de ecuaciones diferenciales.
kBi Si K Si
kB
=f ti , Bi , Si
kS
=g ti , Bi , Si
0.75kBi Si K Si
1. Evaluar k1
kBi Si K Si
k1B
=f ti , Bi , Si
k1S
=g ti , Bi , Si
2. Evaluar
k2 B
k2 S
0.75kBi Si K Si
k2
h h h =f ti , Bi k1B , Si k1S 2 2 2 h h k Bi k1B Si k1S 2 2 = h K S i k 1S 2 h h h =g ti , Bi k1B , Si k1S 2 2 2 h h 0.75k Bi k1B Si k1S 2 2 =h K S i k 1S 2
3. Evaluar k3
154
k3 B
=f ti h, Bi 2hk2 B hk1B , Si 2hk2 S hk1S =
k3 S
k Bi 2hk2 B hk1B Si 2hk2 S hk1S K Si 2hk2 S hk1S
=g ti h, Bi 2hk2 B hk1B , Si 2hk2 S hk1S =-
0.75k Bi 2hk2 B hk1B Si 2hk2 S hk1S K Si 2hk2 S hk1S
En la tabla 24 se muestran algunos de los cálculos iterativos para h = 1.
Tabla 24. Algunas iteraciones del ejemplo 17
t B S k1B k1S k2B k2S k3B k3S
0 0.050 5.000 0.015 -0.011 0.017 -0.013 0.021 -0.016
1 0.067 4.987 0.020 -0.015 0.023 -0.017 0.028 -0.021
2 0.091 4.969 0.027 -0.020 0.031 -0.024 0.038 -0.028
3 0.123 4.945 0.037 -0.028 0.042 -0.032 0.051 -0.038
12 1.824 3.669 0.547 -0.410 0.629 -0.472 0.761 -0.570
13 2.462 3.191 0.738 -0.554 0.849 -0.637 1.026 -0.770
14 3.322 2.546 0.997 -0.747 1.146 -0.860 1.385 -1.039
15 4.483 1.675 1.345 -1.009 1.547 -1.160 1.869 -1.402
16 6.050 0.500 1.815 -1.361 2.087 -1.565 2.523 -1.892
En la figura 11 se ilustra la variación de la concentración de B y S con el tiempo a partir de los datos obtenidos con las iteraciones en el método de Ruge-Kutta:
8 B Concentración
S 6
4
2
0 0
4
8 Tiempo
12
16
155 Figura 11. Variación de la concentración de B y S con el tiempo
3.10. Ejercicios propuestos 1. Determine los parámetros de Underwood apropiados para realizar los cálculos en una torre de destilación multicomponente que tiene la siguiente distribución (tabla 25) y con una alimentación tal que q = 0.67.
Tabla 25. Distribución del alimento de la torre de destilación del ejercicio propuesto 1.
lk hk
Componente CH4 C2H6 n-C3H8 n-C4H10 n-C5H12 n-C6H14
j 53.2 14.94 6.30 2.405 1.0 0.456
ZjF 0.03 0.07 0.15 0.33 0.30 0.12
La ecuación de Underwood es:
J z jF 1 q j
2. Use el método de Newton para hallar un cero complejo de la siguiente función: f(z) = z4 – 2z3 + 1.25z2 – 0.25z – 0.75. Tome como punto de partida z = 1+i 3. Una reacción química toma lugar en una serie de cuatro reactores CSTR. Allí se convierte el reactivo A en el producto B (relación estequiométrica 1 a 1), la reacción es elemental y la constante de velocidad es k = 0.1 h-1. Si el caudal alimentado es q = 100 ft3/h y la concentración de A a la entrada del primer reactor es CA,0 = 3 lb/ft3, calcule la concentración a la salida de cada reactor, teniendo en cuenta que el volumen en cada uno de ellos es V1 = 20 ft3, V2 = 30 ft3, V3 = 50 ft3 y V4 = 40 ft3, y que un 10% de la corriente de salida del reactor 4 se recircula al reactor 3 y otro 10% al reactor 2. Tenga en cuenta que el sistema está en estado estable, las reacciones son en fase líquida y se despreciarán los cambios en volumen o densidad del líquido. Para la solución utilice los métodos de Gauss-Siedel y Jacobi
156
4. Un reactor químico de flujo continuo operando como un sistema en estado estable se puede describir por el siguiente conjunto de ecuaciones:
FxA FA r FxB FB r F FA FB r
r 60 x A xB
0.6
Resuelva el conjunto de ecuaciones asumiendo FA = 10 y FB = 20. Utilice el método de Newton-Raphson. 5. La concentración de saturación del oxígeno disuelto en agua en función de la temperatura para una concentración de cloruro de 20 mg/l se muestra en la tabla 26. Tabla 26. Concentración de saturación de oxígeno disuelto a diferentes temperaturas
Temperatura, ºC 5 10 15 20 25 30
Concentración de saturación 10.5 9.2 8.2 7.4 6.7 6.1
Determine: a) Nivel de oxígeno disuelto a 28ºC, utilizando el método de aproximación de puntos base igualmente espaciados b) La función de aproximación con el método de mínimos cuadrados 6. En la tabla 27 se presentan los datos de composición del líquido versus la presión total para el sistema benceno (1) y ácido acético (2) a 50ºC. Tabla 27. Presión de vapor para el sistema benceno – ácido acético en función de la composición a 50ºC x1 P, mmHg
0.0 57.52
0.0069 58.20
0.1565 126.00
0.3396 175.30
0.4666 189.50
0.6004 224.30
0.7021 236.00
Halle la presión total de la mezcla para una composición de benceno de 0.5. Utilice el método de Gregory-Newton y el método de Lagrange.
157
7. Determine la pendiente de la curva de presión de vapor de agua a 35, 45 y 55 ºF. En la tabla 28 se tabulan los valores de la presión de vapor de agua contra la temperatura. Realice la aproximación con diferencias finitas.
Tabla 28. Presión de vapor del agua a diferentes temperaturas
T, ºF
35
40
Pv, psi 0.09995
45
50
55
0.12170 0.14752 0.17811 0.2141
60
65
0.2563
0.3056
8. Use los datos de la tabla 29 para hallar la capacidad calórica media del npropano a 1500, 1300 y 1100 K. Esta se define por la ecuación que se presenta a continuación. Para la solución utilice la regla trapezoidal y la de Simpson y como temperatura de referencia asuma 300 K: T
C p dT
Cp
Tref
T Tref
Tabla 29. Capacidad calórica del n-propano a diferentes temperaturas
Temperatura, K 300 400 500 600 700 800 900 1000 1100 1200 1300 1400 1500
Capacidad calórica, kJ/kgK 73.93 94.01 112.59 128.59 142.67 154.77 163.35 174.60 182.67 189.74 195.85 201.21 205.89
9. Un material radiactivo se descompone de acuerdo a la siguiente reacción en serie:
158 k1 k2 A B C
Donde k1 y k2 son las constantes de velocidad de reacción y B y C son los productos intermedio y final, respectivamente. Los valores de las constantes son: k 1 = 3 s-1 y k2 = 1 s-1. Las condiciones iniciales de las concentraciones son: CA(0) = 1 mol/m3, CB(0) = 0 y CC(0) = 0. Determine las concentraciones de CA, CB y CC como una función del tiempo por el método: a) Taylor b) Euler c) Runge-Kutta
3.11. Bibliografía Alkis Constantinides and Mostoufi Navid, “Numerical Methods for Chemical Engineers with MATLAB Applicatons”, Prentice Hall, New Jersey, 1999 Carnahan, B., Luther, H.A., Wilkes, J.O., "Applied numerical methods", Wiley, New York, 1970. Cutlip, M.B., Shacham, M., “Problem solving in Chemical Engineering with numerical methods”, Prentice Hall, Upper Saddle River, USA, 2000. Gerald, C.F., Whealtley P.O., “Análisis numérico con aplicaciones”, 2nd Edición, Pearson Educación, México, 2000 Mickley, H.S., Sherwood, T.S., Reed, C.E., "Applied Mathematics in Chemical Engineering". McGraw, New Delhi, 1975. Press, W.H., Flannery, B.P., Teukolsky, S.A.., Vetterling. W.T.,"Numerical recipesthe art of scientific computing", Cambridge University Press, Cambridge, 1986. Smith, C., Pike, R., Murril, P., "Formulación and optimización of mathematical models", International texbook Company, Scranton,1970. Zurmühl, Rudolf, “Numerical Analysis for Engineers and Physicists”, Springer International, student Edition, New York, 1976. Luthe, L., Olivene, A., Schutz, F., “Métodos Numéricos”, Editorial Limusa, México, 1984.
160
CAPÍTULO IV OPTIMIZACIÓN TABLA DE CONTENIDO
4.1. Organización del problema de optimización ..................................................162 4.2. Métodos de optimización de funciones univariables .....................................166 4.2.1. Método analítico de funciones no restringidas ........................................166 4.2.2. Método analítico de funciones restringidas ............................................167 4.2.3. Métodos numéricos de funciones no restringidas ...................................168 4.2.3.1. Método de la etapa fija ....................................................................169 4.2.3.2. Método directo con aceleración .......................................................175 4.2.3.3. Método de Fibonacci .......................................................................179 4.2.3.4. Método de la sección de oro ............................................................182 4.2.4. Método numérico de funciones restringidas ..........................................184 4.3. Métodos de optimización de funciones multivariables ...................................191 4.3.1. Método analítico de funciones no restringidas ........................................191 4.3.2. Métodos analíticos de funciones restringidas .........................................196 4.3.2.1. Restricciones de igualdad................................................................197 4.3.2.1.1. Método de substitución directa ..................................................197 4.3.2.1.2. Método de la variación restringida .............................................206 4.3.2.2. Restricciones de igualdad y desigualdad .........................................213 4.3.2.2.1. Método de los multiplicadores de Lagrange ..............................213 4.3.2.2.2. Método de los multiplicadores de Lagrange y variables de holgura ................................................................................................223 4.3.3. Métodos numéricos de funciones no restringidas ...................................225 4.3.3.1. Método del poliedro flexible .............................................................225 4.3.3.2. Método del gradiente .......................................................................231 4.3.3.3. Método de las tangentes paralelas ..................................................234 4.3.3.4. Método de Newton ..........................................................................239 4.3.3.5. Método de Davidon-Fletcher-Powell ................................................239 4.3.3.6. Método de Fletcher-Reeves ............................................................241 4.3.4. Métodos numéricos de optimización de funciones restringidas ..............242 4.4. Ejercicios propuestos ...................................................................................243 4.5. Bibliografía ...................................................................................................246
161
CAPITULO IV. OPTIMIZACIÓN En el diseño y mejoramiento de plantas químicas y unidades de procesos se tienen múltiples posibilidades y algunas veces hasta infinitas. A esta multiplicidad se enfrenta el ingeniero químico desde de las primeras etapas del diseño cuando debe seleccionar el proceso o tipo de unidad de transformación que va a diseñar. Esta selección, así como la especificación plena de condiciones de operación y dimensionamiento de los equipos, se hace normalmente optimizando en términos de algún criterio efectivo. La optimización en las industrias de procesos químicos requiere, además de la selección del proceso, la selección del equipo y las condiciones de operación apropiadas para la producción de un material determinado, de tal modo que el beneficio sea máximo. Este beneficio puede interpretarse como la producción máxima de una sustancia o como la inversión mínima para un nivel de producción específica. En el caso en que el criterio sea la máxima producción del material o sustancia, puede omitirse el balance económico y el óptimo obtenido se denomina operacional. La necesidad del óptimo operacional puede surgir en el momento en que ya se dispone del equipo. Por ejemplo, en la operación de un reactor catalítico, puede existir una temperatura óptima de operación para cada tamaño de reactor, que puede ser basada en el máximo porcentaje de conversión o en la máxima cantidad de producto por unidad de tiempo. Sin embargo, las variables de costo necesitan ser consideradas en la práctica y el desarrollo de un óptimo operacional es generalmente una etapa en la determinación de un óptimo económico sometido a consideraciones de costo o ganancias. Aunque puede suceder que el óptimo económico no resulte ser el diseño final recomendado, ya que consideraciones de costos incrementales pueden mostrar que el retorno sobre la inversión adicional puede llegar a ser inaceptable antes de que se alcance el punto óptimo. En estos casos los valores óptimos pueden usarse como una base en el análisis de costos incrementales para hacer la selección y especificación del diseño final. La optimización en el campo de la industria química puede dividirse en dos campos: optimización estática y optimización dinámica. El objetivo de la optimización estática es el establecimiento de las condiciones estacionarias de operación del proceso más apropiadas. Estas condiciones pueden estar ligadas a parámetros de los equipos o condiciones de operación como tamaño de equipos, nivel de producción, temperaturas, presión, caudales, etc.; mientras que el establecimiento del mejor procedimiento para corregir fluctuaciones de las condiciones de operación del proceso de sus valores nominales establecidos en la optimización estática es el objetivo central de la optimización dinámica. Esta optimización es una extensión del análisis del control automático del proceso y
162 requiere por lo tanto de un conocimiento de las características dinámicas del proceso. La optimización puede ser tratada de muchos modos que van desde procedimientos analíticos sencillos o sofisticados y métodos numéricos, hasta herramientas que se vienen desarrollando en el ámbito de la inteligencia artificial como los algoritmos genéticos. Las técnicas convencionales de optimización se pueden clasificar en métodos analíticos, métodos numéricos, métodos gráficos; para los cuales se requiere del conocimiento de la función a optimizar, y los métodos experimentales en los que se desconoce la forma de esta función. En los métodos analíticos, que hacen uso del cálculo diferencial y el cálculo variacional como herramientas, el problema de optimización debe describirse en términos matemáticos de tal forma que la función y las variables se puedan manipular mediante reglas conocidas. Los métodos numéricos, que se usan cuando el problema no se puede resolver analíticamente o cuando el cálculo requerido en el modelo analítico es prohibitivo, generan aproximaciones sucesivas del óptimo mediante procedimientos iterativos usando información sobre la función objetivo y otros criterios en ciertas condiciones. Los métodos gráficos, que tienen aplicación limitada para una o dos variables, se valen de la representación gráfica de la función objetivo para obtener por inspección los valores extremos de la función objetivo. Y en los métodos experimentales el óptimo se busca realizando experimentos directamente sobre el sistema o proceso.
4.1. Organización del problema de optimización Un procedimiento general para optimizar involucra la mayoría de las siguientes etapas: i. Definición de un objetivo apropiado. El objetivo resume el problema real y debe ser expresado en términos de maximizar o minimizar una función a la que se le da el nombre de función objetivo. ii. Restricciones impuestas al problema por agentes externos. En la práctica casi todos los procesos reales tienen restricciones impuestas por agentes externos que no pueden ser controladas por el optimizador.
163 Ejemplos:
La producción tiene un límite que lo determina el mercado o la dirección de la empresa. La calidad está controlada por especificaciones legales o por especificaciones de la compañía o el consumidor. La materia prima está limitada a ciertas calidades. Las pérdidas de calor y la temperatura de enfriamiento de agua están parcialmente gobernadas por las fluctuaciones diarias del clima. iii. Selección del sistema o sistemas para estudio. Pueden existir varios sistemas que satisfagan una misma necesidad y la especificación o selección de uno de ellos se convierte en una restricción para el proceso de optimización. Un recipiente para almacenar un líquido, por ejemplo, puede tener formas diversas: esférica, cilíndrica, cónica, irregular, etc. La producción de una sustancia química puede hacerse mediante procesos diferentes. iv. Examen de la estructura del sistema y de las entradas y salidas. Es conveniente representar esquemáticamente el sistema bajo estudio para identificar los componentes y sus relaciones, así como las entradas y salidas; ya que esta representación facilita el análisis del sistema y muy especialmente la identificación y visualización de las relaciones que proveen información para la formulación de la función objetivo. Para efecto de la formulación de las ecuaciones del modelo matemático que expresa el problema de optimización, es necesario asociar variables de caracterización – variables que informan sobre atributos como flujo, composición, temperatura, presión - a cada una de las corrientes de entrada, de salida, y de las que conectan elementos internos del sistema. Debe contemplarse también en esta etapa del proceso de optimización el conocimiento del comportamiento del sistema bajo estudio, pues sólo ese conocimiento posibilitará la construcción de un modelo matemático y por lo tanto la formulación del problema de optimización. v. Construcción de un modelo para el sistema. La construcción del modelo matemático del sistema, representado por el conjunto de ecuaciones que relacionan las variables del sistema, permite no sólo definir la función objetivo en términos de las variables del sistema, sino también algunas restricciones para los valores de estas variables.
164 vi. Estudio y definición de las restricciones internas del sistema. Además de las restricciones externas pueden surgir otras restricciones impuestas al conjunto de variables del sistema. Estas restricciones, impuestas por criterios de diseño o por el comportamiento del sistema, limitan a ciertos dominios los valores de las variables y se expresan como igualdades o desigualdades matemáticas que deben cumplirse. Como parte de este conjunto de restricciones se encuentran las ecuaciones básicas del modelo matemático del sistema, que son establecidas por los principios de conservación de masa, de momento, energía, o por las expresiones de rata de flujo de estas entidades u otras relaciones entre las variables del sistema.
g J g J x1 , x2 ,...xn 0
g k g k x1 , x2 ,...xn 0
vii. Reducción del problema a sus partes esenciales. El problema de optimización constituido por una función objetivo y el conjunto de restricciones, puede simplificarse en algunos casos, para facilitar su manipulación en el proceso de solución. Esta simplificación puede lograrse de varias formas.
Eliminación de aquellas variables que no afecten significativamente la función objetivo. Realizar la optimización por etapas, dividiendo el problema de optimización en varios problemas con menores variables. Transformación de la función y las restricciones en relaciones matemáticas más sencillas. Un caso especial lo constituye la linealización, o sea aproximación de todas las funciones en ecuaciones lineales. viii. Verificación de que el sistema propuesto representa el sistema bajo estudio. ix. Formulación de la función objetivo en términos de las variables del sistema. x. Optimización Se encuentra la solución óptima mediante alguna técnica de optimización. xi. Análisis de la solución óptima. Como resultado del desarrollo de este procedimiento, el problema de optimización quedará definido como:
1. Maximizar o minimizar la función objetivo: f X
165 2. Sujeto a:
2.1 Restricciones de igualdad: hi X 0 , i=1,2,...,m
2.2 Restricciones de desigualdad: g i X 0 , i=m+1,...,p
gi X 0 Ejemplo 1: 1. Definición del objetivo. Maximizar el volumen de una caja sin tapa, que se desea construir con una lamina de área total A. 2. Restricciones externas. El área lateral de la caja no debe exceder el área de la lámina disponible. 3. Elección del sistema. Caja rectangular. 4.Examen de la estructura del sistema (ver figura 1).
Figura 1. Representación de una caja abierta 5. Construcción del modelo.
V x1 x2 x3 A 2 x1 x3 2 x1 x2 x2 x3 6. Restricciones internas.
g1 x1 , x2 , x3 x1 0
g 2 x1 , x2 ,.x3 x2 0 g 3 x1 , x2 , x3 x3 0
7. Reducción del problema a sus partes esenciales. No es posible en este caso eliminar variables.
166
8. Verificar que el sistema propuesto representa el sistema estudiado. Las relaciones que describen el sistema son las apropiadas. 9. Formular la función objetivo
f x1 , x2 , x3 x1 x2 x3 El problema de optimización se formulará como: Maximizar
f x1 , x2 , x3 x1 x2 x3
h1 x1 , x2 , x3 2 x1 x3 2 x1 x2 x2 x3 AL 0 g1 x1 , x2 , x3 x1 0
Sujeto a:
g 2 x1 , x2 , x3 x2 0 g 3 x1 , x2 , x3 x3 0
4.2. Métodos de optimización de funciones univariables 4.2.1. Método analítico de funciones no restringidas Para la existencia de un punto extremo en una función univariable se requiere que se cumplan dos tipos de condiciones: condiciones necesarias y condiciones suficientes. Si la función es continua y derivable en el intervalo a
y
dy df ( x) dx dx
ii. La primera derivada sea nula.
y
df x dx
x0
0
Condiciones suficientes: i. Si y´´( x0 )<0 la función tiene un máximo local en x0 .
167 ii. Si y´´( x0 )>0 la función tiene un mínimo local en x0 . iii. Si y´´( x0 )=0 deben analizarse las derivadas de orden superior para determinar la naturaleza del punto extremo. Este análisis se puede realizar haciendo una expansión en una serie de Taylor cerca al valor x0 de la función: 2 n x x0 x x0 y x y x0 x x0 y x0 y x0 ...
2!
Si
y( x0 ) y( x0 ) y( n) ( x0 ) 0 ,
n!
pero y
( n 1)
y n x0 Rn
( x0 ) 0 :
La función tiene un máximo local en x0 si n es impar y y(n+1)( x0 )<0. La función tiene un mínimo local en x0 si n es impar y y(n+1)( x0 )>0. La función tiene un punto de inflexión en x0 si n es par.
4.2.2. Método analítico de funciones restringidas La técnica de optimización para este tipo de problema es análoga al caso de funciones no restringidas, sólo que deben chequearse las restricciones para la solución que se obtenga. Específicamente, si la restricción es una restricción de igualdad, el óptimo se obtiene comparando los valores de la función objetivo en las raíces de la función restricción. Si existen restricciones de desigualdad, se obtienen los valores extremos de la función (máximos ó mínimos) y se comparan con el valor de la función objetivo evaluado en la frontera establecida por el dominio factible de la variable independiente. El dominio factible es el conjunto de factores de la variable independiente que satisface las restricciones.
Ejercicio 1: Maximizar
x5 5 x 4 35 x3 y 25 x 2 24 x 4 5 2 3
Sujeto a:
x 2 (4 1)2 0
- 4.1 x 4.1
Dominio factible
La primera y la segunda derivada de la función objetivo son respectivamente:
168
y (x 1)(x 2)(x 3)(x 4) y (x 1)(x 2)(2x 7) (x 3)(x 4)(2x 3) Chequeando los puntos estacionarios de la función se obtiene (ver tabla 1): Tabla 1. Puntos estacionarios del ejercicio 1.
x
y
y
y
1 2 3 4 -4.1 4.1
4.37 3.73 4.10 3.47 -2264.8 3.50
0 0 0 0
-6 2 -2 6
Tipo Max Min Max Min
El máximo global cae en x =1.0
4.2.3. Métodos numéricos de funciones no restringidas Los métodos numéricos se aplican cuando no se cumplen las condiciones para utilizar los métodos analíticos o es muy engorrosa la aplicación del método para determinar los valores extremos de la función objetivo. Estos métodos esencialmente requieren la determinación del valor de la función objetivo y algunas veces su gradiente en localizaciones sucesivas. En síntesis, la búsqueda de un óptimo mediante métodos numéricos envuelve el cálculo sucesivo de valores de la función objetivo y su comparación con un valor actual. Las dos características esenciales de estos métodos es la escogencia de la dirección y magnitud del desplazamiento en la búsqueda desde un punto actual. La investigación del óptimo puede llevarse a cabo por métodos preplaneados y secuenciales. En la primera técnica se eligen los puntos de investigación sin ninguna interacción entre ellos; mientras que en los métodos secuenciales la localización del próximo punto de investigación depende del resultado previo. El procedimiento general de los métodos secuenciales es el siguiente: i. Seleccionar un punto base. ii. Evaluar la función objetivo en el punto base iii. Escoger de acuerdo al método una segunda localización factible. iv. Evaluar la función objetivo en la segunda localización. v. Comparar el valor de la función en el punto base y la segunda localización.
169 vi. Se prosigue la búsqueda en otra dirección si la función en el punto base es peor que en la segunda localización, de acuerdo con el objetivo de optimización, o se toma como punto base la segunda localización en el caso contrario. De acuerdo con las características del método secuencial, este se puede clasificarse en: métodos de investigación directa y métodos del gradiente. Los métodos de investigación directa requieren únicamente la evaluación de la función objetivo en una localización particular. La selección de la dirección y magnitud del movimiento puede ser independiente o no de los resultados pasados. Si se utiliza esta información para decidir sobre la dirección y magnitud del movimiento, los métodos se pueden clasificar en: métodos uniformes y métodos acelerados, dependiendo si el desplazamiento tiene una magnitud uniforme o es variable. Los métodos del gradiente requieren valores tanto de la función objetivo como del gradiente en una localización. Estos métodos se dividen en dos subgrupos:
Métodos que siguen la dirección del gradiente tan cerca como sea posible, con desplazamiento acelerado o uniforme. Métodos que usan la dirección del gradiente como guía para la investigación, pero no necesariamente en la dirección del gradiente, también con desplazamiento acelerado o uniforme. Los métodos más comúnmente usados son el método de la etapa fija, método directo con aceleración, método de Fibonacci y método de la sección de oro.
4.2.3.1. Método de la etapa fija Este es un método de investigación directa uniforme. A partir de un punto base, en el intervalo factible, y mediante desplazamientos de tamaño fijo, se evalúa la función en el punto base y en la nueva localización. De la comparación de estos dos valores, se continúa en un nuevo desplazamiento o se obtiene un subintervalo de incertidumbre. Si en el desplazamiento k-ésimo hubo cambio en la tendencia de la función objetivo decreciente-creciente, o creciente-decreciente, según se esté minimizando o maximizando, el intervalo de incertidumbre se establece como:
xk 2 , xk Si se cumple la precisión requerida definida como:
f xk f xk 1 el valor del óptimo se ubica en xk 1
170
x* xk 1 Si la precisión requerida no se cumple, se continúa la búsqueda en el intervalo de incertidumbre xk 2 , xk , redefiniendo el tamaño del desplazamiento. El tamaño del desplazamiento en cada intervalo de incertidumbre se define como:
S
x N x0 N
donde N es el número de subintervalos en que se divide el intervalo de incertidumbre y x0 y xN sus limites: x0 , xN . En la figura 2 se muestran los puntos en una búsqueda de un máximo. Nota: En caso que en el primer desplazamiento no se observe el comportamiento de la función esperado, creciente o decreciente según se esté maximizando o minimizando, se cambia de dirección para la búsqueda. El nuevo punto se ubica con la siguiente ecuación:
x1 x0 S
f(x)
... xo
S S
xk-2 xk-1 xk
... xN
Figura 2. Puntos de búsqueda de un máximo por medio del método de la etapa fija Ejercicio 2: Hallar el mínimo de
171
f x x 100
2
Tomar como intervalo de incertidumbre 80 x 120 y 4 En la tabla 2 se presentan las búsquedas hechas con el método de la etapa fija. Tabla 2. Búsqueda del óptimo con el método de la etapa fija
Etapa
xi
f ( xi 1)
f ( xi )
1 2 3 4 5 6
84 88 92 96 100 104
400 256 144 64 16 0
256 144 64 16 0 16
f ( xi ) f ( xi 1) S 144 112 80 48 16 16
4 4 4 4 4 4
Ya que no se cumple que la precisión requerida ( f xk f xk 1 ), se cambia de intervalo y redefine el desplazamiento, pues hubo cambio en la tendencia de la función Nuevo intervalo: [96,104
S
104 96 2 . En la tabla 3 se muestran las nuevas etapas de búsqueda del 4
óptimo. Tabla 3. Nueva búsqueda del óptimo por el método de la etapa fija
Etapa
xi
f ( xi 1)
f ( xi )
1 2 3
98 100 102
16 4 0
4 0 4
Tomando
f ( xi ) f ( xi 1) S 12 4 4
2 2 2
x =100.
Ejemplo 2: Se desea saber cuál es el espesor de aislamiento óptimo-económico para un tanque de almacenamiento. El costo se puede dividir en dos categorías: a) costo instalado (CI) y b) costo de operación (CO). El costo de aislamiento instalado
172 ($/año) es C1C2Ax. También se debe instalar un serpentín de calentamiento para mantener el aceite en el tanque con la viscosidad apropiada, y su costo de instalación es:
C3C4
Q U t s to
donde:
Q
At o t a x 1 1 k ha ho
Los costos de operación del tanque ($/año) son C5C6Q. Halle el costo mínimo y el aislamiento requerido para el caso en que: A = 8000, t0 = 120, ta = 40, ts = 250, k
= 0.024, C1 = 4, C2 = 0.2, C3 = 0.8, C4 = 0.262, C5 = 1.5*10-6, C6 = 4000, h0 = 15 + 60x + 10x2, ha = 4.0 - 10x, U = 17. CI CO CT C1 C2 C3 C4 C5 C6 A ha ho k Q U ta to ts x
: Costo instalado, $/año : Costo de operación, $/año : Costos totales, $/año : Costo del material aislante, $/(ft2 superficie)(ft espesor) : Costo de amortización, 1/año : Costo de calentamiento superficial, $/ft2 : Costo de amortización, 1/año : Costo de vapor, $/BTU : Horas de operación por año, h/año : Área de aislamiento, ft2 : Coeficiente de transferencia de calor, de la pared del tanque al aire, BTU/h(ft2)(ºF) : Coeficiente de transferencia de calor, del aceite a la pared del tanque, BTU/h(ft2)(ºF) : Conductividad térmica de aislamiento, BTU/h(ft)(ºF) : Pérdida calor, BTU/h : Coeficiente de transferencia de calor entre el serpentín y el producto, 2 BTU/h(ft )(ºF) : Temperatura ambiente, ºF : Temperatura del producto, ºF : Temperatura del serpentin, ºF : Espesor de aislamiento, ft
A continuación se hallará la función objetivo:
CT CI CO
CI C1C2 Ax C3C4
Q U t s t0
173
Q
At o t a
h0 15 60 x 10 x 2
h 4 10 x
a x 1 1 k ha ho $ 1 $ 1 QBTU / h CI 4 2 0.2 8000 ft 2 xft 0.8 2 0.262 ft ft año ft año 17 BTU 250 120 º F hft 2 º F $ 6400 x 9.48 105 Q año 2 8000 ft 120 40 º F Q xft 1 1 BTU BTU BTU 0.024 15 60 x 10 x 2 2 4 10 x 2 hft º F hft º F hft º F 640000 BTU Q 1 1 h 41.67 x 4 10 x 15 60 x 10 x 2
C 0 C5 C 6 Q
$ h BTU 4000 Q BTU año h $ CO 6 103 Q año
CO 1.5 106
CT 6400 x 9.48 105 Q 6 103 Q
6400 x 9.48 105 6 103 Q
Después de sustituir Q, se obtienen los costos totales anuales en función del espesor del aislamiento. Función objetivo: CT 6400 x
3900.672 1 1 41.67 x 4 10 x 15 60 x 10 x 2
La solución se hallará por el método de la etapa fija: Tomando como intervalo de incertidumbre 0 x 0.2 y 2 Si N 10 S
0.2 0 0.02 10
174
En la tabla 4 se presentan las iteraciones para la búsqueda del espesor óptimo económico del aislante. Tabla 4. Iteraciones para la búsqueda del óptimo del ejemplo 2.
Etapa
xi
CT ( xi 1)
CT ( xi )
S
1 2 3 4 5 6 7 8
0.000 0.020 0.040 0.060 0.080 0.100 0.120 0.140
-7588.23 12317.9 3495.67 2204.39 1753.63 1567.25 1497.72 1490.04
12317.9 3495.67 2204.39 1753.63 1567.25 1497.72 1490.04 1519.03
19906.1 8822.2 1291.3 450.76 186.38 69.531 7.6796 28.9919
0.020 0.020 0.020 0.020 0.020 0.020 0.020 0.020
Se cambia de intervalo y redefine el desplazamiento, pues hubo cambio en la tendencia de la función objetivo. Nuevo intervalo: [0.100, 0.140]
S
0.140 0.100 5
En la tabla 5 se muestran las nuevas iteraciones. Tabla 5. Nuevas iteraciones para la búsqueda del óptimo del ejemplo 2.
Etapa
xi
CT ( xi 1)
CT ( xi )
1 2 3 4 5
0.092 0.100 0.108 0.116 0.124
1546.45 1516.02 1497.72 1489.03 1488.07
1516.02 1497.72 1489.03 1488.07 1493.44
f ( xi ) f ( xi 1) 30.429 18.301 8.6936 0.9549 5.36987
S 0.008 0.008 0.008 0.008 0.008
Tomando 2 , se obtiene el espesor óptimo: x 0.116 ft , lo cual hace que los costos totales sean mínimos e iguales a 1488.07 $/año
175 4.2.3.2. Método directo con aceleración Como su nombre lo indica este es un método directo, en donde el desplazamiento es acelerado. En este método la función se evalúa en la secuencia:
x0 , x0 S , x1 2S , x2 4S ,...xk xk 1 2k 1 S donde xk es el primer valor en que falla la tendencia de la función. Es decir, si se está buscando un máximo:
y0 < y1 < y2 ...
Si y x0 y x1 ó y x0 y x1 , en el caso de maximización o minimización, la búsqueda debe realizarse en la dirección contraria con: x1 x0 S .
f(x) d 2k 1 S d 2k 2 S 2
xk-2
xk-1
xk
Figura 3. Búsqueda de un máximo por el método directo con aceleración
El máximo se puede localizar de varias maneras:
Aproximando los tres últimos puntos a un polinomio de segundo grado, por ejemplo, con el método de Gregory-Newton:
176
y 0 1 x xk 2 11 x xk 2 x xk 1 donde:
0 yk 2 y( xk 2 )
1
yk 1 yk 2 f xk 1 , xk 2 xk 1 xk 2
11 f xk , xk 1 , xk 2
yk 2
yk 1
xk 2 xk 1 xk 2 xk xk 1 xk 2 xk 1 xk
yk
xk xk 2 xk xk 1
El óptimo se localiza en:
x
1 ( xk 2 xk 1 ) 1 2 2 11
Realizando una búsqueda adicional en xk 1 .
xk 1 x k 1
d 2
donde:
d xk xk 1
El óptimo se localiza con las siguientes fórmulas: o Si y(xk+1) < y(xk-1), para un máximo y si y(xk+1) > y(xk-1), para un mínimo
x xk 1
d yk 1 yk 2 4 yk 1 2 yk 1 yk 2
o Si y(xk+1) > y(xk-1), para un máximo y si y(xk+1) < y(xk-1), para un mínimo
x xk 1
d yk yk 1 4 yk 2 yk 1 yk 1
177
Ejercicio 3: Hallar el mínimo de f ( x) ( x 100)2 . Sugerencia: partir de x0 = 66 y usar un desplazamiento original S = 3. En la tabla 6 se muestran los resultados de las iteraciones. Tabla 6. Iteraciones en la búsqueda del mínimo del ejercicio 3.
Etapa
xk
f ( xk 1)
f ( xk )
1 2 3 4 5
69 75 87 111 159
1156 961 625 169 121
961 625 169 121 3481
f ( xi ) f ( xi 1) d 195 336 456 48
3 6 12 24
El intervalo de incertidumbre es [87,159. Repitiendo el proceso (tabla 7)
Tabla 7. Nuevas iteraciones en la búsqueda del mínimo del ejercicio 3.
Etapa
xk
f ( xk 1)
f ( xk )
f ( xi ) f ( xi 1)
d
1 2 3
90 96 108
169 100 16
100 16 64
69 84 48
3 6 12
El mínimo puede calcularse con la aproximación de segundo grado:
0 f ( xk 2 ) 100
16 100 14 96 90 f ( xk 2 ) f ( xk 1 ) 11 f xk , xk 1 , xk 2 ( xk 2 xk 1 )( xk 2 xk ) ( xk 1 x k 2 )( xk 1 xk )
1 f x k 1 , xk 2
f ( xk ) ( xk xk 2 )( xk xk 1 )
100 16 64 1 0 (90 96)(90 108) (96 90)(96 108) (108 96)(108 90)
178
1 xk 2 xk 1 1 2 2 11
x*
1 14 90 96 2 2 * x 100
x*
El mínimo también puede estimarse, realizando el experimento o búsqueda en xk 1 . d xk 1 xk 1 2 12 xk 1 96 2 xk 1 102
y ( xk 1 ) 4 Como y( xk 1 ) y( xk 1 ) , (4<16) , entonces
x xk 1
d yk yk 1 4 yk 2 yk 1 yk 1
12 64 16 4 64 2 4 16 48 x* 102 3 72 * x 102 2
x* 102
x* 100 Ejemplo 3: Resuelva el ejemplo 2 por el método directo con aceleración. Se parte de x0 0.095 y desplazamiento original de 0.005. En la tabla 8 se muestran las iteraciones. Tabla 8. Iteraciones en la búsqueda del mínimo del ejemplo 3.
Etapa
xi
CT ( xi 1)
CT ( xi )
f ( xi ) f ( xi 1)
S
1 2 3 4
0.100 0.110 0.130 0.170
1507.89 1497.72 1488.12 1500.95
1497.72 1488.12 1500.95 1604.1
10.1691 9.59601 12.8303 103.151
0.005 0.010 0.020 0.040
179 El intervalo de incertidumbre es [0.110, 0.170]. Repitiendo el proceso(tabla 9): Tabla 9. Nuevas iteraciones en la búsqueda del mínimo del ejemplo 3.
Etapa
xi
CT ( xi 1)
CT ( xi )
f ( xi ) f ( xi 1)
S
1 2 3
0.115 0.125 0.145
1488.12 1487.82 1494.5
1487.82 1494.5 1530.32
0.30446 6.68064 35.816
0.005 0.010 0.020
El mínimo puede calcularse con la aproximación de segundo grado:
0 1487.819, 1 668.064, 11 4957426.6 x* 0.120
CT 1490
Realizando una búsqueda adicional:
d 0.02 xk 1 0.135
CT xk 1 1509.2
Como 1509.2 > 1494.5, entonces se aplica la fórmula:
x xk 1
d yk 1 yk 2 4 yk 1 2 yk 1 yk 2
x* 0.11167 CT 1487.7 Finalmente, se escoge este último como el valor mínimo.
4.2.3.3. Método de Fibonacci Es un método de aproximación secuencial que usa como mínimas dos investigaciones por ciclo para eliminar una región de posteriores búsquedas. Es análogo a los métodos anteriores con un tamaño de etapa variable, en donde el intervalo de incertidumbre se disminuye en cada etapa e igualmente el desplazamiento para la localización del óptimo y están relacionados con los números de la serie de Fibonacci. El método exige predeterminar el número de investigaciones del óptimo que se van a realizar. En cada subintervalo de incertidumbre los puntos se localizan a una misma distancia de los extremos (ver figura 4).
180
Lj lj
lj
A
D
C
E lj+1
lj+1
Región que se descarta
B
Lj+1
Figura 4. Representación de las etapas a seguir con el método de Fibonacci En la figura 4 puede observarse que AC DB y CD EB . La variable independiente se ubica en AB , y por ejemplo, en una búsqueda j cualquiera, en C y D se encuentran los valores a investigar en la función, y de esta manera se decide cuál se rechaza y cuál se conserva para la siguiente búsqueda. En el gráfico se descarta la región AC . En el ejemplo 4 se ilustra esta situación. Para satisfacer el requerimiento de equidistancia de los extremos de los puntos de investigación del óptimo, se debe cumplir la relación:
lj
FN ( j 1) FN ( j 1)
Lj
donde N es el número de investigaciones predeterminadas. La serie de Fibonacci es la solución de la siguiente ecuación diferencia.
Fj Fj 1 Fj 2 , Fo F1 1, cuya solución es: 1 1 5 Fj 5 2
j 1
1 5 2
j 1
,
j0
En el primer intervalo de incertidumbre, las investigaciones se localizan a una distacia l1 de los extremos:
l1
FN 2 L1 FN
En los intervalos siguientes sólo se requiere de una investigación por cada etapa, porque se conserva un punto de la etapa anterior, como puede confirmarse en la
181 figura 4 con el punto D. Después de realizar m experimentos de los N predeterminados, la longitud del intervalo de incertidumbre está dada por:
Lm
FN ( m1) FN
L1
La región fraccional de incertidumbre o efectividad, definida como la fracción con respecto al intervalo de incertidumbre a la que se reduce el intervalo después de realizar las N investigaciones, está dada por:
E
LN 1 L1 FN
La última investigación se lleva a cabo en el centro del intervalo LN 1:
l N 1
Fo L LN 1 N 1 F2 2
Ejemplo 4: Resuelva el ejemplo 2 por el método de Fibonacci. Si se define una efectividad de 0.01, se puede determinar FN y por lo tanto N:
FN
Fj
1
1 100 0.01
1 1 5 5 2
j 1
1 5 2
j 1
,
j 0,
para j = 10, F10 = 89 y para j = 11, F11 = 144. Se decide trabajar con N=10 En la tabla 10 se presentan los resultados de las iteraciones. El espesor óptimo es de 0.112 ft para un costo total mínimo de 1487.64 $/año. Como puede observarse en la tabla 10 se realizaron 10 búsquedas, dos en el intervalo inicial y una en cada etapa siguiente; aunque debe aclararse que realmente son nueve búsquedas, pues la última coincide con la que se conserva de la etapa anterior. Tabla 10. Iteraciones en la búsqueda del mínimo del ejemplo 4.
Etapa 0
Lk
lk
x
CT
Intervalo 0.000 0.200
182
1 2 3 4 5 6 7 8 9
0.200 0.124 0.076 0.047 0.029 0.018 0.011 0.007 0.004
0.076 0.047 0.029 0.018 0.011 0.007 0.004 0.002 0.002
0.076 0.124 0.106 0.094 0.106 0.112 0.110 0.112 0.112
0.124 0.153 0.124 0.106 0.112 0.117 0.112 0.115 0.112
1589.72 1493.04 1490.73 1509.43 1490.73 1487.64 1488.09 1487.64 1487.64
1493.04 1550.50 1493.04 1490.73 1487.64 1488.36 1487.64 1487.75 1487.64
0.076 0.076 0.076 0.094 0.106 0.106 0.110 0.110 0.112
0.200 0.153 0.124 0.124 0.124 0.117 0.117 0.115 0.112
4.2.3.4. Método de la sección de oro Este método es una modificación del método de Fibonacci. Se ha observado que para grandes valores de j:
Fj 2 Fj
0.382 , por lo tanto,
lJ 0.382L j , cuando N>5. Este método exige que las últimas cinco investigaciones se hagan mediante el método de Fibonacci. El método se utiliza cuando no se conoce el número de investigaciones que se van a realizar, o no se sabe el límite de seguridad deseado. Por el contrario el método de Fibonacci permite el cálculo del número de investigaciones a partir de la relación de la seguridad deseada. La región fraccional de incertidumbre después de realizar N experimentos está dada por:
(0.618) N 1 Ejercicio 4: Localizar el mínimo de la función representada por: y (x 30)2
Tomar como intervalo de incertidumbre inicial presentan los resultados.
0 x 100 . En la tabla 11 se
Tabla 11. Iteraciones en la búsqueda del mínimo del ejercicio 4.
183
Etapa 0 1 2 3 4 5 6 7 8
Lk
lk
y( x )
x
Intervalo 0 x 100
100 38.2 38.2, 61.8 67.2, 1011 61.8 23.61 23.61, 38.2 40.8, 67.2 38.2 14.59 14.59, 23.61 237.5, 40.8 23.61 9.0 23.61, 29.2 40.8, 0.6 14.59 5.57 29.2, 32.63 0.6, 6.9 9.02 3.45 27.06, 29.2 8.6, 0.6 5.57 2.13 29.2, 30.5 0.6, 0.3 3.44 1.3 30.5, 31.33 0.3, 1.8
0 x 618 . 0 x 38.2 14.59 x 38.2
23.61 x 38.2 23.61 x 32.6 27.06 x 32.6
2919 . x 32.6 2919 . x 3133 .
Hasta este punto la región fraccional de incertidumbre es 0.618 0.034 7
Se continúa con el método de Fibonacci a partir de la novena etapa (ver tabla 12).
l1
F3 3 * L1 * 214 . 08025 . . F5 8
Tabla 12. Últimas etapas en la búsqueda del mínimo del ejercicio 4.
Etapa 0 1 2 3 4
Lk
lk
2.14 0.8025 1.33 0.532 0.8 0.2666 0.53 0.265
x
y( x )
29.98, 30.52 29.72, 29.98 29.98, 30.25 29.98, 29.98
4x10-4, 0.27 0.078, 4x10-4 4x10-4, 0.0625 4x10-4, 2x10-4
Intervalo 2919 . x 3133 .
2919 . x 3052 . 29.72 x 3052 . 29.72 x 30.25
29.98 x 30.25
El óptimo se localiza en x* 29.985 con y( x* ) 2 104 . El número total de etapas fue 12, lo que sería equivalente a trabajar con el método de Fibonacci para N = 13. Ejemplo 5: Resuelva el ejemplo 2 por el método de la sección de oro. Se va a tomar como intervalo de incertidumbre inicial 0 x 0.2 . En la tabla 13 se presentan las iteraciones. Tabla 13. Iteraciones en la búsqueda del mínimo del ejemplo 5.
Etapa
Lk
lk
x
CT
Intervalo
184
0 1 2 3 4 5
0.200 0.124 0.076 0.047 0.029
0.076 0.047 0.029 0.018 0.011
0.076 0.124 0.106 0.094 0.106
0.124 0.153 0.124 0.106 0.112
1589.75 1493.05 1490.76 1509.30 1490.77
1493.04 1550.44 1493.05 1490.77 1487.64
0.000 0.076 0.076 0.076 0.094 0.106
0.200 0.200 0.153 0.124 0.124 0.124
Se hacen las últimas búsquedas con el método de Fibonacci (tabla 14):
Tabla 14. Últimas iteraciones en la búsqueda del mínimo del ejemplo 5.
Etapa 0 1 2 3 4
Lk
lk
0.018 0.011 0.007 0.005
0.007 0.005 0.002 0.002
x 0.112 0.110 0.112 0.112
CT 0.117 0.112 0.115 0.112
1487.65 1488.10 1487.65 1487.65
1488.36 1487.65 1487.74 1487.65
Intervalo 0.106 0.124 0.106 0.117 0.110 0.117 0.110 0.115 0.110 0.112
La región fracciónal de incertidumbre en este caso se ha reducido a 2.3% , el cual puede considerarse un valor aceptable. El espesor óptimo es de 0.112 ft para un costo total mínimo de 1487.65$/año.
4.2.4. Método numérico de funciones restringidas Muchas funciones solamente toman valores en valores discretos de la variable independiente. Caso de estas funciones se obtienen con procesos reales donde, la variable independiente es el diámetro de la tubería, el espesor de los materiales de aislamiento, el número de unidades en una batería de unidades de proceso: reactores, evaporadores, etc. En los problemas con estas restricciones no son directamente aplicables los métodos precedentes. Estos problemas pueden ser resueltos utilizando modificaciones de los métodos anteriores. Por ejemplo, el método de Fibonacci puede aplicarse con algunas adaptaciones.
Caso 1:
Si la función discreta está definida en K puntos y se cumple que:
K 1 FN
185 Donde FN: Número de la serie de Fibonacci Para esta aplicación no es necesario que los valores de la variable independiente estén igualmente espaciados, pero si se requiere que estén ordenados de alguna forma. Una vez estén ordenados, creciente o decrecientemente, es necesario rotular los valores con números desde 1 hasta K, de tal manera que cada uno quede identificado por un entero k, donde:
1 k K Con esta asociación de la posición definida, para cada valor de la variable independiente la búsqueda del óptimo siempre corresponderá a un número entero, que no es el valor de la variable sino que indica la posición de la variable en el orden preestablecido. Se define entonces que el intervalo inicial para la búsqueda está dado por:
L1 K 1 y los dos primeros experimentos se realizan en k l1 y k K 1 l1 , donde: F F l1 N 2 L1 N 2 ( K 1) FN 2 FN ( K 1) En general:
lj
FN ( j 1) FN
L1 FN ( j 1)
Caso 2:
Si K+1 no es un número de la serie de Fibonacci, se agregan puntos ficticios en los extremos hasta obtener un número de la serie de Fibonacci, o sea que: FN F K 1
Donde F es el número de puntos ficticios agregados en los extremos. Se recomienda que estos puntos se distribuyan en los dos extremos; y si debe realizarse una búsqueda en un punto ficticio se pasa la búsqueda al punto real más cercano. El intervalo de incertidumbre inicial, para los dos casos se define como [0,FN] y en la etapa j, [kI,kS] siendo kI el límite inferior y kS el superior. Estos valores dependen de que región se descarta y cual se conserva, de acuerdo con el objetivo de optimización.
186
Las posiciones en el ordenamiento donde debe evaluarse la función objetivo en la etapa j serán: k1 = kI + lj y k2 = kS-lj Si el mejor valor de la función objetivo, mínimo o máximo, se ubica en el valor k 1, se descartan los valores mayores que k2 y se conservan para el nuevo intervalo de incertidumbre todos los valores de k menores que k 2. En el caso en que el mejor valor de la función se ubique en el valor k 2, se descartan los valores menores que k1. Ejemplo 6: Se desea bombear 1000 lb/h de glicerina a 15°C desde un tanque de almacenamiento que está al nivel del piso, hasta otro situado a una altura de 35 ft. La longitud total de la tubería es de 75 ft e incluye cuatro codos de 90°. Determine el diámetro más apropiado de la tubería para la planta considerando solamente los costos de tubería instalada y los costos de bombeo. El costo de tubería de 1 in de diámetro es X $/ft de longitud, y para determinar el costo de cualquier tubería se puede utilizar la relación:
CD2
CD1
D2
D1
CD: Costo de la tubería de diámetro D
Los tamaños estándares de la tubería pulgadas pueden ser tomados como 1, 1¼, 1½, 2, 2 ½, 3, 4, 5, 6 y 8, los costos de electricidad Y $/kwh. Una representación del sistema se muestra en la figura 5.
187
H2
35 ft
H1 1ft Figura 5. Representación del sistema de bombeo del ejemplo 6.
CTotal CB CT
CB: Costos de bombeo
CT: Costos de tubería
CB Q HtY
H: Cabeza del sistema
g
H hD hS
hD: Cabeza total de descarga hS: Cabeza total de succión
hD hSD hPD h fD
hSD: Cabeza estática de descarga hPD: Cabeza superficial de descarga hfD: Cabeza fricción de descarga hSS: Cabeza estática de succión hPS: Cabeza superficial de succión hfS: Cabeza fricción de succión
hS hSS hPS h fS
hSD 35 H 2
t: Tiempo
hPD 0 A la cabeza de fricción de descarga contribuyen los 74 ft de tubería (1), los cuatro codos de 90º (2) y el agrandamiento súbito al final de la línea de descarga, pero este último es despreciable.
h fD h fD1 h fD 2
L V 2 64 L V 2 h fD1 4 f D 2 g Re D 2 g
188
g lb lb 79.01 800 cp 2.42 1936 cm3 ft 3 fth m ft g 9.8 2 4.1731108 s h lb 1 lb ft 3 Q 1000 12.673 h 79.01 ft 3 h
1.264
V
Q 4Q 4 12.673 16.136 A D2 D2 D2
Re
DV
0.6577 D
16.136 64 D 74 2.2464 103 h fD1 0.6577 D D 4 2 4.1731108 D4 2
Aunque la solución de este problema se buscará en régimen laminar, se usarán valores de longitudes equivalentes de tubería para régimen turbulento como una aproximación. En la tabla 15 se presentan las longitudes equivalentes (Le) de tubería recta para codos estándares de 90º para flujo turbulento. Tabla 15. Longitudes equivalentes para codos de 90º1. Diámetro nominal (in) Longitud equivalente (ft)2 Diámetro interno (ft)
1
1¼
1½
2
1.6
2.1
2.4
3.1
0.087
0.115
0.134
0.172
2½
3
4
5
6
8
3.6
4.4
5.9
7.3
8.9
12
0.206
0.256
0.336
0.421
0.505
0.673
Realizando una regresión del diámetro interno (ft) frente a la longitud equivalente (ft) y haciéndola pasar por el origen, se obtiene el mejor ajuste para una línea recta cuya ecuación es Le 17.658D
h fD 2
2 64 D Le D 16.136 0.00214 4 4 8 D3 0.6577 D D 2 4.173110
2.2464 103 0.00214 h fD D4 D3 2.2464 103 0.00214 hD 35 H 2 D4 D3 1 2
Syska R. And Birk J., “Pump engineering manual”, The Duriron Company, 1976 Radio corto
189
hSS H1
hPS 0 A la cabeza de fricción de succión contribuyen 1 ft de tubería y pérdidas por la entrada a la tubería, pero esta última se va a despreciar.
16.136 64 D 1 3.0357 105 h fS 0.6577 D D 4 2 4.1731108 D4 2
3.0357 105 hS H1 D4 H 35 H 2
2.2464 103 0.00214 3.0357 105 H 1 D4 D3 D4
Suponiendo que H1 = H2
H 35
2.216 103 0.00214 D4 D3
3 ft 3 0.3048 h 5 m Q 12.673 9.97 10 h ft 3 3600s s 3
100 cm m g kg g 9.8 2 1.264 3 s cm 1000 g m3 3
3
N 12387.2 3 m
t 8000h Y 151$ / kW
CB Q HtY 9.97 105 8000
m3 N 2.216 103 0.00214 0.3048m 12387.2 3 35 ft 4 3 s m D D 1 ft
h $ 1kW Ws 151 año kWh 1000W Nm
15917
1.008 0.973 D4 D3
El costo de tubería de 1 in de diámetro nominal en acero inoxidable 304 sch 40 es 18900 $/m.
190
DL CT CD1 D1 T L: Longitud total de tubería, ft T: Vida útil del sistema, año Para la longitud de tubería del sistema y 10 años de vida útil:
$ 0.3048m Dft 12in 1 75 ft m 1 ft 1in 1 ft 10año 518465D
CT 18900
Sumando los costos de tubería y costos de bombeo se obtiene la función objetivo:
CTotal 15917
1.008 0.973 518465D D4 D3
D[=] ft, diámetro nominal CT[=] $ El diámetro óptimo se encuentra entre uno de los siguientes valores de diámetro nominal en pulgadas: 1, 1¼, 1½, 2, 2 ½, 3, 4, 5, 6 y 8. En estos casos el método más apropiado para realizar la optimización es el numérico de funciones restringidas, tal como el de Fibonacci modificado, en donde la variable toma valores discretos. Siguiendo el método tenemos que: K = 10, K+1 = 11 Como K+1 no coincide con un número de Fibonacci, entonces corresponde al caso 2, y debe buscarse un F tal que: FN F K 1
De allí se encuentra F = 2 y F6 = 13 En la tabla 16 se muestra la distribución de la variable independiente D, frente a la nueva variable independiente k. Como puede observarse, los valores ficticios de k se distribuyen en los extremos del intervalo de D. Uno se adicionó a la izquierda, por ello el primer valor del diámetro no está asociado al valor de k = 1, y el otro se adicionó al otro extremo. Queda el intervalo inicial [0, FN] = [0, 13]
191 Tabla 16 Variables independientes para el ejemplo 6
k D(in)
0
1
2 3 1 1¼
4 1½
5 2
6 2½
7 3
8 4
9 5
10 6
11 8
12
13
En la tabla 17 se muestran los resultados de las iteraciones, Tabla 17. Iteraciones en la búsqueda del mínimo del ejemplo 6.
Etapa 0 1 2 3 4 5
Lj
lj
13 8 5 3 2
5 3 2 1 1
k 5 3 2 3 3
CTotales 8 5 3 4 3
1.038x105 1.888x105 0.79356x105 1.038x105 0.8171x105 0.79356x105 0.79356x105 0.8535x105 0.79356x105 0.79356x105
Intervalo 0 13 0 8 0 5 2 5 2 4
El diámetro óptimo para el sistema de bombeo es 1¼ in. El número de Reynolds para este diámetro es 6.34 el cual es menor de 2100, confirmando la suposición de régimen laminar en el sistema.
4.3. Métodos de optimización de funciones multivariables 4.3.1. Método analítico de funciones no restringidas Análogamente a las funciones univariables, para la existencia de un punto extremo es necesario que se cumplan dos tipos de condiciones: si f ( x1 , x2 , ... , xn ) f ( X ) es la función objetivo, las condiciones necesarias y suficientes son:
Condiciones necesarias:
i. f ( X ) diferenciable en X * ii. f X * 0
Condiciones suficientes:
f ( X ) sea dos veces diferenciable en X * i. Para un máximo, que:
192
Di 0 ; i=1,3,5,... (impar) Di 0 ; i=2,4,6,... (par) ii. Para un mínimo, que:
Di 0 ; i=1,2,3,4,... Donde: Di es el determinante menor de la matriz hessiana definido como:
f x1x1 f x x Di 2 1 f xi x1 donde:
f
x x j i
f x1x2 f x2 x2
f xi x2
;
2 f X*
segunda derivada evaluada en X *
x x j
f x1xi f x2 xi f xi xi
i
Si no se cumple ninguno de los dos grupos de condiciones suficientes, el valor estacionario puede no ser una condición óptima. En el caso en que todos los Di sean ceros deben chequearse las derivadas de orden superior a dos. En los otros casos el punto estacionario es un punto silla. Las condiciones necesarias y suficientes para un punto óptimo de una función pueden analizarse en la expansión de Taylor para la función. La expansión de Taylor para una función puede expresarse como:
2 y 3 y k y y ( X ) y ( X ) y ... Rk 1 2! 3! k! ó 2 f 3 f k f f ( X ) f ( X ) f ... Rk 1 2! 3! k! donde: f x1 x
1
f x1 x 2
f X x1
2 1
x2 x2
2 f X x12
f X
x2 x2
x2
2
... xn xn
2 f X x2 2
f X* xn
... xn xn
2
2 f X* xn 2
193 2 x1 x
x
* 1
2
2 x1 x
* 1
x
* 2
x
n
xn
*
2 f X* x1 x2
2 x1 x
2 f X* x1xn
* 1
x
3
x
* 3
2 f X* x1 x3
... 2 xn1 xn 1 xn xn *
*
...
2 f X*
x
xn
n 1
En general:
k f
k! k f ( X ) * p1 * pn ( x1 x1 ) ... ( xn xn ) p1 ! p2 !... pn ! x1 p1 x2 p2 ... xn pn
donde la sumatoria se hace sobre todos los enteros positivos mayores o iguales a cero, tal que: n
p
i
k
i 1
Por ejemplo para n=2 y 2 f k=2, los enteros resultantes son:
p1 = 0 y p2 = 2, p1 =1 y p2 = 1, p1 = 2 y p2 = 0 2 f
( x1 x1* )2
2 * 2! p p f (X ) ( x1 x1* ) 1 ( x2 x2* ) 2 p1 p2 p1 ! p2 ! x1 x2
2 * 2 f (X *) 2 f (X *) * * f (X ) * 2 2( x x )( x x ) ( x x ) 1 1 2 2 2 2 x12 x1 x2 x22
Para que la función f ( X ) tenga un óptimo en un punto estacionario se requiere: i. Para un máximo: 2 f 0 ii. Para un mínimo : 2 f 0 Si no se cumplen las condiciones anteriores deben analizarse los signos de los de orden superior junto con la función en términos de la serie de Taylor, o sea :
* 2 f 3 f k f f ( X ) f ( X ) f ... 2! 3! k! Ejercicio 5: Encuentre el punto estacionario de la función
2 2 2 f ( X ) x1 x2 x3 2 x1x3 x2 x3 4 x1
194
y diga si es un máximo o un mínimo.
f X x1
f X x2
f X x3
2 x1 2 x3 4 2 x2 x3
2 x1 x2 2 x3
Haciendo f ( X * ) 0 , se obtiene:
2 x1 2 x3 4 0 2 x2 x3 0 2 x1 x2 2 x3 0 Resolviendo el sistema de ecuaciones lineales se tiene:
x1 10 x2 4 x3 8 Evaluando los determinantes menores de la matriz hessiana:
D f 1 x1x1 fx x D2 1 1 fx x 2 1 fx x 11 D fx x 3 2 1 fx x 31
f f f
x x 11 x x 2 1 x x 31
fx x 1 2 fx x 2 2 fx x 1 2 fx x 2 2 fx x 3 2
fx x 1 3 fx x 2 3 fx x 3 3
2
f
0
f
2
f
x x 1 2
x x 2 2
x x 3 2
0 2 1
f
x x 1 3
2
1 x x 2 3 f 2 x x 3 3
f
195
D 2 1 2
D 2 0
0
2
4
-2
0
-2
D 0 -2 -1 2 3 -2 -1 2
El punto estacionario no es ni máximo ni mínimo, es un punto silla. Ejemplo 7: Un fabricante puede producir un cierto ítem A por 20 pesos/lb y un ítem B por 10 pesos/lb. El equipo de mercadeo de la empresa cree que la compañía puede vender 2’000.000/x2y lb/dia de A y 2’000.000/xy2 lb/día de B, donde x es el precio de venta de A, en pesos/lb y y es el precio de venta de B, en pesos/lb. Cuáles son los valores de x y y para obtener el máximo beneficio? El beneficio obtenido se puede expresar a través de la siguiente función objetivo:
f X
2'000.000 x 20 2'000.2000 y 10 2 x y xy
x Siendo X y Utilizando el método analítico de funciones no restringidas, se puede optimizar f X para hallar los valores de x y y que hacen máxima la función.
Se debe cumplir la condición necesaria:
f ( X * ) 0 , es decir: f * x 0 f ( X ) f 0 y
f X 2 10 40 y 2 2 2 y 10 0 x x y x 6
(1)
196
f X 2 10 2 2 y x y
6
20 x 2 x 20 0 y
(2)
Resolviendo el sistema de ecuaciones formado por (1) y(2), se obtiene:
x * 30 y y * 15 Con estos valores, se puede confirmar la otra condición necesaria, de que es diferenciable en X x .
f X*
Para la existencia de un máximo debe cumplirse que
Di 0 ; i=1,3,5,... (impar) Di 0 ; i=2,4,6,... (par).
Di
f x 1x 1 f x 2 x1 :
f x1x 2 ..... f x 2 x 2 ..... :
f x1xi f x 2 xi :
f xix1
f xix 2 .....
f xixi
2 f 2 10 2 2 2 x x y
6
2 f ( X *) f
x x j i
x x
j i
120 y 4 y 20 x 2 x x f xx 6.584
2 f 2 106 60 x 4 x 40 f 26.337 yy y 2 x 2 y 2 y 2 y y
40 20 x 2 y 2 6 f 2 10 40 20 2 2 2 yx x y x y 2 f 2 106 2 2 xy x y
f f
xy yx
6.584 6.584
D1 6.584 0 D2
6.584 6.584 130.05 0 6.584 26.337
Se confirma que los valores de x = 30 y y = 15, generan el máximo beneficio.
4.3.2. Métodos analíticos de funciones restringidas
197 4.3.2.1. Restricciones de igualdad 4.3.2.1.1. Método de substitución directa Si existen m restricciones de igualdad lineales, el método consiste en eliminar m de las n variables y resolver el problema por el método de funciones no-restringidas con (n - m) variables. Ejercicio 6: Encontrar el mínimo de la función:
f X 4 x12 5x22
sujeto a
2x1 3x2 6 .
De la restricción se obtiene que:
x1
6 3x2 2
al sustituir x1 en la función objetivo se obtiene:
f1 x2 14 x22 36 x2 36
f1 x2 28 x2 36 x2 36 1.286 28 D1 f1x2 x2 28 x2
x1 1.071
El mínimo es:
f X 12.857
f X * 4 1.071 5 1.286 2
2
*
El método de substitución directa es recomendable cuando las variables pueden despejarse fácilmente para substituirlas. Este método debe usarse preferencialmente cuando las restricciones son lineales. Ejercicio 7: Maximizar y x1 3x2 5x32 x1 x22 3x3 10 Sujeto a
198 Eliminando
x1 10 x22 3x3
f x2 , x3 y1 10 x22 3x3 3x2 5x32 10 x22 3x2 5x32 3x3
Condiciones necesarias:
y1 2 x2 3 0 x2 y1 10x3 3 0 x3
x2 x3
3 2 3 10 2
3 3 x1 10 3 8.65 2 10 Condiciones suficientes:
D1 f x 2 x 2 f x2 x2 f x2 x3
D2
2 y1 2 x22
2 y1 0 x3x2
f x3 x3
2 y1 10 x32
f x3 x2
f x3 x3
D1
2 0 20 0 10
8.65 X 3 / 2 3 /10 *
f x2 x3
2 y1 0 x2 x3
f x3 x2
D2
f x2 x2
es un máximo
199
y 8.65 3(3 / 2) 5(3 /10) 2 y* 12.7 Ejemplo 8: Se dispone de la materia prima A en una solución saturada de 0.2 gmol/l, a partir de la cual se puede producir D mediante la reacción: AD cuya velocidad de reacción puede aproximarse a:
-rA = k1CA donde:
k1 = 0.004 min-1 CA [=] gmol/l Determine el grado de conversión necesaria y el tamaño del reactor de tanque agitado para un proceso constituido por un reactor y una unidad de destilación para la recuperación del reactivo, para producir 50 gmol/min de D, si el costo del reactor es 3000+1500V pesos y el de la columna 20000+5000Q pesos, donde:
V: Volumen del reactor, l Q: Flujo volumétrico en el sistema, l/min Los costos de operación anual del reactor y de la columna de destilación pueden asumirse proporcionales al flujo e iguales a $10000/(l/min)(año). El valor del producto D es 60 $/gmol y el de A en solución 20 $/gmol. Para el análisis del sistema considere que se opera 350 días al año y se tiene un horizonte económico de vida útil igual a 10 años. También asuma que la recuperación del reactivo en la unidad de destilación es completa, que no se recircula en el sistema y que tiene el mismo precio de la solución materia prima. En la figura 6 se muestra el esquema del problema planteado. Modelo matemático del sistema:
CD = 50 gmolmin-1
CA0 = 0.2 gmolmin-1 CD = 0
200
Figura 6. Esquema del problema 8 1. Volumen de control: Reactor - Reactor CSTR - Sistema isotérmico - Flujo volumétrico constante Principio de conservación de masa: QCA0 k1CAV QCA k1CAV QCD
(i) (ii)
2. Volumen de control: Unidad de destilación
gmol (iii) min Modelo matemático del problema de optimización: QCD 50
Tiempo de análisis: Objetivo a optimizar:
1 año de operación costos totales anuales
Costos totales anuales = costos operación anual + costo anual materia prima + costo anual del reactor (inversión) + costo anual de la torre (inversión) En la función del costo se asume que no se carga al sistema costos financieros del capital invertido en el reactor y en la unidad de destilación.
201 Costo de operación anual = 10000Q Se tiene sólo en cuenta la materia prima que reacciona, porque la otra se recupera en el proceso. Costo materia prima (A) = 50
gmol ( A) 60 min 24h 350d $ 20 5.04 108 min h d año gmol ( A)
Costo de capital por el reactor (anual) = 3000 1500V
1 300 150V 10
Costo de capital por unidad de destilación (anual) =
1 2000 500Q 10 El consumo de materia prima por minuto se obtiene a partir del modelo matemático del sistema.
20000 5000Q
Consumo de materia prima por minuto = QCA0 QCA k1CAV Función objetivo:
CTA 10000Q 5.04 108 300 150V 2000 500Q Restricciones: QCA0 k1CAV QCA
(1) (2) (3)
k1CAV QCD
QCD 50
Utilizando el método de la sustitución directa: (3) en (1): k1C AV 50 V
50 k1C A
(2) en (3): QC A0 QC A 50 Q
50 C A0 C A
Sustituyendo V y Q en términos de CA en la función objetivo:
50 50 50 8 CTA 10000 2000 500 5.04 10 300 150 k1C A C A0 C A C A0 C A
202
5.25 105 7500 CTA 5.04002 10 C A0 C A 0.004C A 8
5.25 105 1.875 106 CTA 5.04002 10 C A0 C A CA 8
dCTA 5.25 105 1.875 106 dC A 0.2 C A 2 C A2 dCTA 2 0 5.25 105 CA2 1.875 106 0.2 CA dCA
C A 2 3.57 0.2 C A
2
C A 1.889 0.2 C A 2.889C A 0.3778 C A 0.1308
V
50 95638.87l 0.004 0.1307
Q
50 l 721.5 0.2 0.1307 min
6 5 d 2CTA 2 5.25 10 1 2 1.875 10 3 dC A2 C A3 0.2 CA
d 2CTA 1.05 106 3.75 106 0 dC A2 0.2 C A 3 C A3 Porcentaje de conversión:
x A 100
C A0 C A 34.6% C A0
Ejemplo 9:
203 Se convierte un reactante A en un producto B, en una batería de N reactores continuos de tanque agitado, cuyo volumen total es V ft3. Si el caudal de alimentación es q ft3/min y la concentración de A a la entrada es CA,0 , demuéstrese que la producción máxima de B se obtiene cuando todos los tanques son del mismo tamaño. Puede considerarse que la reacción es de primer orden y que la batería opera isotérmicamente, además puede tomarse densidad constante para cualquier reactor. Objetivo: Maximizar la producción de B o minimizar la concentración de A a la salida del sistema Sistema para estudio: En la figura 7 se muestra el esquema de una batería de reactores.
q CA,0
q CA,1
q CA,n-1
V1
V2
1
2
q CA,N
Vn n
Figura 7. Esquema de una batería de reactores
Formulación del modelo matemático del sistema: De un balance de A en el reactor n, se obtiene:
qCA,n 1 kCA,nVn qCA,n definiendo:
VN N
204 n
Vn
q
1 k n CA , n CA , n 1 0 1 CA , n CA , n 1 0 1 k n 1 Si: An 1 k n CA,n An CA,n 1 0
1
La ecuación (1) es una ecuación diferencia con coeficientes variables cuya solución es: n
C A,n C A,0 At t 1
C A,n C A,0 A1 A2 .... An 1 1 1 C A,n C A,0 .... 1 k1 1 k 2 1 k n
2
Para una batería de N reactores cuyo volumen total es constante, se tiene que: N N V t i q t 1 i 1
donde V: es el volumen total de los reactores.
N
V i i 1 N
= n n=1
De la ecuación (2) se obtiene que la concentración de salida de A, de la cascada, está dada por
205
1 1 1 C A, N C A,0 .... 1 k1 1 k 2 1 k N N 1 C A, N C A,0 t 1 1 k t V como: 1 2 .... N q
N
V N 1 t q t 1
Función objetivo:
C A, N
Solución: Todas las derivadas (
C A, N 1
N 1
i 1
i
) deben ser iguales a cero.
N 1 N 1 -kCA,0 1 k 1 C A,0 + 2 N 1 N 1 1 k i i 1 1 k i 1 k V 1 k1 1 k V i i 1 i q q i 1 i 1
C A, N 0 1
1
1 k
V 1 k i q i 1
C A, N i
N 1
C A,0
N 1
kC A,0 V N 1 1 k i q i 1 kC A,0
2
1
1 k i 1
V N 1 1 k i 1 k1 q i 1
i
N 1
1
1 k i 1
i
206
1 V 1 k i q i 1 N 1
1 1 k1
V N 1 1 k i 1 k1 q i 1 1 k N 1 k1 N 1 De la derivada con respecto a n se obtiene:
N n
VN Vn VN Vn q q
O sea que el volumen del reactor N es igual al volumen de cualquier reactor de la batería; lo que implica que todos los reactores tienen el mismo tamaño.
4.3.2.1.2. Método de la variación restringida En el método de la substitución directa el procedimiento está constituido por una primera etapa de substitución y una posterior de diferenciación, y el óptimo no se empieza a buscar hasta tanto no se hayan eliminado las m variables de la función objetivo. En el método de la variación restringida el orden del procedimiento se invierte. Condiciones necesarias: La condición necesaria para la existencia de un óptimo en este método, asumiendo continuas la función objetivo, las restricciones y sus primeras derivadas, junto con la existencia de las segundas derivadas, es:
f ( X ), g1 , g2 , .... gm Jk 0 xk , x1 , x2 .... xm para k=m+1,m+2,...,n donde:
207
f x k g1 f ( X ), g1 , g2 , .... gm Jk x k
xk , x1 , x2 .... xm
:
gm x k
f x1 g1 x1 :
gm x1
f f ...... x2 xm g1 g1 ...... x2 xm :
:
gm gm ...... x2 xm
g: restricciones de igualdad n: númerode variables m: número de restricciones de igualdad La condición necesaria constituida por (n-m) ecuaciones y las m ecuaciones de igualdad conforman un sistema de n ecuaciones con n incógnitas. Condiciones suficientes: La condición suficiente está dada por el signo de 2 f en la expansión de Taylor de la función después de eliminar m variables.
f ( X ) f ( X *)
n f j m 1 x j
n n 2f h 1 j 2! j m 1 k m 1 x j xk g
h h ..... j k g
En esta expresión h j ( x j x*j ) . La notación g se interpreta como que los xi con i=1,2,...,m toman los valores que satisfacen las restricciones. La condición se define como: i. Para un mínimo 2 f
n n 2f i m 1 j m 1 xi x j
h h 0 i j g
ii. Para un máximo 2 f
donde:
n n 2f i m 1 j m 1 xi x j
h h 0 i j g
208
1.
2f m f 2x s x x x xi x j g s 1 s x i j m 2f s 1 xs x j
2.
m m 2 x x f s r s 1 r 1 x x x x r s x i g j g g
x m 2 s f xi s 1 xs xi x g
x s x j x
2f xi x j g
x
g1, g2 ,....., gm J x x , x ,..... x , x , x ,...., x p 1 i p 1 m 1 2 p x g1, g2 ,....., gm i J g x1, x2 ,....., xm
En el jacobiano del numerador se reemplaza la variable xp por xi
3.
2x p x x i j
g
g , g ,....g , g ,....,g l 1 l 1 m J 1 2 x , x ,.... x , x ,...., x 1 2 m p 1 p 1 m (1) p l dl i, j g , g ,....., g l 1 m J 1 2 x , x ,....., x m 1 2
En el jacobiano del numerador se eliminan la función gl y la variable xp.
4.
d l
i, j
m m 2g l x p 1 s 1 p xs
x
x xp s x x j g i g
m x p 2 g l p 1 x j x p xi g
x 2g l p x x x x i g p j
para: m 1 i n, m 1 j n Como condición suficiente puede aplicarse también: i. Para un máximo, que Dit 0
; i=1,3,5,.... (impar)
2g l x x x i j
x
209 Dit 0
; i=2,4,6,.... (par)
ii. Para un mínimo, que Dit 0
donde:
D it
f 0x m 1 xm 1 f 0x m 2 xm 1 : 0 f x m i xm 1
f 0x ...... m 1 xm 2 f 0x ...... m 2 xm 2 : 0 f x ...... m i xm 2
f 0x m 1 xm i f 0x m 2 xm i : 0 f x m i xm i
2 f f 0x x i j x x i jg Ejercicio 8:
y x12 4 x22 4 x1
Minimizar Sujeto a:
2 x2 x1 12
A) Solución por el método de substitución directa:
Eliminando
x2
x1 12 2 2
x 12 y1 x 4 1 4 x1 2 y1 2 x12 20 x1 144 2 1
Condición necesaria:
dy1 4 x1 20 0 dx1
x1* 5
x2* 7 / 2
210
Condición suficiente:
d 2 y1 2 0 dx1 x *1 d 2 y1 2 4 0 dx1 5 X* 7 / 2
y* 94
B) Solución por el método de la variación restringida: y f ( x1 , x2 ) x 21 4 x 2 2 4 x1 g ( x1 , x2 ) 2 x2 x1 12 0
Condiciones necesarias: i. Tanto la función objetivo como la restricción son continuas y sus primeras y segundas derivadas existen. ii.
f ( X ), g1 0 J2 x2 , x1 f f x x1 8 x2 J2 2 g1 g1 2 x2 x1 8x2 4 x1 8 0
2 x2 x1 12 0 x1 5
x2 7 / 2 Condiciones suficientes:
n = 2, m = 1 y k =2 2 x1 4 1
(1) (2)
211
2y D1 f 0 x2 x2 2 x2 g
i =2 y j = 2
2 2 2 2 2 2x 1 y x1 2 y x1 y y y x 2 x2 2 x 2 x x x 1 2 2 g x2 x 2 g 1 x2 x2 g x1 x 2 g 2 1 y 2 x1 4 x 1 x2
2y 2 2 x1 x2
2y 0 x1 x2
x1 J ( g1 / x2 ) 2 J ( g1 / x1 ) x2 g
2 x1 2 0 x2 g
y 8 x2 x 2 x1
2y 2 8 x2 x1
, pues g ( X ) es lineal. 1
D1 (2 x1 4)(0) 2(2) 2 2(0)(2) 8 D1 16
5 Como D1 0 entonces X * es un mínimo 7 / 2 Ejercicio 9: Encontrar un óptimo para f ( X ) 4 x12 5x22 g1 ( X ) 2 x1 3x2 6 0 sujeto a:
Como n=2 y m=1, la condición necesaria establece que:
f , g1 J2 0 x 2 , x1
f x J2 2 g1 x 2
f x1 10 x 2 8 x1 20 x 2 24 x1 0 g1 3 2 x1
Esta ecuación resuelta simultáneamente con g1 ( X ) se obtiene:
x2 36 / 28 1286 . x1 5x2 / 6 1071 .
212 Con n=2 y m=1, se analiza el signo de 2 f .
2 f 2 f 2 x 2
2 f x2 2
( x 2 x 2* ) 2 g
2 2x 1 f f x 2 2 g 1 x2 x2 g x1
f 8 x1 x1 x 2
x 2 2 2 x 1 2 f 1 f x 2 x x x 1 2 2 g x2 x 2 g 2
x 1
2 f 2 8 x1 x2 2 f 2 10 x2 x1
f 10 x2 x2 x1
2 f 0 x1 x2 x1 J ( g / x2 ) g / x2 3 J ( g / x1 ) g / x1 2 x2 g 2 x1 J (0 / 0) 2 (1)11 d12, 2 J ( g / x1 ) x2 g
En este caso como sólo hay una restricción: g , g , .... gk 1 , gk 1 , .... , gm J (0 / 0) 1 J 1 2 x1 , x2 , .... x p 1 , x p 1 , .... , xm
En el numerador no queda ninguna función al sacar a g1 (única restricción de igualdad) y en el denominador tampoco queda ninguna variable al sacar la única posible, pues m =1. 2
2 ,2 1
d
2 g x1 x1 2 g 2g 2 2 2 x1 x2 x2 g x2 g x1 x2 x x2 x1
Como la restricción es lineal,
213 2g 2g 2g 2 2 0 x1 x2 x1 x2 x x2 x1
d12 ,2 0
Por lo tanto:
2 x1 2 0 x2 g Substituyendo los valores encontrados en: 2 f 2 2 8x1 ( 0) 8( 3 / 2) 2( 0)( 3 / 2) 10 28 x2 g
Con este valor 2 f 0 , siendo el punto entonces un mínimo.
Nota: Se recomienda aplicar el método de la variación restringida cuando el número de restricciones no es mayor que 3. 4.3.2.2. Restricciones de igualdad y desigualdad Una restricción de desigualdad es activa cuando la desigualdad es de la forma 0 . 4.3.2.2.1. Método de los multiplicadores de Lagrange Las condiciones necesarias establecidas por el método de Lagrange para la existencia de un mínimo de una función restringida dependen de si las restricciones son de primer orden o de segundo orden. Definido el problema: Minimizar Sujeto a:
Restricciones de primer orden:
f (X) hi ( X ) 0 gi ( X ) 0
, ,
i=1,2,...,m i=m+1,...,p
214 Las restricciones son de primer orden cuando son una vez diferenciables y todos los gradientes de las restricciones activas de desigualdad y de las restricciones de igualdad evaluadas en el óptimo ( X * ) son linealmente independientes.
1. Condiciones necesarias: Si se cumple la condición de restricción de primer orden las condiciones necesarias para la existencia de un mínimo son:
i. Las funciones f ( X ) , hi ( X ) y gi ( X ) sean una vez diferenciables. ii. Existen multiplicadores de Lagrange, tales que: , i=1,2,...,m hi ( X * ) 0 * , i=m+1,...,p gi ( X ) 0 U i* gi ( X * ) 0 , i=m+1,...,p , i=m+1,...,p U i* 0 * * * 5. L( X ,U ,W ) 0
1. 2. 3. 4.
donde: L( X , U , W ) f ( X )
WJ hj ( X ) m
J 1
p
U
J 1
gj( X)
J m 1 p
L( X ,U ,W ) f ( X ) WJ hj ( X ) m
J
U g ( X ) J
j
J m 1
Los valores de X * ,U * y W * se obtienen resolviendo el sistema hi ( X * ) 0 U i* gi ( X * ) 0 L( X * ,U * ,W * ) 0
, , ,
i=1,2,....,m i=m+1,....,p n: ecuaciones
2. Condiciones suficientes:
i. Las funciones f ( X ) , hi ( X ) y gi ( X ) sean dos veces diferenciables. ii. Para todo vector V 0 , el cual:
V t g J ( X * ) 0
Para todas las restricciones de desigualdad activas.
V t g J ( X * ) 0
Para todas las restricciones de desigualdad no activas
215
V t hJ ( X * ) 0
J=1,...,m
Se cumple que:
V t 2 L( X * ,U * ,W * )V 0
donde 2 L( X * ,U * ,W * ) es la matriz hessiana. Restricciones de segundo orden: Las restricciones son de segundo orden cuando son dos veces diferenciables y los gradientes de las restricciones de desigualdad activas y los gradientes de las * restricciones de igualdad, evaluadas en X son linealmente independientes. 1. Condiciones necesarias: Las condiciones necesarias para que haya un mínimo cuando las restricciones son de segundo orden son:
i. Las funciones f ( X ) , hi ( X ) y gi ( X ) sean dos veces diferenciables. ii. Existen multiplicadores de Lagrange, tales que: hi ( X * ) 0 , i=1,2,...,m * gi ( X ) 0 , i=m+1,...,p * * U i gi ( X ) 0 , i=m+1,...,p U i* 0 , i=m+1,...,p * * * 5. L( X ,U ,W ) 0
1. 2. 3. 4.
iii. Para todo vector V diferente de cero, el cual: V t g J ( X * ) 0 Para todas las restricciones de desigualdad activas. t * y, V hJ ( X ) 0 J=1,...,m Se cumple que:
V t 2 L( X * ,U * ,W * )V 0
donde 2 L( X * ,U * ,W * ) es la matriz hessiana. 2. Condiciones suficientes:
216
También se aplican las mismas condiciones que se usan cuando las restricciones son calificadas como restricciones de primer orden. Una condición suficiente alternativa para que en X * haya un mínimo (válido para restricciones de primer y segundo orden) es que f ( X ) , g J ( X ) y hJ ( X ) sean dos veces diferenciables y el determinante de la matriz Jacobiana de las funciones hJ ( X ) , U J g J ( X ) y las definidas por L( X ,U ,W ) 0 sea diferente de cero evaluado en X * . La matriz Jacobiana está definida como:
L L h1,h2 ,...,U m 1g m 1,...,U p g p , x1 ,..., x n J x , x ,..., x ,U , U ,..., U , W , W ,..., W n m 1 m 2 p 1 2 m 1 2 h1 x1
h1 h1 h h h ... ... 1 ... 1 ... 1 x2 U m 1 U p W1 Wm
U m 1g m 1
U m 1g m 1
...
x1
2L xn x1
Wm
2L 2L 2L ... ... xn x2 xn U m 1 xn Wm
Ejercicio 10: Minimice
f X x12 x2
Sujeto a: g1 X x12 x22 9 0
g X x x 2
1
2
1 0
Al analizar las funciones g1 X
y g2 X
se observa que son dos veces
diferenciables. Como solo hay una restricción activa y ninguna restricción de igualdad, entonces se cumplen las condiciones para calificar las restricciones como de segundo orden.
217
La función f X es también dos veces diferenciable, entonces:
2. U g X U x
1. U1* g1 X U1* x1*2 x2*2 9 0 * 2
* 2
2
* 1
x2* 1 0
Como:
L X ,U ,W x12 x2 U1 x12 x22 9 U 2 x1 x2 1 g1 g2 f x x x 1 U1 1 U 2 1 L X , U , W g1 g2 f x x x 2 2 2 f f 2 x1 1 x1 x2
g1 2 x1 x1 g2 1 x1
g1 2 x2 x2 g2 1 x2
L X *,U *,W * 0 2 x1* 2 x1* 1 * U 2* 0 U1 * 2 x2 1 1
3.
2 x1* 2U1* x1* U 2* 0
4.
1 2U1* x2* U 2* 0
Hay varias soluciones para este sistema de ecuaciones, sin embargo la única que satisface U i* 0 es: t t 1 X * 0,3 U * ,0 6 Esta solución puede obtenerse mediante el siguiente procedimiento: Si U 2* 0 , de (3) se obtiene 2 x1* 1 U1* 0 . Lo cual implicaría que U1* 1
x1* 0 .
El valor U1* 1 viola la condición U i* 0 , entonces x1* 0 .
x x * 2 1
* 2 2
ó
De (1),
9 , con x1* 0 , se obtiene x2* 3 . El valor de x2* 3 no satisface
218
t g2 ( X ) , por lo tanto X * 0,3 . Los valores de U * son entonces U 2 * 0 y
U1* 1/ 6 que se obtiene de (4). Este sistema de ecuaciones no lineales también se resolvió por métodos numéricos, usando el programa Polymath, arrojando los siguientes resultados: (i) x1 = 0, x2 = -3, U1 = 0.167, U2 = 0, (ii) x1 = 0, x2 = 3, U1 = -0.1667, U2 = 0, (iii) x1 = 0.5, x2 = 0.5, U1 =0, U2 = -1 y (iv) x1 =-1.56, x2 = 2.56, U1 = -0.5 y U2 = 1.56
La otra condición necesaria se chequea con un V t v1 , v2 , tal que: V t g J ( X * ) 0
0 Como solo g1 ( X ) es activa en X * , entonces 3 2 x 1 0 2
v1 , v2 2 x
v1 v2 0 V 0
0v1 6v2 0
V t 2 L( X * , U * , W * )V 0
2L x2 2 L( X , U , W ) 2 1 L x2 x1 2L 2 (1 U1 ) x12
2L 0 x1 x 2 2L 0 x 2 x1 2L 2U1 x22
L X ,U ,W 2
2L x1 x2 2L x22
2 1 U1* 0 0 2U1*
0
v1 , v2 6 0
219 Reemplazando U *
L X ,U ,W 2
14 v1 , 0 6 0
1 6
14 6 0
0 2 6
2 0 v 1 14 v1 0 2 0 6 6
14 2 v1 es mayor a cero independientemente del valor que tome v1 , por lo 6 tanto se cumplen las condiciones necesarias para que las restricciones sean v2 calificadas como de segundo orden. También se cumple que 14 1 0 la condición 6 suficiente para un mínimo. El valor
Puede verificarse la condición suficiente alterna. Para esta condición se evaluar obtiene primero la matriz Jacobiana con respecto a X ,U y W de las funciones:
L L U g , U g , , 1 1 2 2 x1 x2 J x1 , x2 ,U1 ,U 2
U1 g1 x1
. .
U1 g1 U 2
. .
. . . .
. .
.
2 L . . x2 U 2
.
U1 g1 ( X ) U1 ( x12 x22 9) U 2 g2 ( X ) U 2 ( x1 x2 1) L 2 x1 2U1 x1 U 2 x1
L 1 2U1 x2 U 2 x2
U1 g1 2U1 x1 x1
U1 g1 2U1 x2 x2
U1 g1 ( x12 x22 ) 9 U1
U1 g1 0 U 2
U 2 g2 U 2 x1
U 2 g2 U 2 x2
220
U 2 g2 0 U 1
U 2 g2 x1 x2 1 U 2
2L 2(1 U1 ) x12
2L 0 x1 x2
2L 2 x1 x1 U1
2L 1 x1 U 2
2L 0 x2x1
2L 2U1 x22
2L 2 x2 x2 U1 2L 2 x1 x1 U1
2L 1 x2U 2
2L 1 x1 U 2
La matriz Jacobiana evaluada en
1 0 0 0 0 0 14 / 6 0 0 1/ 3 6 0
t X * 0,3
t y U * 1 / 6,0 se obtiene:
0 4 1 1
Resolviendo el determinante por la primera fila
0 (1) 1 14 / 6 3
0
0 0
4 14 / 6 0 1 4(1) 4 4(14 / 6)(6) 56 0 6 6 1
Como el valor es diferente de cero, entonces el punto
t X * 0,3 es un mínimo
f X * 3
Ejemplo 10: El hidrocarburo que se alimenta a un proceso petroquímico se calienta y se mezcla con el reciclo del material que no reaccionó, antes de pasarlo por un reactor catalítico. El producto del proceso y el material que no reaccionó se separan por destilación, y el reciclo se comprime antes de mezclarlo con el alimento del proceso.
221 Determine la temperatura T y la razón de reciclo R (Flujo de reciclo/flujo del alimento fresco) óptimas, que minimizan los costos diarios de operación, para un flujo de alimentación al proceso de 5000 bbl/día, si la razón entre la temperatura y la razón de reciclo debe ser igual a 5000ºF. El costo de operación del horno que calienta el alimento fresco es $0.5 por barril y por cada 50ºF de calentamiento por encima de la temperatura del alimento. El costo de operación del reactor es 5(R+R2)-1 $/bbl de alimento al reactor diario. El producto se separa por destilación a un costo de 0.5 $/bbl de alimento a la unidad de destilación, y el costo de recirculación es 0.15 $/bbl de recirculado. La temperatura del alimento es 70 ºF. F: Rata de alimentación = 5000 bbl/día
COT COH COR COD COC COH 0.5F
T 70 50T 3500 50
5F 2.5 104 COR 5 R R F 1 R R R COD 0.5F 1 R 2500 1 R 2 1
COC 0.15RF 750R
COT 50T 3500
2.5 104 2500 1 R 750 R R
Función objetivo:
COT 50T
2.5 104 3250 R 1000 R
(1)
Restricción:
T 5000R (2) Utilizando el método de la variación restringida: Condiciones necesarias: La función y la restricción son dos veces diferenciables, por lo tanto las condiciones necesarias para restricciones de segundo orden son: Las condiciones necesarias cuando las restricciones son de segundo orden son: i. Las función COT f (T , R) y la restricción de igualdad h(T , R) T 5000R 0 son dos veces diferenciables. ii. Existen multiplicadores de Lagrange, tales que:
222 1. h T , R T * 5000R* 0
(1)
2. L T , R, W 0 como L T , R,W 50T
2.5 104 3250 R 1000 W T 5000 R R
L 50 W T 0 4 y L T , R, W 2.5 10 L 3250 5000 W 2 R R y 50 W * 0 2.5 104 3250 5000W * 0 R*2
(2) (3)
Resolviendo simultáneamente estas tres ecuaciones se tiene:
R* 0.314
T * 1570º F W * 50
iii. Para todo vector V diferente de cero, el cual: V t h T * , R* 0 , se cumple que: V t 2 L(T * , R* ,W * )V 0
h T * 1 como h T * , R* h 5000 R* 1 V t h T * , R* v1 v2 0 5000 v1 5000v2 0
Lo que implica que existen muchos vectores [v1 v2] diferentes de cero que satisfacen esta condición.
2.5 104 3250 R 1000 W T 5000 R se tiene Para la función L T , R,W 50T R que:
223
2 L 0 T 2
2 L 5 104 R 2 R3
2 L 0 T R
2 L 0 RT
y
2L T2 2 L(T , R,W ) 2 L R T
2L T R 2L R 2
0 0 2 L(T * , R* ,W * ) 6 0 1.615 10
Condición suficiente: h T 2L
L L h, , J T R 2 T , R,W T 2L RT
1 0 0
h R 2L
h W 2L
T R
T W
2L R 2
2L RW
5000 0 5104
0.314 3
0 1 5000
5104 5000 0 0 0 1.615 106 0 1 0.314 3
como este valor de la jacobiana es diferente de cero, entonces, en R* 0.314 y T * 1570º F hay un mínimo. Los costos mínimos diarios son: 158 138 $ 4.3.2.2.2. Método de los multiplicadores de Lagrange y variables de holgura En este método las restricciones de desigualdad son transformadas en restricciones de igualdad, introduciendo una variable de ajuste apropiada por cada restricción. Con esta transformación el problema de optimización se convierte en: Minimizar o maximizar
f (X)
224 hi ( X ) 0 gi ( X ) vi2 0
Sujeto a:
i=1,...,m i=m+1,...,p
donde vi son las variables de holgura. La función de Lagrange queda definida entonces como:
p( X , W ) f ( X )
wi hi ( X ) i 1
p
m
w (g ( X ) v i
i
i
2
)
i m 1
wi 0, i 1, p para minimizar wi 0, i 1, p para maximizar Las condiciones necesarias para minimizar se establecen como: donde
pX xi
pX wi
pX vi
0
i 1,..., n
0
i 1,..., p
2wi vi 0
wi 0
i m 1,..., p i 1,..., p
Notas:
El método de multiplicadores de Lagrange puede fallar en problemas no convexos en minimización o no cóncavos en maximización3. Cuando solo existen restricciones de desigualdad, en el método de multiplicadores de Lagrange puede utilizarse como condición suficiente la establecida para funciones no-restringidas, si el punto extremo es un punto 4 interior . En el caso en que solo existan restricciones de desigualdad y se haya utilizado el método de Lagrange con variables de holgura, puede utilizarse como condición suficiente la definida en el método de la variación restringida. Ejercicio 11: Halle el mínimo de la función: y 4 x1 5 5 x2 4 , restringido a que x1 x2 1 2
3
2
Un conjunto es convexo si para todo X 1 y X 2 en el conjunto, el segmento que los une está en el conjunto 4 Un punto interior en la región factible, es un punto que cae dentro de ella y no en su frontera. Estos puntos se dan cuando las restricciones son satisfechas sin el signo igual.
225
g X
g X x1 x2 1 0 2 i
0
Función de Lagrange:
w h X w g X m
P X ,W f X
m
i 1
i i
i
i 1
2 i
i
P X ,W 4 x 5 5 x 4 w x x
P X ,W f X w g X 2 2
1
2
2
P 8 x1 5 w 0 x1 P 10 x2 4 w 0 x2 P x1 x2 1 2 0 w P 2 w 0
1
2
1 2
w 8 x1 5
(1) (2) (3) (4)
Si w = 0
de (1), (2) y (3): x1 5
Si = 0
de (3):
x2 4
5 4 1 8
x1 x2 1 x1 1 x2
(5)
Reemplazando (5) en (1): w 8 1 x2 5 8 4 x2 (6) De (2): w 10 x2 4 Igualando (6) y (7):
(7)
x2
4 9
x1 1 x2
5 9
El mínimo de la función es y = 0, para x1 = 5 y x2 = 4. 4.3.3. Métodos numéricos de funciones no restringidas 4.3.3.1. Método del poliedro flexible El método consiste en comparar en cada etapa de aproximación los valores de la función objetivo en los vértices de un poliedro flexible, y eliminar del poliedro aquel vértice donde la función es mayor si se está minimizando, o donde es menor si se está maximizando, y remplazarlo por un vértice nuevo localizado en una nueva posición, la cual se define con el resultado de una de tres operaciones que se realizan sobre el poliedro: expansión, contracción o reducción.
226
Un poliedro puede ser definido mediante un conjunto de vectores, en el cual cada vector representa la posición de un vértice; así, las coordenadas de los vértices de un poliedro convexo regular pueden definirse por una matriz D, en la cual las columnas representan los vértices V1 , V2 , V3 ,..., Vn y las filas representan las coordenadas de los vértices ( x1 , x2 ,....., xn ) . Antes de iniciar el algoritmo se define un poliedro con n filas, numero de variables de decisión en el problema de optimización y n+1 filas, número de vértices del poliedro. Si el primer vértice de este poliedro inicial se ubica en el origen, la matriz que define el poliedro convexo regular es:
0 0 D 0 0
d1 d2 d2 d2
d2 d2 d1 d 2 d2 d2 d 2 d1
donde:
n 1 n 1 n 2 t n 1 1 d2 n 2
d1
t
D: matriz de n filas y (n+1) columnas t: distancia entre dos vértices contiguos n: número de coordenadas Si el primer vértice se ubica en otro punto diferente al origen, las coordenadas de cada uno de los vértices estará incrementada en la correspondiente coordenada de este primer vértice. Algoritmo Para minimización, los cálculos requeridos en la etapa k son (en la figura 8 se muestra un esquema del procedimiento): 1. Ubicación en el poliedro del valor mínimo y valor máximo de la función. En cada etapa de aproximación se debe conocer en que vértice del poliedro se localizan el mínimo y el máximo de la función objetivo. Si en la etapa k:
227
k k k k X i xi1 , xi2 ,..., xin son las coordenadas del vértice i, con i=1,2,....,n+1; el valor mínimo y el valor máximo de la función objetivo, que se identificarán con los k k vectores X b y X a respectivamente, se obtienen como:
X , f X ,..., f X X , f X ,..., f X
k f X a max f k f X b min f
k
k
1
n1
2
k
k
1
n1
2
k
k
2. Cálculo de las coordenadas del centroide.
El centroide X n 2 se obtiene como el centroide de todos los vértices del poliedro, excluyendo el vértice donde se localiza el valor máximo de la función, y se calcula como:
1 n1 k k xn2 , j xi , j xa , j ; n i 1
j: designa cada coordenada, j=1,2,...n.
k
3. Reflexión de X a a través del centroide.
k k k k X n3 X n 2 X n 2 X a donde =1.
es el coeficiente de reflexión, mayor que cero, pero se recomienda
Se calcula f X n 3k
y dependiendo del valor que tome la función para
X n 3k ,
comparado con el de los demás puntos del poliedro, debe hacerse una de las tres operaciones: expansión, contracción o reducción 4. Expansión.
k k k k k k f X n 3 f X b , se obtiene X n 4 X n 2 X n 3 X n 2 donde 1 ( es el coeficientes de expansión) y se recomienda 2.8 3.0 . Si
Se calcula f X n 4 k
y se compara con
f X bk
228 el vértice done se encuentra el f X , se reemplaza
Si f X n 4
4.1.
k
k
b
k
k
máximo de la función, X a , por X n 4 y se pasa a la etapa k+1.
el vértice donde se encuentra el f X , se reemplaza
Si f X n 4
4.2.
k
k
b
k
k
máximo de la función, X a , por X n 3 y se pasa a la etapa
k+1.
5. Contracción.
Si f X b
k
f X X n 3
k
k
a
se hace una contracción obteniendo:
k k k X n 5 X n 2 ( X a X n 2 )
es el coeficiente de contracción, 0< <1, para el cual se recomienda 0.4 0.6 .
donde
Se calcula f X n 5
k
y se compara con f X k
a
k k 5.1. Si f X n5 f X a , se reemplaza el vértice donde se encuentra el
k
k
máximo de la función, X a , por X n5 y se pasa a la etapa k+1.
f X n5k f X a k , se hace reducción con la siguiente fórmula:
5.2. Si
X ik 1 X bk 0.5 X ik X bk ,
i 1,
, n 1 y se pasa a la etapa
k 1. 6. Reducción. Si
k k f X n 3 f X a , se reducen todos los vectores del poliedro,
redefiniendo los vértices como :
X ik 1 X bk 0.5 X ik X bk ,
i 1,
, n 1 y se pasa a la etapa k 1 .
229
Antes de proseguir a la etapa k 1 , se analiza la convergencia con: 1
2 2 1 n 1 k k f X f X i n2 n 1 i 1
Figura 8. Esquema del procedimiento del proliedro flexible
230
x2
Disminuye f(X)
Contornos de f(X) x1 Figura 9. Representación gráfica del método del poliedro flexible en dos dimensiones Ejercicio 12: Halle el mínimo de la función y x1 2 x2 3 , por el método del poliedro 2
2
flexible. Tabla 18. Iteraciones para la búsqueda del mínimo del ejercicio 12
k 1
2
3
i 1 2 3 4 5 6 1 2 3 4 5 6 1
x1 2.000 2.483 2.129 2.306 2.612 3.225 3.225 2.483 2.129 2.677 2.871 3.259 3.225
x2 1.000 1.129 1.483 1.306 1.612 2.225 2.225 1.129 1.483 1.854 2.578 4.027 2.225
f Xk
Convergencia
4.000 3.732 2.318 2.301 2.101 2.101 3.732 2.318
0.833 Expansión
0.937 2.641 2.101
1.190 Expansión
231
2 3 4 5 1 2 3 4 5 6 1 2 3 4 5
4
19
2.871 2.129 3.048 3.967 3.048 2.871 2.500 2.960 2.694 2.164 1.992 2.001 1.995 1.998 2.004
2.578 1.483 2.402 3.320 2.402 2.578 2.031 2.490 2.755 3.285 2.998 3.004 2.995 2.999 3.001
0.937 2.318 3.970 1.456 0.937 1.190 0.542 0.108 6,2E-05 1,37E-05 4,79E-05
0.690 Reducción
2.321 Expansión
4.23039E-05 1,48E-05 Reducción
Se partirá del valor inicial x1 = 2 y x2 =1. En este caso n = 2 y se tomará t = 0.5, =1, = 0.5 y =3. d1 y d2 se calculan con las fórmulas:
d1
t
n 2 t d2 n 2
n 1 n 1 0.4830
n 1 1 0.1294
Los datos de las primeras cuatro iteraciones y de la última teniendo en cuenta una convergencia de 4x10-5 se muestran en la tabla 18. El mínimo está en x1 = 1.998 y x2 = 2.999. 4.3.3.2. Método del gradiente
k X k Este método utiliza el gradiente en la etapa para la transición desde el punto a otro punto X k 1 , mediante la siguiente expresión:
X k 1 X k X k X k k Sˆ k donde:
S k : vector unitario en la dirección del gradiente en X k . k : escalar que define la magnitud del desplazamiento desde X k en la dirección del gradiente o en la dirección contraria. Si se toma el signo (+) el
232 desplazamiento se hace hacia donde crece la función y si se toma (-) hacia donde decrece.
puede escogerse como una cantidad variable o como una constante. También puede ajustarse en cada etapa de tal manera que la función se minimice o maximice, dependiendo del propósito, en cada etapa.
Sˆ k
f X
f X k
xf
f X
k
k
1
f X
k
f x2
f xn X k
2
f f ... x1 xn
2
El valor de variable se obtiene en cada etapa a partir de una expansión en Taylor de la función objetivo.
t 1 f X k 1 f X k t f X k X k 1 X k X k 1 X k H X k X k 1 X k 2
H: Matriz Hessiana
Si X k 1 X k k S k
f X k k Sˆ k k
f X Sˆ
t f X k Sˆ k Sˆ k t
k
0
k
Sˆ k
T
T
H k Sˆ k 0
k
HSˆ k
En algunos textos se sugiere utilizar un constante. Con este, si se pretende buscar un mínimo, los siguientes son los cálculos en la etapa k . 1.
Si f X k S k f X k , entonces se toma X k como el óptimo, con :
exactitud de la medida para el óptimo.
1. Se calcula f X k Sˆ k , se compara con f X k siguientes opciones: 2.1. Si f X k S k f X k :
y se elige una de las dos
233
Se evalúa f X k 2S k y se compara con f X k S k ; si continua menor se mantiene la misma dirección hasta obtener un punto X k 2m S k tal que:
f X k 2m 1 Sˆ k f X k 2m S k f X k 2m 1 Sˆ k
y se continúa en la etapa k+1, partiendo de X k 2m S k . Si f X k S k f X k :
2.2.
S k Se evalúa f X k y se compara con f X k , si continúa mayor, se 2 sigue disminuyendo el desplazamiento hasta que: f X k m S k f X k 2 X k m S k . 2
y se continúa en la etapa k+1 en el punto
Ejercicio 13: Halle el mínimo de la función y x12 25x2 2 , por el método del gradiente. Se partirá del valor inicial x1 = 2 y x2 =2. Se tomará = 1 y = 0.05
xf
f X
1
f xn X k
f x2
k
f X k 2 x1 50 x2
f X
Sˆ k
k
y1'
2 x1 50 x2 2
f X
f X k
s1
k
y1' M
2
y 2 x1 x1
y2'
y 50 x2 x2
M
s2
y2' M
En la tabla 19 se muestran los resultados de las iteraciones. Tabla 19. Iteraciones para la búsqueda del mínimo del ejercicio 13
Desplaz.
k 0
x1 2
x2 2
y1 ’ 4
y2 ’ 100
M 100.08
s1 0.040
s2 0.999
y 104
234
2 4
2 4 /2 /4 /8 /16
1
2
3
1.998 1.960 1.920
1.950 1.001 0.002
1.840 1.923 1.873 0.923 -0.076 -2.076 -0.076 -0.073 0.003 -0.037 -0.057 -0.067 -0.072 -0.072 -0.066
-1.997 0.001 3.846 0.0739 0.001 -0.018 -0.037 -0.075 -0.038 -0.153 -1.9234 0.011 0.958 0.460 0.211 0.086 0.024 0.024 -0.143 1.1925 -0.026
3.847
1.000
0.019
1.930
-0.079
-0.997
1.201
-0.119
0.993
99.058 28.882 3.687 103.06 7 3.698 3.509 0.860 0.040 4.452 0.043 0.008 22.963 5.290 1.114 0.190 0.019 0.019 0.021
El mínimo se localiza en x1 = -0.066 y x2 = -0.026. 4.3.3.3. Método de las tangentes paralelas Este método conocido como el método PARTAN, utiliza dos tangentes paralelas a contornos de la función y en la línea que une los puntos de tangencia investiga el óptimo de la función. Existen algunas modificaciones de este método, entre ellos uno denominado PARTAN CONTINUADO. Las etapas para la búsqueda de un mínimo por el método PARTAN son:
(0) X 1. Dada una primera aproximación , determinar la dirección del negativo del (0) gradiente en X . T
f f X 0 x1
f f x2 xn X 0
2. Localizar X (1) en el mínimo de f X a lo largo del negativo del gradiente desde X (0) .
X X n S 1
0
0
n = 1, 2, ...
235
ˆ 0
S
f X 0 0 f X
Se obtienen aproximaciones de X (1) iniciando con n = 1, hasta un n+1 en donde el valor de la función objetivo cambie la tendencia de decreciente a creciente. es un escalar que determina el tamaño del desplazamiento para la búsqueda del mínimo en la dirección del negativo del gradiente. 3. Determinar la dirección del negativo del gradiente desde X (1) .
f X
1
f x1
4. Localizar X (2) en el mínimo de f X desde X (1) .
T
f xn X 1
f x2
a lo largo del negativo del gradiente
X X n S n = 1, 2, ... 2
1
1
f X
f X 1
ˆ 1
S
1
Se obtienen aproximaciones de X (2) iniciando con n=1, hasta un n+1 en donde el valor de la función objetivo cambie la tendencia de decreciente a creciente. 5. Conectar X ( 0 ) y X (2) con una línea recta y localizar el mínimo de f ( X ) a lo
largo de esta línea y denotarlo con X (3) . 3 0 0 X X nUˆ
X X 0 ˆ U 2 0 X X 2
0
Se usa el signo + ó - dependiendo de la dirección hacia donde decrezca la función objetivo. Esta dirección se identifica realizando un cálculo inicial para el valor de n = 1.
236
6. Establezca X(3) como un nuevo punto de arranque y repita el procedimiento desde la etapa 1, hasta obtener una convergencia deseada, la cual se define como X k 1 X k , siendo e un escalar mayor que cero. Ejemplo 11: Resuelva el ejemplo 7, por el método de las tangentes paralelas. Función objetivo:
1 10 5 f X 4 106 2 2 xy x y xy
f f X (k) x
T
f y (k) X
1 f X 20 5 4 10 6 2 3 2 2 y x x x y x y x y
1 f X 10 10 4 10 6 2 2 2 3 y y y x y xy xy
f X f ( X ) x
2
f X y
2
M
yy yx f X Sˆ , s2 s1 M M f X Siguiendo el procedimiento descrito para el PARTAN, tomando un = 0,1, = 0.05 y tomando como valores iniciales x = 29 y y = 14, se calcularon los datos que aparecen en la tabla 20. Tabla 20. Iteraciones para la búsqueda del mínimo del ejemplo 11. Etapa X(k) 0 X(0)
n
x 29
y 14
-yx o x(2)-x(0) 15,89
-yy o y(2)-y(0) 41,600
M 44,53
s1 o u1 s2 o u2 0,357 0,934
f -
237 9 1
29,036
14,093
2
29,071
14,187
3
29,107
14,280
4
29,143
14,374
5
29,178
14,467
6
29,214
14,560
7
29,250
14,654
8
29,286
14,747
9
29,321
14,841
10
29,357
14,934
11
29,393
15,028
12
29,428
15,121
X(1) 13
29,464
15,214
14
29,500
15,308
29,464
15,214
1
29,540
15,149
2
29,615
15,083
3
29,691
15,018
4
29,766
14,952
5
29,842
14,887
1
29,627
14,779
-1
28,373
13,221
2
30,254
15,558
29,627
14,779
1
29,670
14,870
2
29,712
14,960
X(2)
X(3)
1
X(0)
4
2,250
-1,952
2,979
0,755
0,766
0,952
1,222
0,627
4,125
8,754
9,678
0,426
2936,3 2940,5 2944,3 2947,7 2950,7 2953,3 2955,6 2957,5 2959,0 2960,3 2961,2 2961,8 2962,1 2962,2 2961,9 -0,655 2962,2 2962,4 2962,6 2962,7 2962,7 2962,6 0,779 2961,3 2872,3 2958,1 0,905 2961,3 2962,1 2962,6
238
(1)
X
X(2)
X(3)
2
3
29,755
15,050
4
29,797
15,141
5
29,840
15,231
29,797
15,141
1
29,816
15,043
2
29,834
14,944
1
30,209
15,592
-1
29,045
13,966
2
30,791
16,405
30,209
15,592
1
30,178
15,497
2
30,148
15,402
3
30,117
15,307
4
30,086
15,212
5
30,055
15,116
6
30,025
15,021
7
29,994
14,926
30,025
15,021
X(0)
X(1)
X(2)
1
29,986
14,929
X(3)
1
30,025
15,021
-1
30,516
15,973
2
29,595
13,118
0,425
-2,306
2,345
0,181
-0,983
0,189
0,264
0,324
0,582
0,813
-4,856 -15,047
15,81 1
-0,307 -0,952
-0,301
-0,718
0,778
-0,387 -0,922
-0,184
-0,571
0,600
-0,307 -0,952
2962,8 2962,8 2962,4 2962,8 2962,9 2962,8 2957,8 2935,5 2933,5 2957,8 2959,3 2960,5 2961,5 2962,2 2962,7 2963,0 2962,9 2963,0 2962,9 2963,0 2948,3 2894,7
Los valores de precios de venta de A y B para obtener el máximo beneficio, son respectivamente:
x 30,025 30 $/día y 15,021 15 $/día
239 Otros métodos de optimización numérica de funciones multivariables son: 4.3.3.4. Método de Newton
La ecuación algorítmica para este método es: X k 1 X k H 1 ( X k ) f ( X k ) . para encontrar un mínimo, y para un máximo: X k 1 X k H 1 ( X k ) f ( X k ) , donde H 1 ( X k ) es la matriz inversa de la hessiana evaluada en el punto X k .
4.3.3.5. Método de Davidon-Fletcher-Powell Este método está basado en la lógica de las direcciones conjugadas. En los métodos que utilizan esta lógica, las aproximaciones sucesivas no se obtienen siguiendo las direcciones del gradiente en cada punto, sino las llamadas direcciones conjugadas. n 1 X X 0 i Si i0
T donde en cada etapa Si es un vector unitario s1 , s2 ,...., sn que hace parte del conjunto llamado de direcciones conjugadas de la matriz H, los cuales cumplen la condición: T Si HS j 0
i j , j=0,1,....n-1. con Si
y Sj 0.
Un procedimiento general que utilice las direcciones conjugadas arranca generando X 1 y a partir de este sigue generando X 2 , X 3 , hasta obtener X en n iteraciones.
El valor de X 1 lo obtendría
X1 X 0 0 S0 donde 0 se obtiene optimizando g( 0 ) f ( X 0 0 S0 )
o sea:
0 b H X
0
X0
T
S0 S 0T H X 0 S 0
El vector S 0 inicial puede ser cualquier vector unitario.
240 Una vez obtenido X1 , X 2 X1 1S1
X 2 se obtiene como:
El vector S1 se obtiene de la propiedad de conjugado: S1 HS0 0
y de que S1 sea un vector unitario S1T HS1 0
El valor del desplazamiento 1 se calcula con la ecuación T S1 1 b HX 1 T S1 HS1
Siguiendo esa secuencia, cualquier aproximación se puede obtener X k 1 X k k S k S k HS k 1 0 S kT S k 0 T Sk k b HX k T S k HS k
El algoritmo para el método de Davidon-Fletcher-Powell consiste en obtener una aproximación con la ecuación: X k 1 X k k
donde k k Sk X k donde la dirección S k se obtiene como:
Sk Dk f X k
Dk: aproximación de H 1 X k
k se calcula con la minimización de: g k f X k k Sk
241
si se está buscando un mínimo, o maximizando, si se está buscando un máximo. La matriz Dk se actualiza en cada etapa con la ecuación: Dk 1 Dk Ak Bk donde:
Ak
k kT kT k
k f X k 1 f X k Bk
Dk k Tk Dk T Tk Dk k
Para la primera iteración puede tomarse D0 como la matriz identidad; realmente lo que se requiere es que esta matriz sea simétrica y positiva definida. Este método es mucho más efectivo, tiene una mayor convergencia, que los métodos que utilizan únicamente la dirección del gradiente. Para medir esta efectividad existe la función de Rosembrok
f X 100 x2 x12
1 x 2
2
1
que tiene contornos marcadamente excéntricos y que hace que los métodos basados puramente en el gradiente presenten una convergencia lenta.
4.3.3.6. Método de Fletcher-Reeves Este método también está basado en las direcciones conjugadas, pero no tiene la misma eficiencia del método anterior, pero si lo es más que los métodos de ascenso-descenso acelerado y de Newton. El método obtiene una aproximación a partir de la ecuación algorítmica X k 1 X k Sk
donde k se obtiene de la optimización de: g( k ) f ( X k k sk ) .
El vector sk se obtiene para una nueva etapa con:
242
sk 1 f ( X k 1 ) k sk . T f ( X k 1 ). f ( X k 1 ) k T f ( X k ). f ( X k )
El algoritmo arranca escogiendo como dirección inicial: s0 f ( X 0 ) . 4.3.4. Métodos numéricos de optimización de funciones restringidas La mayoría de los métodos de optimización de problemas no lineales restringidos se apoyan en uno de los siguientes conceptos básicos. i. Extensión de la metodología de programación lineal por medio de aproximaciones sucesivas a un problema lineal. ii. Transformación de la función objetivo mediante el uso de funciones de penalización. iii. Uso de tolerancias factibles para acomodar las aproximaciones a la región factible. En los problemas de optimización sin restricciones no era necesario iniciar la búsqueda del óptimo a partir de un punto factible, mientras que en la mayoría de los métodos numéricos para problemas con restricciones se requiere la búsqueda inicial de un punto factible para comenzar con el problema de optimización. La búsqueda de un óptimo restringido puede hacerse, en principio, mediante las técnicas para problemas no-restringidos, con una rutina adicional que chequee y asegure en cada aproximación que se está en la región factible. El movimiento desde un punto a una nueva localización puede conducir a una región no factible, requiriéndose de un retorno a la región factible, el cuál puede hacerse con información únicamente de la función objetivo y de las restricciones en métodos directos, o con evaluación del valor del gradiente local cuando se utilizan métodos del gradiente. Los métodos que utilizan aproximación del problema a un problema lineal en cada etapa, utilizan la expansión en Taylor para la aproximación. El problema : optimizar
f (X )
Sujeto a: hi ( X ) 0 , i=1,2,...m gi ( X ) 0 , i=m+1,.....,p Se transforma a: Optimizar
f ( X k ) t f ( X k )( X X k )
243
Sujeto a: hi ( X k ) t hi ( X k )( X X k ) 0 , i=1,...,n. g i ( X k ) t g i ( X k )( X X k ) 0 , i=m+1,...,p. Entre estos métodos se tienen: MAP: Método de aproximación programación. POP:Programa para el proceso de optimización. NLP: Método de programación no lineal. La solución del problema lineal se resuelve mediante el método simplex revisado o un algoritmo modificado de este método. El método simplex es un proceso iterativo en el cuál el procedimiento de búsqueda comienza en un punto que satisface las restricciones, y en cada ciclo se obtiene un punto que mejora el valor de la función objetivo. En este método, los puntos que se prueban son puntos localizados en los vértices de la región factible. Los métodos que usan tolerancias factibles, mejoran el valor de la función objetivo usando puntos factibles y puntos llamados casi-factibles. La tolerancia para clasificar estos puntos casi-factibles se hace más restrictiva a través de la solución del problema hasta un límite determinado. En estos métodos, el problema de optimización se transforma a:
Optimizar: f ( X ) Sujeto a: ( k ) T ( X ) 0 . donde ( k ) es el valor de la tolerancia flexible para el criterio de factibilidad en la etapa k. 1 2
p m 2 2 definiendo la función T ( X ) hi ( X ) ui gi ( X ) i m 1 i 1 donde ui es el operador Heaviside tal que ui = 0 para gi ( X ) 0 , ui =1 para gi ( X ) 0 .
Los métodos del gradientes son métodos que utilizan información sobre el gradiente de la función objetivo en cada etapa para obtener la próxima aproximación del óptimo.
4.4. Ejercicios propuestos 1. Se desea instalar un evaporador de múltiple efecto para manejar un alimento de 100.000 lb/h de una solución salina del 5% en peso. Si se va a concentrar la
244 solución hasta el 20%, determine el número de efectos que deberían usarse para conseguir los costos anuales más bajos. El costo de inversión del evaporador debe ser tomado como US$50.000 para cada efecto instalado, junto con un valor adicional de US$15.000 para el equipo auxiliar que debe ser dispuesto, independientemente del número de efectos usados. La vida de la unidad se estima en 12 años y al final de este tiempo el valor de salvamento se considera que es US$7.500 por efecto. El evaporador operará 320 días al año. Los costos fijos anuales (excluyendo depreciación) deben ser tomados como el 12%, y los costos de mantenimiento anual como el 5%, ambos basados en la inversión original de capital. Los costos de vapor son US$5/1.000 lb de vapor usado, y 0.8N lb de agua se evapora en la unidad por cada libra de vapor, N es el número de efectos instalados. Los otros costos, excepto los de depreciación, deben ser considerados independientes del número de efectos usados. 2. Halle la temperatura máxima de salida del tercer intercambiador mostrado en el esquema (figura 9), sujeto a la restricción de que el área total tendrá un valor fijo, donde: N = 3, t1 = 150ºF, t2 = 200ºF, t3 = 250ºF, To = 100ºF, U = 0.1 ft-2, At = 100 ft2
Ti
A1 To
A2 T1
1
t1
Ti 1 ti AiU 1 AiU
2
An T2
...
Tn-1
t2
Tn
n
Tn
Figura 9. Esquema intercambiadores en serie
2. Resuelva el ejemplo 9 con el método de sustitución directa 3. Considere un proceso de extracción de 2 etapas con flujo cruzado. En cada etapa se pone en contacto 10 l/min de fluido de proceso con un solvente inmiscible con el fin de extraer el soluto presente que se alimenta en cada etapa. Para esto, se alimenta wi ml/min de solvente fresco (i representa cada etapa). La concentración de soluto en la solución original que se alimenta al sistema es x0 = 0.4. zi es la concentración de soluto deseado en la corriente de salida del solvente en cada etapa. Las composiciones de las corrientes de salida de cada etapa están relacionadas por la ecuación de equilibrio zi = 2xi. Si la cantidad unitaria de soluto extraído vale 500 $/l y el costo de la cantidad unitaria de solvente es 100 $/l, determine: i) una expresión para las ganancias con este sistema, si éstas están dadas por la resta del valor del soluto extraído menos el
245 costo del solvente suministrado, asumiendo costos de operación nulos, ii) los puntos estacionarios resultantes de optimizar las ganancias y clasifíquelos como máximo, mínimo y punto silla. Las concentraciones xi y zi están expresadas como ml de soluto/ml de solvente extractor o solvente portador. Utilice para la solución un método analítico de optimización de funciones multivariables con restricciones.
246 4.5. Bibliografía Avrial M., “Nonlinear Programming: Analysis and Methods, Prentice-Hall, New Jersey, 1976 Bazaraa M., “Nonlinear programming”, John Wiley & Sons, New York, 1979 Beveridge, S., “Optimization, theory and practice”, McGraw-Hill, New York, 1970 Himmelblau, D., “Applied nonlinear programming”, McGraw-Hill, New York, 1972. Mickley, H.S., Sherwood, T.S., Reed, C.E., "Applied Mathematics in Chemical Engineering". McGraw, New Delhi, 1975. Smith, C., Pike, R., Murril, P., "Formulation and optimización of mathematical models", International texbook Company, Scranton,1970.
247
TABLA DE CONTENIDO 5.1. Distribución de errores .................................................................................250 5.2. Propagación de errores ................................................................................252 5.3. Varianza de una medida indirecta.................................................................258 5.4. Estimación de intervalos y confiabilidad de estimaciones .............................260 5.5. Estimado de intervalos de desviaciones estándar ........................................266 5.6. Pruebas de hipótesis ....................................................................................270 5.6.1. Etapas en las pruebas de hipótesis ....................................................270 5.6.2. Comparación de varianzas.....................................................................271 5.6.2.1. Comparación de la varianza de una muestra y una varianza hipotética .......................................................................................................271 5.6.2.2. Comparación entre las varianzas de dos muestras..........................274 5.6.3 Comparación de medias .....................................................................278 5.6.3.1 Comparación entre la media de un conjunto y una media hipotética .279 5.6.3.2 Comparación entre la media de un conjunto x1 y la media de otro conjunto x 2 ....................................................................................284 5.6.3.3 Comparación entre las medias de dos conjuntos cuando se sospecha que hay factores extraños que pueden influir en las determinaciones individuales ....................................................................................289 5.6.3.4 Comparación entre varios valores de medias ...................................290 5.7. Ejercicios propuestos ...................................................................................296 5.9. Bibliografía ...................................................................................................297
248
CAPITULO V. INTERPRETACIÓN DE RESULTADOS EXPERIMENTALES Son muchas las actividades en ingeniería química en las que se requiere obtener, analizar e interpretar datos para la toma de decisiones. En la investigación y desarrollo de procesos, así como en el diseño, operación y mejoramiento continuo de unidades de transformación o plantas de procesos completas, por ejemplo, el ingeniero químico está enfrentado al tratamiento y análisis de datos, resultados de experimentos, cálculos u operaciones de producción cotidiana. En la investigación y desarrollo, y en el diseño de algunas unidades como reactores, filtros, centrífugas, lixiviadores, sistemas de suspensión y emulsificación, entre otros, el ingeniero químico debe realizar experimentos, tantos como sea necesario para validar hipótesis, encontrar relaciones entre variables de los sistemas en estudio, o determinar las mejores condiciones de operación para diseñarlos y optimizarlos. En la operación, el tratamiento y análisis de datos es una actividad cotidiana que debe realizarse por cambios o variaciones en materias primas y variables de operación, o por modificaciones en las especificaciones de los productos para adaptarlos a los cambios del mercado o requerimientos de los consumidores. En todas estas actividades el ingeniero está interesado en obtener siempre resultados confiables. Confiabilidad que está sustentada en el grado en que los valores de dichos resultados efectivamente representen el valor verdadero de los parámetros o características de los sistemas. Así, el significado de las conclusiones basadas en datos numéricos y la seguridad en las decisiones apoyadas en dichas conclusiones, están necesariamente determinados por la confiabilidad de los datos y métodos de procesamiento utilizados. Por ello es necesario evaluar la confiabilidad tanto de los datos como de los resultados obtenidos con base en medidas experimentales o medidas directas, mas aún, cuando de dichas conclusiones se desprenden decisiones costosas. La confiabilidad en datos no sólo es requerida en las investigaciones para la seguridad en las conclusiones y en la determinación experimental de propiedades físicas y fisicoquímicas, sino que condiciona también la realización de investigaciones y medidas experimentales con un mínimo de tiempo y costo. Tiempo y costo que están vinculados al número de experimentos que deben realizarse y a la precisión de los instrumentos de medida y rigurosidad de los métodos de cálculo o procesamientos utilizados. Todos los datos, medidos o calculados, están sujetos a errores. En la práctica no es posible obtener el valor verdadero de un parámetro o característica de un sistema. Siempre habrá la presencia de una desviación, ya por las limitaciones inherentes a los sentidos humanos, debido a las aproximaciones de los métodos que se usen o sofisticación de procedimientos de medida o instrumentos, o por la descalibración de estos instrumentos.
249
Si el error en un dato es descubierto y tenido en cuenta en su magnitud y signo en la forma de una corrección en su efecto, el error se denomina determinado, y los que no pueden ser tenidos en cuenta se denominan indeterminados. Estas categorías de errores también pueden clasificarse de manera más específica en errores accidentales, errores constantes y errores de método. Los errores accidentales son una clase importante de errores indeterminados. Ellos ocurren por limitaciones físicas de las personas que realizan la medida (error humano) y/o por variaciones fortuitas en la sensibilidad del instrumento de medida (error por sensibilidad). Los errores de métodos, también indeterminados, son debidos a aproximaciones y suposiciones hechas en el desarrollo teórico del modelo usado para calcular un resultado u obtener un dato, como por ejemplo el truncamiento en una serie y los errores de redondeo. Mientras que los errores constantes, que pueden determinarse haciendo medidas con diferentes instrumentos, son debidos a la descalibración del instrumento de medida. La presencia de errores accidentales y constantes determina la precisión y exactitud en una medida. La precisión o reproducibilidad está asociada a la ausencia de errores accidentales en la medida, mientras que la exactitud hace referencia a medidas libres de errores accidentales y constantes. Se concluye entonces de las afirmaciones precedentes, que si se desea conocer un valor de una propiedad mediante un análisis de laboratorio, resulta evidente que no se obtiene el valor “verdadero”. Sin embargo, puesto que ningún valor obtenido experimentalmente es absoluto, si se puede determinar mediante métodos estadísticos la confiabilidad de la determinación experimental. Esto exige realizar una medida tantas veces como deseemos tener confianza en relación con el valor absoluto o verdadero. En el caso específico de la comprobación de una hipótesis o la determinación de la confiabilidad de algún valor factual, se debe utilizar un experimento planeado estadísticamente. Básicamente esos experimentos preparados le permiten al analista determinar con un grado de confianza preestablecido, el grado de variación de las determinaciones experimentales que se debe a la casualidad y el causado por influencias conocidas o no. En el análisis de datos y planeación de experimentos es necesario responder algunas preguntas: ¿Qué tipo de errores son probables en una medida o cálculo? ¿Cómo se extiende en los resultados un error en los datos? ¿Cuánta seguridad deben poseer las cantidades individuales que entran en un cálculo para una confiabilidad especificada en el resultado? ¿Qué seguridad es económicamente factible obtener en una investigación? ¿Qué método de investigación es más confiable?
250
Estas preguntas y otras relacionadas con la comprobación de hipótesis, la determinación de una estimación confiable de algún valor factual y la representación funcional de una característica, se responden con ayuda del análisis estadístico. El análisis estadístico está constituido por un conjunto de técnicas para reducir y organizar datos y para determinar su significado esencial. Los métodos estadísticos se basan en el concepto simple de la variabilidad. Mediante este concepto se determina una base para la planeación de experimentos y el análisis de datos; en este sentido, los métodos estadísticos, se ocupan de obtener la información máxima a partir de un conjunto dado de datos (análisis) y, a la inversa, de minimizar la cantidad de datos (planeación experimental) necesarios para deducir informaciones específicas. 5.1. Distribución de errores Toda medida individual de una propiedad o característica de un sistema, por la presencia de errores, no es más que un estimado de su valor verdadero. Por ejemplo, si se tiene un tanque de producto de un proceso y se desea conocer la densidad del producto en el tanque, y se toma una muestra y se le determina su densidad, se dice que esta medida es un estimado de la densidad del producto. Por los errores que pueden estar presentes en la medida, no es posible decir que ese dato es el valor real o verdadero de la densidad. Esa medida específica de la densidad puede expresarse en función del valor verdadero y una variación debida a los errores, como: = + ε donde: = valor verdadero. ε = error experimental. Si se toman varias muestras y a cada muestra se le determina la densidad, la medida para cada muestra puede expresarse como: i= + i En este caso la media de estas determinaciones puede tomarse como un estimado más confiable de la densidad. Resulta evidente, en forma intuitiva, que en la medida en que se tome un mayor número de muestras, la media de las determinaciones tiende a un valor fijo. Este valor representa el valor verdadero de la densidad, si no existen errores de método y/o errores no-aleatorios inherentes en las medidas.
251
Las medidas repetidas de una cantidad x son comúnmente reportadas en términos de la media o valor promedio, y la desviación estándar o variación o la dispersión de los datos. Así, la media o promedio está dada por:
x
1 n xi n i 1
donde:
xi : son los valores individuales. n : número de datos o valores. La desviación estándar muestral es la raíz cuadrada del promedio de la diferencia al cuadrado entre los valores individuales y el valor promedio.
1 n s xi x n 1 i 1
2
Si en un conjunto infinito de datos las variaciones de los valores individuales son aleatorias, Gauss demostró que la distribución de los datos alrededor de la media está dada por la función:
1 ( x u ) 2 exp 2 , -∞< x < +∞ f ( x) 2
donde:
u = media hipotética = desviación estándar f ( x ) = frecuencia o probabilidad de ocurrencia de un valor de magnitud x. Esta función de distribución puede simplificarse definiendo la transformación:
z
xu
por lo tanto:
252
1 exp z 2 2 , -∞< z < +∞ f ( z) 2 La cual es conocida como la distribución normal estándar 5.2. Propagación de errores Cuando una cantidad deseada M está relacionada a varias cantidades directamente medidas M1 , M 2 ,..., M n por la ecuación:
M f M1 , M 2 ,..., M n M puede determinarse indirectamente o medirse indirectamente. En general, el valor verdadero de M no puede ser conocido si no se conocen los valores verdaderos de M1 , M 2 ,..., M n , pero el valor mas probable de M denotado por Q puede obtenerse a partir de los valores más probables de
M1 , M 2 ,..., M n , denotados por q1 , q2 ,..., qn . Evidentemente los errores en las medidas se propagaran hasta la cantidad calculada. El valor más probable de M, así como un estimado de M a partir de los estimados de qi pueden calcularse con la misma función, como:
Q f q1 , q2 ,..., qn
Q f q1 , q 2 ,..., q n
Si se conocen los errores en q1 , q2 ,......., qn se puede estimar la característica del error en Q . Haciendo una expansión en Taylor alrededor del punto que define los valores más probables de los qi y reteniendo únicamente los términos lineales se obtiene:
Q Q t f q q q donde:
q q1 , q2 ,..., qn y q q1 , q2 ,..., qn Como Q Q Q , error en la medida indirecta
253
Q Q Q t f q q q Q Q Q t q q q Q
f f q1 q2 ... q1 q q2 q f qi i 1 qi q n
Q
El signo en qi es el que haga máximo a Q . Así, el error calculado en Q depende entonces de: Naturaleza de la función f Magnitud de las cantidades medidas Magnitud de los errores en las cantidades medidas Si la función f es una suma:
Q q1 q2 ....... qn
q
i
n
q
Q
i
i 1
Si la función es una productoria n
Q qi i 1
n q Q i Q i 1 q i
En este caso si denominamos error relativo al error fraccional, en este caso se tiene que el error relativo en Q es igual a la suma de los errores relativos en q. Si la función tiene la forma:
Q q1 q2 ...qn a
b
k
a 1
k 1
Q q2 ...qn aq1 q1 ... q1 ...qn1 kqn qn b
k
kq n Q aq1 bq 2 ... Q q1 q2 qn
a
j
254
En este caso se establece que el error relativo de Q está dado por la suma de errores relativos afectados por la respectiva potencia en q i en la función. Ejemplo 1: Durante el curso de un análisis de funcionamiento de planta se hizo necesario determinar la velocidad promedio de agua a través de cierta tubería. El método más conveniente de medida fue un método indirecto consistente en la medida del peso del agua que salía de la tubería durante un tiempo t, medida del diámetro de la tubería y cálculo de la velocidad promedio con la relación:
W 4W tA D 2 t Las medidas directas con los errores estimados son: v
W 100 5 lb t 70 10 . s D 1 0.03 in 62.34 0.001lb/ft3 Si despreciamos el error relativo en el peso específico, se tiene que el error en v está dado por:
v
v v v W t D W t D
De la relación de v se obtiene:
v 4 W D 2 t v 4W t D 2 t 2 v 8W D D 3t v
4 4W 8W W t D 2 2 2 D t Dt D3t
Reemplazando los valores de las variables, sin el error, se obtiene:
v 0.042W 0.060t
100 D 12
255
Para obtener el máximo error se toman los signos de W , t y D tales que v sea máximo. v 0.042 5 0.060 1.0
100 0.03 12
v 0.522 ft / s 4 100 144 v ft / s 70 3.14 62.3 4.21 ft / s
El máximo error relativo es:
0.522 100 12.4% 4.21
Para hallar los errores relativos en las cantidades medidas para que el error de la cantidad indirectamente medida esté dentro de cierto margen de seguridad se utiliza el principio de efectos iguales; asumiendo que el error total puede estimarse como n veces la contribución de cualquiera de las medidas directas. O sea:
Q n
f f f q1 n q2 ... ...n q q1 q2 qn n
i. Si Q q1 q2 ... qn q q Q n 1 n 2 Q q1 q2
ii. Si Q q1 q2 ...qn a
b
n
qn qn
k
q q q Q na 1 nb 2 ... nk n Q q1 q2 qn Ejemplo 2: Cuáles deben ser los errores relativos en W,D y t para el ejemplo anterior, si se desea que v posea un error de 2.0%.
256 v W W 0.02 3 0.7% v W W 3 v t t 0.02 3 0.7% v t t 3 v D D 0.02 3 2 0.33% v D D 23
Ejemplo 3: La calibración de un orificio medidor normalmente se realiza midiendo la rata de flujo de agua con la caída de presión medida en un manómetro de mercurio. El método más simple para obtener la rata de flujo másico consiste en recoger y pesar el agua que fluye a través del medidor en un período definido de tiempo. Para un orificio particular de 0.25 in. de diámetro, se determinó una rata de flujo W igual a 19 lb/min con un error estimado de +/- 0.1 lb/min, y la correspondiente caída de presión fue 9.1 inHg con un error estimado de +/- 0.1 in Hg. Calcular el máximo error posible en el cálculo del coeficiente del orificio Cv, para el flujo medido. Determine cuál debe ser el error máximo en las medidas de W y caída de presión si se desea que el error máximo en Cv sea el +/-2%.
Cv
1 W K hm
donde
K A0 w 60 2 1.05 g
1
lb seg 1 ft 2 ft 2 (0.25) in 62.3 3 60 2 1.05 32.2 4 ft min 144in 2 seg 2
2
1
lb ft 2 K 10.5 min W = rata másica en lb/min. hm = caída de presión en in Hg. Cv
Cv Cv W h W hm m
Cv 1 W K hm
257
Cv W 32 hm hm 2K 1 W 32 W hm hm 2K K hm
Cv
Reemplazando los valores de K, W y hm, se obtiene:
Cv 0.0316W 0.0329hm Para obtener el máximo error se toman los signos de W y hm que hagan, efectivamente, máximo el valor.
Cv 0.0316(0.1) 0.0329(0.1) 6.45 103 El valor del coeficiente será por lo tanto Cv 0.6 6.45 * 10 3 . Para hallar los errores relativos de W y hm, para que Cv tenga un error máximo del +/-2% se aplica el principio de efectos iguales:
Q n
Q Q Q q1 n q2 ... n q q1 q2 qn n
En este caso:
Cv 2 W
Cv Cv W 2 h W hm m
Cv 2 Cv
W
Cv Cv CvW CvW W K hm K hm 2 2 W 2Cv 2W K hm
W 1 Cv 1 (0.02) 0.01 1% W 2 Cv 2 hm 2
Cv Cv
hm
Cv 32 Wh 2 m 2 K
hm Cv 2% hm Cv
Cv Wh 1 m K hm
Cv hm W K hm
Cv hm Cv
258 El error relativo con que debe determinarse el flujo W es ±1% y ±2% para la caída de presión.
5.3. Varianza de una medida indirecta La varianza de una medida indirecta está dada por: 2
Q 2 (Q) (qi ) i 1 qi q n
2
y el estimado de dicha varianza se puede obtener de una relación similar: 2
Q 2 s 2 (Q) s (qi ) i 1 qi q n
Esta relación se puede demostrar a partir de una expansión en Taylor función de Q. Una expansión en Taylor truncada en el segundo término da:
Q Q t f (q ) q q Q f (q1 , q2 ,...qn )
qi : Media estimada del valor verdadero.
Q Q t f q q q f f Q q1 q2 ... q1 q q2 q Elevando al cuadrado y despreciando los dobles productos. 2
2
2
f f f 2 2 2 Q qn q1 q2 ... q1 q q2 q qn q 2
dividiendo por n -1
de la
259
2
2
2
f qn2 Q 2 f q12 f q22 ... n 1 q1 q n 1 q2 q n 1 qn q n 1 donde n es el número de medidas individuales y usando la definición de varianza, para cada medida directa de qi, se obtiene: 2
Q 2 s (Q) s (qi ) i 1 qi q n
2
Ejemplo 4: Hallar la varianza de la velocidad promedio del agua, con los datos del ejemplo 1, teniendo en cuenta que el estimado de la varianza para cada una de las variables es: s 2 W 4.884 s 2 t 0.195 s 2 D 1.69 104 s 2 1.95 107
v
W 4W tA D 2 t
Las medidas directas con los errores estimados son:
W 100 5 lb t 70 10 . s D 1 0.03 in 62.34 0.001lb/ft3 Si despreciamos el error relativo en el peso específico, la varianza de v está dada por: 2
v 2 s v s qi i 1 qi q i 3
2
260
v 2 v 2 v 2 s v s W s t s D W t D 2
2
2
2
De la relación de v se obtiene:
v 4 W D 2 t v 4W t D 2 t 2 v 8W D D 3t 2
2
2
4 2 4W 2 8W 2 s v s W s t s D 2 2 2 3 D t D t D t 2
Reemplazando los valores de las variables, sus varianzas y para obtener el máximo error se toman los signos de las derivadas parciales positivos para que s 2 v sea máximo. 2
2 2 100 2 s 2 v 0.042 s 2 W 0.060 s 2 t s D 12
s 2 v 1.76 103 4.884 3.6 103 0.195 69.44 1.69 104 2.1102
5.4. Estimación de intervalos y confiabilidad de estimaciones Los valores de y para una medida de alguna propiedad o característica provee una descripción de la precisión del método de medida. Sin embargo, en la práctica no es posible obtener estos parámetros, sino estimaciones de ellos a partir de un conjunto finito de datos o medidas. Si se supone que la diferencia entre una media muestral x y se debe solo a la casualidad y que las medidas individuales de x tienen una distribución normal, se puede determinar una medida de la confiabilidad de x al estimar . Esta medida se denomina intervalo de confianza. Se puede demostrar que si una distribución de observaciones o medidas individuales es normal, con una media y desviación estándar , las medias muestrales, cada una de ellas basadas en n observaciones o medidas escogidas aleatoriamente de la población, tendrán
261 también una distribución normal en torno a , pero con una desviación estándar
. Así, si se conociera se podría definir un intervalo de confianza en el n cual se encuentre el valor , con una probabilidad especificada, a partir de una igual a
muestra. El intervalo estaría definido por:
x z
n
2
donde: n: número de observaciones o medidas para la muestra. z/2: valor definido por el nivel de probabilidad, y obtenido de la distribución normal.
z
2
2
P ( z z ) 2
f z dz
z
2
Ejemplo 5 : Obtener un intervalo de confianza del 95% para el rendimiento diario de un reactor de ácido sulfúrico, a partir de los rendimientos: 91.37%,91.45%,93.13%,92.87%,91.65%,91.96%,92.28%,92.57%,92.93% y 92.79%; si se supiera que =0.75. n
x i 1
xi 1 (9137 . 9145 . ...92.79) 92.30 n 10
De una tabla de valores de probabilidad para la distribución normal con 1-p(z)=5%/2=2.5%, se obtiene z=1.96, para p(z)=97.5. El intervalo para el rendimiento diario sería:
196 . * 0.75 196 . * 0.75 R 92.30 10 10 9183 . R 92.76. 92.30
R 92.30 0.464. Si se tiene un conjunto de medias con los respectivos estimados de la desviación estándar de la población, se puede conformar una muestra de medias de x1 , x2 , x3 ,..., xn y a partir de esta muestra obtener un mejor estimado de la media i
de la población. Este estimado está definido como:
xm
1 ni
ni
x j 1
j
262
donde:
ni representa el número de muestras o medias El estimado muestral de la desviación estándar del conjunto de medias está dado por:
sm
1 ni ( x j xm ) 2 ni 1 j 1
Este estimado muestral de la desviación estándar del conjunto de medias se puede estimar desde una simple muestra.
sm
s 1 2 ; s xi x n 1 n
s = estimado de la desviación estándar de la población sm = estimado de la desviación estándar de la población medias muestrales Se ha observado que la distribución de frecuencia de medias muestrales xi en torno a la media de la población es esencialmente normal, aunque la distribución de frecuencia de la población no lo sea. Este hecho es importante porque permite calcular intervalos de confianza para la media de una población aún cuando no se cumpla la condición de distribución normal para ella. Para una muestra con n 30 se puede aproximar m a sm , es decir
m sm Como la media de una muestra es un buen estimado de la media de la población, se puede usar junto con sm para la estimación de intervalos. En este caso el intervalo estará definido como:
x m z s m
a partir de un conjunto de medias
2
x z z
2
2
2
s n
a partir de una media
P( z z ) 2
263
Ejemplo 6: Un resultado analítico arroja una media de 30.8 y una desviación estándar estimada del conjunto de medias igual a 0.489. Calcular el límite del 95% de confianza para el valor verdadero. Se parte del supuesto de que m es conocido e igual a 0.489 por lo que, en el cálculo del intervalo se usará el estadístico z. De una tabla de probabilidad para la 5 distribución normal con 1 P z 2.5% , se obtiene z = 1.96 para P z 97.5% . 2 El intervalo de confianza del 95% será:
x z sm 2
30.8 1.96 0.489 30.8 0.96 29.8 31.8
s2 no n es un estimado adecuado de 2m . En este caso se utiliza la distribución t de Student para el estimado del intervalo en lugar de la distribución normal. La distribución t de Student está definida por. En el caso en que el número de datos de la muestra sea pequeño n 30,
1 1 2 t2 2 1 f t , -∞< t < +∞ 1 2 donde:
x sm : grados de libertad (número de valores usados para calcular las medias menos el número de medias calculadas). t
Por lo tanto un intervalo para el valor verdadero puede definirse a partir de la distribución t de Student con una probabilidad específica o una confianza deseada. Con esa probabilidad, y de la definición de la variable t , se tiene
264
x t 2 sm donde:
x t sm 2
t P(t t ) f (t )dt 2 t / 2 2 2
Ejemplo 7: Los resultados de un análisis gravimétrico son: 55.3, 56.9, 55.8, 57.3 y 57.7. Calcular el rango en que pueda encontrarse el valor verdadero con una confianza del 95%. Como el número de datos es menor que 30 (n 30), para el calculo del intervalo de confianza se usará el estadístico t y el estimado sm . Cálculo de la media:
x
1 5 xi n i 1 1 55.3 56.9 55.8 57.3 57.7 5 56.6
Cálculo de la sm :
sm2
5 1 2 xi x n n 1 i 1
0.20
x t sm 2
56.6 0.45t Con el 95% de probabilidad y los grados de libertad igual a 4 se obtiene de la tabla 2-1, de Mickley and Sherwood, “Applied Mathematics in Chemical Engineering”, 1975, el valor de
t / 2 2.776 2.8 .
56.6 126 . 55.34 57.86
265 Si se tienen varios grupos de datos que muestren medias equivalentes estadísticamente, es decir no existe una diferencia entre ellas estadísticamente significativa, se puede obtener a partir de las medias muestrales un mejor estimado del valor verdadero: ni
w x i
x mv
i
i 1 ni
w
i
i 1
donde :
wi
nk i nk i i
2
si
2
1 s
2
m ,i
nk = número de datos en un grupo Un intervalo para el valor verdadero puede definirse a partir de la distribución t de Student con el valor xmv y un estimado muestral de la desviación estándar del conjunto de medias muestrales. El estimado del intervalo de confianza se hace con el mejor valor de la media de las medias, cuando la varianza del conjunto de datos de cada muestra tienen los 2 2 valores diferentes i j , donde i, j son dos conjuntos de datos diferentes. El estimado de la varianza de la población de mejores valores de media, sm2 , mv , se puede obtener a partir de los estimados de la desviación estándar de la población de medias maestrales que se hace en cada conjunto de datos.
2 m ,mv
i 1
1 nk i
i2
1 2 sm ,mv 1 sm ,i
2
El intervalo de confianza esta dado como:
xmv t sm,mv 2
con = número total de datos menos el número de grupos ni
nk i ni i 1
266
donde:
ni = número de grupos o muestras (nk)i = número de datos en el grupo o muestra i Ejemplo 8: Un análisis realizado por dos procedimientos diferentes arroja los resultados que se muestran en la tabla 1. Tabla 1. Procedimientos del ejemplo 7
Procedimiento 1 Procedimiento 2
x1
x2
x3
x4
x5
x
55.3 52.6
56.9 54.3
55.8 58.0
57.3 52.7
57.7 60
56.6 55.5
2
sm 0.2 2.2
Obtenga el rango del valor verdadero con una confianza del 95%.
xmv
56.6
sm2 ,mv
1
1
0.2 0.2 1
0.2
55.5 1
1
2.2 56.5
2.2
0.183 2.2
Para obtener el intervalo con el mejor valor de la media se asumirá que las varianzas de los dos procedimientos son diferentes, es decir 12 22 . Con 10 2 8 y p(t
2
t t ) 0.95 se obtiene de la tabla 2-1 de Mickley 2
and Sherwood, “Applied Mathematics in Chemical Engineering”, 1975, el valor de
t / 2 2.306 , así el intervalo está dado por: xmv t sm, mv
2
56.5 2.306 0.18 56.5 0.984
5.5. Estimado de intervalos de desviaciones estándar
267 Si se asume que la población de la cual se hace el muestreo tiene una distribución aproximada a la distribución normal, se puede demostrar que el estadístico
2
(n 1) s2
2
llamado chi-cuadrado, tiene una distribución continua conocida como la distribución de chi-cuadrado, con media igual a (n-1), los grados de libertad. Esta distribución está dada por la función: f 2
1
2
2
2
1
( 2 ) 2 e
2
2
, 0 2
donde
: grados de libertad
k t k 1et , k >0 0
Para esta distribución: Con una probabilidad de (1 ) , se puede acertar que:
12
(n 1) s 2
2
2
2
2
A partir de esta ecuación, mediante transformaciones algebraicas se obtiene el intervalo para , para muestras pequeñas, (n 30) : (n 1) s2
2
2
.
(n 1) s2
12
2
donde : 2 es el valor de la variable 2 tal que P( 2 2 ) como se muestra 2 2 2 en la figura 1; y 12 es el valor de la variable 2 tal que P( 2 12 ) 2
se ilustra en la figura 2.
2
2
como
268
Figura 1. Distribución chi-cuadrado
Figura 2. Regiones de la distribución chi-cuadrado Para muestras grandes. (n ≥ 30), la distribución de s se puede aproximar a una distribución normal que tiene media igual a y desviación estándar igual a
. 2n Con esta distribución se puede establecer el intervalo para con un nivel de significancia .
269
s 1
z
s
1
2
2n
z
2
2n
donde:
z
2
P( z z )
2
2
Ejemplo 9: Se hicieron cinco determinaciones del flujo de agua fria en un intercambiador de calor. Los valores obtenidos en GPM (galones por minuto) fueron: 5.84, 5.76, 6.03, 5.90, 5.87. Determine el intervalo de confianza para la imprecisión en la medida del flujo. Como el número de datos es menor que 30, n 30, el intervalo de confianza se construye con el estadístico 2 ; y esta dado por: (n 1) s2
2
(n 1) s2
.
12
2
2
Cálculo de la media:
x
1 xi 5
1 5.84 5.76 6.03 5.9 5.87 5 5.88
Cálculo del estimado de la varianza:
1 5 s xi x 4 i 1 2
2
1 (5.84 5.88)2 (5.76 5.88)2 (6.03 5.88)2 (5.9 5.88)2 (5.87 5.88)2 4 = 0.013 0.00975
Los valores de 2 / 2 y 12 / 2 se leen de una tabla para las distribución Chi-cuadrado con 5% ; para obtener el intervalo de confianza con una probabilidad del 95%. Los valores leídos con 4 son:
270
2 2 0.4844 0.025 11.1 ; 0.975
4 0.00975 4 0.00975 . 11.1 0.4844 0.059 0.284
5.6. Pruebas de hipótesis Con mucha frecuencia en las investigaciones es necesario comparar un promedio de un conjunto de datos con un valor hipotético o con el valor promedio de otro conjunto (o los promedios de otros conjuntos) de datos, para determinar si las diferencias observadas entre ellos pueden deberse a la casualidad. Igualmente es necesario, en algunos casos, tener información sobre la homogeneidad de datos o de un conjunto de determinaciones experimentales; es decir, conocer la variabilidad o la varianza de un conjunto o varios conjuntos de medidas. En esas circunstancias, el criterio para determinar si una diferencia es o no real, es determinar la magnitud de la diferencia que puede deberse a la casualidad. Si la diferencia observada es mayor que la que pudiera esperarse razonablemente en forma aleatoria, se dice que dicha diferencia es estadísticamente significativa. Para responder si efectivamente existe alguna diferencia entre la media y un valor hipotético, o entre un conjunto de medias, así como si existe alguna diferencia entre la varianza y un valor hipotético se realizan pruebas de hipótesis. En las pruebas de hipótesis, se pueden cometer dos tipos de errores: Error tipo I: Descartar una hipótesis cuando es verdadera. Error tipo II: Aceptar una hipótesis cuando es falsa. Esta situación puede esquematizarse en la tabla 2, si se simboliza con H la hipótesis. Tabla 2. Pruebas de hipótesis
H es verdadera H es falsa Aceptar H Decisión correcta Error tipo II Rechazar H Error tipo I Decisión correcta
5.6.1. Etapas en las pruebas de hipótesis 1. Formular una hipótesis de tal forma que pueda calcularse la probabilidad de un error tipo I. A esta hipótesis se le llama hipótesis nula.
271 2. Formular una hipótesis alterna de tal forma que el desecho de la hipótesis nula sea equivalente a la aceptación de la hipótesis alternativa. 3. Especificar la probabilidad con la cuál queremos correr el riesgo de un error tipo I. Esta probabilidad es generalmente llamada el nivel de significancia con el cuál se realizará la prueba y es denotada por . 4. Construir el criterio de la prueba usando la teoría estadística apropiada. 5. Finalmente, especificar si la alternativa de desechar la hipótesis nula es aceptar o reservarse el juicio sobre la hipótesis alterna.
5.6.2. Comparación de varianzas Hay tres tipos básicos de comparaciones de varianza:
Entre la varianza de un conjunto y una varianza hipotética. Entre la varianza de dos conjuntos de datos. Entre las varianzas de varios conjuntos de datos.
5.6.2.1. Comparación de la varianza de una muestra y una varianza hipotética La hipótesis nula que se denominará H0, y la hipótesis alterna que se designará H1, se formularán de acuerdo con la pregunta que se requiere responder. Con cada hipótesis nula hay asociada una hipótesis alterna. Si 2 es el valor verdadero de la varianza del conjunto de datos y 02 un valor hipotético de la varianza, los pares posibles que pueden construirse son:
Ho : 2 ≥ 02
y
H1 : 2 02
Ho : 2 ≤ 02
y
H1 : 2 > 02
Ho : 2 = 02
y
H1 : 2 ≠ 02
El estadístico 2 se usa en los criterios para aceptar o rechazar la hipótesis nula. El valor calculado u observado de este estadístico está dado por la ecuación:
2
n 1s 2 20
donde s2 es un estimado del valor verdadero de 2, y los grados de libertad son iguales a n 1 . Los criterios para decidir en la prueba aparecen en la tabla 3
272 Tabla 3. Criterios para aceptar o rechazar la hipótesis nula en la comparación de una varianza 2 con un valor hipotético 02
Hipótesis nula 2 02 2 02 2 02
Hipótesis alterna 2 02 2 > 02 2 02
Desechar la Aceptar la hipótesis nula hipótesis nula o reservarse el juicio 2 2 1 2 12 2 >2 2 2 12 / 2 2 2 / 2 2 12 / 2 ó 2 >2 / 2
Donde:
2 P( 2 2 ) 12 1 P( 2 12 ) 2 / 2 / 2 P( 2 2 / 2 ) 12 / 2 1 / 2 P( 2 12 / 2 ) Estos mismos criterios están representados en las figuras 3, 4 y 5. En las figuras está representado el criterio para rechazar la hipótesis nula, cuando el valor de 2 calculado u observado cae en las zonas rayadas en las figuras. La figura 3 para el caso de hipótesis nula 2 02 , la figura 4 para la hipótesis nula 2 02 y la figura 5 para la hipótesis 2 02 . 2 2
Y Axis Title
f( )
0
2
0
2
Figura 3. Hipótesis alterna 0 -2 -2
0
2
4
6
X Axis Title
8
10
12
273
Figura 4. Hipótesis alterna 0
2 2
Y Axis Title
f( )
0
2
0
2
Figura 5. Hipótesis alterna 0
-2 -2
Ejemplo 10:
2
0
2
4
6
8
10
12
X Axis Title
El espesor de una parte usada en un semiconductor tiene una dimensión crítica tal que su variación está dada por una desviación estándar no mayor que 0.60 milésimas de pulgada. Si de un proceso de manufactura de estas partes se tomaron 18 muestras cuya desviación estándar es s= 0.82 milésimas de pulgada, puede considerarse que el proceso está ajustado para satisfacer la calidad de las partes?. Para responder la pregunta se plantean como hipótesis:
274
H0:
2 02 (0.60)2
H1:
2 > 02 (0.60)2
El valor observado para 2 es:
n 1 s 2 2 2
0
17 0.82
0.60
2
2
2 31.75 Con un nivel de significancia igual al 5% ( 5% ), para 17 grados de libertad se obtiene de una tabla para la distribución chi-cuadrado:
2 27.587. Como el valor observado es mayor que el valor leído 2 2 se descarta la hipótesis nula, lo que implica que el proceso no satisface el requerimiento de dimensión crítica y por lo tanto debe ajustarse. 5.6.2.2. Comparación entre las varianzas de dos muestras De igual manera a la comparación de una varianza con un valor hipotético, en la comparación de dos varianzas de dos conjuntos de datos, las hipótesis se formularán de acuerdo con lo que se requiere saber. Si 12 es el valor verdadero de un conjunto de datos y 22 el valor verdadero correspondiente al otro conjunto, los pares posibles de hipótesis que pueden formularse son:
Ho : 12 ≥ 22
y
H1 : 12 22
Ho : 12 ≤ 22
y
H1 : 12 > 22
Ho : 1 = 22
y
H1 : 1 ≠ 22
2
2
El estadístico F se usa en los criterios para aceptar o rechazar la hipótesis nula. El valor calculado u observado de este estadístico esta dado por:
F
s12 s22
2 donde s12 y s22 son estimados de las varianzas 1 y 22 , respectivamente.
Los criterios para decidir en la prueba aparecen en la tabla 4.
275
Tabla 4. Criterios para aceptar o rechazar la hipótesis nula en la comparación de dos varianzas 12 y 22 , de datos normalmente distribuidos
Hipótesis nula
Hipótesis alterna
Desechar la hipótesis nula
Aceptar la hipótesis nula o reservarse el juicio
12 22
12 22
F F1
F F1
12 22
12 22
F F
F F
12 22
12 22
F F1 ó F F 2
2
F1 / 2 F F / 2
Donde:
F1 1 P( F F1 ) F P( F F ) F1 / 2 1 / 2 P( F F1 / 2 ) F / 2 / 2 P( F F / 2 ) F , F1 , F / 2 y F1 /2 se obtienen de valores tabulados de la distribución F; los cuales deben leerse teniendo en cuenta los grados de libertad del parámetro del numerador ( s12 ) y los grados de libertad del parámetro del denominador ( s22 ). Por economía en la escritura se han escrito estos valores sin los respectivos grados de libertad, pero estrictamente su representación es: F F ( 1 , 2 )
donde: 1 : Grados de libertad asociados al numerador 2 : Grados de libertad asociados al denominador Las tablas que registran valores de la distribución F, normalmente tabulan una de las colas para valores que dejan a la derecha probabilidades del 5%, 2.5% y 1%; es decir valores de F y F / 2 . Para encontrar los valores de F1 y F1 /2 se utiliza la propiedad:
276 F1 ( 1 , 2 )
1 F ( 2 , 1 )
F1 / 2 ( 1 , 2 )
1 F / 2 ( 2 , 1 )
Por ejemplo, de una tabla se lee F0.05 (7,9) = 3.29 y el valor de F0.95 (9,7) se obtiene como:
F0.95 (9, 7)
1 F0.05 (7,9)
1 3.29 F0.95 (9, 7) 0.304
F0.95 (9, 7)
Ejemplo 11: El rendimiento diario de un reactor determinado durante 10 días fue 92.30 con una desviación estándar de 0.65. Si cierto tiempo después se realizaron otras 10 pruebas para el reactor, con algunas modificaciones ligeras en él, en las cuales se obtuvo un rendimiento promedio de 92.59 con una desviación estándar de 0.37. Existe diferencia entre las desviaciones estándar de los dos conjuntos de medidas del rendimiento. Para responder la pregunta se formularán como hipótesis: H0: 1 2 H1: 1 2 La prueba se realizará con un nivel de significancia igual al 5%, es decir, 5% . El estadístico que se usará es el estadístico F, calculado como:
s12 (0.65) 2 F 2 3.086. s2 (0.37) 2 F El valor de / 2 se lee en una tabla con grados de libertad en el numerador, n1-1, igual a 9 y grados de libertad en el denominador, n2-1, también igual a 9.
F = 4.03 2
El valor F1 / 2 se tiene haciendo uso de la propiedad de este estadístico:
277
F1 / 2 ( 1 , 2 )
1 F / 2 ( 2 , 1 )
F0.975 (9,9)
1 F0.025 (9,9)
F0.975 (9,9)
1 0.248 4.03
o sea, F1 / 2 =0.248 Como el valor de F calculado está en el intervalo de 0.248 F 4.03 , se acepta la hipótesis nula; es decir, se concluye que no hay diferencia en las desviaciones estándar o varianzas de los rendimientos del reactor Ejemplo 12: Un análisis realizado por dos procedimientos diferentes arroja los siguientes resultados:
x1 55.3 52.6
Procedimiento 1 Procedimiento 2
x2 56.9 54.3
x3 55.8 58.0
x4 57.3 52.7
x5 57.7 60
x 56.6 55.5
Determine si los dos procedimientos tienen la misma precisión. Para responder la pregunta se hará una prueba de hipótesis de varianza con las siguientes hipótesis: H0: 12 22 H1: 12 22 La prueba se hará con un nivel de significancia del 5%. Con este valor de α se obtiene de una tabla para la distribución F el valor de F0.025 (4, 4) y con este valor se calcula F0.975 (4, 4) usando la propiedad que tiene esta distribución. Así, el valor de F0.025 es: F / 2 F0.025 (4, 4) 9.6
F1 / 2 F0.975 (4, 4)
1 0.104 9.6
El valor calculado de F es:
278
s22 F 2 s1 Con:
s12
1 xi,1 x1 4
2
1 (55.3 56.6) 2 ... (57.7 56.6) 2 4 1.02
y
s22
1 xi,2 x2 4
2
1 (52.6 55.5)2 ... (60 55.5)2 4 11.02
F
11.02 10.8 1.02
Como el valor de F calculado cae fuera del intervalo 0.104 F 9.6 se descarta la hipótesis nula; es decir, se concluye que hay diferencia en las desviaciones estándares de los dos procedimientos. Con este resultado de este ejemplo se confirma la suposición que se hizo sobre las varianzas de los dos procedimientos analíticos en el ejemplo 8; en consecuencia si era posible obtener el intervalo de confianza con el mejor valor de la media. Si el cálculo de F se hubiese hecho como:
s12 1.02 F 2 0.092 s2 11.02 también se hubiera llegado a la misma conclusión, ya que este valor calculado esta igualmente por fuera del intervalo. 5.6.3 Comparación de medias También en la comparación de medias hay tres tipos básicos de comparaciones:
279
Entre la media de un conjunto y una media hipotética. Entre las medias de dos conjuntos de datos. Entre las medias de varios conjuntos de datos.
5.6.3.1 Comparación entre la media de un conjunto y una media hipotética La hipótesis nula, que denominaremos Ho, y la hipótesis alterna que se designará H1, se formulan de acuerdo con la pregunta que desee responderse. A cada hipótesis nula le corresponde una hipótesis alterna. Si es el valor verdadero de la media del conjunto de datos y o un valor hipotético de la media, las posibilidades que pueden construirse son: Ho : ≥ o y H1 : o Ho : ≤ o y H1 : > o Ho : = o y H1 : ≠ o El estadístico que se usa en los criterios para aceptar la hipótesis nula o rechazarla depende de si el valor de para la población de donde se tomó el conjunto de datos es conocido o no es conocido, y del número de datos de la muestra o conjunto de datos. Cuando el valor de es conocido se usa el estadístico Z de la distribución normal y los criterios para decidir en la prueba se registran en la tabla 5. Tabla 5. Criterios para aceptar o rechazar la hipótesis nula con conocido
Hipótesis nula 0 0 0
Hipótesis alterna 0 0 0
Desechar la hipótesis Aceptar la hipótesis nula nula o reservarse el juicio z z
z z
z z
z z
z z ó z z 2
2
donde:
z P( z z )
z
f ( z )dz
z P( z z ) f ( z )dz 2 z / 2 2 2 z
x 0
/ n
n : número de datos en la muestra o conjunto de datos
z z z 2
2
280
Cuando el valor de de la población es desconocido se usa el estadístico z de la distribución normal para una muestra de tamaño grande, n > 30, y el estadístico de la distribución t student para una muestra pequeña, n ≤ 30. Los criterios para decidir en la prueba, en el caso de muestras grandes son los mismos que se registran en la tabla 5; mientras que para muestras pequeñas estos criterios aparecen en la tabla 6.
Tabla 6 Criterios para aceptar o rechazar la hipótesis nula con desconocido y n ≤ 30
Hipótesis nula 0 0
Hipótesis alterna 0 0 0
0
Desechar la hipótesis nula
Aceptar la hipótesis nula o reservarse el juicio
t t
t t
t t
t t
t t ó t t 2
t t t 2
2
2
donde:
t P(t t ) f (t )dt t
t P(t t ) f (t )dt 2 t / 2 2 2
x 0 sm con: t
n 1 para leer t o t
2
n : numero de datos de la muestra o conjunto de datos Los criterios registrados en las tablas 5 y 6 pueden mostrarse sobre una línea recta, en la que se representa el dominio del estadístico y los valores leídos del estadístico de acuerdo con las hipótesis formuladas. Simbolizados como θ (t o z) el estadístico usado en los criterios, en las siguientes gráficas se representan las
281 regiones donde se acepta la hipótesis nula o se rechaza, dependiendo donde se localice el valor calculado del estadístico
Hipótesis nula Ho
Región de aceptación y rechazo de la hipótesis
Reservarse el juicio
≥ o
Rechazar Ho
Aceptar Ho Θ = - Θα
Θ=0
Reservarse el juicio Rechazar Ho
≤ o
Aceptar Ho
Θ=0
= o
Rechazar Ho
Θ = - Θα/2
Θ = Θα
Rechazar Ho
Aceptar Ho
Θ=0
Θ = Θα/2
Reservarse el juicio
Ejemplo 13: El contenido de azufre de varias muestras de un crudo se reportan como: %s = 2.1, 1.9, 2.4, 2.3, 2.5, 2.4, 2.6, 2.5, 2.7, 2.3, 2.3, 2.4.
282
Se desea saber si las muestras representan un crudo con un contenido de azufre menor que el 2.5%. Hipótesis nula H 0 : 0 2.5% Hipótesis alterna H1: 0 . Para responder la pregunta sobre el contenido de azufre del crudo, es conveniente que una de las dos hipótesis, la nula o la alterna, represente lo que se quiere saber; es decir, si el verdadero () es menor que el valor hipotético (o). En términos matemáticos será o . Las hipótesis para realizar la prueba se formularán, entonces como: Hipótesis nula
H0:
Hipótesis alterna
H1:
0 = 2.5% 0 = 2.5%
Como el valor del es desconocido y el número de datos que se tiene es menor que 30 se usará el estadístico t para decidir en la prueba. Cálculo de la media:
x
1 12 1 xi 2.1 ... 2.4 2.37 12 i 1 12
Calculo del estimado de la varianza:
1 12 ( xi x) 2 11 i 1 1 s 2 (2.1 2.37)2 (1.9 2.37)2 ...... (2.4 2.37)2 11 2 s 0.0326
s2
Entonces:
s 2 0.0326 s n 12 2 sm 2.716 x103 2 m
sm 0.052 Valor de t calculado:
283
t
x 0 2.37 2.5 sm 0.052
t 2.5 El valor leído de t se obtiene, para 5% , con 11 de la tabla 2-1, de Mickley and Sherwood, “Applied Mathematics in Chemical Engineering”, con P = 0.9. También puede obtenerse el mismo valor de una tabla de la distribución t de Student con una probabilidad P ( t t )= 0.05. t = 1.796 Como t t , o sea -2.5 1.796, se acepta la hipótesis nula. En consecuencia el crudo tiene un contenido menor del 2.5% en azufre. Si se hubieran planteado como hipótesis: H0: H1:
0 = 2.5% 0 = 2.5%
se habría llegado a la misma conclusión, ya que t t , es decir -2.5 -1.796. Si la prueba se hace con 2.5% , también se habría llegado a la misma conclusión. El análisis también puede realizarse sobre una línea recta donde se ubiquen los valores del estadístico t. Para las hipótesis H0: H1:
0 = 2.5% 0 = 2.5%
Rechazar Ho
Aceptar Ho
t =-2.5
0
tα=1.796
284 Se observa en este gráfico que el valor de t cae en la zona donde se acepta la hipótesis nula. Los intervalos de confianza también pueden usarse para realizar la prueba. En este caso si se obtiene el intervalo de confianza del 95% asociado a las hipótesis H0: 0 = 2.5%
0 = 2.5%
H1:
Con 2.5% , la decisión se toma observando si el valor de o cae dentro o fuera del intervalo. Este intervalo está dado por:
x t sm 2.37 2.201 0.052 2.37 0.114 2.256 2.484 Como o =2.5 es mayor que el limite superior del intervalo, se concluye que es menor que o. Es decir se acepta la hipótesis nula: El crudo tiene un contenido de azufre menor que el 2.5% 5.6.3.2 Comparación entre la media de un conjunto x1 y la media de otro conjunto x 2 De manera similar a la comparación de una media con un valor hipotético, en este caso también la hipótesis nula y alterna se formularán de acuerdo con la pregunta que desee responderse. Si es el valor verdadero del conjunto cuya media es x1 y el 2 el valor correspondiente al otro conjunto de media x 2 , los pares posibles de hipótesis que pueden plantearse son:
Ho : 1 ≥ 2 Ho : 1 ≤ 2 Ho : 1 = 2
y y y
H1 : 1 2 H1 : 1 > 2 H1 : 1 ≠ 2
El estadístico que se usa en los criterios para decidir sobre las hipótesis depende de si los valores de las , 1 y 2, son conocidos o desconocidos e iguales o diferentes, y del número de datos de las muestras o conjuntos de datos. 5.6.3.2.1 Comparación con 1 y 2 conocidos e iguales 1 = 2 = Cuando es conocido e igual para los dos conjuntos de datos 1 = 2 = , se utiliza el estadístico z si el número de datos es mayor que 30 (n> 30), para cada
285 conjunto, y el estadístico t si es menor o igual que 30 (n ≤ 30). En el primer caso el valor de z se calcula con la ecuación:
z
x1 x2 1/ n1 1/ n2
En el segundo caso cuando (n ≤ 30) el valor de t se calcula con la ecuación:
t
x1 x2 1 1 n1 n2
con: .
n1 n2 2
grados de libertad
donde: n1 : numero de datos del conjunto 1 n2 : numero de datos del conjunto 2 Los criterios para decidir sobre las hipótesis se encuentran registrados en las tablas 7 y 8. 5.6.3.2.2 Comparación con 1 y 2 conocidos y diferentes 1 ≠ 2. Para valores de conocidos y diferentes, 1 ≠ 2, también se usa el estadístico z cuando el número de datos es mayor que 30 (n> 30) y el estadístico t cuando el número de datos es menor e igual a 30 (n ≤ 30). En el caso de n > 30 el valor de z se calcula como:
z
x1 x2
12 / n1 22 / n2
El valor de t, para diferentes y n ≤ 30, se obtiene como:
t
con:
x1 x2
/ n1 22 / n2 2 1
286
n1 n2 2
grados de libertad
donde: n1 : numero de datos del conjunto 1 n2 : numero de datos del conjunto 2 Los criterios para decidir sobre las hipótesis son los que se encuentran registrados en las tablas 7 y 8. 5.6.3.2.3 Comparación con 1 y 2 desconocidos e iguales 1 = 2. El estadístico que se usa, como en las situaciones anteriores, igualmente depende del número de datos. En el caso de n> 30 se usa el estadístico z y el valor se calcula con la siguiente ecuación:
x1 x2
z
2 1
s
n1
s22
n2
donde s12 y s22 son los estimados de 12 y 22, respectivamente. Para n ≤ 30 se utiliza el estadístico t y su valor se obtiene como:
t s
x1 x2 1 1 n1 n2
donde:
s2
(n1 1) s12 (n2 1) s22 n1 n2 2
con:
n1 n2 2 grados de libertad Los criterios para decidir son los mismos registrados en las tablas 7 y 8. 5.6.3.2.4. Comparación con 1 y 2 desconocidos y diferentes.
287 Para estas combinaciones se utiliza el estadístico t, independientemente del número de datos en los conjuntos. El valor de t se calcula como:
x1 x2
t
s12
n1
s22
n2
con:
s
2 1
s
2 1
/ n1 s22 / n2
2
/ n1 / n1 1 s22 / n2 / n 2 1 2
2
También en las tablas 7 y 8 se registran los criterios para decidir sobre las hipótesis
Tabla 7. Criterios para aceptar o rechazar la hipótesis nula en la comparación de dos medias x1 y x 2 ; para n> 30
Hipótesis nula
Hipótesis alterna
Desechar la hipótesis nula
Aceptar la hipótesis nula o reservarse el juicio
1 2
1 2
z z
z z
z z
z z
1 2 1 2
1 2
1 2
z z ó z z 2
2
z z z 2
2
Tabla 8. Criterios para aceptar o rechazar la hipótesis nula en la comparación de dos medias, x1 y x2 para n ≤ 30
Hipótesis nula 1 2 1 2 1 2
Ejemplo 14:
Hipótesis alterna 1 2 1 2
1 2
Desechar la hipótesis nula
Aceptar la hipótesis nula o reservarse el juicio
t t
t t
t t
t t
t t ó t t 2
t t t 2
2
2
288 El rendimiento diario de un reactor determinado durante 10 días (una prueba por dia) fue 92.30 con una desviación estándar de 0.65. Si cierto tiempo después se realizaron otras 10 pruebas para el reactor, con algunas modificaciones ligeras en él, en las cuales se obtuvo un rendimiento promedio de 92.59 con una desviación estándar de 0.37, afectó el rendimiento promedio las modificaciones realizadas?. Para responder la pregunta, las hipótesis apropiadas son: Hipótesis nula H0 : 1 2 . Hipótesis alterna H1: 1 2 . ya que interesa saber si los rendimientos son iguales o no. Para realizar la prueba previamente se debe tener información sobre las varianzas; si ellas son conocidas, desconocidas, iguales o diferentes. Como se tienen estimados de las desviaciones estándar de los rendimientos, s1=0.65 y s2=0.37, y como en el ejemplo 11 se encontró que no había diferencias en las desviaciones estándar para los dos conjuntos de medidas 1 2 , la prueba que se hará es para desviaciones desconocidas e iguales. Dado que el número de datos n1 y n2, es menor que 30, se usará el estadístico t para la prueba y su valor está dado por:
t s
x1 x2 1 1 n1 n2
el valor de s2 es:
s2
(n1 1) s12 (n2 1) s22 n1 n2 2
como n1 = n2
1 1 s 2 ( s12 s22 ) (0.65) 2 (0.37) 2 0.28 2 2 s 0.53 t
92.3 92.59 1.22 2 0.53 10
Si se toma α=5%, con n1 n2 2 18 , el valor de t =2.10 2
289 Al comparar t =2.10 con el valor de t calculado se observa que t t , lo que 2
2
implica que se acepta la hipótesis nula H0 y por lo tanto se concluye que no hay evidencia estadística par afirmar que el rendimiento del reactor haya cambiado con las modificaciones realizadas.
5.6.3.3 Comparación entre las medias de dos conjuntos cuando se sospecha que hay factores extraños que pueden influir en las determinaciones individuales Los valores de xdi se generan así: Conjunto 1
x 1,1
x 2,1
x 3,1
x 4,1
………
x n-1,1
x n,1
Conjunto 2
x 1,2
x 2,2
x 3,2
x 4,2
………
x n-1,1
x n,1
Diferencias
x d1
x d2
x d3
x d4
………..
x dn
x di = x i,1 – x i,2 La prueba se realiza con las siguientes hipótesis:
xd o 0
Ho:
H1 : xd o 0 Con un número de datos menor que 30 en cada conjunto se utiliza el estadístico t, y se calcula como:
t
xd 0 smd
donde: n
2 smd
(x i 1
di
xd ) 2
n(n 1)
n : número de datos en cada conjunto. n = n1 = n2.
xd : la medida de las diferencias de valores
290
xd
1 n xdi n i 1
Con el nivel de significancia especifico, α, se obtiene de una tabla el valor t ( P(t t ) / 2) 2
2
La hipótesis nula se acepta si t calculado está contenido en el intervalo t t t , y se descarta si esta fuera de este intervalo 2
2
5.6.3.4 Comparación entre varios valores de medias En esta comparación se utilizarán las siguientes hipótesis
1 2 3...... n H1 : 1 2 3...... n Ho:
i
i
donde ni es el número de medias que se requieren comparar. La prueba se realizará con el estadístico F y la condición de que las varianzas sean todas iguales para los n conjuntos de datos. Es decir, 1 2 3 ... ni , El valor de F se calcula como:
F
s 2p se2
donde s 2p es un estimado de la varianza de la población de datos y se2 es también un estimado de la varianza 2. La diferencia es que se2 es un mejor estimado en el que no aparecen los errores de método, mas sí en el valor de s 2p , si dichos errores existen. Si no existieran variaciones no-aleatorios los estimados se2 y s 2p serían iguales. La presencia de factores no aleatorios que causan las diferencias entre las medias muestrales, hacen que s 2p sea mucho mayor que se2 .Así, la razón entre s 2p y se2 , el valor de F calculado, es una medida de si pueden o no acontecer diferencias entre las medias muestrales. El mejor estimado se2 , se calcula como:
291 ni
nk
( x
s e2
i 1 k 1 ni
(n i 1
xi ) 2
ik
) i ni
k
donde:
ni : número de conjuntos, número de medias. (nk ) i : número de medidas en el conjunto i. Los grados de libertad asociados con se2 son:
ni
(n
k
) i ni
i 1
se2 , también puede obtenerse a partir de las varianzas de error dentro de cada muestra. ni
se2
( n
) i 1si2
k
i 1 ni
(n
k
) i ni
i 1
El estimado de la varianza de la población de medias está dada por: ni
2 smp
(x x i
i 1
p
)2
ni 1
donde: ni
xp
(n
k
) i xi
i 1 ni
(n
. k
)i
i 1
El estimado de la varianza de la población, s 2p , se puede obtener a partir de la 2 varianza de la población de medias smp :
2 s 2p n0 smp
292
donde:
n0 nk , si todos los conjuntos tienen el mismo tamaño. 1 ni n0 (nk ) i ni 1 i 1
ni
( n ) k
2
i
i 1 ni
(n
k
)i
i 1
.
con s 2p hay asociados ni 1 grados de libertad. 2 En cada muestra la magnitud de errores aleatorios está dada por si , pero no es posible a partir de una sola muestra estimar el error debido al método o errores de método.
Los valores de F que son significativamente mayores que 1.0, indican que la diferencia entre las medias se debe a factores no aleatorios. Para decidir sobre la prueba con un valor de ( ) determinado, se obtiene el valor de F de una tabla. Si 2
el valor observado o calculado de F es mayor que F
leído se descarta la 2
hipótesis nula, en caso contrario se acepta.
.Ejemplo 15: Resuelva el ejemplo 14 utilizando la comparación entre varios valores de medias. La prueba puede plantearse como: Existe una diferencia significativa entre los dos rendimientos promedio?.
H0 : Hipótesis nula Hipótesis alterna H1:
1 2 1 2
Se tiene: x1 92.30
x2 92.59
s1 0.65
s2 0.37
El valor estimado de la varianza combinada está dada por:
se2
1 2 2 0.65 0.37 0.28 2
293 El estimado de la varianza de la población de medias es: 2 mp
s
2 1 ni x x i p ni 1 i 1
x1 x2 92.3 92.59 92.44 2 2 2 2 2 smp 92.3 92.44 92.59 92.44 xp
2 smp
0.0421
2 s 2p 10smp 0.421
F De
s 2p 2 e
s
0.421 1.5 0.28
una
tabla
para
distribución
F
se
obtiene
F 5.98
para
2
5% , p 1, e 18 . Como el valor observado
de F es menor que F
(1.5 5.98), se acepta la 2
hipótesis nula; es decir no hay diferencias significativas entre las medias o no hay evidencia estadística para decir que son diferentes. Ejemplo 16: La empresa Petrochemical Products Co recibió los resultados finales de la determinación del coeficiente global de transferencia de calor de un intercambiador nuevo fabricado por Heat Exchanger Manufacter, bajo ciertas condiciones de 2 operación. Los valores reportados por el fabricante, en Btu/hft °F, fueron: 58, 61, 69, 72, 74, 66, 62, 71, 65, 67. Mediciones posteriores hechas en el intercambiador funcionando bajo condiciones de proceso, arrojaron los siguientes resultados, en Btu/hft2°F: 60, 63, 58, 68, 73, 71, 62, 74, 66, 65. Se puede asegurar que el intercambiador está operando con la misma característica de diseño? Para responder la pregunta se debe hacer una prueba de hipótesis sobre el valor verdadero del coeficiente de transferencia de calor UD, para las dos conjuntos de datos reportados. Con este propósito se llamará 1 el valor verdadero del coeficiente reportado por el fabricante (UD de diseño) y 2, el valor verdadero de las determinaciones del coeficiente UD en condiciones de operación en planta.
294 Como el número de datos es menor que 30, n 30, se usará el estadístico t en la prueba. Para decidir sobre la fórmula con la que se calculará el valor de t, es necesario realizar previamente una prueba de hipótesis sobre las varianzas de los dos conjuntos de datos, ya que las fórmulas para el cálculo de este estadístico dependen de si las varianzas son iguales o diferentes. Cálculo de los estimados de las medias:
1 10 xi,1 10 i 1 1 x1 58 61 65 ... 67 10 x1 66.5 x1
1 10 xi,2 10 i 1 1 x2 60 63 ... 65 10 x2 66.0 x2
Cálculo de los estimados de las varianzas: 2 1 10 xi ,1 x1 9 i 1 1 s12 (58 66.5) 2 ... (67 66.5) 2 9 2 s1 26.5
s12
2 1 10 xi ,2 x2 9 i 1 1 s22 (60 66) 2 ... (65 66) 2 9 2 s2 29.78
s22
Para la prueba de las varianzas se formularán las siguientes hipótesis: Hipótesis nula
H0: 12 22
Hipótesis alterna H1: 12 22
295 La prueba se hará con un nivel de significancia del 5%, 5% . Para este nivel de significancia se obtiene de una tabla para la distribución F el valor de F , y con 2
este valor se calculará F1 . 2
F F0.025 (9,9) 4.03 2
F1 F0.975 (9,9) 2
1 0.248 4.03
El valor de F calculado es: F
s12 26.5 0.89 2 s2 29.78
Como el valor de F calculado esta en el intervalo 0.248 ≤ F ≤ 4.03, se acepta la hipótesis nula; es decir, las dos varianzas son iguales con una probabilidad del 95%. Para la prueba de las medias de los valores del coeficiente de transferencia de calor global, se formularán las siguientes hipótesis Hipótesis nula H0 : Hipótesis alterna H1:
1 2 1 2
La prueba también se hará con un nivel de significancia del 5%, 5% . Como las 2 son iguales, 12 22 , el valor de t se calcula con la ecuación:
t
x1 x2 s 1 1 n1 n2
con:
s2
(n1 1) s12 (n2 1) s22 n1 n2 2
Calculo de s2:
(10 1)26.5 (10 1)29.78 10 10 2 2 s 28.14
s2
296
66.5 66.0 (28.14)1/ 2 1 1 10 10 t 0.21
t
El valor de t
se lee en una tabla para la distribución t de student con 2
n1 n2 2 18 , grados de libertad. Este valor es: t t0.025 2.101 2
Como el valor de t calculado está en el intervalo -2.1 ≤ t ≤ 2.1, se acepta la hipótesis nula; es decir, el intercambiador de calor está operando con la misma característica de diseño.
5.7. Ejercicios propuestos 1. En la producción de viscosa, se purificaron cuatro tortas producto por el método convencional y otras cuatro por un método en prueba. Los resultados de la purificación se midieron en términos de un parámetro que mide el encogimiento de la torta viscosa (Tabla 5). Tabla 9. Producción de viscosa por el proceso convencional y el de prueba
Torta 1 2 3 4 Promedio
Proceso Convencional 1.817 1.716 1.785 1.735 1.763
Proceso Prueba 1.577 1.703 1.553 1.540 1.593
¿Existe alguna diferencia entre el resultado obtenido con el procedimiento nuevo y el resultado del método convencional? 2. ¿Cuáles son los intervalos de confianza del 99% para la media del siguiente grupo: 1.254, 2.532, 1.489, 3.371, 1.986? 3. Obtener un intervalo de confianza del 95% para el rendimiento diario de un reactor de ácido sulfúrico, a partir de los rendimientos: 91.37%, 91.45%, 93.13%, 92.87%, 91.65%, 91.96%, 92.28%, 92.57%, 92.93% y 92.79%; si se supiera que =0.75. 4. Se han obtenido los siguientes conjuntos de datos:
297 Prueba A: 134, 146, 104, 119, 124, 161, 107, 83, 113, 129, 97, 123 Prueba B: 70, 118, 101, 85, 107, 132, 94 ¿Existe alguna diferencia?
5.9. Bibliografía Lazik, Zivorad R., “Design of Experiments in Chemical Engineering”, Wiley-VCH, Germany, 2004 Mickley, H.S., Sherwood, T.S., Reed, C.E., "Applied Mathematics in Chemical Engineering". McGraw, New Delhi, 1975. Smith, C., Pike, R., Murril, P., "Formulation and optimization of mathematical models", International texbook Company, Scranton,1970. Andersen, L.B. "Statistical methods extend your data". Chem. Eng., october, 1962. Idem., "Probability theory provides simple statistical models", Chem. Eng. November 1962. Idem., "How to use statistical inference", Chem. Eng., December,1962. Idem., "Statistical estimation gives measures of probable error", Chem. Eng., January 1963. Idem., "Tests and estimates of statistical mean"., Chem, Eng., february 1963. Idem., "Tests and estimates on the statistical variance", Chem. Eng., March 1963. Idem., "Regression analysis correlates relationships between variables". Chem. Eng., May 1963. Idem., "Multiple regression techniques correlate experimental data", Chem. Eng., june 1963.
298