MÉTODOS
NUMÉRICOS INGENIEROS
Con aplicaciones en computadoras personales
PARA
MÉTODOS
NUMÉRICOS INGENIEROS
PARA
C o n aplicaciones en computadoras personales Steven C. Chapra,
Ph.D.
Professorof Civil Engineering Texas A&M University
Raymond
P. Canale, Ph.D.
Professor of Ci.vil Engineering The University of Michigan Traducción: Carlos Zapata S. Ingeniero Electricista, UDLA Diplomado en Ciencias de la Computación, Fundaci6n Arturo Rosenblueth Alfredo Cortés Anaya LicenciadoenCienciasFísico-Matemiticas, MaestroenCiencias de la Computaci6n, IIMAS,UNAM
UMSNH
Revisión técnica: FernandoVeraBadillo IngenieroCivil,Universidad La Salle Jefe del Departamento de Matemlticas Aplicadas, Universidad La Salle
MÉXICO
BOGOTA
NUEVA YORK
McGRAW-HILL
BUENOS AIRES
PANAMA
AUCKLAND NUEVA DELHI ST. LOUIS
CARACAS SAN JUAN
GUATEMALA LISBOA SANTIAGO SÁ0 PAUL0
HAMBURG0 LONDRES MONTREAL PARíS SAN FRANCISCO SINGAPUR SIDNEY TOKIO TORONTO
MADRID
METODOS NUMÉRICOS PARA INGENIEROS Con aplicaciones en computadoras personales Prohibida la reproducción total o parcial de esta obra, por cualquier medlo, sin autorizactón escrita del editor DERECHOS RESERVADOS (9 1987, respecto a la primera edición en español por LIBROS McGRAW-HILL DE MCXICO. S. A. DE C. V. Atlacomulco 499-501, Fracc. Industrial San Andrés Atoto 53500 Naucalpan de Juárez, Edo. de México Miembro de la Cámara Nacional de la lndustrla Editorial, Reg. Núm. 465
ISBN 968-451-847-1 Traducido de la primera edlclon en Inglés de Numerical Methods for Engineers with Personal Computer Applications Copyright @ MCMLXXXV, by McGraw-Hill, Inc., U.S. A ISBN 0-07-010664-9 L.M.437 1234567890 Punted Mexico Impreso en
Mexico In
Esta obra se terminó de imprimir en febrero de 1988 en Talleres Gráficos Continental, S. R. deC. V. Calz. Tlalpan No. 4620 col. Niño Jesús Delegación Tlalpan 1408 México, D.F. Se tiraron 2 600 ejemplares
CONTENIDO
xi
PREFACIO
PARTE I
LOS METODOS NUMERICOS Y LAS COMPUTADORAS PERSONALES
I. 1 1.2 1.3
1
Motivación Fundamentos matemáticos
4
Orientación
7
Capítulo 1
Modelosmatemáticos
Problemas
Capítulo
2.1 2.2
2.3 2.4
2
La programación en las computadoras personales
Antecedentes históricos Desarrollo de programas Desarrollodeunprogramapara
el problemadelparacaidista
Estrategias de programación Problemas
Capítulo
3
Aproximaciones y errores
11 19
21
22 24 46 52 56
63
3.1
Cifras significativas
3.2
Exactitud y precisión
66
Definiciones de error
67
3.3
64
3 . 4E r r o r e sd er e d o n d e o 3.5 Erroresdetruncamiento 3.6 Errornuméricototal 3.7 Erroresporequivocación,deplanteamiento e incertidumbre en Problemas
los datos
72
77 95 96 98
CONTENIDO -
Vi
EPILOG0
PARTE I 1.4
PARTE II
Elementos de Juicio
1.5
Relaciones fórmulas y importantes
1.6
Métodosavanzadosyalgunasreferenciasadicionales
RAíCES DEECUACIONES II. 1 Motivación 11.2 Fundamentos matemáticos 11.3
4.1 4.2 4.3 4.4
109 112 114
Orientación
Capítulo 4
119
Métodos queusan intervalos
119 123 132
Métodos gráficos Método de bisección Métododelareglafalsa Búsquedasconincrementosdeterminandouna
139 140
aproximación inicial Problemas
Capitulo 5 5.1 5.2 5.3 5.4
145
Métodos abiertos
146
Iteración de punto fijo Método de Newton-Raphson M é t o d od e
1o1 106 107
152
la secante
158 163 167
Raíces múltiples Problemas
171 172 177 180 183 1 86 1 89
EPiLOGO PARTE II 11.4 11.5 11.6
Elementos ¿e
juicio
Relacionesyfórmulasimportantes Métodosavanzadosyalgunasreferenciasadicionales
PARTE 111 SISTEMAS DEECUACIONESALGEBRAICAS III.1 Motivación 111.2 Fundamentosmatemáticos 111.3
Orientación
Capítulo 7 Eliminacióngaussiana 7.1 Solucióndepocasecuaciones 7.2
Eliminación gaussiana simple
LINEALES
197 199 199
203 206 21 5
219 219 227
7.3
Desventajasde
7.4
Técnicasdemejoramientoenlassoluciones
7.5
Resumen
los métodosdeeliminación
236 244 252 254
Problemas
Capítulo 8
8.1 8.2 8.3
Gauss-Jordan, inversión de matrices y Gauss-Seidel
Inversión de matrices Método de Gauss-Seidel Problemas
Capítulo 9
Casos de la parte 111: Sistemas de ecuaciones algebraicas lineales
Caso Caso
9.1 9.2
Distribuciónderecursos(Ingenieríaengeneral) Cálculodedistribucióndetemperaturas
Caso
9.3
Análisisdeunaarmaduraestáticamentedeterminada
Caso
9.4
Corrientes
Caso
9.5 , Dinámica de partículas
,
(Ingeniería química)
280
287
y voltajesencircuitosresistivos
(Ingeniería eléctrica)
291 y cuerpos rígidos
(Ingenieríamecánica) Problemas
293 295
PARTE 111
111.4 111.5 111.6 PARTE IV
279
283
(Ingeniería civil)
EPILOG0
259
259 262 268 276
Método de Gauss-Jordan
Elementosde
juicio
Relaciones
y fórmulasimportantes Métodos avanzados y algunasreferenciasadicionales
301 304 304
AJUSTE DE CURVAS
IV.1 IV.2 lV.3
Motivación Fundamentos matemáticos Orientación
Capítulo 1 O
Regresión con mínimos cuadrados
10.1 Regresiónlineal 10.2 Regresiónpolinomial 10.3 Regresiónlinealmúltiple Problemas
Capitulo 11
1 l. 1
lnterpolación
307 310 315 319
321 336 342 345 349
Polinomios de interpolación con diferencias divididas de Newton
11.2 PolinomiosdeinterpolacióndeLagrange 11.3 Comentariosadicionales 11.4 lnterpolaciónsegmentaria(spline) Problemas
350
363 368 370 383
vi¡¡
CONTENIDO
Capítulo 12
12.1
Caso
12.2
Regresiónlineal
química) Caso
12.3
(Ingeniería Ajuste decurvasen
Caso
12.4
Ajuste decurvas
Caso
12.5
en
387
la parte IV: Ajuste de curvas
Casos de
Caso
Modelodeingenieríadeventadeproductos (Ingenieria
387 y modelosdemográficos
39 1 el diseñodeunmástil
parabarco
(Ingenieria
ca)
en laestimacióndelacorriente
RMS
(Ingeniería
399
Regresiónlinealmúltipleen
el análisisdedatos
mecánica)(Ingeniería experimentales
402 404
Problemas
EPiLOGO
PARTE IV
IV.4 IV.5 IV.6 PARTE V
Elementosde
juicio
409 41 1 41 1
Relaciones y fórmulasimportantes Métodos avanzados
y algunasreferenciasadicionales
INTEGRACION V. 1 V.2 V.3
Motivación
41 5 422 424
Fundamentos matemáticos Orientación
Capítulo
13
429 43 1 443 455 458 46 1
Fórmulas de integración de Newton-Cotes
del
13.1 Regla de 13.2 Regla desiguales intervalos13.3 con Integración erta integración de13.4 Fórmulas Problemas
Capítulo 14 de gaussiana
14.1 14.2
Cuadratura Problemas
Caso Caso
15.1 15.2
Caso
15.3
V: Integración
Casos de parte la
Análisis de movimiento de efectivos (Ingeniería en general) El usodeintegralesparadeterminarlacantidad en calor de los materiales (Ingeniería química)
C a s o 15.4 (Ingeniería Caso
Integración de Romberg y cuadratura gaussiana
Integración
Capítulo 15
eléctrica)
395
15.5
ánica) Problemas
465 465 474 484 487 488
total
490
Fuerzaefectivasobreelmástildeunvelerodecarreras (Ingeniería
492
Determinacióndelacorriente numérica
496
Integraciónnuméricaen (Ingeniería
RMS
medianteintegración
el cálculodeltrabajo
499 503
CONTENIDO
iX
EPiLOGO PARTE V V.4 Elementosdeiuicio V.5 Relacionesyfórmulasimportantes V.6 Métodosavanzadosyalgunasreferenciasadicionales PARTE VI
ECUACIONES DIFERENCIALES ORDINARIAS VI.1 V1.2 V1.3
Motivación Fundamentos matemáticos Orientación
Capítulo 16 Métodos de un paso 16.1 M é t o d od e Euler 16.2 Modificacionesymeiorasalmétodode 16.3 MétodosdeRunge-Kuttc 16.4 Sistemasdeecuaciones
Euler
Capítulo 17 Métodos de pasos múltiples 17.1 U n e n f o q u e simple depasosmúltiples:Métodode H e u n sin principio Fórmulasdeintegración Métodos de pasos
múltiples de orden superior
Problemas
Capítulo 18 Casos de la parte VI: Ecuaciones diferenciales ordinarias C a s o 18.1 Modelosmatemáticosparaproyectosdeventade 18.2
Caso
18.3 18.4
573 574 588 594 600
603
Diseñodeunreactorparaproducciónfarmacéutica (Ingeniería química)
Caso
528 54 1 550 564 570
604
computadoras (Ingenieria en general) Caso
51 5 51 9 522
527
Problemas
17.2 17.3
509 51 1 51 1
Deflexióndel
mástil de unvelero(Ingeniería
civil)
608 61 3
Simulacióndeunacorrientetransitoriaenuncircuitoeléctrico (Ingeniería eléctrica)
Problemas
61 5 61 8 622
EPiLOGO PARTE VI V1.4 Elementosde juicio V1.5 Relacionesyfórmulasimportantes V1.6 Métodosavanzadosyalgunasreferenciasadicionales
625 627 627
BlBUOGRAFiA
63 1
iNDlCE
635
Caso
18.5
El
péndulooscilante(Ingenieríamecánica)
PREFACIO
Para el ingeniero moderno el hecho de “ir a la par con su profesión” implica inevitablemente el uso de las computadoras.Hay pocas disciplinas, o dicho sea de otra forma, pocas actividades cotidianas que de alguna manera no tienen contacto con estas máquinas tan poderosasy rápidas. Ciertamente, las computadoras han sido por años un aliado de la ingeniería al desempeñar millares de tareas, tanto analíticas como prácticas, enel desarrollo de proyectos y la solución de problemas en forma más eficiente. En consecuencia, cuanto más a fondo y más tempranose familiarice el estudiante de ingeniería con su terminal o su computadora pel. sonal, mejor será su formación. Pero, ¿desde cuándo?, y ¿qué tan a fondo debe ser este contacto? Los profesores de ingeniería reconocen desde hace mucho tiempo la importancia del entrenamiento en los primeros semestres enla tecnología de las computadoras. Tradicionalmente este entrenamiento abarcaba computadoras grandes (mainframes) y un lenguaje de programación de alto nivel como el FORTRAN. Desafortunadamente, es frecuente que a los estudianteslesresulte difícil aplicarsusnuevashabilidades a problemas de otras materias. Esto se debe a una variedad de factores, de entre los cuales no carece de importancia la preparación necesaria para usar sistemas con máquinas grandes. Como resultado, muchos estudiantes de ingeniería no explotan bien la capacidad de solución de problemas que tienen las computadoras hasta que están adentrados ensu educación. Creemos que la revolución de la microelectrónica nos dala oportunidad de integrar la computación de una manera más efectiva en el salón de clases. Debido a su bajo costo y conveniencia, las computadoras personales pueden aumentar la capacidad del estudiante de ingeniería para resolver problemas durante sus añosescolares. Sin embargo, para explotar esta oportunidad al máximo es necesaria una innovación de los cursos de introducción a la computación. Por ejemplo, a través de los años se ha desarrollado en las universidades’deTexas A&M y Michigan una reestructuración en dos etapas. Hay un “primer curso de computación” dedicado a orientar al estudiante al equipocomputacionaldisponible y al
Xii
PREFACIO
desarrollo de habilidades firmes dentro dela programación. El “segundo curso de computación” está planeado para reafirmar estas habilidadesy mostrarel empleo de lasolu&n de problemas en ingeniería. El presente libro emanó del segundo curso. Se eligió el tema de los métodos numéricos como punto principal por sus muchas aplicaciones a la ingeniería. Ya sea que los ingenieros utilicensoftware comercial o propio, creemos que es esencial una base sólida en los métodos numéricos para la aplicación efectiva de las computadoras en la solución de problemasdeingeniería. Desafortunadamente, los métodosnuméricos se presentan durante el último año de licenciatura o a nivel de posgraduados, años después del punto donde pudieron haber sido herramientas útiles, instructivas y creativas para el futuro ingeniero. Por consigu.iente,hemos elaborado este libro de tal forma que pueda enseñarse en los extremos inferior o superior de la carrera de ingeniería a nivel de licenciatura. Un aspecto de este plan se hace notar en la organización y en el alcance del libro, que está dividido en seis partes. La parte I trata del material introductorio e incluye información sobre programación y análisis de aproximación y error. Las cinco partes restantes están dedicadas a las áreas de métodos numéricos, que tienen importancia directa para el candidato a ingeniero: raíces de ecuaciones no lineales, ecuaciones algebraicaslineales,ajustedecurvas(regresióneinterpolación),integración y ecuaciones diferenciales ordinarias. Excluimos temas como los valores característicosy las ecuaciones diferenciales parciales, que tiene mayor importancia para los estudiantes de posgrado. Junto con este materialhemos incorporado ciertas características adicionales en la elaboración de este libro, para hacerlo más accesible a lectores tanto de los primeros como de los últimos niveles de licenciatura. Incluyen: 1. Recuadros. Nos hemos empeñado en incluir derivaciones importantes y análisis de error, con el fin de enriquecer la presentación. Sin embargo, algunas veces tal material representa un escollo para el estudiante novato. En consecuencia, hemos apartado en recuadros el material matemático más complicado. Muchos estudiantesencontrarán que pueden aplicar los métodos numéricos sin tener que dominar completamente el material contenido en los recuadros. 2. Material introductorio y fundamentos matemáticos. Cada parte del libro incluye una sección de introducción. Después de una breve exposición al problemamatemáticogeneralque va aestudiarse, se suministra una motivación describiendo cómo podría enfocarseel problema en ausencia de computadoras, y dónde se plantea este problema en la práctica de la ingeniería. En seguida se efectúa una revisión de los conceptos matemáticos necesarios para comprender el tema por estudiar. Por ejemplo, se revisa álgebra matricial antes del estudio de ecuaciones algebraicas lineales, y estadística antes del estudio
xiil
PREFACIO
de regresión. Por último, se presentan un esquema y los objetivos de estudio de cada parte, como orientación para el lector. 3. Epilogos. Así como la introduccih está planeada para dar una motivación y una orientación, incluimos un epílogo alfinal de cada partedellibroparaconsolidar ios conceptos recién adquiridos. Un detalleimportantedeesteepílogo es una seccióndedicada a los elementos de juicio necesarios para la elección de los métodos numéricos apropiados para un problemaenparticular. Además, se y se citanreferenciaspara resumenalgunasfórmulasimportantes métodos avanzados.
4. Presentaciones secuenciales y gráficas. Cada parte principal del libro consta de tres capítulos: dos dedicados a la teoría y uno al estudio de casos. Siempre que es posible, los capítulos de teoría se estructuranen forma secuencial, esto es, primero se presentan los planteamientos más directos y elementales. Dado que muchos de los métodos más avanzados se construyen sobre los más simples, la intención de este desarrollo es proporcionar un sentido de evolución de lastécnicas. Adicionalmente hemos desarrollado representaciones gráficas para complementar las descripciones matemáticas en la mayor parte de los planteamientos contenidos enellibro. Hemos encontrado que esta orientación visual es particularmente efectiva para proporcionar una mayor comprensióna los estudiantes de los primeros niveles de licenciatura.
5. Estudio de
casos. En cada parte del libro se incluyen casos para demostrar la utilidad práctica de los métodos numéricos. Se realizó un gran esfuerzo para dar ejemplos de los cursos iniciales de las carreras de ingeniería. Cuando esto no es posible, se han suministrado bases teóricas y motivación para los problemas.
6. Software. Se dispone de un paquete de software denominado NUMERICOMP que muestra algunos métodos numéricosque se cubren en el texto: bisección, eliminación gaussiana, interpolación de Lagrange, regresión lineal, la regla trapezoidal y el método de Euler. Estos programas proporcionanal estudiante los criterios de programaciónnecesarios para cada una de las partes del libro. El software está diseñado para utilizarse con facilidad. Los estudiantes también pueden emplearlo para verificar los resultados de sus propios esfuerzos de programación. Aunque el paquete es opcional, pensamos que puede lograrse un progreso más rápidocuando se emplean ellibro y el software conjuntamente; se puede conseguir a través de McGraw-Hill para lascomputadoras personales IBM-PC y APPLE 11. Una versión profesional Softde NUMERICOMP puede adquirirse directamente de EnginComp ware, Inc., 15 Research Dr., Ann Arbor, MI 48103.
Finalmente, nos hemos esforzado conscientemente en hacer este libro tan sencillo al usuario como sea posible, por lo que nos empefiamos en mantener nuestras explicaciones con una orientacióndirecta y práctica. Aunque nuestraintención primaria es presentar a los estudiantes una sólida introducción a los métodos numéricos, un objetivo subordinado ha sido hacer d e esta introducción una experiencia agradable. Creemos que los estudiantes que disfruten los métodos numéricos, las computadoras y las matemáticas, serán al final mejores ingenieros.Si nuestro libro alienta el entusiasmo por estas materias, consideraremos nuestro esfuerzo como un éxito.
AGRADECIMIENTOS Queremos agradecer las revisiones hechas por los profesores Ted Cadman (University of Maryland), Lee W. Johnson (Virginia Polytechnic and State University), Richard Noble (University of Colorado), Satish Ramadhyani (Purdue University), Howard Wicke (Ohio University) y Thomas C. Young (Clarkson University). Extendemos nuestra gratitud a la Texas A&M University y a la University of Michigan por proporcionarnos apoyo secretarial y gráfico y el tiempo necesario para preparar estelibro. En particular, Donald McDonald y Roy Hann de Texas A&M apoyaron consy buenasideas d e tantemente este esfuerzo.Obtuvimossugerencias nuestros colegas Bill Batchelor, Harry Jones, Bill Ledbetter, James Martin y Ralph Wurbs. Jeanne Castro ideó la organización gráfica de los capítulos. También Vanessa Stipp, con la ayuda de Kathy Childers, Cindy Denton y Frances Kahlich, hicieron una excelente labor al mecanografiar el manuscrito. Este libro se experimentó en clase durante cuatro semestres, principalmente con alumnos de segundo año en Texas A&M y durante dos semestres con alumnos de todoslos niveles d e licenciatura en Michigan. Durante este tiempo, muchos de los alumnos nos ayudarona comprobar la exactitud matemática y a enriquecer la comprensión de este libro. Lisa Olson leyó el texto completo varias veces y preparó los programas en FORTRAN. Tad Slawecki proporcionó una ayuda excelente en cuantoal software complementario. Además, Marla lsenstein, Luis Garcia, Sijin “Tom” Lee y Rick Thurman hicieron contribuciones notables. También debemos agradecer a Kiran Verma, Dave Damstra y a B. J. Clark de McGraw-Hill su supervisión y aliento. Ursula Smith efectuó un trabajo impecable en la edición de pruebas del libro. Finalmente, nos gustaría agradecer a nuestras familias, amigos y colegas, quienes soportaron comprensivamente la gran cantidad de horas “robadas”, necesarias para completar esta obra. Steven C. Chapra Raymond P. Canale
U N O
PARTE LOSMÉTODOS NUMÉRICOS Y LAS COMPUTADORAS PERSONALES
I.1 M O T I V A C I ~ N Los métodos numéricos son técnicas mediante las cuales es posible formular problemas de tal forma que puedan resolverse usandooperaciones aritméticas. Aunque hay muchos tipos de métodos numéricos, todos comparten una característica común: Invariablemente los métodos numéricos Ilevan a cabo un buen número de tediosos cálculos aritméticos. No es raro que con el desarrollo de computadoras digitales eficientes y rápidas, el papel de los métodos numéricos en la solución de problemas de ingeniería haya aumentado considerablemente en losúltimos años.
I . 1 . l Métodos anteriores a la aparición de la computadora
'), 7,
M á s allá de sólo proporcionar un aumento en la potencia de cálculo, la disponibilidad general de las computadoras (especialmente de las computadoras personales)y su asociación con los métoha tenido una influencia muy dosnuméricos, significativa en el proceso de solución de problemas de ingeniería. Antes del uso de la computadora había tres métodos diferentes que los ingenieros aplicaban a la solución de problemas: 1. Primero, se encontraban las soluciones de algunos problemas usando métodos exactos o analíticos. C o n frecuencia estas soluciones resultaban útiles y proporcionaban una comprensión excelente del comportamiento de algunos sistemas. Sin embargo, las soluciones analiticas pueden encontrarse sólo para una clase Iimitada de problemas. Estos problemas incluyen aquellosquepuedenaproximarse mediante modelos lineales y también aquellos quetienen una geometríasimple y pocas dimensiones. En consecuencia, las soluciones anabjticas tienen valor práctico limitado, porque la mayor parte de los problemas reales no son lineales, e implican formas y procesos complejos.
2
MÉTODOS NUMÉRICOS
PARA INGENIEROS
2.Para analizar el comportamiento de los sistemas se usaban soluciones gráficas. Éstas tomaban la forma de grafoso nomogramas. Aunque las técnicas gráficas a menudo pueden emplearse pararesolver problemas complejos, IQS resultados no son muy precisos. Es más, las soluciones gráficas (sin la ayuda de una computadora)son tediosas en extremo y difíciles de implementar. Finalmente,las técnicas gráficas están limitadas a aquellos problemas que puedan describirse usando tres dimensiones o menos.
3. Para implementar los
métodos numéricos se utilizaban calculadoras manuales y reglas de cálculo. Aunque en teoría estas aproximacionesdeberían ser perfectamenteadecuadas para resolver problemas complicados, en la práctica se presentan algunas dificultades. Los cálculos manuales son lentos y tediosos. Además no existen resultados consistentes debido a que surgen equivocaciones cuando se efectúan las tareas manualmente.
Antes del uso de la computadora, se gastaba mucha energía en la técnica misma de solución, en vez de aplicarla sobre la definición del problema y su interpretación (Fig. 1.1~).Esta situación desafortunada existía debido al tiempo y trabajo monótono que se requerían para obtener resultados numéricos con técnicas que no utilizaban a la computadora. Hoy en día, las computadoras y los métodos numéricos proporcionan unaalternativapara cálculostan complicados. AI usar lacomputadora para obtener soluciones directamente, se pueden aproximar los cálculos sin tener que recurrir a suposiciones de simplificación o técnicas deficientes. Aunque dichas suposiciones son aún extremadamente valiosas tanto para resolver problemas comopara proporcionar una mayor comprensión, los métodos numéricos representan alternativas queamplíanconsiderablementela capacidad para confrontar y resolver los problemas; como resultado, se dispone de más tiempo para aprovechar las habilidades creativas personales. Por consiguiente, es posible dar más importancia a la formulación de un problema, a la interpretación de la solución y a su incorporación al sistema total, o conciencia “holística” (Fig. 1 . 1 b).
1.1.2 Los métodosnuméricosy
la práctica de la ingeniería
Desde finales de la década de 1940, la multiplicación y disponibilidad de las computadoras digitales ha llevado a una verdaderaexplosión en cuanto al uso y desarrollo de los métodos numéricos. Al principio, este crecimiento estaba algo limitado por el costo de acceso a computadoras grandes (rnainfiames),por lo que muchos ingenieros continuaban usando simples planteamientos analíticos en una buena parte
LOS METODOS NUMÉRICOS
..___3
Y LAS COMPUTADORAS PERSONALES
Formulac4dn
fundamentales
Metodos muy elaborados
Exposici6n a fondo de 1. rdaci6n del problema con las leyes fundamentales
Mdtodo num6rico
y frecuentemente complcador
para hacer manelable el problema
lnterpretacidn Anll~oma fonda lhmitado por una
FIGURA 1 . 1
permite pensar holisticamente y desarrollar la intulmdn: se puede estudtar la
Lastresfases en la solución de problemas de ingenieríaen a ) la era anterioralas computadoras y b) la era de las cornputadoras. Los tamaños de los recuadros indican el nivel de importancia que se dirige a cada fase en el salón de clases. Las cornputadoras facilitan la implementación de técnicas de solucion y así permiten un mayor cuidado sobre los aspectos creativos de la formulación de problemas y la interpretación de resultados.
de su trabaio. N o es necesario mencionar que la reciente evolución de computadoras personales de baio costo, ha dado a mucha gente un fácil acceso a poderosas capacidades de cómputo. Además existe un buen número de razones estudiar los métodos numéricos:
1.
por las cuales se deben
Los métodos numéricos son herramientas extremadamente poderosas para la solución de problemas. Son capaces de manejar sistemas deecuacionesgrandes,nolinealidades y geometrías complicadas que son comunes en la práctica de la ingenieríay que, a menudo, son imposibles de resolver analíticamente. Por l o tanto, amplían la habilidad de quien los estudia para resolver problemas.
2. En el transcurso de su carrera, es posible que el lector tenga la ocasión de usar software disponible comercialmente que conten-
MÉTODOS NUMÉRICOS PARA INGENIEROS
4
g a métodos numéricos. El uso inteligente de estos programas depende del conocimiento de lateoría básica enla que se basan estos métodos.
3.
H a y muchos problemas que no puedenplantearse al emplear programas “hechos”. Si se está versado en los métodos numéricos y sees un adepto de la programación de computadoras, entonces se tiene la capacidad de diseñar programas propios para resolver los problemas, sin tener que comprar unsoftware costoso.
4. Los métodos numéricos son un vehículo eficiente para aprender a servirse de las computadoras personales. Es bien sabido que una manera efectiva de aprender a programar las computadoras es al escribir los programas. Comolos métodos numéricos, en su mayor parte están elaborados para implementarse en computadoras, resultan ideales para este propósito. Aún más, están especialmente adaptados parailustrar la potencia así como las limitaciones de las computadoras. Cuando el lector implemente con buen resultado los métodos numéricos en una computadora personal y los aplique para resolver problemas que de otro modo resultan intratables, entonces tendrá una demostración tangible de cómo pueden ayudarle las computadoras para su desarrollo profesional. AI mismo tiempo, aprenderá a reconocer y controlar los errores de aproximación que son inesperables de los cálculos numéricos a gran escala.
5. Los métodos numéricos son un medio para reforzar su comprensión de las matemáticas. Porque una función de los métodos numéricos es la de reducir las matemáticas superiores a operaciones aritméticas básicas, ya que profundizanen los temas que de otro
modo resultan oscuros. Esta alternativa aumenta su capacidad de comprensión y entendimiento en la materia.
1.2 FUNDAMENTOSMATEMÁTICOS Cada parte de este libro requiere de algunosantecedentes matemáticos. En consecuencia, el material introductorio de cada parte incluye una sección, como la que el lector está leyendo en este momento, de fundamentos matemáticos. Debido Q que la parte I en sí está dedicada al material básico sobre las matemáticas y la computación, la presentesección no abarca la revisión de algún tema matemático específico. En su lugar, se presentan los temas delcontenidomatemático que se cubre en este libro. Estos se resumen en la figura 1.2, y son:
LOS MÉTODOS
5
NUMÉRICOS PERSONALES COMPUTADORAS Y LAS
FIGURA 1.2
Resumen de los métodosnuméricos
que se cubren eneste
libro.
6
MÉTODOS
NUMÉRICOS
PARA INGENIEROS
1. Rakes deecuaciones (Fig. 1.24.
Estos problemas están relacionados con el valor de una variable o de un parámetro que satisface una ecuación. Son especialmente valiosos en proyectos de ingeniería donde confrecuencia resulta imposible despejar analíticamente parámetros de ecuaciones de diseño.
2. Sistemas de ecuaciones algebraicas lineales (Fig. 1.2b). En esencia, estos problemas son similares a los de raíces de ecuaciones en el sentido de que están relacionados con valores que satisfacen ecuaciones. Sin embargo, a diferencia de satisfacer una sola ecuación, se busca un conjunto devaloresque satisfaga simultáneamente a un conjunto de ecuaciones algebraicas. Las ecuaciones lineales simultáneas surgenen el contexto deuna variedad de problemasy en todas las disciplinas de la ingeniería. En particular, se originan a partir de modelos matemáticos de sistemas grandes de elementos interconectados, como: estructuras, circuitos eléctricos y redes de fluio de fluidos, aunque también pueden encontrarse en otras áreasde los métodosnuméricos como el aiuste de curvas.
3. Ajuste de curvas (Fig. 1.24. Con frecuencia
se presentará la oportunidad de ajustar curvas a un conjunto de datos representados por puntos. Las técnicas que se han desarrollado para este fin pueden dividirse en dos categorías generales: regresión e interpolacion. La regresión se emplea cuando hay un grado significativo de error asociado a los datos; frecuentemente los resultados experimentales son de esta clase. Para estas situaciones, la estrategia es encontrar una curva que represente la tendencia general de los datos sin necesidad de tocar los puntos individuales. En contraste, la interpolación se maneja cuando el objetivo es determinar valores intermedios entre datos que estén relativamente libres de error. Tal esel caso de la información tabulada. Para estas situaciones, la estrategia es ajustar una curva directamente a través de los puntos y usar esta curva para predecir valores intermedios.
4. Integración (Fig.l.2d).Tal como se representa, una interpre-
tación física d e la integración numérica es la determinación del área bajo la curva. La integracióntiene muchas aplicaciones par a el ingeniero práctico, empezando por la determinación de los centroides de objetos con formas extravagantes hasta el cálculo de cantidadestotales basadas en conjuntos de medidas discretas. Adicionalmente las fórmulas de integración numérica juegan un papel importante en la solución de las ecuaciones en diferencias.
5 . Ecuaciones diferenciales ordinarias. (Fig.
1.2e). Las ecuaciones diferenciales ordinarias tienen un enorme significado
NUMERICOS LOS METODOS PERSONALES COMPUTADORAS Y LAS
7
en la práctica de la ingeniería. Esto se debe a que muchas leyes físicas están expresadas en tefminos de la razónde cambio de una cantidad más que en términos de su magnitud. Entre los ejemplos se observan desde los modelos de predicción demográfica (razón de cambio de la población) hasta la aceleración deun cuerpo en descenso (razón de cambio de la velocidad).
1.3 ORIENTACI~N Resultaútilesta orientación antes de proceder a la introducción de numéricos. Lo que sigue está pensado como unavista panorámica del material contenido en la parte l. Se incluyen además algunos objetivos como ayuda para concentrarel esfuerzo del lector al estudiar el material.
los métodos
1.3.1
Alcanceycontenido
La figura 1.3 es una representación esquemáticadel material contenido en la parte I. Se ha elaborado este diagrama para darleun panorama global de esta parte del libro. Se considera que un sentido de "imagen global" resulta importante para desarrollar una verdadera comprensión de los métodos numéricos. AI leer un texto, es posible que frecuentemente se pierda uno en los detalles técnicos. Siempre que el lector perciba que está perdiendo la "imagen global" regrésese a la figura 1.3 para orientarse nuevamente.C a d a parte de este libro incluye una figura similar. Esta figura sirve también como una breve revisión previa del material que se cubre en la parte I. El capítulo 1 está diseñado para orientarle a los métodos numéricos y para darleuna motivación mostrándole cómo pueden usarse estas técnicas en el proceso de elaborar modelos matemáticos aplicados a la ingeniería. El capítulo 2 es una introestán ducciónyuna revisiónde los aspectosdecomputaciónque relacionados con los métodos numéricos y presenta las habilidades de programación que se deben adquirir para explotar eficientemente la computadora. El capítulo 3 se ocupa del importante tema del análisis de error, que debe entenderse bien para el uso efectivo de los métodos numéricos.
1.3.2 Metas y objetivos Estúdiese los objetivos. AI terminm la parte I el lector deberá estar preparado para aventurarse en los métodos numéricos. En general,
8
MÉTODOS
FIGURA 1.3
NUMÉRICOS PARA INGENIEROS
Representación de la organización del material en la parte I: Los métodos numéricos y las computadoras personales.
habrá adquirido una noción fundamental de la importancia de las computadoras y el papel de las aproximaciones y los errores en la implementación y desarrollo de los métodos numéricos. Adicionalmente a los objetivos esestas metas generales, deberá dominar cada uno de pecíficos de estudio que se enuncian en la tabla 1 . 1 .
LOS MhODOS NUMERICOS
TABLA 1.1
Y LASPERSONALES COMPUTADORAS
9
Obietivos de estudio especificos para la parte I
1.
2. 3.
4. 5.
6. 7.
8. 9.
1o. 11.
Entender la diferencia entre error de truncamiento y de redondeo Entender el concepto de cifras significativas Conocer la diferencia entre exactitud y precisión Apreciar la utilidad del error relativo Conocer la diferencia entre el error relativo verdadero E" y el error relativo aproximado eo; darse cuenta de cómo este último puede emplearse en conjunci6n con un error aceptable especificado con anterioridad E , para terminar un cálculo Ser capaz de relacionar el error relativo con cifras significativas Ser capaz de aplicar las reglas de redondeo explicadas enel recuadro 3.1 Comprender cómo se usa la serie de Taylor para aproximar funciones Comprender la naturaleza de la aproximación y los términos residuales de la serie de Taylor Conocer la relación que existe entre las diferencias finitas y las derivadas Familiarizarse con los elementos de juicio que se describen enel epílogo de la parte I
Objetivos en computación. AI completar la parte I el lector se habrá familiarizado con el software (NUMERICOMP)disponible para este libro. Deberá saber qué programas contiene y algunas de sus capacidades de graficación. También deberá tener las habilidades de prolos gramaciónnecesariasparadesarrollarsoftwarepropiocon métodos numéricos de este libro. Deberá ser capaz de desarrollar programas en términos de los algoritmos o diagramas de fluio dados. Podrá guardarsu software en dispositivos de almacenamiento, como discos flexibles o cinta magnbtica. Finalmente, el lector habrá desarrollado la capacidad de documentarsus programas de tal forma que los usuarios puedan emplearlos eficientemente.
CAPíTULO UNO MODELOS MATEMÁTICOS
¿Por qué se deben dominar los métodos numéricos y la programación de computadoras para resolver los problemas? Adem6s del hecho que de a diario se observa que las computadoras intervienen en las actividades m6s comunes de la vida diaria, dhabr6 alguna contribución esencial que estas mAquinas, con sus capacidades decididamente sobrehumanas,puedan hacer a las tareas y retos de los ingenieros? Es totalmente factible, y con el material contenido en este capítulo, se tratar6 de orientar al lector y motivarlo hacia una posibilidad cuando menos. Primero se aplica el concepto de modelos matemáticos para ayudar a definir lo que se entiende por métodos numéricos y para ilustrar cómo pueden facilitar la solución de problemas en ingeniería. Paraesto, se desarrolla aquí el modelo matemático deun proceso físico y se resuelve con un método numérico sencillo. El mundo físico, con toda su complejidad, puede parecer abrumador e impredecible, Tradicionalmente,la tarea del científico ha sido la de identificar los patrones reproducibles y las leyes que gobiernaneste caos. Por ejemplo, sobre la base de sus observaciones, Newton formuló su segunda ley del movimiento, que afirma que la velocidad de cambio dela cantidad de movimiento de un cuerpo con respecto al tiempo es igual a la fuerza resultante que actúa sobreél. Considerando las maneras excesivamente complejas en que las fuerzas y los objetos interactúan en la tierra, estaleyhaprobadoserunageneralizaciónválida. Además de que estas leyes proveen de discernimiento, los ingenieros pueden aplicarlas para formular soluciones a problemas prácticos. Porejemplo, los conocimientos científicosse usan rutinariamente por los ingenieros en el diseño de,elementos tales como estructuras, mhquinas, circuitos eléctricos y sustancias químicas sintéticas. Desde la perspectiva del diseño de ingeniería, estos conocimientos sonmuy útiles cuando se expresan en formade un modelo matem6tico. Un modelo matemático puede definirse, de una manerageneral, como una formulacióno ecuación que expresalas características fundamentales de un sistema o proceso fisico en términos matemáti'cos. Los modelos
12
MÉTODOS
NUMÉRICOS
PARA.INGENIEROS
se clasifican desde simples relaciones algebraicas hasta grandesy complicados sistemas de ecuaciones diferenciales. Recordando nuevamente a Newton para este ejemplo, la expresión matemática, o modelo, de su segunda ley es la bien conocida ecuación
F
ma
=
[1.11
donde F es la fuerza neta que actúa sobre el cuerpo (en dinas, o gramocentímetro por segundo cuadrado), m es la masa del objeto (en gramos), y a es su aceleración (en centímetros por segundo cuadrado). La ecuación (1.1)tiene varias características habituales de los modelos matemáticos del mundo físico.
1. Describe un sistema o proceso natural en términos matemáticos. 2. Representa una idealización y una simplificación de la realidad. Es decir, ignora los detalles insignificantes del proceso natural y se concentra en sus manifestaciones elementales. Es por esto que la segunda ley no incluye los efectos de la relatividad, que tienen una importancia mínima cuando se aplican a objetos y fuerzas que interactúan sobre o alrededor de la tierra a escalas visibles a los seres humanos. 3. Finalmente, conduce a resultadospredecibles y , en consecuencia, puede emplearse para propósitosde predicción. Por ejemplo, si se conocen la fuerza aplicada sobre un objeto y su masa, entonces puedeusarse la ecuación (l.1)para predecir la aceleración. Como tiene unaforma algebraica sencilla, puede despejarse directamente a=-
F
m De este modo, la aceleración puede calcularse fácilmente. Sin embargo, los modelos matemáticos de otros fenómenos físicos pueden ser mucho más complejos y no pueden resolverse exactamente o requieren de técnicas matemáticas más complejas que la simple álgebra para susoluci6n. Para ilustrar un modelo de este tipo pero más complicado, se puede usar la segunda ley de Newton para determinar la velocidad final de un cuerpo en caídalibre cerca de la superficie terrestre. El cuerpo en descenso será un paracaidista como se muestra en la figura 1.1.Para este caso puede crearse un modelo al expresar la aceleración como la razón de cambio de la velocidad con respecto al tiempo (dv/dtj y sustituir en la
MODELOS MATEMÁTICOS
FIGURA 1.1
13
Representación de las fuerzas que actúan sobreun paracaidista en descenso. FD es la fuerza hacia abaio debido a la atracción de la gravedad. Fu. es la fuerza hacia arriba debido a la resistencia del aire.
ecuación ( l .1) paradar
dv dt
m-=F
u31
donde u es la velocidad en centímetros porsegundo). Así, la masa multiplicada por la razón de cambio de la velocidad es igual a la suma de fuerzas que actúan sobre el cuerpo. Si lafuerzatotal es positiva, el objeto acelera. Si es negativa, el objeto sufre una desaceleración. Si lafuerza neta es cero, la velocidad del objeto permanecerá a un nivel constante. Para un cuerpo que cae dentro del perímetro de la tierra (Fig. l.1) , la fuerza total está compuesta por dos fuerzas contrarias:la atracción hacia abajo debida a la gravedad F D y la fuerza hacia arriba debida a la resistencia del aire Fu.
Si a la fuerza hacia abajo se le asigna un signo positivo, se puede usar la segunda leyparaformularlafuerzadebida a la gravedad como
donde g es la constante de gravitación, o la aceleración debida a la gravedad, que es aproximadamente igual a 980 cm/s2.
INGENIEROS MÉTODOS
14
NUMÉRICOS
PARA
La resistencia del aire puede formularse de diferentes maneras. Una aproximación sencilla es suponer que es linealmente proporcional a la velocidad, como en
donde c es una constante de proporcionalidad llamada el coeficiente de
arrastre (en gramos por segundo). Así, a mayor velocidad de caída, ma-
yor es la fuerza hacia arriba debida a la resistencia del aire. El parámetro c toma en cuenta las propiedades del objeto descendente, tales como la forma o la aspereza de su superficie, que afectanla resistencia del aire. Para este caso, c podría ser una función del tipo de traje o la orientación usadaporelparacaidistadurantelacaídalibre. La fuerza total es la diferencia entre las fuerzas hacia abajo y hacia arriba. Por tanto, las ecuaciones (1.3)a (1.6) pueden combinarse para dar dv
m- = mg - cv dt
o , dividiendocadaladoentre
m,
dv C -9--v dt m
”
La ecuación (1.8)es un modelo que relaciona la aceleración de un cuerpo que cae a las fuerzas que actúan sobre él. Es una ecuación diferencia[ porque está escrita en términos de la razón de cambio diferencial (dv/dt) de la variable que nos interesa predecir. Por esta razón a veces se denomina ecuación e n diferencias. Sin embargo, en contraste con la solución dada por la segunda ley de Newton en la ecuación(1.2),la solución exacta de la ecuación (1.8)para la velocidad del paracaidista que cae, no puede obtenerse usando simples manipulaciones algebraicasy operaciones aritméticas. Envez de eso, deberán aplicarse las técnicas del cálculo para obtener una solución exacta. Por ejemplo, si el paracaidista inicialmente está en reposo ( u = O en t = O ) , se puede usarelcálculopararesolver la ecuación (1.8),así
EJEMPLO 1.1
Solución analítica al problema del paracaidista que cae Enunciado del problema: un paracaidista con una masa de 68 100 g salta de un aeroplano. Aplíquese la ecuación (1.9) para calcular la veloci-
15
MÉTODOS MATEMATICOS
FIGURA 1.2
Soluciónanalítica al problema del paracaidista que cae según se calcula enel ejemplo l. l. La velocidad aumenta con el tiempo y se aproxima asintóticamente o una velocidad final.
dadantes de abrir el paracaídas. El coeficiente de arrastre c es aproximadamente igual a 12 500 g / s . Solución: al sustituir los valores de los parámetros en la ecuación (1.9) se obtiene
I
v (t)
980(68,100) [I - e-t12.500/68.1001f 12,500 1 = 5339.0 (1 - e-0 18355t ) =
al dar varios valores de t se obtienen las velocidades para dicho tiempo: los resultados se presentan a continuación t, S
v, cm/s
O
O
2 4 6
2776.9
1640.5
a
3564.2 4 109.5
10
4487.3
12
4749.0
X
5339.0
16
MÉTODOS
NUMERICOS PARA INGENIEROS
De acuerdo al modelo, el paracaidista acelera rápidamente (Fig. 1 . 2 ) .Se llega a una velocidad de 4 487.3 cm/s (161.5km/h) despu6s de 10 s . Nótese también que después deun tiempo suficientemente grande se alcanza una velocidad constante (llamada velocidad final) de 5 339.0 cm/s (192.2 km/h). Esta velocidad es constante porque después de u n tiempo suficiente, la fuerza de gravedad estará en equilibrio con la resistencia del aire. Por lo tanto, la fuerza total es cero y cesa la aceleración. A la ecuación (1.9)se le llama una solución analítica o exacta porque satisface exactamente la ecuación diferencial original. Desafortunadamente, hay muchos modelos matemáticos que no puedenresolverse exactamente. En muchos de estos casos,la única alternativa es la de desarrollar una solución numérica que se aproxime a la solución exacta. Como se mencionó con anterioridad, los métodos numéricos son aquellos en los que se reformula el problema matemático para que se puedaresolver mediante operaciones aritméticas. Esto puede ilustrarse para la segunda ley de Newton notándose que se puede aproximar la razón de cambio de la velocidad con respecto al tiempo mediante (Fig. 1.3) [1.10]
FIGURA1.3
USO
de una diferenciafinita
v con respecto a t .
paraaproximarlaprimeraderivadade
METODOS MATEMATICOS
17
donde Au y At son diferencias en la velocidad y el tiempo calculadas sobre intervalos finitos, u(t,) es la velocidad en el tiempo inicial t,, y u ( t , + I ) es la velocidadalgúntiempo más tarde t,, Laecuación ( l .10) es una diferencia finita diuida enel tiempo ti. Puede sustituirseenla ecuación (1.8)paradar
Esta ecuación puede ordenarse otra
vez para dar
[ : I 9
- -u(ti)
-
u(t1+1) = U@¡)
+
Nuevo valor de u
valor anterior valor estimulado incremento de u dependiente la
&+I
ti)
[1.12] Y así, la ecuacióndiferencial (1.8)se transforma enuna ecuación qGe puede resolverse algebraicamente para u(ti+J . Si se da un valorinicial para la velocidad en un tiempo ti, se puede calcular fácilmente u en t ! , Este nuevo valor de u en ti+l puede emplearse para extender el cálculo de u en t i + 2 y así sucesivamente. Por lo tanto, en cualquier tiempor de la trayectoria, -
+
EJEMPLO 1.2
Solución numérica al problema
x
del tiempo
del paracaidista que cae
Enunciado del problema: efectuarel mismo cálculo que en el ejemplo l .1 pero usando la ecuación (1.12)para calcular u ( t ) con un incremento de tiempo igual a 2 s. Solución: alprincipio de los cSlculos (tl = O ) , la velocidaddel paracaidista uft,) es igual a cero. Con esta información y los valores de los parámetros del ejemplo l.l , la ecuación ( l .12) se puede usar para estimar v (ti+1)en ti+l = 2 s.
Para el siguiente intervalo (de t sultado,
[
~ ( 4= ) 1960 + 980 =
3200.5 cmis
-
=
2 a 4 S ) , se repite el cálculo con el
___
68 l2500 100(1960+
re-
20
MÉTODOS
i)
j)
NUMÉRICOS
PARA INGENIEROS
significat~voasociado con los puntos de los datos. Los sistemas grandes de ecuaciones. las no linealidades 51 las geometrías complicadas son comunes en la práctica de la ingeniería y fáciles de resolver analíticamente Los modelosmatemáticos no se pueden usar nunca con propósitos de predicción.
1.2 Léanse las siguientes descripciones de problemas e identifíquese qué área de los métodos numéricos (según lo señalado enla Fig. 1.2)se relaciona con su solución. Una persona pertenece a una cuadrilla de reconocimiento topográfico y debe determinar el área de un terreno limitado por dos caminos y una corriente que serpentea Un ingeniero es responsable de la determinación de los flujos en una gran red de tuberías interconectadas entre sí para distribuir gas natural a una serie de comunidades diseminadas en un área de 20 km2 Para el problema del paracaidista que cae. se debe decidir el valor del coeficiente de arrastre para que un paracaidista de 90 kg de masa no exceda los 160 km/h en los primeros 10 S después de haber saltado. Deberá hacer esta evaluación sobre la base. de la solución analítica [Ec. (1.9)]. La información se empleará para diseñar un tra~ede salto. Un investigador efectúa experimentos para encontrar la caída de voltaje a través de una resistencia como una función de la corriente. Hace las mediciones de la caída de voltaje para diferentes valores de la corriente Aunque hay algún error asociado con sus datos, al 91-aficar los puntos. éstos le sugieren una relación curvilínea. Debe derwar una ecuación que caracterice esta relación. Un ingeniero mecánico tiene que desarrollar un sistemade amortiguamiento para un auto de carreras. Puede usar la segunda ley de Newton para tener una ecuación para predecir la razón de cambio en la posición de la rueda delantera en respuesta a fuerzas externas. Debe calcular el movimiento de la rueda. como una función del tiempo después de golpear contra un tope de 15 cm a 240 km/h. Un administrador tiene que calcular el ingreso anual requerido en un periodo de 20 años para un centro de entretenimientos que se va a construir para u n cliente. El préstamo puede hacerse a una tasa de interés del 17.6"; Aunque para hacer este estimado. la información está contenida en tablas de economía, sólo aparecen listados los valores para tasas de interés del 15 y 20%
1.3
Proporciónese un ejemplo de un problema de ingeniería donde sea oportuno cada uno de los siguientes tipos de métodos numéricos. En IO posible. remitasr el ejemplo de las experiencias del lector en cursos y en conferencias u otras experiencias profesionales que haya acumulado hasta la fecha. a) Raíces deecuaciones b) Ecuaciones algebraicas lineales c) Ajuste de curvas: regresión d ) Ajuste de curvas: interpotación el Integración fi Ecuaciones diferenciales ordinaria5
CAPITULO DOS
LA PROGRAMACION EN LAS COMPUTADORAS PERSONALES
Los métodos numéricos combinan dos en las herramientas más importantes en el repertorio de la ingeniería: matemáticas y computadoras. Los métodos numéricos se pueden definir (sin ser muy exacto) como las matemáticas por computadora. Las buenas técnicas de programación aumentan la habilidad para aplicar los conocimientos de los métodos numéricos. En particular, las potencialidades y limitaciones de las técnicas numéricas se aprecian mejor cuando se usan estos métodos para resolver los problemas de ingeniería utilizando como herramienta una computadora. Al usar este libro se obtiene la posiblidad de desarrollar los propios programas. Debido a la gran disponibilidad de computadoras personales y dispositivos de memoria magnética, los programas se pueden conservar y usar durante toda la carrera. Por lo tanto, uno de los principales objetivos de este texto es que el lector obtenga programas útiles y de alta calidad. Este texto contiene características especiales que maximizan esta posibilidad. Todas las técnicas numéricasvan acompañadas de material para una implementación efectiva en la computadora. Además, se dispone de programas suplementarios para seis de los métodos más elementales discutidos en el libro. Estos programas, desarrollados para computadoras personales (IBM-PC y Apple 11), pueden servir como base para una biblioteca de programas propios. Este capítulo presenta una información preliminar que tiene utilidad siempre y cuando se desee usar este texto como base para el desarrollo de programas. Está escrito bajo la suposición de que ya se ha tenido una experiencia previa en la programación de computadoras. Debido a que el libro no está enfocado hacia un curso de programación, se estudian únicamente aquellos aspectos que definen el desarrollo de programas de análisis numérico. También se propone proporcionarcriterios específicos para la evaluación de los esfuerzos del lector.
22
METODOS NUMÉRICOS PARA INGENIEROS
2.1 ANTECEDENTES HISTóRICOS En el sentido más amplio, una computadora se puede definir como un dispositivo que ayuda acalcular. Con base en esta definición, una de las computadoras más antiguas es el ábaco. Descubierto en el antiguo Egipto y en China, se compone de cuentas hiladas sobre alambrese n un marco rectangular (Fig. 2. la). Las cuentas se usan para guardar potencias 10 de (unidades, decenas, centenas, etc.) durante un cálculo. Cuando se emplea con destreza, el ábaco puede competir en velocidad con una calculadora de bolsillo. Aunque los dispositivos manuales tales comoel ábaco aceleran la velocidad en los cálculos, las máquinas extienden aún más las capacidades humanas para estos cálculos. Estimulados por la revolución industrial, los científicos del siglo XVII desarrollaron la primera de tales computadoras mecánicas. Blas Pascal inventó, en 1642, una máquina para sumar (Fig. 2. l b ) . AI final de ese siglo, Gottfried Leibnitz desarrolló una calculadora mecánica que podía multiplicar y dividir. Aunque en los siglos siguientes se desarrollaron otros instrumentos de cálculo, no fuesino hasta la década de 1940 cuando surgieron las computadoras electrónicas. Se originaron, inicialmente para proyectosmilitares en la segunda guerra mundial, erandispositivos de investigación para un solo propósito. Estas máquinas, con nombres comoENIAC Y EDSAC, usaron tubos al vacío como componentes electrónicos básicos. Aunque eran caras, lentas y a menudo desconfiables, estas computadoras de la primera generación auguraban un procesamiento de datos agran escala. Aunque algunas máquinas de la primera generación, en especial la UNIVAC,se vendieron a nivel comercial, no fue sino hasta la década de 1960 que las computadoras estuvieron disponibles para una gran cantidad de científicos e ingenieros. Esto se debió al desarrollo de los transistores y de algunos dispositivos electrónicos de estadosólido que suplieron a los tubos al vacío creando computadoras que, entre otras cosas, eran más confiables. Aunque el uso de estas computadoras se extendió, su acceso era algunas veces limitado ya que las máquinas seguían siendo muy caras para quela mayoría de los profesionistas las obtuvieran individualmente. Por lo tanto, los ingenieros debían asociarse con grandes organizaciones tales como universidades, oficinas gubernamentales, corporaciones o firmas consultoras para tener acceso a las computadoras. Sin embargo, a la mitad de la década de 1960 y principios de la década de 1970 un adelanto en la técnica alteró dramáticamente esta situación. En particular, el reemplazo de los transistores por circuitos integrados ha producido un gran poder computacional en el medio profesional de los ingenieros. Un circuito integrado, o CI, consiste en una pastilla delgada de silicón donde se han colocado miles de transistores. El resultado práctico de esta innovación ha sido en dos aspectos. Primero, en el núcleo de la máquina o la parte central de las computadoras, las velocida-
LA PROGRAMAC16NEN LAS COMPUTADORASPERSONALES
FIGURA 2.1
23
Evolución de los dispositivos de cálculo: a) ábuco; b) calculadora de Pascal; c) supercomputadora y d) microcomputadora o computadora personal (los incisos b y c con permiso de IBM; el inciso d con permiso de Apple Computer, Inc.).
des y la capacidaddememoriason muy grandes. Segundo, y más importante en el contextoactual, las computadoras personales que son convenientes, pequeñas, rápidas y confiables se están produciendo en masa y a precios razonables.Como se expresóen un artículo de la revistaScientific American: “Las microcornputadoras de hoy día a un costo tal vez de $300 dólares, tienen más capacidad de cómputo que las primeras computadoras electrónicas gigantescas ENIAC. Son 20 veces más rápidas,
24
MÉTODOS
CUADRO 2.1 de
* Condensodo de
PARA INGENIEROS
Comparación de sistemas comunes de cómputo*
Longitud Cifras almacenacálculo,de Costo palabra significativas (dólares) bits Sistema Calculadora prograrnable Microcomputadora Minicornputadora Cornputadoras grandes
NUMÉRICOS
ciclosls
1-2 O 7-1 O 7-1 O 7-1 4
miento (K)
25-350 7-1 6 16-32 32
100-5000 15,000-1 20,000 100,000-1 o,ooo,ooo+
106-1 106-1 106-1
o7
o7 o*
16-256 128-51 2 8000-32,000
Auerboch Computer Technology Reports, Agosto 1983.
tienenunamemoriamayor,sonmilesdevecesmás confiables, consulocomotora,ocupan menla energíade un bulboenvezdeladeuna 1/30 O00 de volumen y cuestan 1/10 O00 parte. Se pueden obtener por unaordenpostal o encualquiertiendaespecializada” (Noyce, 1977). Las computadoras personales se agrupan, por lo general en una de dos categorías que a veces no están bien delimitadas: micro y minicomputadoras. Las rnicrocornputadoras son aquellas cuya función principal está contenida en una sola pastilla de circuito integrado. Comúnmente cuestan unos miles de dólares.Las minicomputadoras son un término más imprecisoque se refiere a computadorasquesonmáspotentesque las micros pero caen aún dentro de las posibilidades de compra de algunas personas y pequeñas compañías. Ambos tipos de computadoras están en contraste con computadoras grandes, o supercornputadoras, que se manejan en intervalos de millones de dólares y sus propietarios son, por lo general, organizaciones o compañías muy grandes. El cuadro 2 . 1 resume lainformacióngeneralsobrevariostiposdecomputadoras. Larevoluciónenelcampodelestadosólidohaabiertolaspuertas en el área computacional a cada ingeniero. Sin ernhnrgo, no importa qué tipo de computadora se use, ésta sólo tiene utilidad si se le proporcionan instrucciones precisas. A estas instrucciones se les conoce como prograútil para mas.Lassiguientesseccionescontieneninformaciónqueserá el desarrollo de programas de alta calidad para utilizar los métodos numéricos.
2.2
DESARROLLODE
PROGRAMAS
El material de este capítulo está organizado alrededor de cinco temas, esquematizados en la figura 2 . 2 , requeridos para la elaboración y cuidado de programas de alta calidad. Este caljitulo contiene secciones que cubren cada uno de estos pasos. Este material incluye un caso de estudio donde cada uno de los pasos se aplica para desarrollar un programa y resolver el problema del paracaidista. Después de asimilar este material,
EN LA PROGRAMACldN
PERSONALES LAS COMPUTADORAS
25
el estudiante debe estar mejor preparado para desarrollar programas de alta calidad para los métodos del resto del libro.
2.2.1
Diseño de algoritmos
Se puede ahora empezar con el proceso de desarrollar programas para una computadora. U n programa es simplemente un conjunto de instrucciones para la computadora. Todos los programas que se necesitan correrenuna computadora particular, en conjunto se les llama software.
FIGURA 2.2
Cinco pasos necesarios para producir y dar soporte a programas de alta calidad . Las flechas hacia atrás indican que los primeros cuatro pasos se pueden ir meiorando conforme se gane experiencia.
26
INGENIEROS
PARA
MÉTODOS NUMERICOS
Un algoritmo es una secuencia l6gica de pasos necesarios paraejecutar una tarea específica tal como la solución de un problema. Los buenos algoritmos tienen ciertas características. Siempre deben terminardespuk de una cantidad finita de pasos y deben ser lo más general posible para tratar cualquier caso particular. Los buenos algoritmos deben ser determinísticos; esto es, no debendejarnada al azar. Los resultadosfinales no pueden ser dependientes de quién esté usando el algoritmo. En este sentido, un algoritmo es análogo a una receta. Dos cocineros que preparan independientemente unabuenarecetadeben obtener dos platillos idénticos. La figura 2 . 3 muestra ~ un algoritmo para la solución de un problema simple que suma dos números. Dos programadores que partan de este algoritmopuedendesarrollardosprogramasconestilos diferentes. Sin
FIGURA 2.3
a) Algoritmo y b) diagrama de fluio para la solucióndel problema de una sumasimple.
EN LA PROGRAMACldN
PERSONALES LAS COMPUTADORAS
27
embargo, dados los mismos datos, los programas deben arrojar los mismos resultados. Una forma alternativade representar un algoritmo es medianteun diagrama de flujo. Esta es una representación visual o gráfica del algoritmo que emplea una serie de bloques y flechas. Cada bloque en el diagrama representa una operación particular o un paso en el algoritmo. Las flechas indican la secuencia en que se implementan las operaciones. La figura 2.4 ilustra ocho tipos de bloques y flechas que conforman la mayor parte de las operaciones que se requieren en laprogramacióndeuna computadora personal. Lafigura 2.3b muestra un diagrama de flujo para el problema simple de sumar dos números. Los diagramas de flujo tienen una utilidad particular para bosquejar algoritmos complicados. En estos casos, un bosquejo gráfico puede ser útil para visualizar el flujo lógico del algoritmo. En este texto, se han incluido diagramas de flujo para la mayor parte de los métodos importantes. Se pueden usar estos diagramas como base para el desarrollo de sus propios programas.
2.2.2
Composición de un programa
Después de confeccionarun algoritmo, el paso siguiente es expresarlocomo una secuencia de declaraciones de programación llamado código. Es importante resistir la tentación de escribir el código antes de que el problema en su totalidad esté claramente definido y la técnica de solución y el algoritmo hayan sido cuidadosamente diseñados. Lasdificultades que más comúnmente encuentran los programadores sin experiencia se deben por lo general a la preparación prematura de un código que no abarque un plan o unaestrategia total, para la solucióndelproblema. Después que se ha diseñado un buen algoritmo, el código se escribe en un lenguaje de alto nivel para una computadora. Se han desarrollado cientos de lenguajes de programación de alto nivel desde que la era de las computadoras empezó. Entre ellos, hay tres que tienen importancia paracomputadoras personales: BASIC, FORTRAN y PASCAL. FORTRAN, es la construcción de fórmula translation (traducción de fórmulas), y se desarrolló en la década de 1950. Debido a que fue expresamente diseñado para cálculos, ha sido el lenguaje más usado en la ingeniería y la ciencia. BASIC, es la contracción de beginner’s all-purpose symbolic instruction code (clave de instrucciones simbólicas de propósito general para principiantes), fue desarrollado en la década de 1960. Requiere una cantidad pequeña de memoria y es relativamente simple de implementar.En consecuencia es uno de los lenguajes más usados en las computadoras personales; sin embargo, el BASIC no es tanflexible como el FORTRAN y a veces no es conveniente para programas grandes o complejos. El PASCAL, que debe su nombre al científico francés BlasPascal, es un lenguaje estructurado que se desarrolló enla década de 1970. Los programas escritos en Pascal para una computadora determinada pueden
METODOS
28
FIGURA 2.4
Símbolos utilizados en diagramas de fluio.
NUMERICOS PARA INGENIEROS
29
LAPERSONALES PROGRAMACldN COMPUTADORAS EN LAS
ser corridos fácilmente en otra. Aunque el Pascal es más difícil de aprender que el BASIC y el FORTRAN, su fuerza sugiere que su importancia crecerá en el futuro. Esto es verdad para la programación avanzada a gran escala. BASIC y FORTRAN son convenientes para programas simples y cortos que son suficientes parala implementación de los métodos numéricosde este libro. Por lo tanto, se ha optado por limitar las presentaciones del texto, a programas en estos lenguajes. BASIC es unaalternativaobvia por su amplia disponibilidad. Se ha incluido el FORTRAN por su significado continuo en el trabajo de ingeniería. Aunque este libro hace énfasis enlas computadoras personales, puede usarse por aquéllos que tienen acceso a máquinas más grandes y en conjunción con cualquier lenguaje de alto nivel. Con este espíritu, los programas y diagramas de flujo son lo suficientemente simples como para que puedan servir de base en el desarrollo de programas para aquéllos que son expertos en Pascal. Una descripción completa delBASIC y el FORTRAN, obviamente va más allá del alcance de este libro. Además, el número de dialectos disponibles en cada lenguaje complica aún más su descripción. Por ejemplo, existen más de 10 dialectos derivados del BASIC. Sin embargo, limitando la discusión a lo fundamental, se puede cubrir información suficiente de forma tal que se pueda entender e implementar efectivamenteel material relacionado con la computadora enel resto dellibro. En la figura 2.5 SF! presentan los códigos en FORTRAN y BASIC para sumar dos números, mostrando las diferencias estructurales principales entre los dos lenguajes, el etiquetado y el espaciamiento de código. En BASIC, cada instrucción se escribe con un número. En contraste, en FORTRAN se etiquetan con un número sólo aquéllas instrucciones que requieren identificación. Por ejemplo, lainstrucciónque tiene la etiqueta número 1 en la versión FORTRAN de la figura 2.5 se llama una declara-
SIC c
I FIGURA 2.5
Programa de computadora en la suma simple.
FORTRAN y BASIC para el problema de
30
INGENIEROS
PARA
METODOS NUMERICOS
ción FORMAT. Especifica la forma en que seva a introducir o a imprimir una línea particular. Por lo tanto, se debe etiquetar con un número para que la computadora pueda distinguirla de otras declaraciones FORMAT. Las declaraciones FORTRAN se deben numerar para otros casos pero la mayor parte, por lo general van sin numerar. Otra diferencia entre los dos lenguajes es el espaciamiento de cada línea; en BASIC, por lo general el espaciamiento no tiene importancia. Por ejemplo, la línea 10 se pudo haber escrito de las siguientes formas 10 A = 25 1OA=25 10
A
=
25
y la computadora debe interpretar todas las formas como equivalentes. En contraste, los términos en FORTRAN se deben alinear en columnas específicas. Las reglas sobre la alineación provienen del hecho de que el FORTRAN se introducía originalmente en una computadora usandolectora de tarjetas. Aunque las tarjetas se emplean menos frecuentemente hoy en día, las reglas de espaciamiento por lo general se han conservado. A las 80 columnas de la tarjeta perforada se les llama campos de la tarjeta. Los campos de la tarjeta se agrupan por partes para diferentes propósitos. Estos se ilustran en la forma de codificación de la figura 2.6. Una forma de codificación es un pedazo de papel donde se puedeescribir y verificar un programa para revisarlo de errores antes de introducirlo a la computadora. Nótese que también contiene80 columnas al igual que una tarjeta perforada. También obsérvese que cada una de las partes de los campos se usa para propósitos particulares. Aparte de la estructura, los dos lenguajes tienen otras diferencias así como fuertessimilitudes. En el cuadro 2.2 se delinean éstas. Este cuadro muestra comparaciones en paralelo deseis elementos principales de programacióc que tienen importancia directa en el uso de los métodos numéricos. Estos son: 1. Constantes y variables. Se deben seguir ciertas reglas para expresar
números y nombres simbólicos en los dos lenguajes. Como se puede ver en el cuadro 2.2 ésta es un área en donde el BASIC y el FORTRAN son muy diferentes.
2. Entrada-salida. Éstas son instrucciones mediante las cuales se transmite información de y hacia la computadora. He aquíotra área donde los lenguajes muestran diferencias considerables. Aunque la mayor parte de los lenguajes modernos mejoran esta situación, históricamente las capacidades de entrada-salidadel BASIC, han sido muy limitadas. En constraste, las declaraciones FORMAT del FORTRAN son herramientas muy potentes para etiquetar y espaciar la salida. Sin embargo, son de las declaraciones de programación más difíciles para un novato y aun para u n experto.
32
METODOS NUMÉRICOS
CUADRO 2.2
PARA INGENIEROS
Referencia rápida: comparación de FORTRAN y BASIC. FORTRAN y BASIC son lenguajes de computadora fáciles de aprender y de practicar, en general son los primeros lenguajes de programación que se les enseña a los estudiantes de ingeniería. Como sucede con muchos lenguajes de programación, existen varios aspectos que hacen dificil entender su uso. La siguiente comparación resulta del intento de bosquejar las diferencias generales y las similitudes entre FORTRAN y BASIC y a la vez servir de referencia rápida y como recordatorio. Se pueden consultar otras fuentes para los detalles referentes Q cada uno de los lenguajes. Este resumen se limita y se enfoca a la vez al material que tiene importancia directa con los metodos numéricos y con los programas descritos en el texto. FORTRAN
BASIC
CONSTANTES Y VARIABLES
(Representan los números y caracteres usados a lo largo del programa)
Constantes
Son valores positivos o negativos, (excluyendo las comas o los símbolos especiales) que se mantienen inalterados a lo largo del programa.
numéricas Constantes Enteros sonconstantes que no contienenpuntosonnúmerosenteros decimal:
1, -2, 100
o reales con punto
decimal:
1, -2.0, 0.001,100
Constantes reales: contienen punto decimal:
1.o, -2., 0.001 Exponenciales sonconstantesescritasen
notación científica.
Por ejemplo, los números:
-12 000, 0.000 006 8, 386 O00 O00 se expresan en notación científica como:
-12 x
lo3, 6.8 x
3.86 x 10’
y se pueden escribiren FORTRAN y BASIC como: - 12E3, 6.8E-6, 3.86E8
Constantes alfanuméricas y cadenas de caracteres representan letras, números y símbolos que se usanenestetexto para etiquetar. Las cadenas de caracteres tienenotras aplicaciones, incluyendo el U S O de expresiones de relación. En FORTRAN se encierran como: ‘JOHN DOE’, ’INTRODUCE B’
En BASIC se encierran como:
“VALOR DE A =”, “8/5/48”
EN LA PROGRAMACldN
33
PERSONALES LAS COMPUTADORAS
CUADRO 2.2
Referencia rápida: comparación de FORTRAN y BASIC. (cont.) FORTRAN
Variables numéricas representan cantidades que pueden cambiar de valor. Se usan para estas y no variables los nombres simbólicos, que deben empezar con una letra pueden contener símbolos especiales.
Nombres de variables
Nombres de variables
consisten de uno a seis caracteres, desde la A a la Z y del O a 9:
constan de dos caracteres (mós en algunos dialectos) de la A a la Z y del O al 9:
AA, X, N1
Variables enteras
representan valores enteros y empiezan representan valores con las letras I a la N:
reales o enteros.
N,KOUNT, lNDl Variables reales representan valores reales y empiezan con las letras A a la H y O a la Z:
X, COUNT, VEL1 Variables de caracteres o cadenas representan cadenas alfanuméricas y de caracteres. Se usan nombres simbólicos. . El tratamiento de las cadenas de caracteres varía considerablemente entre diferentes versiones
Declaración CHARACTER
Cadenas variables
$. La longitud de
son de la forma: terminan con
la varia-
ble es limitada. A$, N1$
CHARACTER * n vorl,vor2 donde n es la longitud específica de la cadena de caracteres seguida por una lista de variables. Por ejemplo,
CHARACTER * 4 NOMBRE1, NOMBRE2 ~~
Arreglos son variables con subíndice que almacenan un conjunto de valores en vectores de una dimensión y en matrices multidimensionales. El espacio de almacenamiento suficiente para un número dado de elementos se especifica mediante
Declaración DlMENSldN
Declaración DIM
DIMENSION A(n), ISUM(n,,n2) Se permiten hastasietesubindices deben ser enteros positivos.
DIM A(n), IS(nl,n2) que
La declaración DIM, en general se limita a arreglos bidimensionales; las n pueden
ser variables. Los arreglos no dimensionados generan un error. dimensionados Los noarreglos un valor de n = 10.
suponen
34
M ~ T O D ONUMÉRICOS S
CUADRO 2.2.
Referenciarápida:comparacióndeFORTRAN
PARA INGENIEROS
y BASIC. (cant.)
FORTRAN
BAS IC
La declaración DIG-ENSION se debe colocar antes de cualquier declaración ejecutable.
La declaración DIM se debe colocar antes de la primera línea donde la variable dimensionada se va a usar. En caso de no ir, supone el valor n = 10. El redimensionamiento genera a unmensaje de error.
Las variables definidas en la declaración DIMENSION (esto es, A o ISUM)tienen la misma regla de las variables numéricas "esto es, el arreglo A debe contener valores reales, mientras que el arreglo ISUM debe contener valores enteros.
ENTRADAlSALlDA
qué medios se transmite información a y desde un programa),
Declaraciones de formato especifican la longitud y la posición de cada uno de los datos, que se van a leer o a imprimir. Aunque en laentraday salida de datos existe formato libre, el FORTRAN estándar, en general impone un formato de lectura o impresión.
Aunque existe Io declaración de formato para lectura o impresión de datos, las versiones recientes de BASIC no lo empleon.
Entrada especifica los medios por los cuales se transmitendatos al programa
Declaración READ permitenintroducirdatos durante su ejecución:
READ f varl,vur2,.
alprograma . .
, vur,
donde f esun código de formato que especifica el tipo, disposición y, en algunos casos, el dispositivo usado para leer los valores de var], var2, . . ., varn. Por ejemplo:
READ (5,2) A,B donde el 2 es la etiqueta donde está la declaración FORMAT correspondiente y el 5 especifica que los datos se obtendrán de una lectora de tarjetas.
Declaración DATA
Declaración INPUT Permitenintroducir datos at programa durante su ejecución:
In INPUT varl,vur2,. . . , var, donde Ines el número de líneas donde está la declaración INPUT y var,, var2, . . ., var, son los nombres de las variablescuyosvalores se vanaleer. Por ejemplo:
10 INPUT A,B Cuando se ejecutaestainstrucciónse deben introducir los valores de A y B en undispositivo,tal como el teclado.
DeclaracionesREDlDATA
son declaraciones no ejecutables que defi- consiste de una declaración READ asociada a una declaración DATA que contienen el valor inicial de una variable. ne los valores que se van a leer, como: Tienen la forma general.
35
LAPERSONALES PROGRAMACldN COMPUTADORAS EN LAS
CUADRQ 2.2
Referencia rápida: comparación de FORTRAN y BASIC. (cont.). FORTRAN
BASIC
DATA var,, , . .,var,,lvalor,,
10 READ A,B,C,Z
. . .,valor,,/
donde var es el nombre de la variable y valor es una constante. Por ejemplo:
90 DATA5,0.001,88,1 E-6
DATA A,B,C,Z/5.,0.001,88.,1.E-6/ Salida esel
medio por el cual se transmiten datos del programa.
Declaración WRITE
Declaración PRINT
se usa comúnmente para imprimir datos. Su forma general es:
se usa comúnmente para imprimir datos. Su forma general es:
WRITE fvarl, . . . , vur,
In PRINT varl, . . . , var, Por ejemplo:
Por ejemplo:
WRITE (6,2)A,B donde (6,2) es el código de formato, el 2 es la etiqueta de la declaración FORMAT
correspondiente y el 6 especifica que los datos se imprimirán en una impresora.
10 PRINT A,B Enel momento que esta declaración se ejecuta, los valores de A y B se imprimen en un dispositivo tal como la pantalla o una impresora.
1 I cA1cu10s
(Operaciones que usan expresiones matemáticas)
Declaraciones de asignación se usan para asignar un valor a una variable:
XM=3.281 indica a la computrdora
que asigne el valor
3.281
a la variable
XM;
A=XM+5 5 a XM y le asigne el resultado (en este caso, 8.281) a la variable A;
indica a la computadora que sume
A=A+40 indica a la computadora que sume 40 a A y le asigne el resultado (en este caso, 48.281) a la variable A . El valor anterior de A se destruye enel proceso. Nótese que, aunque A = A 40 no es una expresión matemática válida, tiene un significado especial dentro de la computadora. AI signo de igual en la declaración de asignación se le puede dar un significado de "se reemplaza por", como en:
+
A se remplaza por A+40 Operadores aritméticos
sonsímbolos usados para representar operaciones matemáticas:
+ -
..
Suma Resta
+ -
36
MÉTODOS
CUADRO 2.2
NUMÉRICOS
PARA INGENIEROS
y BASIC. (cont.).
Referencia rápida: comparación de FORTRAN FORTRAN
BASIC
*
*
Multiplicación División Exponenciación
i
**
i **, ? , A (El signode exponenciación depende del tipo de BASIC)
Si una expresiónaritméticatuvieratodos los operadores, el orden en que se efectuaríansería: primero, todas las exponenciaciones de izquierda a derecha en BASIC, Applesoft y Microsoft, y de derecha a izquierda en FORTRAN; a continuacidn todas las multiplicaciones y divisiones de izquierda a derecha, y finalmentetodaslassumasyrestas de izquierda a derecha. Cuando una expresión presenta paréntesis, la forma de efectuarlos es del másinterno al más externo.
x=
$0
+
3":
-
y4 45
"
X=(((A+B)-RA3)/33-YA4/45)A.5
X=(((A+B)-R**3)/33-Y**4/45)**.5
CONTROL
(Dirigen el flujo del programa mediante saltos, transferencias y reasignacianes)
especificaunsalto
Dedaración GO TO
incondicional aun número de líneaespecífico:
GO TO 200 Operadores lógicos
se usan para comparar los valores de dos expresiones:
.EQ. .NE. .IT. .LE.
.GT. .GE. .AND. .OR.
, Igual .
-
a diferente de menor que menor o igual que mayor que mayor o igual que
<> < <= > >=
lógica
AND OR
Declaración lógica If se utilizan para la toma de decisiones, de acuerdo al valor verdadero
a falso
que tenga una expresión lógica
IF(N.GT.l .OR.N.LT.3)N=2 IF(N.GE.l) GOTO 10
IF(N>l)OR(N<3)THEN N=2 IF N>=l THEN 10
En los ejemplos anteriores, si la expresión lógica se cumple, seejecuta la transferencia o la asignación. En el primer ejemplo, si N es mayor que 1 a
EN LA PROGRAMACldN
PERSONALES LAS COMPUTADORAS
CUADRO 2.2
37
Referencia rápida: comparación de FORTRAN
y BASIC. (cont.).
FORTRAN
BASIC
menor que 3, entonces N se iguala a 2 y el control pasa a la siguiente línea. En el segundo, si N es mayor o igual a 1, el programo se transfiere a la línea 1 O. En cualquier caso, si la expresión es falsa, no se ejecuto la transferencia o reasignación y el control se pasa a la siguiente línea.
Ciclos permiten repetir cálculos con una cantidad
mínima de declaraciones
Ciclos con IF lógico repiten calculos que se controlan con base en la declaración
1 0 X=Y(I)*Z(I-1) IF(X.LT.O)GO T O 50 1=1+1 GO TO 1 0 50 X=-X
IF:
10 X=Y(I)*Z(I-1) 20 IF X
Ciclos controlados por un indice Ciclos D O
FORlNEXT Ciclos
DO In I=j,n,k
In
CONTINUE
FOR I = i T O
In
n
STEP k
NEXT I
donde In es el número de línea de la ú h a declaración del ciclo, i es el valor inicial del contador, n es el valor final o terminal y k es el incremento dado a la variable I para que.varíe desde j hasta n. Después de terminar el ciclo,, I tiene el valor de n + k siempre y cuando I sea múltiplo de n.
SUBPROGRAMAS: FUNCIONES Y SUBRUTINAS (ejecutan una proposición o un conjunto de proposiciones que se repiten varias veces a lo largo de un programa) ~~
~
Funciones intrínsecas son funciones construidas internamente o funciones de biblioteca que realizan operaciones matemáticas o trigonométricas que se emplean comúnmente.
SIN
Seno Coseno TAN Tangente ALOG o LOG Logaritmo natural o de base e ALOG o LOGIO Logoritmo común o de base 10 EXP Exponencial SQRT Raíz cuadrada ABS absoluto Valor IN T El entero más grande que Es menor o igu:?! a x
cos
SIN
cos TAN LOG
EXP SQR ABS INT
38
INGENIEROSMETODOS
CUADRO 2.2
NUMÉRICOS
PARA
Referencia rápida: comparación de FORTRAN y BASIC.(cont.). FORTRAN donde x es el argumento de la función. Nótese que la lista anterior no está completa. Dependiendo de la versión del compilador pueden existirmás funciones intrínsecas.
Funciones definidas por el usuario SOL.
son funciones definidas por el programador. Declaración de funciones son de la forma: narnbre(xl, .
. . ,xn) =
f
Declaración DEF son de la forma general:
in DEF FNa(x) = f
donde nombre es el nombre de la función (se puede dar cualquier nombre); x , , . . .,x,,son variables numéricas que no tienensubíndice y f es una expresión aritmética que depende de x , , . . .,x,,.
donde In es el número de línea, a es cualquier letra del alfabeto, x es una variable numérica (sin subíndice) y f es una expresión aritmética que es función de x .
Las declaraciones de funciones van antes de laprimera proposición de ejecutable.
La declaración DEF va antes de ejecutar dicha función.
Se pueden pasar varios argumentos en unadeclaración de unafunción. Las otras variables dentro de lafunción tienen el mismo valor que en el programa principal en el punto donde se llama la función.
Se puede pasar sólo argumentos en una declaración DEF. Lasotras variables dentro de la función tienen el mismo valor que en el programa principal en el punto donde se llama a la función.
TRIG(X,Y)=SIN(X)-LOG(Y)
& )'&
A=5 B=10 S=TRIG(A,B) Subprogramas Function se parecen a las declaraciones de funciones en la ejecución pero, como su nombre lo indica, son programas, esto es, consisten de varias líneas. Los subprogramas tipofunctionson de lo forma general:
FUNCTION name(xl,. . . x2j
nombre =
RETURN
f
donde todos los valores que toma la función son aquellos que se definen a1 llamar a dicha Función.
10 DEF FNT(X)=SIN(X)-LOG(B)
r
9
80 E= 10 70A=5 90 S=FNT(AJ
39
LA PROGRAMACldN EN PERSONALES LAS COMPUTADORAS
CUADRO 2.2
Referencia rápida: comparación de FORTRAN FORTRAN
y BASIC. (cont.).
BASIC
A= 5 B=10 S=TRIG (A.B)
FUNCTION TRIG(X,Y) TRIG=SIN(X)-LOG(Y) RETURN Nótese quelas constantes y las variables que no se pasan como argumentosdeben definirse dentro de la función o pasarse por una declaración COMMON.
Subrutinas son subprogramas que consisten de un conjunto de proposiciones que realizan una tarea en particular. Contienen una declaración RETURN que regresa al punto donde se llamó a la subrutina. Las subrutinas se llaman con una declaración CALL de la forma:
Call nombre (arg,,org,,.
. .,arg,)
donde nombre es el nombre de la subrutina y org,,. . ., org, son los n argumentos (variables o constantes) que se pasan a la subrutina. La subrutina va después del programa principal y empieza conuna declaración SUBROUTINE, de la forma:
Las subrutinas se llaman con una declaración GOSUB de la forma:
In, GOSUB Inn donde In, es el número de línea de la declaración GOSUB y In2 es el número de línea donde empieza la subrutina. La primera línea de la subrutina puedeir en cualquier lugar dentro del programa.
donde nombre debe ser el mismo al Ilamar dicha subrutina conla proposición CALL. Una vez dentro de la subrutina, las proposiciones se ejecutan en secuencia hasta que se encuentra una declaración RETURN, después de lo cual regresa a la siguiente línea de donde está la subrutina. Se pasan a y desde la subrutino únicaTodos los valores se pasan a y desde la mentelos valoresqueaparecencomosubrutina. argumentos de la misma:
40
MÉTODOS
CUADRO 2.2. BAS
Referencia rápida: comparación de FORTRAN FORTRAN
NUMÉRICOS PARA INGENIEROS
y BASIC. (cont.)
IC
CALL SUM (X.Y,Z)
200 GOSUB 800
END SUBROUTINE SUM (A,B,C) C=A+B RETURN
500 END 800 Z=X+Y 850 RETURN
-
Nóteseque lasconstantes y las variables que no se pasan como argumentos se deben definir dentro dela subrutina o pasarseconunadeclaración
COMMON.
DOCUMENTACI~N
(le permite incluir información
para el usuario de los programas)
las declaraciones de documentación son instrucciones no ejecutables.
REM REM seguida
Declaración comentario de Declaración
Consiste del carácter C o del símbolo * en Consiste de la declaración por unmensaje: la columna 1 seguido por unmensaje:
C aquí se puede teclear cualquier
1 O REM aquí se puede teclearcualquier
mensaje.
mensaje.
3. Cálculos. Las operaciones matemáticas son muy similares en ambos lenguajes. Aunquela nomenclatura es un poco diferente,las ecuaciones escritas en los dos lenguajes casi son idénticas. 4. Control. Estas declaraciones se usan para
dirigirla secuencia lógica de las instrucciones en el programa. Para los m6todos numéricos, es suficiente con tres tipos: la declaración GO TO, el IF lógico y los ciclos. Aunque hay pequeñas diferencias en la nomenclatura de ambos lenguajes, las declaraciones son muy similares en operación.
5.
Subprogramas. Como lo indica el nombre, son miniprogramas dentro del programa principal. Se diseñan para ejecutar declaraciones que se repiten muchas veces a lo largo del programa. En vez de reescribir los miniprogramas muchas veces dentro del programa, se pueden escribir sólo una vez e invocarse con una declaración simple cuando sea necesario. Estos .subprogramas, que incluyen las subrutinas, funciones definidas por el usuario y funciones predefinidas, son otro caso
078fq LA PROGRAMACIóN EN LASCOMPUTADORASPERSONALES
donde FORTRAN y BASIC difieren significativamente. Las diferencias estriban en la manera en que se pasainformación entre el cuerpo principal del programa y los subprogramas. Como se muestra en el cuadro 2.2. los argumentos de los subprogramas FORTRAN actúan como ventanaspara controlar el paso de informacih. Este es un ejemplo que muestra al FORTRAN como un lenguaje más complicado y . en consecuencia. más potente que el BASIC. 6. Documentación. Estas declaraciones permiten incluir información enfocada al usuario dentro del programa.
En resumen, el FORTRAN es un poco más flexible y más poderoso aunque también es más difícil de aprender que el BASIC. Sin embargo. ya que éste sedesarrolló originalmente como una versión simplificada del FORTRAN. los dos lenguajes muestran varias similitudes. Aunque cada uno de ellos tiene sus reglas que deben respetarse e n cuanto a estilo. su vocabulario y gramática son lo suficientemente similares como para permitir una traducción fácil de la mayor parte de los programas de un lenguaje a otro. Por 10 tanto, en este libro todo el código para computadora se presenta en formato doble como el de la figura 2.5. Aunque algunas veces signifique que se olvidarán características peculiares de uno u otro lenguaje, esto permitirá alcanzar un conocimiento de los dos lenguajes FORTRAN y BASIC.
2 . 2 . 3 Rastreo y
prueba
Después de escribir el código del programa. se debe probar para buscar los errores, a los que se les llama bugs. AI proceso de localizar y corregir los errores se les conoce como rastreo. Pueden ocurrir varios tipos de errores cuando se programa encualquier lenguaje. Los errores de sin taxis violan las reglas del lenguaje como la ortografía. la formación de los números. los números delínea y otras reglas específicasa cada lenguaje. Estos errores a menudo resultan al teclear cosas raras. Por ejemplo. la declaración en BASIC 30 A
=
5/(0.2+ 4 * SIN (2* Y1
generaría un error de sintaxis inmediato porque los paréntesis no se encuentran por parejas. Los errores más difíciles de detectar están asociados con la lógica y con la construcción de los programas y pueden ocurrir sin interrupciones de sintaxis. Por lo tanto, se debe tener especial cuidado y asegurarse de que el programa hace lo que se le pide. Por ejemplo. supóngase que. se deseansumar los enterosentre 1 y 10 y luego dividirlos entre 10 (es decir. calcular su promedio). Los códigos en FORTRAN y BASIC deben ser
42
MÉTODOS
FORTRAN
PARA INGENIEROS
BASIC
s=o
DO40 I
NUMÉRICOS
=
1 , 10
S=S+I 40 CONTINUE A = S/I WRITE (6, 1 )A
1os=o
20 FOR I = 1
TO 10
3OS=S+I 40 NEXT I 5C A = S/l 60 PRINT A
obteniendo como resultado A = 5.mientras que el resultado esperado era A = 5.5. La sintaxis está perfecta. pero hay un error de lógica que la computadora jamás podrá detectar porque no hay forma de observarlo. Una manera de eliminar este tipo de error es la de imprimir durante el programa los valores de las variables que no se requieran en la forma final del programa. Por ejemplo. si se ha escrito WRITE f V O ~ I. , . . , vorn
in PRINT vorl, . . . , V O ~ ,
con los resultados A = 5 e I = 11, probablemente se notará que el error estriba en que el valor de I se incrementa al salir del ciclo. Los erroresdeeste tipo a menudoson muy dificiles de detectar en programas muy grandeso muy complejos. Porlo tanto, es una buena práctica verificar manualmente si es posible, los resultados dados por ' el programa y probarlos en casos especiales. Esto puede hacerse con lápiz, papel y una calculadora. Los errores asociados con la lógica o con la finalidad de un programa. no con la gramática, se les conoce como errores de semántica. Estos ocurren. por lo general durante la ejecución del programa y se les conoce también como errorese n el momento de /acorrida (run time errors). Es absolutamente necesaria la técnica de imprimir los valores de las variables intermedias para verificar la lógica de un programa y evitar errores de semántica en programas muy grandes. El rastreo y la prueba de los programas se facilita empleando u n buen estilo de codificación, Esto puede implicar que el disefio de los programas consista de varias partes pequeñas. A este tipo de estilo de programación se le conoce como programación modular. Cada parte esespecifica e identifica fácilmente las tareas a ejecutar. Las subrutinas son medios apropiados para tal modularización. El programa principal (o el programa que las llama) puede, entonces ser simplemente un director que guía cada una de las partes en un esquema lógico. De esta manera. si los programas no funcionan perfectamente, se puede aislar y localizar el problema más rápidamente. Por ejemplo. se pueden escribir subrutinas para c,ada una de las siguientes tareas:
1. datos. Leer
4. Ejecutar algoritmos numéricos.
2. Mostrar datos.
5. Mostrar los resultados en una
3. Mostrarun carácter para
6. Mostrar los resultados enuna gráfica.
información.
tabla.
LA PROGRAMACIóN ENPERSONALES LAS COMPUTADORAS -
43
Cada una de estas subrutinas realiza una tarea limitada y aislada que se puede programar y rastrear separadamente. Esto simplifica mucho eltrabajo total. comparado con el rastreo de todo el programa simultáneamente. Después de probar los módulos, todo el programa se debe sujetar a una prueba total del sistema. Para un programa de métodos numéricos, se debe realizar una serie de cálculos y debe compararse con casos donde se conozcapreviamente lasolución exacta. Algunas veces sedispone de la soluciónanalítica lacual es aceptable para estos propósitos. Tal fue el caso delparacaidista (recuérdense los ejemplos 1.1. y 1.2). En otros casos, el programador debe realizar cálculos manuales con una calculadora de bolsillo para comprobar que el programa lleva a resultados confiables. En cualquier caso, el programa se sujetará a una gran variedad de pruebas para asegurarse de que funcionará confiablemente bajo todas las condiciones de operación posibles. Unicamente hasta entonces el programa estará listo para ser usado en la solución de problemas de ingeniería.
2.2.4
Documentación
Después de que el programa ha sido rastreado y probado, se debe documentar. La documentación es la inclusión de comentarios que le permiten al usuario implementar el programa más fácilmente. Recuérdese que junto con otras personas que pueden usar sus programas, el programador mismo es un “usuario”. Aunque un programa parezca simpley claro cuando está reciénhecho y se guarda en la mente, después de pasar cierto tiempo el mismo códigopuede parecer inaccesible. Por lo tanto, se debe incluir suficiente información para permitirle a los usuariosentender e implementar inmediatamente tales programas. Esta tarea exhibeaspectos internos y externos. La documentacióninterna consiste de algún análisis o explicación que se inserta a lo largo del código del programa para la descripción de cómo trabaja cada una de las secciones del mismo. Es importante en casos donde se va a modificar el programa. Esta documentaciónse debe incluir tan pronto como se termine una parte del programa, en lugar de hacerlo hasta el final, para evitar la pérdida del concepto en el diseño original que se tuvo en el desarrollo del programa. La documentación interna se mejora considerablemente con el uso de nombres mnemónicos apropiados para las variables. Estos nombres pueden ser más difíciles de codificar que los nombres pequeños, pero la ventaja de ser más informativos, por lo general hace que valga la pena el esfuerzo adicional. Utilizar nombres mnemónicosconvenientes, incluyeen esencia eluso de nombres convencionales o est6ndares o abreviaciones comunes para variables. La documentación externa explica las instrucciones como mensajes al usuario en e información impresa suplementaria diseñada para auxiliar la implementación de los programas. Los mensajes impresos se supone que ayudan a que los resultados estén bien presentados y accesibles al usuario. Esto implica el uso correcto de espacios, líneas en blanco o ca-
MÉTODOS
44
NUMÉRICOS
PARA INGENIEROS
racteres especiales que ilustren la secuencia lógica y la estructura de los resultados de un programa. Los resultados bien presentados simplifican la detección de errores y aumentan la comprensión de los mismos. La información suplementaria puede variar desde una hoja hasta un manual para el usuario. La figura 2.7 muestra un ejemplo de una forma
FIGURA 2 . 7
Formato simple de una página para la documentación de un programa. Esta página se debe guardar en una carpeta con un listado del programa.
45
L A P R O G R A M A C I ~EN N LAS COMPUTADORASPERSONALES
de documentación simple que se recomienda para preparar cada unode los programas a desarrollar. Estas formas se pueden mantener enun cuaderno denotas para tener unareferencia rápida para la biblioteca d e programas. El manual del usuario para una computadora es un ejemplo de una documentación accesible.Este manual indica cómo correr el sistema y los programas d e operación en disco de la computadora.
2.2.5 Almacenamiento
y mantenimiento
Los pasos finales en el desarrollo de u n programa son el almacenamiento y mantenimiento del mismo. El mantenimiento involucra acondicionar el programa e incluso hacerle cambios que lo hagan accesible a problemas reales. Después de varias corridas, estos cambios pueden hacer al programa más fácil de usar y más aplicable a mayor cantidad de problemas. El mantenimiento se facilita con una buena documentación. El almacenamiento se refiere a la manera en que los programas se guardan para uso posterior. Antes del advenimiento de las computadoras personales, no había formas simples de almacenar copias de trabajo de programas realizados. Los listados de código, de hecho se guardaban, pero tenían que teclearse de nuevo para usos posteriores. Las cajasde tarjetas
FIGURA 2.8
Disco flexible.
46
INGENIEROS
PARA
MÉTODOS NUMERICOS
-
perforadas se podían guardar, pero paraun programa de cualquier magnitud resultaban difíciles de manejar y susceptibles a deteriorarse. Como se menciona al principio de este capítulo, los dispositivos de almacenamiento magnético han mejorado sustancialmente la habilidad de retener programas. Un dispositivo común de almacenamiento esel disco flexible. mostrado en la figura 2.8. Los discos flexibles son un medio barato para almacenar programas y datos. Aunque los discos flexibles tienen una granutilidad. también tienen algunas desventajas. Por unaparte, su tiempo de acceso es m u y lento; por otra, se deben manejary se deben guardar con mucho cuidado. Dado que pueden borrarse muy fácilmente, siempre se debe teneruna copia de cada uno de ellos. Además,cuando se termina un programa de computadora, se debe imprimir inmediatamente y almacenarlo con la documentación correspondiente. Estas impresiones pueden ser útiles en el caso no deseado, pero posible, de que el disco y su copia se destruyan.
2.3 DESARROLLODE UN PROGRAMA PARA EL PROBLEMADELPARACAIDISTA Ahora se usará el material de las secciones previas para escribir u n programa en BASIC y en FORTRAN para el problema del paracaidista. Estos programas son un ejemplo ideal porque contienen todos los elementos -entrada-salida, ciclos, decisiones, cálculos y subprogramas- que conforman al programa en el resto del capítulo. Recuérdese que el problema del paracaidistaes equivalente ala solución de la ecuación (l.12): r
-7
donde v es la velocidad en un tiempo posterior v(tJ es la velocidad en el tiempo actual ti, g es la aceleración de la gravedad (igual a) 980 cms/s2, c es el coeficiente de rozamiento, m es la masa del paracaidista y At = ti+l - ti. El término entre corchetes es el valor actual del promedio de cambio de velocidad respecto al tiempo [Ec. (1.8)].Si se conoce la velocidad inicial del paracaidista v (ti)la ecuación (2.1) se puede resolver repetidamente para valores de v(ti+J, como se hizo en el ejemplo l.2. Con esta información como antecedente, ahora se puede desarrollar un algoritmo para el problema. En este punto, se podría desarrollar un algoritmo bien detallado. Sin embargo, con la práctica que se tiene, difícilmente se podría. En lugar de ello, se empezará con una versión general simple, agregándole detalles poco a poco en forma secuencia1 para expandir la definición. Entonces, cuando se haya obtenido una versión
LA PROGRAMACldN EN LAS COMPUTADORAS PERSONALES
FIGURA 2.9
Diagrama de fluio de un programa simple para el problema del paracaidista.
47
48
MÉTODOS
NUMÉRICOS
PARA INGENIEROS
final. se puede proceder a escribir el programa. En programación. este método de iniciar en general e ir avanzando hacia lo específico se le conoce como esquema de análisis descendente. Entre otras cosas. es eficiente porque,engeneralesmuchomás fácil eliminar errores si los algoritmos y los programas se escriben en pasos simples y se van verificando conforme se avanza. Un algoritmo muy simple para realizar los cálculos del ejemplo 1 . 2 puede escribirse con palabras de la siguiente manera: introducir los datos. calcular la velocidad, imprimir la respuesta y repetir hasta que se hayan calculado tantos valores como seanecesario. Este algoritmo se puede expresar d e manera más formal con un diagrama de flujo. La figura 2 . 9 muestra un procedimiento detallado de la implementación de los cálculos.
El diagramade
flujo consiste de tres conjuntos de declaraciones:
1 . Introducir variables y constantes
2. Inicializar todas las variables 3. Hacer unciclo iterativo que calcule e imprimalas respuestas
Con base al diagrama de flujo, se puedeescribir ahora un programa. Las versiones en FORTRAN y BASIC se muestran en la figura 2.10. NÓtese que para la versicin en BASIC, se usan incrementos de 10 para etiquetar los números de línea. Esto se hace para prever la posibilidad de
T0=0 v0=0 H=Z t4=t 0 C=t2500
I
M1681 O 0 T=TO
'V =v o
2 0O
URITE<6,I >T,V FORMAT(2( ' ' , F 1 0 . 3 > ) I=O ' V = V + C 98 O-C*V,'l'l >*H T=T+H WRITE(6,l )T,V I=I+t I F ! I . L T . H jC O T O2 0 0 STOP E ti C)
FIGURA 2.1 O
Programas FORTRAN y BASIC para el problema del paracaidista. Estos programas duplican los cálculosmanuales del ejemplo 1.2.
.
"
.
.
EN LA PROGRAMAC16N
PERSONALES LAS COMPUTADORAS
49
insertar nuevas líneas de código en refinamiento subsecuentes del programa. Aunque el ejercicio mencionado anteriormente ciertamente es un programa válido para el problema del paracaidista, por ningún medio explota todas las posibilidades de programación ni en FORTRAN ni en BASIC. Para demostrar como se pueden emplear líneas adicionales, para desarrollar una versión mejor, ahora se refinará el programa. Muchas de las modificaciones e insercionessiguientes representan una técnica de programación más eficiente y más sencilla de ejecutar. Sin embargo, cierto material se enfoca hacia propósitos didáctico5 para demostrar el uso de ciertasdeclaraciones. El siguiente análisis muestra directamente la versión en BASIC. Ya que los programas de la figura 2.11 están escritos en paralelo, es muy fácil extender el análisis a la versión FORTRAN. El programa de la figura 2.11 tiene nuevas características. Lasprincipales son: 1. El programa calcula ahora la velocidadpara tres valores diferentes del coeficiente d e rozamiento y d e la masa. La habilidad de realizar cálculos repetitivos es una delas ventajas de las computadoras. Dentro del diseño en ingeniería, a menudo útil es realizar una serie de cálculos varias veces con valores diferentesde los coeficientes para valorar la sensibilidad del modelo a estos cambios. Esto se hace en este caso, realizando los cálculos del ejemplo 1.2 con el coeficiente de rozamiento variando 2 10%. De esta manera, los tres casos usados en el programa son parael caso del coeficientede rozamiento original (12 500 g / s ) , el coeficiente de rozamiento más el 10 por ciento (13 750 g/s) y el coeficiente de rozamiento menos el 10 por ciento (11 250 g/s) . El cálculo repetitivo se lleva a cabo agregando un ciclo iterativo (líneas 3080 a la 3390). Cada vez que el programa pasa a través del ciclo, se usa un coeficiente de rozamiento diferente para calcular la velocidad. Nótese también que el coeficiente de rozamiento y la masa se usan como variables con subindices C(K) y M(K) . Por lo tanto, se les asigna una dimensión en la línea 3040. 2. El programa tiene ahora un esquema iterativo más preciso. Además de agregar el ciclo mayor para los tres casos dec y de m (líneas 3080 a la 3390), se han usado dos ciclos para calcular el valor actual de u . Se hace así porque pudiese ser que no se deseeimprimir una respuesta después de cada paso. Esto sería especialmente cierto si se usara un paso muy pequeño, por ejemplo 0.01 S , para obtener resultados más exactos. Para calcular desde t = O hasta 20 S , se requerirían 2 0 / 0 . 0 1 ó 2 O00 números. Ya que se requiere un valor para cada 2 S que esquemetice razonablementela caída del paracaidista, se han usado dos ciclos anidados de forma tal que el programa imprima resultados en tiempos intermedios.Un ciclo anidado es aquelciclo que
50
MÉTODOS
NUMÉRICOS PARA I N G E N I E R O S
F PRDCRRMR LEGIBLE RL USURRIO En FDRTRBN p a s a EL PROBLEMQ
C
c
C
DEL PARPCP,IDISTP.
c C
sc c u w R n CIVIL EHCINEERIHC
C C
CDLLECE STATION, TEXnS 77843
C
c
TEXPS
a w UNIVERSITY
................................................ C FUHCIOH DV/DT CRLCULUR
................................................ ................................................ ................................................ PPlRP
DVDT(C.V,N)-980-C.V/M
C
PRDCRRMR PRINCIPRL
................................................ ................................................ €UD
SUBRUTINR p a w IMPRIMIR EL ENCP,BEZPDO
C
I
SUBRDUTIHE LRBEL VRITE(6, I >
FORMIIT( '-':SDLUCION
Paun LP,
VELOCIDAD
DE
................................................ ................................................ RETURN END
C
SUBRUTINR L E EPRR W
calw
GEL P m m a I D I s T f i
DRTDS
SUBROUTINE INPUT(TO,TI,VO,U,P> TIEMPO z H I c l a L ( S E G ) RERD < 5 . 2 > 1 0 C TIEMPO F I H A L( S E G ) RE, (S.Z)TI C VELDCIDRD I N I C l P L ( C M / S E C > REIRD(S.2)VO C MRCNITUD DEL IHCREIEUTO ( S E C ) RE!RD<5 , 2 >H C IMPRIME EL IHTERVPlLO ( S E C ) RERD( S , 2 )P 2 FORtlPIT COTO 222U URIlE(6,3> 3 FDRNPIT('EL IWTERVLLD DESE SER MRVOR D IGURL P LO MPIGNITUD *DELINCREMENTO Y NO PUEDEVPLER CERO') 22:2 0 RETURN END ~~
............................................... ......................
C
C C
SUBRUTIN0 PRRR RERLIZRR CfiLCULOS
SUBRDUTIHE C I L C ( T O , T 1 , V O , H , P ) REM. M DIMEHSIOU C < 2 O ) , l M Z O ) DVOT(C.V,M)-SBO-C.Y~M NC-IHT(P/HI HP-IHTl(Tl-TO>/P>
CICLO PP,RR CRLCULRRV CDU DIFERENTES C Y M DO 3370 K-1.20 LEEELCOEFICIENTEDEFRICCIDU REIID.CT.O.O)COTD 3220 VRITE(6,5> S FORMRT('-','LR NASR DEBE SER M(IV0R PUE C E R O ' , COTO 3390 C INICIPLIZI( TIEMPO Y VELDCIDRD 3200 r-To
v-vo
C C
VRITE(6.6) ,,4Y,'T tSEC>'.1OX,'V 6 FDRIIPIT(, YRITE(6.7>T.V INPRIME E L CICLO DO 31601-1,NP CICLO DE CP,LCULD
(
CWSEC
3340 3360
1170 C O N T I k
3390 RETURN END
FIGURA 2.1 1
Versiones FORTRAN y BASIC legibles al usuario del programa de la caída del paracaidista.
INTERVALO
EN LA PROGRAMACldN
PERSONALES LAS COMPUTADORAS
51
contiene otro dentro de sí mismo. En este ejemplo, el ciclo interno (líneas 3320 a la 3350) realiza los cálculos usandoel tamaño de paso deseado (línea 2100). Después de NC iteraciones de este ciclo (donde NC se calcula internamenteen la línea 3050), se imprime una respuesta. El procedimiento se repiteNP veces (donde NP se calcula internamente en la línea 3060) mediante el cicloexterno (líneas 3300 a la 3370). Nótese también que en vez de especificar el número de pasos (N, especificado en la línea 130 en las versiones simples de la figura 2.10), ahora sólo se introducen los tiempos inicial y final (líneas 2040 y 2060) y se usan las líneas 3050 y 3060 para determinar internamente el número apropiado de pasos. 3. El programa muestra ahora un esquema de etiquetado mbs descriptivo.Se incluyen declaraciones de documentación al principio del programa, los mensajes de salida, por ejemplo las líneas 1030 a la 1080 y las entradas más descriptivas, por ejemplo las líneas 2040 a la 2130.
4. El programa está modularizado. Nótese que el programa consiste de una serie de subrutinas que realizan tareas bien definidas. El programa principal sirve como supervisor para dirigir cada una de las parte dentro de un esquema lógico. 5. Se incluyen los diagnósticos para indicaral usuario q u e Se ha cometido un error. Los diagnósticos son declaraciones en el programa que imprimenparaelusuario un mensaje descriptivo, siha ocurrido un error. Las líneas3160 a la 3210 representan un diagnóstico que verifica si la masa es cero. Si así fuese, la ecuación de la línea 210 realizaría una división por cero. Si la masa es menor o igual a cero, la lines 3170 transfiere el control a la línea 3180, que imprime el mensaje:
LA MASA NO DEBE SER MENOR O IGUAL A CERO De forma similar, la línea 2150 examina que el intervalo de impresión sea mayor que el tamaño del paso. Si no es así, se imprimen los mensajes de las líneas 2170 a la 2190 y el programa transfiere el control a lalínea 2100 y pide un nuevo tamaño de paso. Las anteriores no son mas que cinco de varias modificaciones quese han hecho para incrementar las capacidades del programa.Se debe verificar línea por línea para entender a fondo cómo contribuye cada una de las declaraciones en el programa total. La figura 2.12 muestra una corrida. En esta figura se introduce un error intencionalmente en el intervalo de impresión para demostrar lascapacidades de diagnósticos del programa. El análisis de estas corridas junto conla figura 2.11 deben sugerir algunas alternativas para empezar a obtener resultados claros y con un esquema descriptivo.
52
MÉTODOS NUMERICOS PARA INGENIEROS
Depto Ingentería Cwl Texas A&MUnwerstty College Stahon. Texas 77843 DESCRlPClON Este programa calcula la velocidad vertical de caída de u n paracatdtsta en functón del tiempo REQUISITOSESPECIALES: Se pueden usar hasta 20 coeficientes diferentes de rozamiento REQUISITOS ESPECIALES- y masas para calcular la uelocldad
REFERENCIA
Métodos numértcos para Ingenieros con dphcaciones en computadoras personales, 1986 (Mc-Graw-Hill. México),Cap 2
SOLUCION PARA LA VELOCIDAD DEL PARACAIDISTA TIEMPO INICIAL lSEG1 10 TILMPOR FINAL (SEGI 123
Dt CAlCA VICMISECI
MASS I G I - 6 8 1 0 0 TISECI O
O 7
1w n 4699 3985 55437 4482 42869 4796 89686 4995 92151 5121 88278 5201 60276 5252 05696 5283 98906
3%;
4 VFLOCIOAD INICIAL ICMlSEGl
456
6 8 10
MAGNITUD DEL INCREMENTO 32 IMPRIME EL INTERVALOISEGI
12 14 16 18
= 3
20
EL (NTERVALO NO DEBE SER M A Y O R O IGUAL QUE LA MAGNITUD DEL INCREMENTO Y N O DEBE VALER CERO
DRAG COEFFICIENT (GlSECl I T 0 TERMINATE COMPUTATION ENTER ZERO1 = 11250
MAGNITUD DEL INCREMENTO - 8
M A S S I G I = 68100
IMPRIME EL INTERVALO\SEGI = 2 6 COEFICIENTE DE FRlCClON IG'SEGI (PARA TERMINAR EL CALCULO TECLEA U N CERO) 65 MASAIGI
=
23
VICMiSECI
42291
TlSECl
O 2
3272
4 6 6
VICMiSLGl TlSEGl
5133.70342
TISECI VlCMlSECl O
2 3128 51689 4 6 8
0
5771
10 12 14 16 18 20
O 1960 4151.22591 4739.6755 5397 5459 5574 21 576 51452 5692 72778 5824.76927
1960
3825 16572 4240 49528 4488 10732 4635 72918 4723 73869
10 12 14 4776.20838 16 18 4807 48987 20 4826 13934
DRAG COEFFICIENT IGISECI (TO TERMINATE COMPUTATION ENTER ZERO1 = O
DRAG COEFFICIENTE IG.SECI IT0 TERMINATE COMPUTATION ENTERLEROi=12500
FIGURA 2.1 2
Documentación del orograma legible al usuario del problema paracaidista, incluye corrtda del programa.
del
2.4 ESTRATEGIAS DE PROGRAMACIóN Este librobrindaalestudiosodiversos medios, de cálculo con el fin de convertir la teoría de los métodos numéricos en herramientas prácticas para la soluci6n de problemas de ingeniería,Estos medios incluyen 1) discos
EN LA PROGRAMACldN
PERSONALES LAS COMPUTADORAS
53
que guardan a los programas, 2) programas, 3) algoritmos y 4) diagramas de flujo. El propósito de esta sección es el de descubrir la forma en que cada una de estos medios complementa a los otros a lo largo del libro. La estrategia global se ilustraenlafigura 2.13. Tal vez al comprar este libro el lector también adquirió un disco para computadora. A este disco se le conocerá con el nombre de NUMERICOMP, correrá sobre una computadora IBM-PC (o cualquier compatible) o sobre una APPLE 11. El disco contiene seis programas escritos en BASIC: bisección, eliminación Gaussiana, regresión lineal, interpolación
Meta: Resolver los problemas de ingeniería usando una computadora y los métodos numéricos
FIGURA 2.13
Estrategia empleada en el texto para integrar las computadoras personales y los métodosnuméricos en la solución deproblemasde ingeniería.
54
MÉTODOS
NUM~RICOS PARA INGENIEROS
de Lagrange, regla trapezoidal y el método de Euler. Los programas representan una colección de métodos numéricos simples, pero muy úti!es para cada una de las partes de este libro. Con muy poca preparación puede usarse NUMERICOMP para la solución de problemas. Esto se debe principalmente a que los programas están escritos en un lenguaje legible y claro, además que proporciona todala información necesaria para su operación. Además de tener utilidad inmediata, el disco ofrece un ejemplo concreto de programas bien escritos que se pueden usar como modelo para programas escritos porel usuario. Finalmente,los programas se pueden usar para verificar la exactitud de los resultados en los esfuerzos de programacióndelusuario. Cada uno de los programas se ilustra completamente enel capítulo que le corresponde dentro del libro. Las ilustraciones muestran tal como se verían en una pantalla, los datos que se requieren, los resultados de los cálculos y una gráfica de los resultados. Estas ilustracionesse generan usando NUMERICOMP en la solución de un problema determinado. Se incluyen algunos ejercicios en cada uno de los capítulos para reforzar la habilidad en el manejo de los discos del usuario en su propia computadora. Se danloscódigosdeambas versiones. FORTRAN y BASIC para los mismos métodos. Estos programas contienen los algoritmos fundamentales con esquemas simples de entrada y salida de datos y con poca documentación. Por lo que no son muy claros en su exposición. Una de las tareas será la de modificar estos programas de forma tal que sean un poco más claros, usando los recursos y la técnica individual de cada programador. Una vez que esto se haya llevado a cabo, se tendrá unaherramienta que se aproximará a los programas suplementarios. Los seis programas del disco NUMERICOMP son para los métodos básicos de cada una de las partes del libro. No son, necesariamente los más eficientes computacionalmente hablando sobrelos existentes. Por lo tanto se han incluido diagramas de flujo o algoritmos parala mayor parte de los otros métodos numéricos del libro. Se pueden usar estos diagramas y algoritmos con la destrezade programación propia del usuario, para los métodos expuestos. escribir programas de cualquier otro de
EJEMPLO 2.1 Gráficas por computadora
Enunciado del problema: el propósito de este ejemplo es el de familiarizarse con los programas opcionalesNUMERICOMP disponibles con el texto FIGURA 2.14
los programas NUMERICOMP que acompañan al texto. b) Menú principal de NUMERICOMP. c) Menú para BISECCION,d) La pantalla muestra cómo se introduce una función para BISECCION; la función en este caso es la ecuación (1.9), que calcula la velocidad de caída del paracaidista.e) La pantalla muestra una gráfica de la velocidad contra el tiempo para el paracaidista, como lo calcula NUMERICOMP.
a) Título de
LA PROGRAMAC16NEN LAS COMPUTADORASPERSONALES
FIGURE 2.14
55
MoODOS NUMERICOS PARA INGENIEROS
56
y usar las capacidades gráficas de NUMERICOMP para trazarfunciones. Si el libro se compró sin estos programas, entonces se deben buscar formas para realizar tareas similares sobre la computadora. Esto se puede llevar a cabo con la ayuda de los programas dados porel sistema o puede requerirse que se desarrollen los propios. La habilidad en el trazo de funciones es muy importante ya que la forma de resolver un prob!zma de métodos numéricos se facilita mucho cuando se usa en coordinación con gráficas por computadora.
Solución: insértese el discoNUMERICOMPen launidad de discos y córrase el programa de acuerdoa las instrucciones delManual del usuario. La pantalla debe producir un esquema similar al de la figura 1.14~1. Simplemente es la presentación del programa. Tecléese RETURN para continuar. La pantalla debe mostrar ahora un menú de selección principal como se muestra en la figura 2.14b.El menú contiene una lista de seis programas incluyendo una opción que termina la sesión. Se usará cada uno de estos programas en el momento apropiado dentro del libro, cuando se haya visto previamente la teoría de cada uno de los métodos. Por ahora se usará 19 opción de grdficas por computadora dentro del programa de BISECCION para gráficar la velocidad del paracaidista en tunción del ti9mpo. Para hacerlo, simplemente se introduce el programa de BISECCION mediante la opción 1. La pantalla, automáticamente debe mostrar un patrón similar al de la figura 2 . 1 4 ~después de algunos movimientos del disco. Sólo se requieren usar las opciones 1 , 3 y 4 para graficar funciones. Selecciónese la opción 1 para introducir la función usando la ecuación (1.9) con m = 68 100 g, c = 12 500 g/s y g = 980 cm/s (Fig. 2.14d). Regrésese al menúprincipal y escójase laopción 3 para graficar la función. Antesde trazar la gráficase deben dar valores mínimo y máximo para x y paraf(x) que corresponden al tiempo y a la velocidad en este caso. Los valores para x y f ( x ) están dados por definición enlaprimer columna (en este caso son cero). Pruébense varios valores para los ejes x y paraf(x) (incluyendo valores negativos) para familiarizarse con el diseño y operaci6n de la opción de graficación. En la figura 2.14e se muestraunagráficaquemuestrael esquema de lavelocidad como función del tiempo. La opción de graficación dada por este programa tendrá muchos otros usos para visualizar mejor los resultados de la aplicación de los métodos numéricos y la computación enla solución de problemas de ingeniería. Estos usos se exploran en las secciones subsecuentes del texto.
PROBLEMAS 2.1
Escríbanselasdeclaraciones BASIC y FORTRAN equivalentes a cada una de las siguientesexpresiones:
-
57
LA PROGRAMACldN EN LAS COMPUTADORAS PERSONALES
xlsenl
b) y=c)
x-1
-b -
x=
2a
I) Si A y Z tienen el mismo signo, entonces reemplácese 2 por Q .
2.2
Escríbanse las declaracionesBASIC y FORTRAN para realizar la siguienteoperación S
=
2 xi2
Para i = 3, 6, 9,. . ., 21.
2.3
Dado el siguiente programa
10 A = 10.1 20 B = 3.1416 30 Z = 1.1 40 PRINT X1 ¿Cuál será el resultado que se imprima, si se insertan las siguientes expresiones entre las líneas 30 y 40? a)
35 X1
=
A"Z/B
b) 35 X1
=
A' (Z/B)
cj 35 X1 = A'B - B**B/Z d) 35 X1 = ((A'Z)
e ) 32 J
=
36 X1 2.4
+
2'2
- B/Z)' *Z)/(B - Z)
INT(A* *Z/B - 2) =
J'A
Dado el programa del problema 2.3, escríbase el código de la línea 35 que evaluará las siguientes expresiones algebraicas: x1 =
a'
-4 6 2
XI
2.5
=a
- dz/5
+ 6(a + 2)2'3 - -7 b
La figura para este problema muestra la página de una bitácora de un automóvil. Cada renglón representa una visita a la gasolinera en la que el tanque se llena de gasolina. La página tiene, además columnas para la fecha, el kilometraje marcado por el odómetro, la cantidad de gasolina y su costo. Escríbase un programa, diseñado de forma tal que acepte datos de entrada bajo este esquema y calcule los kilómetros recorridos por litro y el costo por ki16metro de acuerdo a cada intervalo entre llenado y llenado. Debe imprimir una tabla con tres columnas que conforman la fecha, los kilómetros por litro y el costo por litro.
58
NUMÉRICOS
MÉTODOS
PARA INGENIEROS
FIGURA DEL PROBLEMA 2.5
2.6
Se invierte una cantidad de dinero P en una cuenta cuyos intereses se reinvierten alfinaldel periodo. El monto futuro F , conuna tasa deinterés i después de n periodos se puede determinarfácilmentecon la fórmula siguiente:
F = P (1
+
i)"
Escríbase un programa que calcule el monto futuro de una inversión. Los datos de entrada deben incluirla cantidad inicial P,la tasa de interés i (como fracción decimal), y el número de a6os n para los cuales se va a calcular el monto futuro. La salida debe incluir también estos valores. Incluyendo, en forma de tablael monto futuro para cada uno de los años, hasta el n-ésimo año. Correr el programa para P = $ 1 000.00, i = 0.1 y n = 20 años. 2.7
Escríbase un programa para calcularlas raíces reales de la ecuación cuadrática ax'
+
bx
+
c =
O
donde a , b y c son coeficientes reales. La fórmula para calcular las raíces es la fórmula cuadrática
EN LA PROGRAMAC16N
59
PERSONALES LAS COMPUTADORAS
X=
-b f
2a
Nótese que sila cantidad dentro del signo de la raíz cuadrada es negativa entonces las raíces son complejas. También ocurre una división por cero si a = O. Diséñese el programa de forma tal que contemple estas contingencias imprimiendo un mensaje de error. También, inclúyase algo de documentación a lo largodel programa y etiquétense las salidas para hacer el programa legible. Repítanse los cálculos para valores diferentes de a , b y c, tantas veces como el usuario desee. Efectúense pruebas para los casos: a) a = l
b = 4 b = -4 h = -2
b) a = O c) a = l
2.8
c = 2 c = 2.3 c = 2.3
La función exponencial e" se puedeevaluarmediante
la serieinfinita:
Escribase un programa para implementar esta fórmula que calcule los valores e x agregando un término cada vez a la serie. En otras palabras, calcúlese e imprímase la secuencia
ex = 1 ex=l+x X*
eX=l+x+-
2
hasta la orden de término prefijado. Para cada caso, calcúlese el porcentaje de error relativo dado por % error
=
solución real
-
solución aproximada
soluciónreal
100%
Utilícese la función de biblioteca para calcular e x y determinar la "solución real". El progrma debe imprimir la solución aproximada y el error en cada paso. Se puede emplear u n a función definida por el usuario para calcular el error. y usar ciclos para simplificar los cálculos tanto como sea posible. Para probarlo, utilicese el programa para calcular exp(0.5) desde el primer término de la serie hasta el término x2"/20!. Interprétense los resultados. 2.9
En economía se dispone de fórmulasparacalcular los pagos anuales debidos a un préstamo. Supóngase que se desea pedir un préstamo de P pesos para pagarlo en n pagos anuales con una tasa de interés ¡. La fórmula para calcular el pago anual, A, es.
A1 = P
i(1 + i)" (1 + i)" - 1
METODOS NUMERICOS PARA INGENIEROS
60
Escríbase un programa para calcular A,. Pruébese con P = $10 O00 y una tasa de interés del 20 por ciento. (i = 0.20). Hágase el programa de tal forma que se puedan evaluar tantosvalores de n como se desee. Calcúlense los resultados para n = 1 , 2, 3 , 4 y 5 . 2.10 Junto con los cálculos de los pagos anuales por préstamos, como se hizo en el problema 2.9, las fórmulas de economía se puedenemplear para determinar los pagos anuales correspondientes a otros tipos de flujo de efectivo. Por ejemplo, supóngase que existe un gasto que crece de manera uniforme a un promedio G conforme avanza el tiempo. A estos pagos se les conoce como series de gradiente aritméticas. La fórmula de economía que calcula un pago anual equivalente para este tipo de flujo de efectivo es
n
1
Ahora, supóngase que se pide un préstamo de P = $10 O00 con un interés del 20% ( i = 0.20) y se compra un nuevo sistema de cómputo. El costo de mantenimiento de la computadora crece de acuerdoa la serie de gradiente aritmética con una tasa de G = $50/año/año. Junto con estos dos costos (esto es, flujos de efectivo negativos para los pagos del préstamo y del mantenimiento), también se obtendrán beneficios o flujos de efectivo positivos con el uso del sistema.El aprovechamiento en consulta y el uso de la computadora se pueden tasar con un valor anual de A, = $4 000. Por lo tanto, el valor neto A, como propietario de la máquina sobre una base anual, se puede calcular como beneficios menos costos, o AN =
AB - A, - A2
Por lo tanto, si A , es positivo, la computadora está generando ganancias sobre una base anual. Si A , es negativo, se está perdiendo dinero. Desarróllese, rastréese, pruébese y documéntese un programa que calcule AN El programa se debe diseñar de tal forma que el usuario pueda introducir como datos las variables P, i, G, A, y n. Úsese el programa para estimar A, con el nuevo sistema de cómputo para n = 1, 2 , 3 , 4 y 5. Esto es, evalúense las ganancias si el sistema se posee de l a 5 años. Grafíquese AN contra n (si es posible se puedeusar la computadora para hacerla gráfica). Determíneseel plazo que se debe poseerel sistema para empezar a ganar dinero. (Nota: la información adicional para este problema se puede obtener del primer caso del capítulo 6). 2.11 Impleméntese el programa de la figura 2.11. Efectúense las modificaciones necesarias de tal forma que sea compatible conel lenguaje usado enla computadora. Una vez que el programa se encuentre en la computadora, pruébese duplicando los cálculos de la figura 2.12. Repítanse los cálculos con pasos de tamaño1 y 0.5. Compárense los resultados con la solución analítica obtenida anteriormente en el ejemplo 1.1.?.Mejoran o empeoran los resultados al hacer el tamaño del pasomás pequeño?. Explíquense los resultados. 2.12 El siguiente algoritmo está diseñado para determinarla calificación final de un curso, que consiste en exámenes parciales. tareas y examen final: Paso 1: Introducir el número del curso y el nombre. Paso 2: Introducir los factores de peso: para exámenes parciales REP) para tareas (PT) y para el examen final (PEF)
LA PROGRAMACl6N EN
if)Zfji3fi51*1
LAS COMPUTADORAS PERSONALES
Paso 3 : Introducir las calificaciones de los exámenes parciales y determinar la calificación promedio (CEP). Paso 4: Introducir las calificaciones de las tareas y determinar la calificación promedio (CT) . Paso 5: Si ésta es la última calificación, ir al paso 8; de otra manera, continuar. Paso 6: Determinar la calificación promedio (CP) mediante CP Paso 7: Paso 8 : Paso 9:
PEP =
CEP
+ PT
PEP
PT
* CT
Ir al paso 10. Introducir la calificación del examen final (CEF). Determinar la calificación promedio (CP) mediante CP
PEP =
+
PT
PEP
+
CEP
CT PT
+
+
(PEF)
(CEF)
(PEF)
Paso 10: Imprimir el número del curso, nombre y calificación promedio Paso 11: Detener los cálculos. a ) Escríbase un programa basado en este algoritmo b) Rastréese y pruébese usando los datos: PEP = 35; PT = 25; PEF = 40; Exámenesparciales = 100, 98, 83, 76, 100; tareas = 96, 94, 83, 100, 77, y examen final = 88. c ) Prepárese una pequeña documentación para el programa.
2.13 La figura para este problema muestra el reverso de una hoja de estado de cuenta de cheques. El banco ha elaborado esta hoja para ayudar en el balance d e una cuenta de cheques. Si se observa bien, se podr6realizar un algoritmo. Desarróllese, rastréese y documéntese un programa que obtenga el saldo actual dela cuenta de cheques basado en el esquema de la figura. Se pueden usar los números de la figura para probar el programa. 2.14 Escríbase, rastréese y documéntese un programa que determine las estadísticas del deporte preferido. Escójase cualquiera desde futbol hasta el lanzamiento de bolos. Si el lector practica deportes eninteriores elabórese uno para el propio equipo. Diséñese el programa de forma tal que sea legible y muestre información interesante a cualquiera (por ejemplo, al entrenador o jugador) que pueda usarse para evaluar el rendimiento de los jugadores. 2.15 Úsese la opción de graficación del programa BISECCIÓN (en el disco NUMERICOMP) para trazar varias funciones de cualquiertipo. Pruébense funciones polinominales y trascendentes cuyo comportamiento sea difícil de visualizar antes de graficarlas. Úsense varias alternativas para ambos ejesx y y para facilitar la exploración. Háganse copias permanentes de los trazos si se tiene una impresora. 2.16 Se debe lograr la capacldad de graticar funciones de una forma parecida a como lo hace el programa BISECCIÓN. Prográmese la computadora de una manera apropiada para lograrlo. Si la computadora no tiene un sistema operativo cuyos programas puedan ayudar, entonces se deben escribir, usando las capacidades ?. de la misma.
62
INGENIEROS
PARA
METODOS
EL ÁREA DE ABAJO SE PROPORCIONA PARA AYUDAR
NUMÉRICOS
EN EL SALDO DEL
TALONARlO
CHEQUESPORCOBRAR NO CARGADOSALESTADODE CUENTA
4 58
4 60
46 I 463 4 64
46 S
466
5 68
13 33 150 O0 I4
Abrl
MES
SALDO NUEVO COMO SE MUESTRA EN ESTEESTADODECUENTA
50 O 0
I
p
6 4 3 . S4
SUMA DEPóSITOS QUE NO ESTAN EN ESTE ESTADO DE CUENTA
74
9 32 44 IS
I
250.00 22. IS
TorAL
S
RESTA TOTAL DE CHEQUES POR COBRAR
600.52
SALDO DEL TALONARIO DESPUÉS DERESTARLA CARGADESERVICIODEL MES ACTUAL Y SUMAR LOS INTERESESDEVENGADOS ( s b l o LASCUENTAS AFAVORDELSALDO
~
FIGURADELPROBLEMA
2.13
El programa se debe guardar en un disco de memoria magnética. Documéntese este programa después de rastrearlo y examinarlo cuidadosamente. Déjese listo para poder modificarlo de acuerdo a los requisitos del libro, conforme se avance 2.17 Apréndase la manera de hacer copias permanentes de 2.16 si se Tiene una impresora.
las gráficas del problema
~
CAPíTULO T R E S APROXIMACIONES Y ERRORES
Debido a que la mayor parte de los métodos expuestos en este libro son muy claros en su descripción y en sus aplicaciones, resulta tentador en este momento ir directamente al cuerpo principal del texto y averiguar el uso de estas técnicas. Sin embargo, ya que los errores son parte intrínseca en el entendimiento y uso efectivo de los métodos numéricos, se ha escogido este capítulo para desarrollar este tema. vez con el proLa importancia de los errores se menciona por primera blema del paracaidista, en el capítulo 1. Recuérdese que se determinó la velocidad de caída del paracaidista analítica y numéricamente. Aunque con la técnica numérica se obtuvo una solución cercana a la real (la analítica), hubo cierta discrepancia o error, debido a q1.le los métodos n u méricos son sólo una aproximación. La mayor parte de las técnicas desarrolladas en este libro tienen la característica de poseer errores. Esto puede parecer contradictorio a primera vista ya que no coincide con la imagen que se tiene de u n buen mecanismo de ingeniería. Los estudiantes y pasantes de ingeniería luchan constantemente para limitar este tipo de errores en sus trabajos. Cuando hacen un examen o realizan tareas, son sancionados mas no premiados por sus errores. En la práctica profesional, los errores pueden resultar costosos y en algunas ocasiones catastróficos.Se puede perder hasta la vida si una estructura o un dispositivo llega a fallar. Aunque la perfección es una meta digna de alabarse, es difícil, si no imposible, alcanzarla. Por ejemplo, a pesar de que el modelo obtenido mediante la segunda ley de Newton es una aproximación excelente. en la práctica jamás predecirá exactamente la caída del paracaidista. Algunos fenómenos, tales como la velocidad del viento y alguna pequena variación en la resistencia del airecambiarán totalmente la predicción, Si estas desviaciones se comportan bajo un patrón constante ya sea subiendo o bajando. bastará con formular un nuevo modelo. Sin embargo, si su distribución es aleatoria pero se agrupa muy próxima alrededor de la predicción, entonces las desviaciones pueden calificarse como insignificantes y el modelo nuevamente se considerará adecuado. Las aproximaciones numéricas pueden in-
64
MÉTODOS
NUMÉRICOS
PARA INGENIEROS
troducirerroressimilaresenelanálisis.Nuevamentelapregunta es: ¿qué errorpuedeconsiderarsetolerable? Este capítulo cubre varios aspectos que identifican, cuantifican y minimizan estoserrores. Enlasprimeras secciones se revisalainformación referente a la cuantificación de los errores. En seguida se estudian dos de los errores más comunes: errores de redondeo y errores de truncamiento. Los errores de redondeose deben a que la computadora sólo puede representar cantidades con un númerofinito de dígitos. Los errores de truncamiento representan la diferencia entre una formulación matemática exacta de un problema y la aproximación dada por un método numérico. Finalmente, se discuten los errores sin relacionarlos con ningún método numérico en especial. Incluyendo errores por equivocación, errores en la formulacióndemodelos y la incertidumbre enla obtención de datos.
3.1 CIFRAS SIGN IFICATIVAS En este libro se analizan casi exclusivamente aproximaciones que se relacionan con el manejo de números. En consecuencia, antesde discutir los errores asociados con los métodos numéricos, es útil repasar algunos conceptos básicos referentes a la representación aproximada de los números mismos. Cuando se emplea un número en un cálculo, debe haber seguridad que pueda usarse con confianza. Por ejemplo, la figura 3.1 muestra un velocímetro y el odómetro (contador de kilometraje) de un automóvil. Con un simple vistazo al velocímetro puede verse que el automóvil viajaa una velocidad comprendida entre 48 y 49 km/h. Ya que la flecha está más
FIGURA 3.1
El velocímetro y el odómetro de un automóvil ilustran el concepto de cifras significativas.
APROXIMACIONES Y ERRORES
65
alládelamitaddelas marcas del indicador, se puede asegurar que el automóvil viaja aproximadamentea 49 km/h. Este resultado casies verídico ya que dos o más lecturas individualesal indicador llevan a la misma conclusión. Sin embargo, supóngase que se desea obtener una cifra decimal más en la estimación de la velocidad. En este caso, alguien puede decir 48.7, mientras que otro podrá decir 48.8 km/h. Por lo tanto, debido a los límites del instrumento, únicamente se pueden usar dos dígitos con confianza. Las estimaciones del tercer dígito (o más) sólo se pueden calcul a r someramente. Seríaridículo afiimar, con base al velocímetro, que el automóvil está viajando a una velocidad de 48. 764 213 8 km/h. En contraste, el odómetro muestra hasta seis dígitos confiables. De la figura 3.1 se puede concluir que el automóvil ha recorridoun poco menos de 87 324.5 km durante su uso. En este caso el séptimo dígito (y los siguientes) se desconocen. El concepto de cifras o digitos significatiuos se ha desarrollado para designar formalmente la confiabilidad de un valor numérico. El número decifrassignificativas es el númerodedígitos,más un dígitoestimado que se pueda usar con confianza. Por ejemplo, el velocímetro y el odómetro de lafigura 3.1 estiman hasta tres y siete cifras significativas respectivamente. Los ceros no siempre son cifras significativas ya que pueden usarsesóloparaubicar el puntodecimal. Los números
0.000018 45 0.000 184 5 0.001 845 tienen cuatro cifras significativas. Cuando se incluyen ceros en números muy grandes, no se ve claro cuantos ceros son significativos, sies que los hay. Por ejemplo, enelvalor nominal, el número 4 5 300 puede si los cetener tres, cuatro o cincodígitossignificativos,dependiendo ros se conocen conexactitud.Laincertidumbre se puede desechar usandolanotacióncientífica en donde 4.53 X l o 4 , 4.530 X l o 4 y 4.530 O x l o 4 muestranque el númerotiene tres, cuatro y cinco cifrassignificativas. El concepto de cifras significativas tiene dos implicaciones importantes enel estudio de los métodos numéricos. 1. Como se dijo en el problema del paracaidista, los métodos numéricos obtienen resultados aproximados. Por lo tanto, se deben desalos resultados rrollarcriteriosparaespecificarquétanprecisosson obtenidos. Una manera de hacerlo esen términos de cifras significativas. Por ejemplo, se puede decidir que la aproximación es aceptable siempre y cuando sea correcta hasta cuatro cifras significativas -esto es, debeexistirseguridadquelasprimerascuatrocifrasson correctas.
66
INGENIEROSMÉTODOS
NUMÉRICOS
PARA
2. Aunque ciertas cantidades tales como T , e , o fi representan números específicos, n o se pueden expresar exactamente conun número finito de dígitos. Por ejemplo, el número T es igual a
3.141 592 653 589 793 238 462 643 . hasta el infinito. Debido a que las computadoras personales sólo retienen aproximadamente diez cifras significativas(comúnmente varían entre 7 y 14, como se puede ver en el cuadro 2. l ) ,tales números jamás se podrán representar exactamente. A la omisión del resto de cifras significativas se le conoce como error de redondeo. Los errores de redondeoy el uso d e cifras significativaspara expresar la exactitud de un número se estudian con más detalle en las siguientes secciones. Además, el concepto de cifras significativas tiene mucha importancia en la definición de exactitud y precisión en la siguiente sección.
3.2 EXACTITUD Y PRECISIóN Los errores asociados con los cálculos y medidas se pueden caracterizar observando SU precisión y exactitud. La precisión se refiere a 1)el número de cifras significativas que representan una cantidad o 2) la extensión en las lecturas repetidas de un instrumento que mide alguna propiedad física. La exactitud se refiere a la aproximación de un número o de una medida al valor verdadero que se supone representa. Estos conceptos se pueden ilustrar gráficamente usando una analogía con un buen tirador al blanco. Los agujeros en el centro del tiro al blanco de cada esquema de la figura 3.2 se pueden imaginar como las predicciones en una técnica numérica, mientras que el centro del blanco de cada esquema representala verdad. La inexactitud (conocida también como sesgo) se define como un alejamiento sistemático de la verdad. Por lo tanto, aunque las balas en la figura 3 . 2 están ~ más juntas que las de los dos casos son igualmente inexactos ya que ambos se la figura 3.2~1, centran en la esquina superior izquierda del blanco. La precisión, por el otro lado se refiere a la magnitud del esparcimiento de las balas. Por lo tanto, aunque las figuras 3 . 2 b y 3.2d son igualmente exactas (esto es. igualmente centradas respectoal blanco), la última es más precisa ya que las balas están en un grupo más compacto. Los métodos numéricos deben ser lo suficientemente exactos o sin sesgos paraque cumplan los requisitos de un problemaparticular de ingeniería. También deben ser lo suficientemente precisos para el diseño en la ingeniería. En este libro se usa el término error para representar la inexactitud y la imprecisión de las predicciones. Con estos conceptos como antecedentes, ahora se puedendiscutir los factores que contribuyen al error en los cálculos numéricos.
APROXIMACIONES Y ERRORES
FIGURA 3.2
67
Un ejemplo de un buen tirador ilustrael concepto de exactitud y precisión. o) Inexacto e impreciso; b) exacto e impreciso; c) inexacto y preciso; d) exacto y preciso.
3.3 DEFINICIONES DE ERROR Los errores numéricos se generan con el uso de aproximaciones para rerepresentar las operaciones y cantidades matemáticas. Estos incluyen errores de truncamiento, que resultan de representar aproximadamente un procedimiento matemático exacto, y los errores de redondeo, que resultan de representar aproximadamente números exactos. Para los dos tipos de errores, la relación entre el resultado exacto o verdadero y el aproximado está dada por Valor verdadero
=
valor aproximado
+
error
[3.11
reordenando la ecuación (3.l), se encuentra que el error numérico es igual a la diferencia entre el valor verdadero y el valor aproximado, esto es E,
=
valor verdadero - valor aproximado
D.21
68
MgTODOS NUMeRICOS PARA INGENIEROS
EJEMPLO 3.1 Cálculo de errores
Enunciado del problema: supóngase que se tiene que medir la longitud de un puente y de un remache, obteniéndose 9 999 y 9 cm, respectivamente. Si los valores verdaderos son10 O00 y 10 cm, calcúlese a) el error y b) el error relativo porcentual de cada caso. puentees [Ec. (3.2)]
Solución: a) Elerrorenlamedicióndel
E , = 10 O00 - 9999 = 1 cm y parael remache es de
E,= 1 0 - 9
=
lcm
b) El errorrelativoporcentualparaelpuenteesde E” =
1
10 O00
100%
=
[Ec. (3.3)]
0.01 %
y parael remache es de
-100% = 10% 10 Por lo tanto, aunqueambasmedidastienen un error de 1 cm, elerror relativo porcentual del remache es mucho más grande. Se puede concluir que se ha hecho un buen trabajo en la medida del puente, mientras que la estimación para el remache deja mucho que desear. €,
=
donde E, se usapara denotar elvalor exacto delerror. Se incluyeel subíndice v para dar a entender que se trata del “verdadero” error. Como ya se mencionó brevemente, esto contrasta con los otros casos, donde se debe emplear una estimación “aproximada” del error. Un defecto en esta definición es que no toma en consideración el orden de magnitud del valor que se está probando. Por ejemplo, un error de un centímetro es mucho más significativo si se está midiendo un remache que un puente. Una manera de medir las magnitudes de las cantial valor dadesque se estánevaluandoesnormalizarelerrorrespecto verdadero. como en Errorrelativofracciona1 =
error valorverdadero
APROXIMACIONES Y ERRORES
69
donde, como ya se dijo en la ecuación (3.2) error = valor verdadero valor aproximado. El error relativo también se puede multiplicar por el 100% para expresarlo como
=
E,
donde
E,
error verdadero 100% valor verdadero denota el error relatioo porcentual.
Nótese que en las ecuaciones (3.2) y (3.3)E y E tienen un subíndice que significa la normalización del error al valor verdadero. En el ejemplo 3.1, se utilizó el valor verdadero. Sin embargo, en las situaciones realeses a veces difícil contar con tal infornación. Para los métodos numéricos, el valor verdadero únicamente se conocerá cuando se habla de funciones que se puedan resolver analíticamente. Porlo general este seráel.casocuando se estudie el comportamiento teórico de una técnica en particular. Sin embargo, en aplicaciones reales, obviamente no se conoce la respuesta verdadera a priori. En estos casos, normalizar el error es una alternativa, usando la mejor estimación posible del valor verdadero, esto es, a la aproximación misma, como error aproximado €a = 100% valor aproximado donde el subíndice a significa que el error está normalizado a un valor aproximado. Nótese también que en aplicaciones reales, la ecuación (3.2) no se puede usar para calcular el término del error para la ecuación (3.4).Uno de los retos a que se enfrentan los métodos numéricos es el de determinar estimaciones del error en ausencia de conocimiento de los valores verdaderos. Por ejemplo, ciertos métodos numéricosusan un esquema iteratiuo para calcular resultados. En tales esquemas, se hace una aproximación en base a la aproximación anterior. Este proceso se repite varias veces, o de forma iterativa, para calcular sucesivamente más y mejores aproximaciones. En tales casos, el error a menudo se calcula como la diferencia entre la aproximación previa y la actual. Por lo tanto, el error relativo porcentual está dado por u
€a
=
aproximación actual - aproximación previa 100% [3.5] aproximación actual -
En capítulos posteriores se explicarán con detalle éste y otros esquemas para expresar errores. El signo de las ecuaciones (3.2)hasta la (3.5)puede ser positivo o negativo. Si la aproximación es mayor que el valor verdadero (o la aproximación previa es mayor que la aproximación actual), el error es negativo; si la aproximación es menor que el valor verdadero, el error es positivo. También, en las ecuaciones (3.2)a la ( 3 . 5 ) ,el denominador puede ser
70
METODOS NUMÉRICOS
PARA INGENIEROS
menor de cero, lo que puedellevar a un error negativo. A menudo. cuando se realizan cálculos, puede noimportar mucho el signo del error sino más bien que su valor absoluto sea menor que una tolerancia prefijada E,. Por lo tanto, a menudo es útil emplear el valor absoluto de las ecuaciones (3.2) a la (3.5).En tales casos, los cálculos se repiten hasta que
Si se cumple la relación anterior, entonces se considera que el resultado obtenido está dentro del nivel aceptable, fijado previamente, E,. Es también conveniente enfocar estos errores hacia el número de cifras significativas en la aproximación. Se puede demostrar (Scarborough. 1966) que si el siguiente criterio se cumple, puede tenerse la seguridad que el resultado es correcto e n al menos n cifras significativas.
[3.7]
EJEMPLO 3.2 Estimación del error para métodos iterativos
Enunciado del problema: en matemáticas, a menudo se pueden representar las funciones mediante una serie infinita. Por ejemplo, la función exponencial se puede calcular usando: [E3.2.1]
Mientras más términos se le agreguen a la serie. la aproximación se acercará más y más al valor de ex. A la ecuación (E3.2.1) se le llama expansión e n series de Maclaurin. Empezando con el primer término, ex = 1, y agregando un término a la vez, estímese el valor de e"'. Después que se agregue cada término, calcúlense los errores relativos porcentuales real y aproximado. usando las ecuaciones (3.3)y ( 3 . 5 ) ,respectivamente. Nótese que el valor real es e o = 1.648 721 271. Agréguense términos hasta que el valor absoluto del error aproximado e, sea menor al criterio preestablecido. f , que contempla tres cifras significativas.
1
Solución: en primer lugar, la ecuación (3.7)se puede emplear para determinar el criterio de error que asegura un resultado correcto en al menos tres cifrassignificativas: es =
(0.5
X
102-3)%= 0.05%
Por lo tanto, se agregarán términos a la serie hasta que E, sea menor que este nivel.
71
APROXIMACIONES Y ERRORES
La primera estimación es iguala la ecuación (E3.2.1) con un sólo término. Por lo tanto la primer estimación es igual a l . La segunda estimación se obtiene agregando el segundo término, como sigue:
ex=l+x y para x = 0.5 =1
+ 0.5 = 1.5
Querepresenta un errorrelativoporcentualde €"
[Ec. (3.3)]
1.648721271 - 1.5 1.648721271
=
=
9.029%
La ecuación (3.5) determina una estimación aproximada del error, dado por: Eo =
1.5 - 1 100% = 33.3% 1.5
Ya que E, no es menor que el valor prefijado, E $ , los cálculos continúan agregando otro término, x2 / 2! y repitiendo los cdlculos de errores. El proceso se continúa hasta que eo < E,. Todos los cálculos se pueden resumirde la siguiente manera. Términos
1 2 3 4
5 6
9%
Resultado
E"
1.625 1.645833333 1.648437500 1.64869791 7
39.3 9.02 1.44 O.1.27 175 0.01 72 0.001 42
EL7
5%
33.3 7.69
O. 158 0.01 58
Así, después de que los seis términos se incluyen, el error estimado baja de E , = 0.05%, y el cálculotermina. Sin embargo, nótese que en vez de tres cifras significativas, ¡el resultado se mejora al llegar a cinco cifras! Esto se debe a que, para este caso, las ecuaciones (3.5) y 3.7) son conservativas, esto es, aseguran que los resultados sonpor lo menos tan buenos como lo especifican. Aunque, como se analiza en el cápítulo 5 , este no es siempre el caso para la ecuación (3.5),y es cierto casi siempre. Con las definiciones anteriores como antecedente, se puede proceder ahora sobre los dos tipos de error ligados directamente conlos métodos numéricos. Estos son los errores de redondeo y los errores de truncamiento.
72
METODOS NUMERICOS PARA INGENIEROS
3.4 ERRORES DE REDONDEO Como ya se ha mencionado, los errores de redondeo se deben a que las computadoras sólo guardan un número finito de cifras significativas durante un cálculo. Las computadoras realizan esta función de maneras diferentes. Por ejemplo, si sólo se guardan siete cifras significativas, la computadora puede almacenar y usar K como K = 3.141 592, omitiendo los términos restantes y generando un errorde redondeo,[de la ecuación (3.2)]:
E,
=
0.000 O00 65.
La anterior es una de las varias formas que utiliza una computadora para redondear números. Esta técnica de retener sólo los primeros siete términos se le llamó “truncamiento”en el ambiente de computación. De preferencia se le llamará de corte para distinguirlo de los errores de truncamiento discutidos en la próxima sección. Un corte ignora los términos restantes de la representación decimal completa. Por ejemplo, el octavo dígito significativo en este caso es 6 . Por lo tanto K se representa de manera más exacta como 3.141 593que como 3.141 592 obtenido mediante un corte, ya que el valor está más cercano del valor verdadero. Esto se puede visualizardelasiguiente manera, si K se aproxima por K = 3.141 593, elerror de redondeo sereduce a:
E,
=
0.000 O00 35.
Las computadoras se pueden desarrollar para redondear números de acuerdo a reglasde redondeo, como laquese acaba de mencionar. Sin embargo, esto agrega costo computacional por lo que algunas computadoras usan el corte directo. Este enfoque se justifica bajo la suposición de que el número de cifras significativas en la mayor parte de las computadoras es mucho mayor que el error de redondeo dado por un corte usualmente insignificante.Estasuposiciónsesustentaenelsiguiente ejemplo. Los errores de redondeo asociados con el ejemplo 3.3 son imperceptibles en todos los casos cuando se comparan conel error de truncamiento en t = 12 S que es (véanse los ejemplos 1.1 y 1.2): E, =
4749.0 - 4995.9 100 4749.0
=
-5.20%
EJEMPLO 3.3 Efectos del error de redondeo en los cálculos del problema del paracaidista
Enunciado del problema: repítanse los cálculos del ejemplo 1.2, usando tres, cuatrocinco y seiscifrassignificativas.
APROXIMACIONES Y ERRORES
73
CUADRO 3.1
Comparacibn del problema del paracaidista usando una cantidad diferente de cifras significativas, con un tamaño de paso igual2 as. Los cálculos se realizan con el número de cifras significativas indicadas. VELOCIDAD, cmls (cifras significativas)
Tiempo,
S
O 2 4 6 8 10 12
’.
3
4
5
6
O
O
1960 3200 3980 4470 4780 4980
1960 3200 3985 4482 4796 4995
0.0 1960.0 3200.4 3985.5 4482.3 4796.8 4995.8
0.0 1960.00 3200.46 3985.54 4482.41 4796.88 4995.91
Solución: usando tres cifras significativas, u ( 2 ) se calculará como en el ejemplo 1.2:
u(2)
=
1960
Con tres cifras significativas, el valor de u(4) = 3 200.5 se representará como 3 200. Los cálculos continúan de la siguiente manera:
u ( 6 ) = 3 980 u ( 8 ) = 4 470
u(10)
=
4 780
u(12) = 4 980 El resto de los cálculos resueltos están en el cuadro 3.1. El valor numérico de t = 12 S y hasta 10 cifras significativas es de 4 995.921 508. Por lo tanto, usando tres, cuatro,cinco y seis cifras significativas se producen los errores relativos porcentuales de redondeo0.32, 0.018, 0.002 4 y 0.000 23, respectivamente.
Ya que la mayor parte de las computadoras tienen entre 7 y 14 cifras significativas, los errores de redondeo parecerían no ser muy importantes. Sin embargo, hay dos razonesdel porqué pueden resultar críticos en algunos métodos numéricos: 1. Ciertos métodos requieren cantidades extremadamente grandes para obtener una respuesta. Además, estos cálculos a menudo dependen entre sí. Esto es, los cálculos posteriores son dependientes de los anteriores. En consecuencia, aunque un error de redondeo individual
74
INGENIEROS
PARA
MÉTODOS NUMERICOS
puede ser muy pequeño, el efecto de acumulación enel transcurso de lagran cantidad de cálculos puede ser significativo.
2. El efecto del redondeo puede ser exagerado cuando se llevan a cabo operaciones algebraicas que emplean númerosmuy pequeños y muy grandes al mismo tiempo. Ya que este caso se presenta en muchos métodos numéricos, el error de redondeo puede resultar de mucha importancia.
EJEMPLO 3.4
La importancia de las cifras significativas de los cálculos algebraicos
Enunciado del problema: determínesela diferencia de dos números grandes: 32 981 108.123 4 y 32 981 107.998 9. En seguida, repítanse los cálculos pero incrementando elminuendoen un 0.001%. Solución: la diferencia de los números es
32 981 108.123 4 -32 981 107.998 9 0.124 5 Ahora, incrementando el minuendo en un 0.001% se obtiene el número 32 981 437.934 5, y la diferencia es:
32 981 437.934 5 -32 981 107.998 9 329.935 6 que es considerablemente diferente de la primera. De aquí que una modificación en el minuendo, aparentemente insignificante, provoca una gran diferencia en el resultado.
Los tipos de errores mencionados hasta ahora pueden tener dificultades para ciertos métodos numéricos. Estos se discuten en las siguientes secciones dellibro.
3.4.1 Reglas de redondeo Las reglas para redondear números en cálculos manuales se analizan en el recuadro 3.1 y se ilustran en el ejemplo 3.5. Estas reglas no se aplican normalmente cuandose realizan cálculos extensos por computadora. Sin embargo, ya que se usan cálculos manuales a lo largo del texto, se han incluido estas reglas como punto de referencia para cálculos posteriores.
75
APROXIMACIONES Y ERRORES
RECUADRO 3.1
tad0 es igual al número más pequeño de cifras significativas que contiene la cantidad en la operación.
Reglas de redondeo
Las siguientes reglas dan la pauta a seguir en el redondeo de números cuando se realizan cálculos a mano. 1. En el redondeo, se conservan las cifras significativas y el resto se descarta (fig. B3.1).El últimodígito que se conserva se aumenta en uno si el primer dígito descartado es mayor de 5. De otra manera se deja igual. Si elprimerdígito descartado es 5 o es 5 seguido de ceros, entonces el Último dígito retenido se incrementa en 1 , sólo si es impar.
4. Para combinaciones de las operaciones aritméticas, existen dos casos generales. S e puede sumar o restar el resultado de las multiplicaciones o de las divisiones.
( )( ) Multiplicación multiplicación diviión
divizón
2. En la suma y en la resta, el redondeo se lleva a cabo
o también se pueden multiplicar o dividir los resultados de las sumas y las restas:
3 . Para la multiplicación y para la división el redondeo es tal que la cantidad de cifras significativas del resul-
En ambos casos, se ejecutan las operaciones entre paréntesis y el resultado antes de proceder con otra operación, en vez de redondear Únicamente el resultado final.
de forma tal que el último dígito retenido en la respuesta corresponda al último dígito m6s significativo de los números que estdn sumando o restando. N6tese que un dígito en la columna de las centésimas es m6s significativo que uno de la columna de las milésimas.
ultimo digito
Primer
digito
5.6170 431 Digitas retenidos o significativas
FIGURA B3-1.
Digitos descartadas
Ilustración de los dígitos retenidos y descartados de un número con cinco cifras significativas.
EJEMPLO 3.5
Ilustraciones de las reglas de redondeo
Los siguientes ejemplos tienen por objeto ilustrar las reglas de redondeo analizadasenel recuadro 3.1 1. Errores de redondeo
5.6723
”+
5.67‘
3 cifras significativas
76
10.406 7.3500
-
”+
88.21650 -.+ 1.25001
METODOS NUMERICOS
10.41 7.4 88,216 1.3
PARA INGENIEROS
4 cifras signlficativas 2 cifrassignificativas 5 cifrassignificativas 2 cifras significativas
2. Sumas y restas. (Nota: las últimas cifras más significativas tienen, están en negritas) :
que se re-
a) Evalúese 2.2 - l .768
2.2
-
1.768 = 0.432 +0.4
+
b) Evalúese 4.68 x l o p 7 8.3 x - 228 x lop6. La evaluación de este cálculose facilita expresando los números con un mismo exponente:
+ 8.3
0.004 68 x
- 2.28 x
x
De esta manera, se puede ver claramente que el 3 es el último dígito significativo reteniendo, por lo que la respuesta se redondea de la siguiente manera: 6 , 0 2648
-
x
6.0 x
3 . Multiplicación y división: a) Evalúese 0.0642 X 4.8
0.0642
X
4.8
=
0.308 16
”-+
0.31
b) Evalúese 945 f 0.3185 945 0.318 5
=
2 967.0329 67 . . .
-”+
2 970
4 . Combinaciones: a) Evalúese [15.2 (2.8 x [(8.456 x 0.1771 Primero, efectúense lamultiplicación y la división que están dentro de los corchetes:
+
+
[4.256
X
10.~1+ [4.777 401 . . .
+
‘10.~1
Ahora, antesde sumar, se redondeanlascantidades
y después súmese y redondéese el resultado:
encerradas:
APROXIMACIONES Y ERRORES
I
77
9.08
10-3-A9.1 X 10-3 6.740 X 10-5 - 8.7 X 10-7 b) Evalúese 2.672 X lo3 + 5.8 X
Antes de realizar las sumas y las restas, se expresan los números del nual mismo exmerador y del denominador de manera que estén elevados ponente.
674 X 10-7- 8.7 X 10-7 2.672 x lo3 + 0.005 8 x lo3 Ahora se hace la suma y la resta:
1
665.3 X 2.677 8 x lo3 y seredondea:
665 X 10-7 2.678 X lo3 finalmente, se divide y se redondea el resultado:
2.483
196 ...
X
lo-*
" +
2.48 x
3.5 ERRORES DE TRUNCAMIENTO Los errores de truncamiento son aquellos que resultan al usar una aproximación en lugar de un procedimiento matemático exacto. Por ejemplo, en el capitulo 1 se aproximó la derivada de la velocidad de caída de un paracaidista mediante la ecuación de diferencia dividida de la forma [€c. (l.lo)]:
Se introdujo un error de truncamiento en la solución numérica ya que la ecuación de diferencias sólo aproxima el valor verdadero de la derivada (Fig. 1.3).Además para obtener conocimiento de las características
78
INGENIEROS
PARA
MÉTODOS
NUMERICOS
de estos errores se regresa a la formulación matemática usada ampliamente en los métodos numéricos para expresar funciones en forma polinomial: La serie de Taylor.
3.5.1
Serie de Taylor
Enel ejemplo 3.2 se usauna serie infinita para evaluar una función en un valor específico de la variable independiente x . De manera similar, la serie de Taylor da una formulación para predecir el valor de la función en x,+l en términos de lafunción y de sus derivadas en una vecindad al punto x,. En vez de presentar en conjunto la serie de Taylor, se obtendrá más conocimiento de la misma construyéndola términoa término. Por ejemplo, elprimertérminodelaserie es:
Esta igualdad, conocida como aproximacióndeorden cero, indica que el valor de f en el nuevo punto es el mismo que el valor en el punto anterior. Este resultado se logra intuitivamente ya que si xi y xi+ están muy próximasunade la otra, entonces esigualmenteposibleque el nuevo valor sea probablemente similaral anterior. La ecuación (3.9) da una estimación perfecta si la función que se va a aproximar es una constante. Sin embargo, si la función cambia en todo el intervalo, entonces se requieren los términos adicionales de la serie de Taylor para obtener una mejor aproximación. Por ejemplo, la aproximación aprimerorden se obtiene sumando otro término al anterior para obtener: [3.10]
El término adicional de primer orden consiste de la pendiente f' (xi) multiplicada por la distancia entre xiy x i + l .Por lo tanto, la expresión ahora representa una línea recta y es capaz de predecir un incremento o un decremento de lafunción entre xi y x ~ + ~ . Aunque la ecuación (3.10)puede predecir un cambio, sólo es exacta para una línea recta o esdedirecciónlineal. Por lo tanto, se le agrega a la serie un término de segundo orden para obtener algo sobre la curvatura de la función si es que la tiene: [3.11] De manera similar, se pueden agregar términos adicionales para desarrollarla expansión completa de la serie de Taylor:
79
APROXIMACIONES Y ERRORES
+m (xi+l3!
Xj)3
+ ... +f(,)(Xi) (Xii-1 n!
-
xi)" +
R" [3.12]
Nótese que debido a quela ecuación (3.12) es unaserie infinita, el signo igual reemplaza al de aproximación usado en las ecuaciones (3.9)a la (3.11). Seincluye un término residual para considerartodos los términos desde n + 1 hasta el infinito:
R, = f'"+"(h)
(n + l)!
(Xi+1 -
Xi),+]
[3.13]
donde el subíndice n indica que el residuo es dela aproximación a n-esimo orden y ( es un valor cualquiera de x que se encuentra en xi y xi+ La inclusión de dentro de la serie es de mucha importancia al grado que se dedica una sección completa (sección 3.5.2) para su estudio. Por ahora, essuficiente darsecuenta que existe este valor que da una estimación exacta del error. Frecuentemente es convenientesimplificar la serie de Taylor definiendo un paso h = - xi y expresando la ecuación (3.12)como:
en donde el término residual es ahora:
[3.15]
EJEMPLO 3.6 Aproximaciones de un polinomio mediante la serie de Taylor.
Enunciado del problema: úsense términos en la serie de Taylor de cero a cuarto orden para aproximar la función:
INGENIEROS 80
PARA
NUMERICOS
METODOS
desde el punto xi = O y con h = 1. Esto es, predecir el valor de la función en xi+ = 1. Solución: ya que se tratadeunafunción conocida, se pueden calcular valoresde f (x) O y 1. Los resultados (Fig. 3.3) indicanquelafunción empiezaen f (O) = 1.2 y continúa hacia abajo hasta f (1) = 0.2. Por lo tanto, elvalor que se trata de predecir es 0 . 2 La aproximaci6n en serie deTaylor de orden cero es [Ec. (3.9)1:
Como se puede verenlafigura 3.3, la aproximación de orden cero es una constante. El errordetruncamiento en este caso es [recuérdese la ecuación (3.2)]:
E” = 0.2
-
1.2:-
1.0
en x = 1. Para n = 1 , laprimerderivada x = O, como:
FIGURA 3.3
se debedeterminar y evaluaren
+
La aproximación de {(x) = -0.1 x4 - 0 . 1 5 ~-~0.5~’ - 0 . 2 5 ~ 1.2 en X = 7 mediante series de Taylor de orden cero, de primero y segundo orden.
APROXIMACIONES Y ERRORES
I
81
Laaproximaciónaprimerorden f ( x i + l )E
es[Ec. (3.10)]
1.2 - 0.25h
que se puede usar para calcularf (1)= 0.95. Por consiguiente, la aproximación empieza a coincidir con la trayectoria de la función como la pendiente de una línea recta (Fig.3.3).De esta manera el error de truncamiento se reduce a:
E,
=
0.2 - 0.95 = -0.75
en x = 1. Para n = 2 , se evalúa la segundaderivadaen
x =
O:
f”(0)= -1.2(0.0)* - 0.9(0.0) - 1.0 = -1.0 y de acuerdo a la ecuación f(xi+l)
(3.11):
1.2 - 0.25h - 0.5h2
y , sustituyendo h =
1
f(1)= 0.45 Al incluirse la segunda derivadase añade una curvatura descendente que proporcionauna estimación mejor, como se muestra en la figura 3.3. El errordetruncamiento se reducea 0.2 - 0.45 = - 0.25. Los términos adicionales mejoranaún m6s la aproximación. En efecto, incluyendo la tercera y la cuarta derivada, se obtiene la ecuación original: f(q+l)
=
1.2 - 0.25h
-
0.5h2 - 0.15h3 - 0.10h4
donde eltérminoresidual es:
ya que laquintaderivada
de un polinomio de cuartoordenes
nula,
R4 = O. Por consiguiente, la expansión en serie de Taylor hasta la cuarta derivadaproduceunaaproximación
exacta en x
=
1.
En general, la expansión en serie de Taylor de n-ésimo ordenes exacta para un polinomio de n-ésimo orden. Para otras funciones continuas diferenciables, como las exponenciales o senoidales, no se obtiene una estima-
82
MhODOS NUMERICOS PARA INGENIEROS
ción exacta mediante un número finito de términos. Cada uno de los términos adicionales contribuye al mejoramiento de la aproximación, aunque sea con poco. Esto se muestra en el ejemplo 3.7. Se obtendría un resultado exacto, únicamente si seagrega un númeroinfinito de términos. Aunque lo anterior se cumple, el valor práctico de la serie de Taylor estriba, enlamayorpartedelos casos, enel usode un númerofinito de términos que darán una aproximación lo suficientemente cercana a la solución verdadera para propósitos prácticos. La decisión sobre cuántos términos se requieren para obtener una “aproximación razonable” se basa en el término residual de la expansión. Recuérdese que el término residual es de la forma general de la ecuación (3.15). Esta fórmula tiene dos grandes desventajas. Primero [ no se conoce exactamente sino que sólo se sabe que está entre xi y xi+ Segundo, para la evaluación de la ecuación (3.15) se requiereevaluar la (n + 1)-ésima derivada de f(x). Para hacerlo, se necesita conocer f(x) . Pero, si ya se conoce f(xj, ¡entonces no hay razón para realizar la expansión en series de Taylor en primer lugar! A pesar de este dilema, la ecuación (3.15) aún resulta útil parala evaluación de errores de truncamiento. Esto se debea que tiene control sobre el término h de la ecuación. En otraspalabras, se puededecidirquétan lejos de x se desea evaluar f(x) y se puede controlarla cantidad de términos incluidos en la expansión. Por lo tanto, la ecuación (3.15) se expresa, usualmente como:
R, = O(hntl) donde la nomenclatura O(h I) significa que el error de truncamiento es de orden h,+ Esto es, el erroresproporcional al paso h a la (n + 1) -enésima potencia. Aunque esta aproximación no implica nada relacionado con las derivadas que multiplica h ,+es extremadamente útil al evaluar el error relativo de los métodos numéricos basados en las expansiones en serie de Taylor. Por ejemplo, si el error es O (hj,y se reduce a la mitad el paso, entonces el error se reducirá a la mitad. Por otro lado. si el error es O(h2) y se reduce a lamitadel paso, entonces el error se reducirá a unacuarta parte. +
EJEMPLO 3.7 Uso de la serie de Taylor para aproximar una función que tiene un número infinito de derivadas.
Enunciado del problema: úsense los términos de la serie de Taylor con n = O hasta 6 paraaproximar:
f (x) = cos x
APROXIMACIONES Y ERRORES
83
en x = a / 3 (60O) en base al valor de f (x) y de sus derivadas alrededor delpunto x = a / 4 (45). Nóteseque esto significaque h = a / 3 a/4=a/12. Solución: como en el ejemplo 3.6, el conocimiento de la función original implicaque se puede conocer elvalor exacto de f (a / 3 ) = 0.5. Laaproximacióndeorden cero es [Ec. (3.9)]: f(d3) =
COS
(d4)
=
0.707 io6781
que representa un errorrelativoporcentual de:
loo^ = “41,49g
0 . 5 - 0.707106781 0.5
E” =
Para la aproximación de primer orden, se suma el término que contiene a laprimer derivada,donde f ’ ( x ) = - sen x:
f(:)
COS
(3
-Sen(:)(g)
=
0.521986659
quetiene un errorrelativoporcentualde E, = - 4.40. En la aproximación de segundo orden, se incluye el término quecontiene a la segundaderivada,donde f’ ’ (x) = - cos x:
con un error relativo porcentual de E, = -0.449. Por lo tanto, al agregarmástérminos a laserie se obtiene una mejor aproximación. Este proceso se puede continuar,los resultados se muestran en el cuadro 3.2. Nótese que las derivadas nunca se acercan a cero, como es el CUADRO 3.2 ~
I
Aproximaciones mediante la serie deTaylor de f (x) cos x en x I 3 alrededor del punto x 14. Los valores se muestran para varios brdenes de apro-
=
xirnaci¿n (m).
Orden n
f”(x)
O 1 2 3 4 5 6
cos x -sin x “cos x sin x cos x -sin x -cos x
P(nI3)
-41.4 0.707106781 0.52 1986659 0.497754491 0.499869147 0.500007551 0.500000304 0.499999988 2.40
C”
-4.4 0.449 2.62 x -1.51 X 10-3 -6.08 X 10-5 x
MÉTODOS
84
NUMÉRICOS
PARA INGENIEROS
casodelpolinomiodelejemplo 3.6. Sin embargo, cada término que se le agrega a la serie produce una mejor aproximación. Nótese también que la mayor aproximación se consigue con los primeros términos. En este caso, en el momento que se le agregó el tercer término, el error se redujo al 2.62 x lo-*%, lo que significa que se haalcanzado el 99.9738% del valor exacto. Por consiguiente, si se le agregan más términos a la serie el error decrece, pero la mejoría será mínima.
En general, se puede suponer queel error de truncamiento disminuye agregando términos a la serie de Taylor. Además, si h es lo suficientementepequeño,entonces los términos de primero y segundoorden influyen desproporcionadamente en el porcentaje del error. Esta propiedad se ilustra en el ejemplo siguiente.
3.5.2 El residuo de la expansión en la serie de Taylor Antes de demostrar cómo se usa la serie de Taylor e n la estimación de errores numéricos, se debeexplicar por qué seincluye el argumento [ en la ecuación (3.15).En vez de presentar una derivación matemática general se desarrollará una exposición más simple basada en una interpretación geométrica. En seguida se puede extender este caso específico a una formulación más general. Supóngase que se truncóla expansión en serie de Taylor [€c. (3.14)l después del término de orden cero para obtener: f(Xi+l)
= f(x0
En la figura 3.4 se muestra un bosquejo de esta predicción de orden cero. El residuo o error de esta predicción, que se muestra también en la figura, consiste de la serie infinita de términos que fueron truncados:
Ro
= f’(xi)h
+ f”(Xi) -h2 2!
+ f’”(X.) -h3 3!
+ ...
Es obvio que tratar el residuo de esta serie infinita con este formato es inconveniente. Se puede obtener unasimplificación truncando el residuo mismo, de la siguiente manera:
Ro
2
f ’ ( x i )h
[3.16]
Aunque, como se mencionó en la sección previa, los términos de las derivadas de ordeninferior cuentan mucho más enel residuo que los términos de las derivadas de orden superior, este resultado todavíaes inexacto, ya que se han despreciado los términos de segundo orden y de órdenes
85
APROXIMACIONES Y ERRORES
FIGURA 3.4
Representacióngráfica residuo.
de unapredicciónde
la serie deTaylorcon
superiores. Esta “inexactitud” se denota mediante el símbolo de aproximación a la igualdad ( =) empleado en la ecuación (3.16). Una simplificación alterna que realiza la aproximación a una equivalencia está basada en el esquema gráfico. Nótese que en la figura 3.4 el error Lo pudo haberse determinado si se hubiera sabido la posición del valor exacto. Obviamente este valor es desconocido ya que de otra manera no sehubiese requerido dela expansión en serie de Taylor.Sin embargo, el teorema delvalor medio del cálculo ofrece una forma de rehacer el problema para evitar en forma parcial este dilema. El teorema del oalor medio diceque si una función f (x) y su primera derivada son continuas sobre un intervalo [x, xi+J, entonces existe al menos un punto sobrela función que tiene una pendiente, dada por f’ (E), que es paralela a la línea que une f ’ (xi) con f ’ (xi+1).El parámetro 4 marca el valor x donde ocurre la pendiente (Fig. 3.5).Se puede hacer una ilustración tangible de este teorema en el hecho de que si se viaja entre dos puntos con una velocidad promedio, habrá al menos un momento durante el curso del viaje en el que se mueva a esa velocidad promedio. Al hacer uso de este teorema resulta fácil darse cuenta, como seilustró en la figura 3.5, que la pendiente f’(4)es igual a cociente Ro entre h, o:
84
METODOS NUMÉRICOS
FIGURA 3.5
PARA INGENIEROS
Representación gráfica del teorema del valor medio.
que se puede reordenar para obtener:
Por lo tanto, se ha obtenido el término de orden cerode la ecuación (3.15). Los términos de órdenes superiores son una extensión lógica del razonamiento usado para derivar la ecuación (3.17), basado e n la forma general del teorema extendido del valor medio (Thomas y Finney, 1979).Por lo tanto, la versión de primer orden es: [3.18]
En este caso, el valor de 4 conforma el valor de x que corresponde a la derivada de segundo orden que hace exacta a la ecuación (3.18).Los términos de orden más alto se pueden desarrollar de la ecuación (3.15). 3.5.3 Uso de la serie de Taylor para estimar los errores de truncamiento Aunque la serie de Taylor es extremadamente útil en la estimación de errores de truncamiento a lo largo de este libro, puede que aún no esté muy claro cómo la expansión puede aplicarse en estos momentos a los métodos numéricos. En realidad, esto ya se hizo en el ejemplo del para-
a7
APROXIMACIONES Y ERRORES
caidista. Recuérdese que el objetivo de los ejemplos l.1 y l.2 fue el de predecir la velocidad en función del tiempo. Esto es, se deseaba determinar u (t). Como se especificó en la ecuación (3.12),u (t) se puede expandir en la serie d e Taylor como:
Ahora, truncando la serie después del término con primera derivada, se obtiene:
La ecuación (3.20) se puede resolver para: [3.21] "
Aproximación de Error primerorden detruncamiento La primera parte de la ecuación (3.21) es exactamentela misma relación que se usó para aproximar la derivada del ejemplo 1 . 2 [Ec. (1.lo)].Sin embargo, con el esquema de la serie de Taylor se ha obtenido una estimación del error de truncamiento asociado con esta aproximación de la derivada. Usando las ecuaciones (3.13)y (3.21) se obtiene: [3.22] O
~R1 ti+1 -
- O(tii.1
-
ti)
ti
[3.23]
Por lo tanto, la estimación de la derivada [Ec. (1.10)o !a primera parte de la Ec. (3.21)]tiene un error de truncamiento de orden t,+ - ti. En otras palabras, el error en la aproximación usando derivadas debe ser proporcional al tamaño del paso. Por lo tanto, si éstese divide a la mitad, entonces se espera que el error de la derivada, se reduzca ala mitad.
3.5.4.
Diferenciación
numérica
A la ecuación (3.21) se le conoce con un nombre especial en el análisis numérico, se le llarr,a diferencias diuididas finitas. Se puede representar
88
MÉTODOS
NUMÉRICOS PARA
INGENIEROS
generalmente como: [3.24] O
[3.25]
donde a Aj,se le conoce como la primera diferencia hacia adelante y a h se le llama tamaño del paso, esto es, la longitud del intervalo sobre el cual se hace la aproximación. S e le llama diferencia "hacia adelante" ya que usa los datos i e i -t 1 para estimar la derivada (Fig. 3.6~1). AI término completo Af,/h se le conoce como primera diferencia dividida finita. Esta diferencia dividida hacia adelante no es sino una de tantas que se pueden desarrollar mediante la serie de Taylor para la aproximación de derivadas numéricas. Por ejemplo,las aproximaciones a primeras derivadas, utilizando las diferencias hacia atrás o las diferencias centrales se pueden desarrollar de una manerasimilar a la de la ecuación (3.24).Las primerasusan a (Fig. 3 . 6 b ) , mientras que las segundasusan información igualmente espaciada alrededor del punto donde está estimada la derivada (Fig. 3 . 6 ~ Las ) . aproximaciones más exactasde la primer derivada se pueden desarrollar incluyendo en la serie de Taylor términos de orden más alto. Finalmente, todas las versiones anteriores se pueden desarrollar para derivadas de segundo orden,tercer orden y órdenes superiores. Las siguientes secciones analizan brevemente estos casos, ilustrando cómo se deriva cada uno de ellos. Aproximaciones a la primera derivada con
diferencias hacia atrás.
La serie de Taylor se puede expandir hacia atrás para calcular un valor anterior sobre el valor actual, dada por: [3.26]
Truncando la ecuación después de la primer derivada y ordenando los términos se obtiene: [3.27]
donde el error es O (h) y V f, indica la primer diferencia dividida hacia atrús. Véase la figura 3.6b para una representación gráfica,. Aproximaciones a la primer derivada con diferencias centrales. Una tercera forma de aproximar la primer derivada es restar la ecuación (3.26)
APROXIMACIONES Y ERRORES
FIGURA 3.6
Gráfica de aproximaciones con diferencias divididas tinitas de la primera derivada, a) hacia adelante, b) hacia atrás y c) centrales.
89
90
MÉTODOS
NUMERICOS PARA INGENIEROS
de la expansión en serie de Taylor hacia adelante: [3.28]
para obtener
que se puede resolver para
or [3.29]
La ecuación (3.29)es una representación de las diferencias centrales (o centradas) de la primera derivada. Nótese que el error de truncamiento es del orden de h 2 en contraste con las diferencias divididas hacia adelante y hacia atrás, las cuales fueron de orden h . Por lo tanto, el análisis de la serie de Taylor ha llevado a la información práctica de que la diferencia central es la representación más exactade la derivada (Fig. 3 . 6 ~ )Por . ejemplo, si se parte el tamaño del paso a la mitad usando diferencias hacia atrás o hacia adelante, el error se reducirá aproximadamente a la mitad, mientras que para diferencias centrales, el error se reduce a la cuarta parte. Aproximaciones a derivadas de orden más alto usando diferencias finitas. Junto a la primer derivada, la expansión de la serie de Taylor se puede
usar para una estimación numérica de las derivadas de orden superior. Para hacerlo, se escribe una expansión en serie deTaylor hacia adelante para f (xj+*)en términos de f (xi) de la siguiente forma: f(Xi+2)
=f
k i )
f"(xi)(2h)Z
+ f'(XiI(2h) + 2
+
...
[3.30]
La ecuación (3.28) se puede multiplicar por 2 y restarse de la ecuación (3.30)para obtener:
que se puede resolver para: [3.31]
APROXIMACIONESY ERRORES
91
A esta relación se le llama diferencias diuididas finitas hacia adelante de segundo orden. Se pueden usar procedimientos similares para obtener las versiones hacia atrás y centrales. Las aproximaciones a tercer orden delasdiferenciasdivididashacia adelante, hacia atrás y centrales también pueden obtenerse (Fig. 3.7 a la 3.9). En todos los casos, las diferencias centradas danuna mejor aproximación. Fórmulas de exactitud para diferencias de orden superior.Todas las estimaciones anteriores truncaron las estimaciones dadas por la serie de Taylor después de algunos términos. Las fórmulas de más exactitud se pueden desarrollar incluyendo términos adicionales. Por ejemplo, la expansión hacia adelante [Ec. (3.28)j se puederesolver para:
[3.32]
FIGURA 3.7
Fórmulas de diferencias divididas finitas hacia atrás. Se presentan dos versiones para cada derivada. La segunda forma incluye más términos de la serie de Taylor y, por lo tanto, esmás exacta.
92
MÉTODOS
NUMÉRICOS
PARA INGENIEROS
I
FIGURA 3.8
Fórmulas de diferencias divididas finitas haciaadelante. Se presentan La segunda forma incluye más dosversiones paracadaderivada. términos de la serie de Taylor, ypor lo tanto, es más exacta.
En contraste con la ecuación (3.24),se puede retener el término de segundo orden sustituyendo la ecuación (3.31)en la ecuación (3.32) para obtener:
o agrupando términos
Nótese que la inclusión del término con segunda derivada ha dado una exactitud O (h ’). Se pueden desarrollar versiones mejoradas similares pa-
93
APROXIMACIONES Y ERRORES
FIGURA 3.9
Fórmulas de diferencias divididas finitas centrales.Se presentan dos versiones para cada derivada. La segunda forma incluye más términos de lo serie de Taylor y, por lo tanto, es más exacta.
ra diferencias hacia atrás y centrales así como para las aproximaciones de derivadas de orden superior. Las fórmulas se resumen en las figuras 3.7 hasta la 3.9. El siguiente ejemplo ilustra la utilidad de las mismas en la estimación de derivadas. En esta sección sólo se han cubierto algunas de las formas con que la serie de Taylor es útil en el análisi numérico. Sin embargo, este material tiene como propósito inicial ayudar en la estimación y el control de errores de truncamiento. Muchosde los métodos numéricos de este libro se basan en la representación de aproximaciones simples, de órdenes inferiores en vez de expresiones matemáticas complicadas. Ya que la expansión en la serie de Taylor da una estructura mediantela cual se separan componentes de orden inferior y superior, se demostrará a lo largo del texto que éste esun vehículo para profundizaren los métodos numéricos.
94
NUMÉRICOS
MÉTODOS
EJEMPLO 3.8
Aproximaciones de derivadas usando diferencias
PARAINGENIEROS
divididas finitas
Enunciado del problema: úsense aproximaciones de diferencias finitas hacia adelante y hacia atrás de O (h) y centradas, de O (h'), para estimular la primera derivada de: f(x)
=
- 0 . 1 ~- ~0 . 1 5 ~ -~ 0 . 5 ~ 0~. 2 5 ~+ 1.2
en x = 0.5 usando un tamaño de paso h = 0.5. Repetirloscálculos usando h = 0.25. Nótese que la derivada se puede calcular directamente como: f ' ( x ) = - 0 . 4 ~-~0 . 4 5 ~ - ~ 1.0~ - 0.25 y se puede usar para calcular el valor exacto de f ' (0.5) = - 0.912 5. Solución: para h = 0 . 5 , se puedeusar lafunciónparadeterminar: x,-1 =
o
f(Xj-1)
xi = 0.5
!(X¡)
=
=
1.2 0.925
1.0
f ( x j + J = 0.2 Estos datos se pueden usar para calcular la diferencia dividida haciaadelante [Ec.(3.24)]: Xi+!
=
f'(0.5) =
0.2
0.925 = -1.45 O. 5
-
la diferenciadivididahaciaatrás
f '(0.5) =
0.925 - 1.2 0.5
Para h
=
58.9%
: [ € c(3.27)] .
-0.55
y la diferenciadivididacentral
E, =
E, =
39.7%
[Ec. (3.29)]:
0.25, los datos son:
= 0.25 x, = 0.50 Xi+l - 0.75
xi-1
f(xi-1)
=
1.10351563
f ( x , )= 0.925 f(xi+l) = 0.636 328 13
que se pueden usar paracalcular la diferencia divididahacia te: f'(0.5) =
0.636 328 13 0.25
-
0.925
-
1.155 = E"
"
=
adelan-
26.5%
95
APROXIMACIONES Y ERRORES
la diferenciadivididahacia atrás:
f'(0.5)=
0.925 - 1.103 515 63 0.25
=
-0.714
E"
=
-0.934
E,
21.7%
y la diferenciadividida,central
0.636 328 13 - 1.103 515 63 f'(0.5)~ 0.5
=
-2.4%
Para los dos tamaños de paso, las aproximaciones de diferencias centrales son más exactas que las diferencias hacia atrásy hacia adelante. También, comolo predijo el análisis de la serie de Taylor, la división del intervalo endospartesigualesdividealamitadelerrordelasdiferenciashacia atrás y hacia adelante, y a la cuarta parte el error de las diferencias centrales.
3.6 ERROR NUMÉRICO
TOTAL
El error numérico total es la suma de los errores de redondeo y de truncamiento. Desde el problema del paracaidista (ejemplo 3.3) se descubrió que laúnicaformademinimizar los errores de redondeo es la de incrementar el número de cifras significativas de la computadora. Más aún, se notó que los errores de redondeo crecen conforme aumenta el número de cálculos. En contraste, el ejemplo 3.8 demostró que laestimaciónporderivadas se puede mejorar disminuyendo el tamaño del paso. Ya que un decremento en el tamaño del paso lleva a un incremento en los cálculos, los errores de truncamientodecrecenconformeelnúmerodecálculosaumenta.Porlo tanto, se encara elsiguientedilema:laestrategiadedisminuir un componente del error total lleva al incremento del otro. En un cálculo es concebible disminuir el tamaño del paso para minimizar los errores de truncamiento sólo para descubrir que al hacerlo, ¡los errores de redondeo empiezan a dominar la solución y el error total crece!. Por lo tanto, el remedio se convierte en problema (Fig. 3.10). Un reto que debe encararse es el de determinar un tamaño apropiado de paso paraun cálculo en particular. Sería bueno escoger una gran cantidad de tamaños de paso para disminuir la cantidad de cálculos y los errores de redondeo, sin incurrir en la pena de un error mayor de truncamiento. Si el error total es el que se muestra en la figura 3.10, el problema es identificar el punto donde el provecho disminuye, es decir donde los errores de redondeo empiezan a negarlos beneficios obtenidos con unareducciónenel tamaño del paso En casos reales, sin embargo, estos casos no son comunes ya que la mayor parte de las computadoras manejan suficientes cifras significativas de No obstante, algunas formatalque los erroresderedondeonoinfluyen. vecesocurren,haciendopensar enuna especiede"principiosdeincertidumbre numérica", que coloca un límite absoluto sobre la exactitud que se puedeobtenerusandociertosmétodosnuméricosconcomputadora.
96
MÉTODOS
FIGURA 3.1 O
NUMÉRICOS
PARA INGENIEROS
Representación gráfica de las ventajas y desventajas entre errores de redondeo y truncamiento que en ocasiones influyen en el curso de un metodo numérico. Aquí se muestrael punto óptimo, donde el error de redondeo comienza a negar los beneficios dados por la reducción del tamaño del paso.
Debido a estas restricciones, hay limitaciones en la estimación de errores. Por lo tanto, la estimación de errores en el análisis numérico es, hasta cierto punto, un arte que depende en gran parte de las soluciones d e prueba-error, además de la intuición y experiencia del analista. Aunque en este capítulo se ha tratadoun tipo de problema numérico "la solución d e una ecuación diferencial ordinaria- las conclusiones anteriores tienen una relevancia general en muchas delas otras técnicas del libro. Sin embargo, debe de hacerse hincapié en que aunqueel tema es, hasta cierto punto, un arte, hay unavariedad de métodos quelos analistas pueden usar para cuantificar y controlar los errores en un cálculo. La elaboración de estas técnicas jugará un papel prominente en las páginas siguientes.
3.7 ERROREP SOR EQUIVOCACIÓN, DE PLANTEAMIENTO E INCERTIDUMBRE EN LOS DATOS Aunque las siguientes fuentes de error no están conectadas directamente con la mayor parte de ios métodos numéricos de este libro, en algunas ocasiones pueden tenergran importancia en el esfuerzo por hacer un modelo exitoso. Por lo tanto, se deben tener siempre en mente cuando se apliquen técnicas numéricas en el contexto de problemas del mundo real.
97
APROXIMACIONESY ERRORES
3.7.1 Errores por equivocación A todos les son familiares los errores por torpezao por equivocación, En los primeros años de la computación, los resultados numéricos erróneos fueron atribuidos algunas veces al mal funcionamiento de la computadora misma. Hoy día, esta fuente de error es muy improbable y la mayor parte de las equivocaciones se pueden atribuir a errores humanos. Las equivocaciones ocurren a cualquiernivel del proceso de modelación matemática y pueden contribuir con todas las otras componentes del error. Se pueden evitar únicamente conel conocimiento de los principios fundamentales y con el cuidado sobre la aproximación y diseño de la solución a un problema. Las equivocaciones, por lo general se pasan por alto en la discusión de un método numérico. Esto sin duda prueba el hecho de que los errores de torpeza son, hasta cierto punto, inevitables. Sinembargo, recuérdese que hay ocasiones en que su aparición se puede minimizar. En particular, los buenos hábitos de programación que se bosquejaron en el capítulo 2, son extremadamente útiles para disminuir las equivocaciones. Además, hay formas muy simples de verificar cuando un método numérico está trabajando correctamente. A lo largo del texto, se estudian algunas formas de verificar los resultados de un cálculo numérico.
3.7.2 Errores de formulación Los errores de formulación o de modelamiento degeneran en lo que se podría considerar como un modelo matemático incompleto. Un ejemplo de un error de formulación imperceptible es el hecho de que la segunda ley de Newton no explica los efectos relativísticos. Esto no desvirtúa la validez de la solución del ejemplo 1.1ya que estos errores son rnínimos en las escalas de tiempo y espacio de la caída del paracaidista. Sin embargo, supóngase que la resistencia del aire no es linealmente proporcional a la velocidad de caída, comoen la ecuación (1.6),sino que es una función del cuadrado de la velocidad. Si este fuese el caso, las soluciones analíticas y numéricas obtenidas en el primer capítulo serían falsas debido al error en la formulación. En algunos casos de estudio del resto del libro se incluyen algunas consideraciones adicionales de los errores de formulación. Se debe estar conciente de estos problemas, y darse cuenta que si se está usando un modelo deficiente, ningún método numérico generará los resultados adecuados.
3.7.3 Incertidumbre en los datos Algunas veces se introducen errores en un an3lisis debido ala incertidumbre de los datos físicos sobre los que se basa el modelo. Por ejemplo, supóngase que se desea probar el modelo del paracaidista haciendo saltos repetidos individualmente y luego midiendo la velocidad después de un
98
MÉTODOS
NUMÉRICOS
PARA INGENIEROS
intervalo de tiempo específico. Indudablemente se asociará con cada medición una incertidumbre. ya que el paracaidista caerá más rápidamente en unos saltos que en otros. Estos errores pueden mostrar inexactitud e imprecisión. Si los instrumentos constantemente subestiman o sobreestiman las mediciones de la velocidad. se estará tratando conu n instrumento inexacto o desviado. Por el otro lado, si las medidas son casualmentealtas y bajas entonces se trata de una cuestión de precisión. Los errores de medición se pueden cuantificar sumando los datos con una o más estadisticas bien conocidas, que generan tanta información como sea posible, observando las características específicas de los datos. Estas estadísticas descriptivas a menudo son seleccionadas para presentar 1) la posición del centro de distribución de los datos y 2) el grado de esparcimiento d e los datos. Comotales dan una medida de la desviación e imprecisión,respectivamente. En el capítulo 10 seretoma el temade caracterización de incertidumbre en los datos. Aunque se debeestar conciente de los errores por equivocación. errores de formulación e incertidumbre e n los datos, los métodos numéricos usados para construir modelos pueden estudiarse, en la mayor parte de los casos independientemente de estos errores.Por lo tanto, en ia mayor parte de este libro se supondrá que nohay errores de torpeza. que el modelo es adecuado y que se está trabajando sin errores en las mediciones de los datos. Bajo estas condiciones. se pueden estudiar los métodos n u méricos sin complicaciones.
PROBLEMAS 3.1 ¿Cuántas cifrassignificativashay
en cada uno de los siguientesnúmeros'?
a) 0.84 X 10'
fl
b) 84.0
g) 0.004 60
c) 70 d ) 70.0
h) 8.00 x 10' i) 8.0 X lo3
e) 7
j) 8
0.046 00
000
3.2 Redondéense los siguientes números atrescifrassignificativas a) 8.755
b) 0.368 124
X
10'
d ) 5.555 x 10" e) 0.999 500
c) 4 225.0002
3.3 Efectúense las siguientes sumas y restas y escríbanse los resultados con todas las cifrassignificativas necesarias. ai
b)
0.004 23 + (25.1 x 1 0 ~ " )+ (10.322 x 10 5 068 - 2.4
99
APROXIMACIONES Y ERRORES
C)
(4.68 X lo6) - (8.2 X 10') - (8.696 X i r 5 ) - (5.409 X + (7.0 X
d ) (9.8 X e) (7.7 X
3.4 Efectúense las siguientes multiplicaciones y divisiones y escríbanse los resultados con todas las cifras significativas necesarias. a)
(8.38 X lo5) X (6.9 X
b) (8.38 x lo4) x (6.90 x c) 87 619/(0.008 71 x 99 999) d ) (2.06 x 111)/888 (0.4 O00 x 0.020 00)
el
(0.010 O0 x 0.800)
3.5 Efectúese cada una de las siguientes operaciones combinadas y escríbanse los resultados con todas las cifras significativas necesarias. a) 6.80(4.0
b) (14 x 10 C)
dl
4
486
x 10~6)- 22 (8.06 x + 555 - 80.8) x (2.000 1 - 0.004)
X 10-6
-
4.45
(7.777 X 103) +
10-5 9.6
X
4.81 x (6.9134 x lo3) + 32.26 58.6 (12 x 10~6) - (208 x
-
6.7845 x 1 0 ~ 6
(1801)
468.94 x
3.6 En el ejemplo 3.2 se usó la serie infinita:
para aproximar ex. a) Demuéstrese que esta expansión en serie Maclaurin es un caso especial de la expansión en serie de Taylor [Ec. (3.1411 con x, = O y h = x. b ) Úsese la serie de Taylor para estimar f ( x ) = e-' en x , , ~= 2 para tres casos diferentes: x, = 0.5, 1.0 y 1.5. Empléense los términos de orden cero, primero, segundo, y tercero, además calcúlese leul para cada caso. 3.7 La expansión en serie de Maclaurin para el cos x es: x2 cosx="-+"-+-
2!
x4
x6
x8
4!
6!
8!
Iniciando con el primer término, COS x = 1. agréguense los términos uno a uno para estimar 'COS (T / 3). Después que se agregue cada uno de los términos, calcúlense los errores porcentuales relativos. exactos y aproximados. Usese una calculadora de bolsillo para determinar el valor exacto. Agrégueme términos hasta que
1 O0
INGENIEROS
PARA
NUMERICOS
METODOS
el valor absoluto del error aproximado falle bajo cierto criterio de error, considerando dos cifras significativas. 3.8 Repítanse los cálculos del problema 3.7,pero ahora usando la serie de Maclaurin para el sen x:
senx = x--y estímese el sen
x3 3! (H
+
xs
x7
5!
7!
+
/ 2)
3.9 Úsense los términos en serie de Taylor de cero a tercer orden para estimar f (3)para
f(xj
=
25x3
-
6x2 + 7x - 88
usando como punto base x ra cada aproximación.
=
2. Calcúlese el error relativo porcentual correcto pa-
3.10 Úsense los términos en la serie de Taylor de orden cero al cuarto para estimar f (4) para f (x) = In x usando como punto base x = 1. Cálculese el error relativo porcentual correcto para cada aproximación. 3.11 Úsense los términos en serie de Taylor de orden cero al cuarto para estimar f (2) paraf (x)= e-x usando como punto base x = 1. Calcúlese el error relativo porcentral correcto e, para cada aproximación. 3.12 Úsense aproximaciones de diferencias de O ( h ) hacia atrás y hacia adelante y una aproximación central de O (h2) para estimar la primera derivada de la función mencionada en el problema 3.9. Evalúese la derivada en x = 2.5 usando un tamaño de paso deh = O. 25. Compárense los resultados con el valor correcto de la derivada en x = 2.5. Interprétense los resultados en base al término residual de la serie de Taylor. 3.13 Úsense aproximaciones con diferencias hacia atrás, centrales y hacia adelante de, O (h’) para estimar la segunda derivada de la función vista en el problema 3.9. Hágase la evaluación en x = 2.6 usando un tamaño de paso de h = 0.2. Compárense las estimaciones con el valor correcto de la segunda derivada en x = 2.6. lnterprétense los resultados en base al término residual de la serie de Taylor.
EPíLOGO: PARTE I
1.4 ELEMENTOS DE JUICIO Los métodos numéricos son científicos en el sentido de que representantécnicas sistemáticas para resolver problemas matemáticos. Sin embargo, hay cierto grado de arte, juicios subjetivos y términos medios, asociados con su uso efectivo en la práctica de ingeniería. Para cada uno de los problemas, la confrontación es con varias técnicas numéricas alternativas y con muchos tipos de computadoras. Por lo tanto, la elegancia y la eficiencia de los diferentes enfoques de los problemas es muy individualista y se relaciona conla habilidad de escoger prudentemente entre todas las opciones. Desafortunadamente, como sucede con cualquier proceso intuitivo, los factores que influyenen esta elección son difíciles de comunicar. Estas habilidades pueden ser comprendidas y afinadas ampliamente sólo por los programadores expertos. Sin embargo, ya queestas habilidades juegan un papel muy importante en la implementación efectiva de los métodos, se ha incluido esta sección como una introducción a algunos de los elementos de juicio que se deben considerar cuando se seleccione un método numérico y las herramientas para su implementación. Aunque no se espera que en la primer ocasión se capten todos los beneficios, si se tiene la esperanza de que estos análisis influyan en la orientación cuando se presente el material subsecuente. También se espera que si se enfrentan alternativas y algunos elementos de juicio en el resto del libro, se consultará nuevamente este material. La figura 1.4 ilustra siete factores o elementos de juicio que se deben tener en cuenta cuandose selecciona un método numérico para un problema en particular. Tipodeproblemamatemático.Comoya se mencionó en la figura 1.2, en este libro se discuten varios tipos de problemas matemáticos:
l.
a. Raíces de ecuaciones
b. Sistemas de ecuaciones algebraicas lineales simultáneas
102
MÉTODOS
NUMÉRICOS
PARA INGENIEROS
ajuste de curvas
d.
Integración numérica
e. Ecuaciones diferenciales ordinarias Probablemente el lector ya tenga algunos conocimientos básicos sobre la aplicación de los métodos numéricos al enfrentar alguno de los problemas de la figura1.4. Los métodos numéricos se necesitarán ya que los problemas no se pueden resolver eficientementeusando técnicas analíticas. Se debe estar consciente de que las actividades profesionales involucran, eventualmente, problemas en las áreas anteriores (Fig. 1.4). Por lo tanto, el estudio de los métodos numéricos y la selección de un equipo de cómputo'deben, al menos considerar estos problemas básicos. Los problemas más avanzados pueden requerir de habilidades en el manejo de soluciones de sistemas de ecuaciones algebraicas no lineales simultáneas, ajuste de curvas de varias variables, optimiza-
FIGURA 1.4
Siete consideraciones para escogerun solucióndeproblemasdeingeniería.
métodonumérico
en la
EPiLOGO PARTE I
103
ción de parámetros, programación lineal, problemas de valores propios y ecuaciones diferenciales parciales. Estas áreas requieren de mayores esfuerzos computacionales y de métodos avanzados que no se cubren en este texto. Se pueden consultar algunas referencias tales como: Carnahan, Luther y Wilkes (1969); Hamming(1 973); Rals(1 978) paraproblemasquevan más allá del tonyRabinowitz contenido de este libro. Además, alfinal de cada parte deeste texto, se incluye un breve resumen y referencias para los métodos avanzados para encaminarle en el estudio de consecución de métodos numéricos adicionales.
2. Tipo, disponibilidad, precisión,costo y velocidad de una computadora. Se tiene la oportunidad de trabajar con cuatro herramientas diferentes de cómputo (recuérdeseel cuadro 2.1). Que van desde una calculadora de bolsillo hasta una supercomputadora. De hecho, cualquiera de las herramientas que se pueden usar en la implementación de un método numérico {incluyendo papel y>lápiz, que noestán incluidos en el cuadro). En general no s e trata de ultimar capacidades, sino costos, conveniencia, velocidad, seguridad, repetibilidad y precisión. Aunque cada una de las herramientas enumeradas en el cuadro 2.1 seguirán teniendo utilidad, los grandes avances recientes en el funcionamiento de las computadoras personales ya han tenido repercusión en la profesión de ingeniero. Se espera que esta revolución se siga extendiendo conforme los avances tecnológicos continúen, ya que las computadoras personalesofrecen un excelente término medio entre conveniencia, costo, precisión, velocidad y capacidad de almacenamiento. Más aún, se pueden aplicar útilmente a la mayor parte de los problemas prácticos de ingeniería. Las técnicas de este libro, por lo tanto, se escogieron expresamente para que sean compatibles con esta clase de computadoras. 3. Costo en el desarrollo de programas contra el costo del software contra el costo del tiempo de ejecución, Una vez que se hayan identificado los tipos de problemas matemáticos a resolver yel sistema de cómputo haya sido seleccionado, será apropiado considerar los costos del software y del tiempo de ejecución. El desarrollo de programas puede representar un esfuerzo adicional en muchos proyectos de ingeniería y por lo tanto ser de un costo significativo. A este respecto, es particularmente importante que se esté bien familiarizado con los aspectos teóricos y prácticos de los métodos numéricos relevantes. Se puede disponer de una cantidad limitada de programas desarrollados profesionalmente a alto costo para la solución de problemas de ingeniería. Sin embargo, estos programas se deben usar con mucho cuidado, ya que en general no se esta familiarizado con la lógica delos mismos. Alternativamente, se puede disponer de programas de utilería general a bajo costo (tales como los que vienen
104
MÉTODOS
NUMÉRICOS PARA INGENIEROS
con este texto) para implementar métodos numéricos que se pueden adaptar fácilmente a una variedad muy amplia de problemas. El costo del desarrollo de programas yel costo del software se puede recuperar en el momento de la ejecución si los programas se han escrito y probado eficientemente.
4 . Características de los métodos numéricos. Cuando el costo de los componentes electrónicos de una computadora y de sus programas es alto, o si la disponibilidad de la computadora está limitada (p. ej., en sistemas de tiempo compartido), la manera de escoger cuidadosamente el método numérico ayudara a adaptarse a tal situación. Por el otro lado, si el problema aún se encuentra en una etapa experimental y el acceso y costo de una computadora no tienen problemas, entonces puede ser apropiado seleccionar un método numérico que siempre trabaje aunque quizás no sea, computacionalmente hablando, muy eficiente. Los métodos numéricos disponibles para resolver un tipo particular de problema, involucrantodos los factores mencionados, además de: a. Cantidad de condiciones o de puntos iniciales. Algunos de los métodos numéricos para encontrar raíces de ecuaciones o en la solución de ecuaciones diferenciales, requieren que el usuario eso puntosiniciales. Los métodos pecifiquealgunascondiciones simples requieren, en general de un valor, mientras que los métodos complicados pueden requerirmás de un valor. Se deben considerar los elementos de juicio; las ventajasde métodos complicados que son computacionalmente eficientes pueden compensar los requerimientos de múltiples puntos iniciales. Se debe echar mano los juicios para cada problema en parde la experiencia y de ticular.
b.
Velocidad de convergenciu. Ciertos métodos numéricos convergen más rápido que otros. Sin embargo, la convergencia rápida puede requerir de más puntos iniciales y de programación más compleja que la de un método con convergencia más lenta. Nuevamente se debe hacer uso de juicios para la selección de cierto método. ¡los más rápidos no siempre son los mejores!
c . fstabilidad. Algunos métodos numéricos para encontrar raíces de ecuaciones o soluciones de sistemas de ecuaciones lineales, en algunos casos pueden divergir en vez de converger a la respuesta correcta. iPor quése debe tolerar esta posibilidad si se ha diseñado o se ha planeado bien el problema? La respuesta es que estos métodos pueden ser altamente eficientes cuando funcionan. Por lo tanto, surgen nuevamente los elementos de juicio. Se debe decidir si los requisitos del problema justifican el esfuerzo necesario para aplicar un método que no siempre funciona.
EPíLOGO PARTE I
105
d . Exactitud y precisión. Algunos métodos numéricos, simplemente son más exactos y precisos que otros. Como ejemplos se tienen las diferentes ecuaciones disponibles para la integración numérica. En general, se puede mejorarel funcionamiento de métodos de poca exactitud disminuyendo el tamaño del paso o aumentando el número de términos sobre un intervalo dado. 2Qué será mejor, usar un método con poca exactitud y con tamaños de paso pequeños o usar un método con altaexactitud y tamaños de paso grandes? Esta pregunta se debe analizar paso por paso considerando los factores adicionales tales como el costo y la facilidad de programación. Además se deben tomar en consideración los errores de redondeo cuando se usan en forma repetida métodos de baja exactitud y el número de cálculos crece demasiado. Aquílas cifras sigla computadorapueden ser el factor nificativas quemaneja decisivo. e . Alcance de las aplicaciones. Algunos métodos numéricos sólo se pueden aplicar a cierta clase de problemaso a los problemas que satisfacen ciertas restricciones matemáticas. Otros métodos no tienen estas restricciones. Se debe evaluar si vale la pena el esfuerzo de desarrollar programas que empleen técnicas apropiadas únicamente para un número limitado de problemas. El hecho de que tales técnicas pueden usarse ampliamente, indica que tienen ventajas que a menudo son menos que las desventajas. Obviamente, deben evaluarse los elementos de juicio.
f . Requisitos especiales. Algunas técnicas numéricas intentan incrementar la exactitud y la velocidad de convergencia usando información especial o adicional. U n ejemplo sería el uso de valores estimados o valores teóricos de los errores para el mejoramiento de la exactitud. Sin embargo, estas mejorías, en general no se Ilevan a cabo sin inconvenientes como el aumento en el costo de cómputo y el incremento en la complejidad del programa.
g . Esfuerzos requeridos de programación. Los esfuerzos para mejorar la velocidad de convergencia, estabilidad y exactitud pueden ser creativos e ingeniosos. Cuando se pueden hacer mejoras sin aumentar la complejidad en la programación, entonces se puede considerar que estas meioras son elegantes y probablemente encuentren uso inmediato en la ingeniería. Sin embargo, si requieren de programasmás complejos, otra vezse deben enfrentar los elementos de juicio que pueden o no favorecer al nuevo método. Se ve claro queel análisis anterior relacionado con la forma de escoger un método numérico se reduce sólo a costo y exactitud. Los costos son los que están involucrados con el tiempo de cómputo y el
106
NUMÉRICOS
MÉTODOS
PARA INGENIEROS
desarrollo de programas. La exactitud apropiada es una cuestión de ética y de juicio profesional.
5. Comportamiento matemático de las funciones, ecuaciones o datos. AI seleccionar un método numérico en particular,el tipo de computadora y el tipo deprogramas, se debe tomarencuentala complejidad de las funciones y de las ecuaciones o datos. Las ecuaciones simples y los datos uniformes se pueden manejar apropiadamente con algoritmos numéricos simples y con computadoras baratas. Sucede lo contrario con las ecuaciones complicadas y los datos que contienen discontinuidades. 6. Facilidad de aplicación (iAccesible al usuario?). Algunos métodos numéricos son fáciles de aplicar y otros difíciles. Esto se debe tomar en cuenta cuando se escoge un método sobre otro. Esta misma idea se aplica a las decisiones referentes al costo en el desarrollo de programas, contra programas desarrollados profesionalmente. El convertir un programa difícil en uno que sea accesible al usuario puede ser de considerable esfuerzo.Las formas de hacerlo se mencionan en el capítulo 2 y se elaboran a lo largo del libro. Además los programas de NUMERICOMP que acompañan a este texto son un ejemplo de programación accesible al usuario.
7. Mantenimiento. Los programas para resolver problemas de ingeniería requieren mantenimiento porque durante las aplicaciones ocurren dificultades, invariablemente. El mantenimiento puede requerir un cambio en el código del programao la expansión dela documentación. Los programas simples y los algoritmos numéricos son más fáciles de mantener. Los siguientes capítulos involucran el desarollo de varios tipos de métodos numéricos para una variedad de problemas matemáticos. Se dan en cada capítulo varios métodos alternativos. Se presentan estos métodos (en vez de un método escogido por los autores) ya que no existe uno que sea "el meior" de todos. N o hay métodos "mejores" ya que existen tantos elementos de juicio que se deben tomar en consideración cuandose aplica un método a problemas prácticos. AI final de cada parte del libro se presenta una tabla que resalta los elementos de juicio involucrados en cada método. Esta tabla debe ayudara seleccionar un procedimiento numérico apropiado para cada problema en particular dentro de un contexto.
I.5
RELACIONES Y FóRMULAS IMPORTANTES El cuadro 1.2 resume la información más importante que se analizó en la parteI . El cuadro se puede consultar para tener un acceso rápid o a las relaciones y fórmulas más importantes. El epílogo de cada parte del libro contiene estos resúmenes.
107
EPiLOGO PARTE I
-
CUADRO 1.2 Resumen de la información importante presentadalaen parte 1. Definiciones de error Error verdadero
= valor verdadero - valor aproximado
- valor aproximado valor verdadero
Error relativo valor verdadera porcentual verdadero % = Error relativo, aprox. actual €0
porcentual oproximado
100%
- aprox. previa
=
100%
aproximación actuol
Criterios de poro
Terminar los cálculos cuando: €0
<
6,
donde es es elerrorrelativoporcentual deseado,especificado de directamente o calculado en términosdelnúmerodeseado cifrassignificativas n =
(0.5
X
lo2-")%
Serie de Taylor Expansión en la serie de Taylor
f(x,+,) =
fYXJ + f'(x,)h + -h2
/(X,)
2!
+-f'"(x) 3!
h3 +
.,.
I f c n ) ( X ! ) hn
+
R,
n!
donde Residuo O
R,
=
O(h"+')
Diferenciación numérica diferencia Primera dividida finlta hacia adelante
f'(XJ =
f(X,+l)
h
f(x,)
+ O(h)
(Otras diferencias divididas se resumen de la fig. 3.7 a la 3 . 9 . )
1.6
MÉTODOS AVANZADOS Y ALGUNAS REFERENCIAS ADICIONALES El epílogo de cada parte del libro también incluye una sección encaminada a facilitar y fomentar estudios adicionales de los métodos nu-
108
MÉTODOS
NUMÉRICOS
PARA INGENIEROS
méricos. Esta sección dará algunas referencias sobre el tema así como material relacionado con métodos más avanzados.* Para extender los antecedentes mencionados en la parte I, existen numerosos manuales sobre programación de computadoras.Resultaría difícil mencionar todos los libros y manuales excelentes correspondientes a lenguajes y computadoras especificas. Además, probablemente ya se tenga material de contactos previos con la programación. Sin embargo, si ésta es la primer experiencia con computadoras, Bent y Sethares (1982) proporcionanunabuenaintroducción a BASIC. McCraken (1965))Merchant (1979) y Merchant, Sturgel (1977) son otros libros útiles sobre FORTRAN. El maestro o los compañeros de semestres avanzados del usuario deben poder darle unconsejo acerca de buenos libros de referencia para las máquinas y los lenguajes disponiblesen la escuela. También para el análisis de error, cualquier libro de cálculo introductori0 incluira material suplementario relacionado con temas tales COmo la serie de Taylor. Los textos de Swokowski (1979) y Thomas y Finney (1 979) proporcionan discusiones legibles de estos temas. Finalmente, aunque se espera que este libro sirva lo suficiente, siempre es bueno consultar otras fuentes cuando se intenta conocer a-fondo un nuevo tema. Ralston y Rabinowitz (1 978) y Carnahan, Luther y Wilkes (1 969) ofrecen textos comprensibles de la mayor parte de los métodos numéricos, incluyendo muchos métodos avanzados que van más allá del alcance de este libro. Otros libros útiles sobre el tema son G e rald y Wheatley (1984))James, Smith y Wolford (1 977), Stark (1 970)) Rice ( 1 983, Hornbeck (1 975) y Cheney y Kincaid (1 980).
* Aquí únicamente se hace referencia a estos libros, una bibliografía completa al final del texto.
se encontrará
I ~
PA RT’E RAKES DE ECUACIONES
DOS
~
11.1 Desde hace años, se aprendió a uiar la fórmula cuadrática:
pura resolver
f(x) = ax2
+ bx + c
=
O
, ~
[11.2] ( 1 1 . 1 ) se
A los valores calculados con la ecuiación les llama “raíces” de la ecuación (11.2). Éstos representan los valores de x que hacen la ecuación
(11.2) igual a cero. Por IS tanto, se puede definir la raiz de una ecuación como el valor de x que hace f (x) = O. Por esta razón, algunas veces a las raíces se les conoce comoceros de la ecuación. 13
a
Aunque la fórmula cuadrática es útil para resol’ ver la ecuación (ll.2), hay muchas funciones diferentes que no se pueden resolver de manera tan fácil. En estos casos, los métodos numéricos descritos en los capítulos 4 y 5 proporcionan medios eficientes para obtener la respuesta.
I I . 1 . l Métodos empleados antes de la era de la computadora pura determinar raíces. las computadoras Antes deladvenimientode digitales, había una serie de métodos para encontrar las raíces de ecuaciones algebraicas o trascendentales. Para algunos casos, las raíces se podían obtener con métodos directos, como se hace con la ecuación ( 1 1 . 1 ) . Aunque había ecuaciones como ésta que se podían resolver directamente, había muchas otras que no lo eran. Por ejemplo, hasta una función aparentemente simple tal, como f ( x ) = e - ” - x no se puede resolver analíticamente. En estos casos, la única alternativaes una técnica de solución aproximada. ..
I_
,A”.”
.,
-
L
x/
..;
?. U n método
para obtener unasolución aproxima-
da es la de graficar la función y determinar dón-
110
MÉTODOS
NUMÉRICOS
PARA INGENIEROS
de cruza al eje x. Este punto, que representa el valor de x para el cual f ( x ) = O, es la raíz. Las técnicas gráficas se discuten al principio de los capítulos 4 y 5. Aunque los métodos gráficos son útiles en la obtención de estimaciones aproximativas de las raíces, están limitadas por la carencia de precisión. U n a aproximación alternativa es usar la técnica de prueba y error. Esta "técnica" consiste en escojer un valor de x y evaluar si f (x) es cero. Si no es así (como sucederá en la mayor parte de los casos), se hace otra conjetura y se evalúa nuevamente f(x) para determinar si el nuevo valor da una mejor estimación de la raíz. El proceso se repite hasta que se obtenga un valor que genere una f (x) cercana a cero. Estos métodos fortuitos, obviamente son ineficientes e inadecuados para las exigencias en la práctica de la ingeniería. Las técnicas descritas en la parte Ill representan alternativas que no sólo aproximan sino emplean estrategias sistemáticas para encaminarse a la raíz verdadera.Además, se adaptanidealmentealaimplementación en computadoras personales. Tal como se presenta en las páginas siguientes, la combinación de estos métodos sistemáticos con la computadora hacen de la solución de la mayorparte de los problemas sobre raíces de ecuaciones una tarea simple y eficiente.
11.1.2
Raícesdeecuaciones
y su práctica en laingeniería
Aunque las raíces de ecuaciones caben dentro de otro contexto, frecuentemente aparecen en el área de diseño en ingeniería. El cuadro 1 1 . 1 muestra un conjunto de principios fundamentales que se utilizan frecuentemente en trabajos de diseño. Las ecuaciones matemáticas o los modelos derivados de estos principios se emplean en la predicción de las variables dependientes en función de las variables independientes y de los parámetros. Nótese que en cada caso, las variables dependientes refleian el estado o funcionamiento del sistema, ya sea que los parámetros representen sus propiedades o su composición. U n ejemplo de tales modelos se presenta en la ecuación derivada de la segunda ley de Newton, usada en el capítulo 1 para la velocidad del paracaidista:
[ 11.31 Donde la velocidadv es la variable dependiente,el tiempo t es la variable independiente y g la constante gravitacipnal, el coeficiente de rozamiento c y la masa m son parámetros. Si se conocen los paráme-
111
RAíCES DE ECUACIONES
CUA,DRO 11.1
Principios fundamentales usados en los problemas de diseño en ingeniería Principio Variable Variable fundamental dependiente
independiente
Parámetros
Balance calor de
Temperatura
Tiempo y Dosición
Las propiedades térmicas del material y la geometría del sistema
Balance de material
Concentración o cantidad de masa
tiempo y posición
El comportamiento químico del material, masa coeficientes de transferencia y la geometría del sistema
Balance de la fuerza
Magnitud y dirección de fuerzas para establecer el equilibrio
Tiempo y posición
Resistencia del material, propiedades estructurales y la configuración del sistema.
Balance de la energía
Cambios en los estados de la energía cinética y potencial del sistema
Tiempo y posición
Propiedades térmicas, masa del material y la geometría del sistema
LeyesNewton de Aceleración, del movimiento velocidad o posición
Tiempo y posición
Masa del material, geometría del sistema y parámetros disipativos tales como la fricción o el rozamiento.
Leyes de Kirchhoff
Tiempo
Propiedades eléctricas del sistema,tales como la resistencia, capacitancia e inductancia.
Corriente y en voltaje los circuitos eléctricos
tros, la ecuación (11.3) se puede usar para predecir la velocidad del paracaidista como una función del tiempo. Estos cálculos se pueden llevar a cabo directamente ya que v se expresa explicitamente como una función del tiempo. Esto es, está aislada a un lado del signo igual.
112
INGENIEROS
PARA
MÉTODOS
NUMERICOS
Sin embargo, supóngase que se tiene que determinar el coeficiente de rozamiento para un paracaidista de una masa dada, para alcanzar una velocidad prescrita enun periodo dado de tiempo. Aunque la ecuación (11.3) proporciona una representación matemática de la interrelación entre las variables del ,modelo y los parámetros, no se puede resolver explícitamente para el coeficiente de rozamiento. Pruébese. N o hay forma de reordenar la ecuación para despejar c de un lado del signo igual. En estos casos, se dice que c es implicita. Esto representa un dilema real, ya que muchos de los problemas de diseños en ingeniería, involucran la especificación de las propiedades o la composición de un sistema (representado por sus parámetros) para asegurar que funciona de la manera deseada (representada por sus variables). Por lo tanto, estos problemas a menudo requieren que se determinen sus parámetros de forma explícita. La solución del dilema las proporcionan los métodos numéricos para raíces de ecuaciones.Pararesolver el problemausando métodos numéricos es conveniente cambiar la ecuación (11.3).Esto se hace restando la variable dependiente v de ambos lados de la ecuación, obteniendo: V
[11.4]
Por lo tanto, el valor de c que cumple f (c) = O, es la raíz de la ecuación. Este valor también representa el coeficiente de rozamiento que soluciona el problema de diseño. La parte I 1 de este libro analiza una gran variedad de métodos numéricos y gráficos para determinar raíces de relaciones tales como la ecuación (11.4). Estas técnicas se pueden aplicar a los problemas de diseño en ingeniería basados en los principios fundamentales delineados en el cuadro II. 1 así como tantos otros problemas que se afrontan frecuentemente en la práctica de la ingeniería.
11.2 FUNDAMENTOS MATEMÁTICOS En la mayor parte de las áreas mencionadas en este libro, en general existen algunos prerrequisitos de fundamentos matemáticos necesarios para conocer a fondoel tema. Por ejemplo, los conceptos de estimación de errores y la expansión en serie de Taylor, analizadas en el capítulo 3, tienen importancia directaen el análisis de raíces de ecuaciones. Adicionalmente, antes de este punto se mencionaron los tér-
RAlCES
113
ECUACIONES
minos de ecuaciones"algebraicas"y "trascendentales".Puede resultar útil definir formalmente estos términos y discutir como se relacionan con esta parte del libro. Por definición, unafunción dada pory = de expresar de la siguiente manera:
fnyn
+ fn-1yn-1 +
...
+ f i y + fo
=
f (x) es algebraica si se pue-
o
[11.5]
donde las f son polinomios en x. Los polinomios son un caso simple de funciones algebraicas que se representan generalmente como:
{(x) =
a0
+ UlX +
.
* *
+ a,x"
C11.61
donde las a son constantes. Algunos ejemplos específicos son: {(X) =
1
-
2 . 3 7 ~+ 7 . 5 ~ ~
[11.7]
Y f(x) = 5x2 - x3
+ 7x6
[11.8]
Una función trascendental es una que no es algebraica. Incluye funciones trigonométricas, exponenciales, logaritmicas y otras menos familiares. Algunos ejemplos son:
f(x) = e-'
-x
[11.9]
f(x) = sen x
[11.10]
f(x) = In x2 - 1
p1.1 1J
Las raíces de las ecuaciones pueden ser reales o complejas. U n ejemplo simple de raícescomplejas es el caso para el cual el término b2 - 4 ac de la ecuación (II. 1 ) es negativo. Por ejemplo, dado el polinomio de segundo orden:
f(x) = 4x2 - 16x
+
17
La ecuación (11.1) se puede usar para determinar que las raíces son: X =
Por
16
V(-16)2 - 4(4) (17) - 16 2 (4)
lo tanto, una raíz x=2+;;
es:
*m 8
114
INGENIEROS
y la otra
PARA
METODOS NUMERICOS
es:
x = 2 - , 1i en donde
i
=
J-"
Aunque hay algunos casos donde las raíces complejas de las funciones no polinomiales son de interes, ésta situación es menos común que para polinomios. Por lo tanto, los métodos estándar para encontrar raíces, en general caen en dos áreas de problemas parecidas en principio, pero fundamentalmente diferentes:
l.
l a determinación de raíces reales de ecuaciones algebraicasy trascendentales. Estas técnicas se diseñaron para determinar el valor de una raíz simple de acuerdo a un conocimiento previo de su posición aproximada.
2.
l a determinación ¿e todas las rakes reales y complejas de un polinomio. Estos métodos se diseñaron específicamente para polinomios. Determinan sistemáticamente todas las raíces del polinomio en lugar de simplemente una, dada una posición aproximada.
Los métodos diseñaEste libro está enfocado al área del primer caso. dos expresamente para polinomios no se analizan ya que van más allá del alcance de este libro. Sin embargo, en el epílogo al final de la parte I I se recomiendan algunas referencias para estas técnicas.
11.3 Antes de proceder con los métodos numéricos para determinar raíces de ecuaciones, seráútil dar algunas orientaciones. El siguiente material es una introducción a los temas de la parte ll. Además, se han incluido algunos objetivos que orientarán al lector en sus esfuerzos al estudiar el material. 11.3.1
Campodeacción
yavance
La figura 1 1 . 1 es una representación esquemática de la organización de la parte It. Examine esta figura cuidadosamente, iniciando en la parte de arriba y avanzandoen el sentido de las manecillas del reloj. Después de esta introducción, el capítulo 4 desarrolla los métodos que usan intervalos para encontrar raíces. Estos métodos empiezan con suposiciones que encierran o que contienen a la raíz y reducen sistemáticamente el ancho del intervalo. Se cubren dos métodos: el de bi-
RAiCES DE ECUACIONES
11s
sección y el de la regla falsa. Los métodos gráficos proporcionan conocimiento visual de las técnicas. Se desarrollan formulaciones especiales para ayudar a determinar cuanto esfuerzo computacionalse requiere para estimar la raíz hasta un nivelde precisión previamente especificado.
En el capítulo 5 se cubren los métodos abiertos. Estos métodos también involucran iteraciones sistemáticas de prueba y error pero no
116
INGENIEROS
PARA
MÉTODOS NUMERICOS
requieren que la suposición inicial encierre a la raíz. Se descubrirá que estos métodos, en general son más eficientes computacionalmente que los métodos que usan intervalos, pero no siempre trabajan. Se analizan los métodos de la iteración de punto fijo, el método de Newton-Raphson y el método de la secante. Los métodos gráficos proporcionan conocimiento en los casos donde los métodos abiertos no funcionan. Se desarrollan las fórmulas que proporcionan una idea de qué tan rápido un método abierto converge a la raíz.
El capítulo 6 extiende los conceptos anteriores a los conceptos actuales de la ingeniería. Los casos de estudio se emplean para ilustrar las ventajas y las desventajas de cada uno de los métodos y para proporcionar conocimiento sobre las aplicaciones de las técnicas en la práctica profesional. Los casos del capítulo 6 también resaltan los elementos de juicio (estudiados en la parte I) asociados con cada uno de los métodos. Se incluye un epílogo al final de la parte I I . Éste contiene una comparación detallada delos métodos discutidos en los capítulos 4 y 5. Esta comparación incluye una descripción delos elementos de juicio relacionados con el uso correcto de cada técnica.En esta sección se proporcionatambién un resumende las fórmulasimportantes,con referencias a algunos métodos numéricos que van más allá del alcance de este texto. Ciertas capacidades automáticas de cálculo se integran de diferentes maneras en la parte I I . En primer lugar, programas en NUMERICOMP legibles para el usuario del método de bisección disponible para la Apple I 1 y la IBM PC. Pero también se dan los códigos en FORTRAN Y BASIC para el método de bisección directamente en el texto. Con esto se tiene la oportunidad de copiar y aumentar el código para implementarlo en su propia computadora personal o supercomputadora. Se incluyen los algoritmos y diagramas de flujo para la mayor parte de los otros métodos expuestos en el texto. Este material puede servir de base para el desarrollo de un paquete de programación y aplicarlo a una serie de problemas de ingeniería.
11.3.2 Metas y objetivos Objetivos de estudio. Después de terminar la parte 11, se debe tener la suficiente información para aprovecharsatisfactoriamente una amplia variedad de problemas de ingeniería que se relacionan con las raíces de ecuaciones. En términos generales se dominarán las técnicas, se habrá aprendido a valorarsu confiabilidad y se tendrá la capacidaddeescoger el mejor método (o métodos)paracualquier problema en particular. Además de estas metas globales, se deben
RAíCES DE ECUACIONES
117
asimilar los conceptos específicos de el cuadro 11.2 para comprender mejor el material de la parte I t . Objetivos de computación. El libro proporciona algunos programas simples, algoritmos y diagramas de fluio para implementar las técnicas analizadas en la parte II. Como herramientas de aprendizajetodos ellos tienen gran utilidad. Los programas opcionales son legibles para el usuario. Incluye métododelabisecciónparadeterminar las raíces realesde las ecuaciones algebraicas y trascendentales. Las gráficasasociadascon NUMERICOMP le facilitarán al lector visualizar el comportamiento de la función en análisis. Los programas se pueden usar para determinar convenientementelas raíces de las ecuaciones a cualquier grado deprecisión. Es fácilde aplicar NUMERICOMP pararesolver muchos problemas prácticos y se puede usar para verificarlos resultados de cualquier programa que el usuario desarrolle por sí mismo. También se proporcionan directamente en el texto los programas en FORTRAN y BASIC para los métodos de bisección y para la iteración simple de punto fijo. Además,se proporcionan algoritmos y diagramas de fluio generales para la mayor parte delos otros métodos de la parte 1 1 . Esta información permitirá aumentar la biblioteca de programas del usuario que sean más eficientes que el método de la bisección. Por ejemplo, puede desearsetener sus propios programas para los métodos de la reglafalsa, Newton-Raphson y de la secante, que en general sonmás eficientes que el método de bisección.
CUADRO 11.2
Obietivos de estudio específicos de la parte II
1. Entender la interpretación gráfica de una raíz
2. Conocer la interpretación gráfica del método de la regla falsa
y por qué, en general, es superior al método de bisecciones. 3. Entender las diferencias entre los métodos que usan intervalos y los métodos abiertos para la localización de las raíces. 4. Entender los conceptos de convergencia y de divergencia. Usar el método de las dos curvas para proporcionar una manifestación visual de los conceptos. 5. Conocer por qué los métodos que usan intervalos siempre convergen, mientras que los métodos abiertos algunas veces pueden divergir. 6. Entender que la convergencia en los métodos abiertos esmás probable si el valor inicial está cercano a la raíz. 7. Entender el concepto de convergencia lineal y cuadrática y sus implicaciones en la eficiencia de los métodos de iteraciones de punto fijo y de NewtonRaphson. 8. Saber las diferencias fundamentales entre los métodos de la regla falsa y la secante y cómo se relaciona su convergencia. 9 . Entender los problemas que contienen las raíces múltiples y las modificaciones que se les pueden hacer para resolverlos a medias.
C A P í T U L OC U A T R O MÉTODOS QUE USAN INTERVALOS
En este capítulo sobre raíces de ecuaciones se analizan los métodos que aprovechan el hecho de que una función, típicamente, cambia de signo en la vecindad de una raíz. A estas técnicasse les llama métodos que usan intervalos porque se necesita de dos valores iniciales para la raíz. Como su nombre lo indica, estos valores deben “encerrar” o estar uno de cada lado de la raíz. Los métodos particulares descritos sobre este punto emplean diferentes estrategias para reducir sistemáticamente el tamaño del intervalo y así, converger a la respuesta correcta. Como preámbulo de estas técnicas, se discutirán los métodos gráficos para graficar funciones y sus raíces. Además de la utilidad de los métodos gráficos para determinar valores iniciales, también son útiles para visualizar las propiedades de las funcionesy el comportamiento delos métodos numéricos.
4.1 MÉTODOS
GRÁFICOS
Un método simple para obtener una aproximación a laraíz de la ecuación f (x) = O consiste en graficar la función y observar en donde cruza el eje x. Este punto, que representa el valor de x para el cual f (x) = O , proporcionaunaaproximacióninicial de laraíz.
EJEMPLO 4.1 Métodos gráficos
Enunciado del problema: empléense gráficas para obtener unaraíz aproximada de lafunción f (x) = e-x - x. Solución: se calculan los siguientesvalores:
120
METODOS NUMERICOS
f(x)
X
1.000
0.0 0.2 0.4
0.6 0.8 1 .o
PARA INGENIEROS
0.619 0.270 -0.051 -0.351
-0.632
Estos puntos se muestran en la gráfica de la figura 4. l . La curva resultante cruza al eje x entre 0.5 y 0.6. Un vistazo a la gráfica proporciona una aproximada estimación de la raíz de 0.57, que se acerca a la raíz exacta de 0.567 143 28. . ., que se debe determinar con métodos numéricos. La validez de la estimación visual se puede verificar sustituyendosu valor enla ecuación originalpara obtener:
f(0.57) = e-057- 0.57
=
-0.004 5
lacual se acerca a cero
FIGURA 4.1
Metodo gráfico para la solución de ecuaciones algebraicas y trascenx contra x . La raíz corresdentales. Representación de f l x ) = e-x x donde f(x) = O, esto es, el punto donde lafunción ponde al valor de cruza el eje x . Una inspección visual de la gráfica muestra un valor aproximado de 0.57.
-
METODOS QUE
FIGURA 4.2 Ilustración de las formas que puede tener una raíz en un intervalo prescrito por los límites inferior, x, y superior x,. Los incisos a) y b) indican que si Ax,) y f (x,) tienen el mismo signo, entonces no habrá raíces dentro del intervaloo habrá un I número par de ellas. Los incisos c) y d) indican que si f ( 4 Y Ax,) t'lenen signosopuestos en los extremos,entonces habrá un número impar de raíces dentro del intervalo.
121
Las técnicas gráficas tienen un valor práctico limitado ya que no son precisas. Sin embargo, los métodos gráficos se pueden usar para obtener aproximaciones de la raíz. Estas aproximaciones se pueden emplear como valores iniciales paralos métodos numéricos analizados eneste capítulo y en el siguiente. Porejemplo, los programas de NUMERICOMP que acompañan este texto le permiten graficar funciones sobre un rango específico. Esta gráfica puede hacerse seleccionando un par de valores iniciales de un intervalo donde está contenida la raíz antes de implementar el m&& num6rico.l a posibilidad de graficar aumenta considerablemente lautilidad de los programas. Las interpretaciones geQmétricas, además de proporcionar aproximaciones iniciales de la raíz, son herramientas importantes en el asimilamiento de las propiedades de las funciones previendo las fallas de los métodos numéricos. Por ejemplo, la figura 4.2 muestra algunas formas diferentes en las que la raíz puede encontrarse en un intervalo definido por un límite inferior x, y un límite superior x,. La figura 4.2b bosqueja el caso donde los valores positivo y negativo de f (x)y f (x,) tienen signos opuestos respecto al eje x , encierran tres raíces dentro del intervalo. En general, si f (x,)y f (x,) tienen signos opuestos, existe un número impar de raíces dentro del intervalo definido porlos mismos. Como se indica en la figura 4.2a y c , si f (x,)y f (x,) tienen el mismo signo, no hay raíces o hay un número par de ellas entre los valores dados. Aunque estas generalizaciones son usualmente verdaderas, existen casos en que no se cumplen. Por ejemplo, las raices múltiples, esto es, funciones tangencialesal eje x (Fig. 4 . 3 ~y) las funciones discontinuas (Fig. 4.3b) pueden no cumplir estos principios.Un ejemplo deuna función que tieneuna raízmúltiple es la ecuacióncúbica f (x) = (x - 2)(x - 2) (x - 4). Nótese que x = 2 anula dos vecesal polinomio, de ahí quea x se le conozca como raíz múltiple. Al final del capítulo 5, se presentan técnicas que están diseñadas expresamente para localizar raíces múltiples. La existencia de casos del tipo mostrado en la figura 4.3 dificulta el desarrollo de algoritmos generales que garanticenla localización de todas las raíces en el intervalo. Sin embargo, cuando se usanlos métodos expuestos enlassiguientesseccionesenconjunciónconesquemasgráficos,sonde gran utilidad en la solución de problemasdemuchas raíces, frecuentemente se presentan enel área de ingeniería y matemáticas aplicadas.
EJEMPLO 4.2 Uso de gráficas por computadora para localizar raíces .J
Enunciado del problema: las gráficas por computadora pueden informar y acelerar los esfuerzos para localizar raíces de una función. Este ejemplo se desarrolló usando los programas de NUMERICOMP disponibles con
INGENIEROS 122
PARA
NUMERICOS
METODOS
FIGURA 4.3 Ilustracióndealgunas excepciones de los casos generales mostrados en la figura 4.2. a) Pueden ocurrir raíces múltiples es cuando la función tangencia1 al eje x. En este caso, aunque los extremos son de signos opuestos, hay unnúmeropar de raícesenel intervalo. b) Las funciones discontinuas en donde losextremostienensignos opuestos también contienen un número par de raíces. Se requieren estrategias especiales para determinar lasraíces enestoscasos.
FIGURA 4.4 Escalamiento progresivo def (x) = sen 1Ox
+
cos 3x mediante la computadora. Estas gráficas interactivas le permiten al analista determinar que existen dos raíces entre x = 4.2 y x = 4.3.
el texto. Sin embargo, de esta manera esposible entender cómo la graficación por computadora ayuda a localizar raíces. La función: !(x) = sen lox
+
cos 3x
tiene varias raíces sobre el r.qngo de x = -5 hasta x = 5. Empléese la opción de graficación del programa para profundizar en el comportamiento de esta función. Solución: Como se ilustró en el ejemplo 2.1, se puede usar NUMERICOMP para graficar funciones. En la figura 4.4a se muestra la gráfica de f ( x ) desde x = -5 hasta x = 5. La gráfica muestra la existencia de varias
MÉTODOS
123
QUE
raíces, incluyendo posiblemente una doble alrededor de x = 4 . 2 en donde f (x) parece ser tangente al eje x. Se obtiene una descripción más detallada del comportamiento de f (x) cambiando el rango de graficación desde x = 3 hasta x = 5, como se muestra en la figura 4.4b. Finalmente, en la figura 4.4c, se acorta la escala vertical a f (x) = -0.15 y f (x) = 0.15 y la horizontal a x = 4.2 y x = 4.3. Esta gráfica muestra claramente que no existe una raíz en esta región y que, en efecto, hay dos raíces diferentesalrededorde x = 4.229 y x = 4.264. Las gráficasporcomputadoratienengranutilidadenelestudio de los métodos numéricos. Esta habilidad también puede aplicarse en otras materias así como en las actividades profesionales.
4.2 MÉTODO
DE BlSECClÓN
Cuando se aplicaron las técnicas gráficas, en el ejemplo 4.1, se observó (Fig. 4.1) que f (x) cambió de signo hacia ambos lados de la raíz. En general, si j (x) es real y continua en el intervalo de x1 a x, y f(xl) y f(x,) tienensignos opuestos, esto es,
FIGURA 4.5
" . . l " -
Algoritmo de la biseccion.
.. ..
.
.
_"
-
"...
124
NUMÉRICOS
MÉTODOS
PARA INGENIEROS
entonces hay, al menos una raíz real entre x, y x,. LOSmétodos de búsqueda incremental se aprovechan de esta característica para localizar un intervalo donde la función cambie de signo. Por lo tanto, la localización del cambio de signo (y por ende, de la raíz), se logra más exactamente dividiendo el intervalo en una cantidad definida de subintervalos. Se rastrea cada uno de estossubintervalos para encontrar el cambio d e signo. El proceso se repite y la aproximación a la raíz mejora cada vez más a medida que los subintervalos se dividen en intervalos más y más pequeños. Seestudia más sobre e¡ tema de búsquedas incrementales en la sección 4.4. El método de bisección, conocido también como de cortebinario. de partición en dos intervalos iguales o método de Bolzano, es un método de búsqueda incremental donde el intervalo se divide siempre en dos. Si la función cambia de signo sobre un intervalo, se evalúa el valor de la función en el punto medio. La posición d e la raíz se determina situándola en el punto medio del subintervalo dentro del cual ocurreun cambio d e signo. El proceso se repite hasta obtener una mejor aproximación. La figura 4.5 muestra un algoritmo para la bisección y en la figura 4.6 se muestra un bosquejo gráfico del método.
EJEMPLO 4.3 Bisección
, Enunciado del problema: úsese el método de la bisección para determi; nar la Paíz de' j(x) = e "x - x. Solución: Recuérdese de acuerdo a la gráfica de la función (Fig. 4.1) que la raíz se encuentra entre O y 1.Por lo tanto, el intervalo inicial se puede escoger desde x/ = O hasta x, = 1. Por consiguiente, la estimación ini'cia1 de la raíz se sitúa en el punto medio de este intervalo: i
X, =
O+l
-= 0.5 2
Esta estimación representa un error de (el valor exacto es 0.567 143 29.
E,
= 0.567 143
29 - 0.5
= 0.067 143
29
o, en términos relativos: =
I
143 29 1100% 0.567 143 29
=
11.8%
,
.)
125
METODOS QUEUSANINTERVALOS
FIGURA 4.6
Gráficadel método de bisección. Esta gráfica incluye las primeras tres iteraciones del ejemplo 4.3.
donde el subíndicev indica que el errores con respectoal verdadero. Ahora se calcula:
f(0)f(0.5) = (1)(0.10653)
=
0.106 53
que es mayor de cero, y por consiguiente no hay cambio de signo entre x/ y x,. Y por lo tanto, la raíz se encuentra dentro del intervalo x = 0.5 y x = 1. Ellímiteinferior se redefine como x, = 0.5, y la aproximación a laraízenla segunda iteración se calcula como:
0.5
+ 1.0 = 0.75 2
le,/ =
32.2%
MÉTODOS NUMERICOS PARA INGENIEROS
126
5
El proceso se puede repetir para obtener aproximaciones más exactas. Por ejemplo, la tercera iteración es:
f(0.5)f(0.75)
-0.030 < O
Por lo tanto, laraíz está entre 0.5 v 0.75: x, =
0.75 0.5 + 0.75 = 0.625 2
/E,[ =
10.2%
Y la cuarta iteración es:
f(0.5)f(0.625)= -0.010 < O Por lo tanto, laraíz está entre 0.5 y 0.625: x, =
0.625
El método se puede repetir para alcanzar mejores estimaciones.La figura 4.6 muestra una gráfica de las primeras tres iteraciones.
En el ejemplo anterior, se puede observar que el error real no disminuye con cada iteración. Sin embargo, el intervalo dentro del cual se localiza la raíz se divide a la mitad en cada paso del proceso. Comose estudiará en la próxima sección, la longitud del intervalo proporciona una aproximación exacta del límite superior del error en el método debisección.
4.2.1
Criterios
de paro y estimación de errores
El ejemplo 4.3 finaliza con la opción de repetir el método para obtener una aproximación más exacta de la raíz. Ahora se debe desarrollar un criterio objetivo para decidir cuando debe terminar el método. Una sugerencia inicial puede ser de que terminen los cálculos cuando el error se encuentre por debajo de algún nivel prefijado. Se puede ver en el ejemplo 4.3, que el error relativo bajó de un 11.8 a un 4.69% durante los cálculos. Puede decidirse que el método termine cuando se al0. 1%. Esta estrategia es cance un errormásbajo,porejemplodel inconveniente ya que la estimación del erroren el ejemplo anterior se basó en el conocimiento del valor exacto de la raíz de la función. Este no
.
METODOS
127
es el caso de una situación real ya que no habría motivo para usar el método siya se supiese laraíz. Por lo tanto, se requiere estimarel error de manera tal que no incluya el conocimiento previo de la raíz. De manera análoga a como se ve en la sección 3.3, se puede calcular el error relativo aproximado € , d lae siguientemanera [recuérdese la ecuación (3.5)]:
donde es laraíz de la iteraciónactual y xYterior es elvalordela raíz de la iteración anterior. Se usa el valor absoluto ya que, en general importa sólo la magnitud de E , sin considerar su signo. Cuando I E, I es menor que un valor previamente fijado, que define el criterio de paro, el programa se detiene.
EJEMPLO 4.4 Estimación del error para el método de la bisección
Enunciado del problema:úsese la ecuación (4.2) paraestimarelerror de las iteraciones del ejemplo 4.3. Solución: las primeras dos estimaciones de la raíz en el ejemplo 4.3 fueron 0.5 y 0.75. Sustituyendo estos valoresen la ecuación (4.2) se obtiene:
lea'
=
1
1
0.75 - 0.5 100% = 33.3% 0.75
Recuérdese queel error exacto para la raíz estimada de O.75 es del 32.2%. De esta manera, E, es mayor que E , . Este comportamiento se muestra en lasotrasiteraciones Iteraci6n
5.3
1 2 3 4 5
9 4.69
Xr
0.5 O. 75 0.625 0.81 0.5625 0.59375
I 4
?fío
11.8 32.2 10.2
/%It
Oh
33.3 20.0 11.1
128
INGENIEROS MÉTODOS
FIGURA 4.7
NUMÉRICOS PARA
Errores del método de bisección. Se grafican los errores verdadero y aproximado contra el número de iteraciones.
Estos resultados, junto con los de las iteraciones subsiguientes se resumenenlafigura 4.7. Lanaturaleza“desigual”delerrorreal se debe a que para el método de la bisección laraíz exacta se encuentra en cualquier lugar dentro del intervalo.Los errores verdadero y aproximado son casi igualescuando el intervalo está centrado sobrela raíz. Cuando la raíz se encuentra cerca de un extremo.del intervalo, entonces los errores son muy diferentes. I
Aunque el error aproximado no proporciona una estimación exacta del error verdadero, la figura 4.7 sugiere que E , capta la dirección des,endente de E,. Además, la gráfica muestra una característica muy interesante; que E, siempre es mayor que E,. Por lo tanto, cuando E, es menor que E, los cálculos se pueden terminar con la confianza de saber que laraíz es al menos tan exacta como elnivel específico prefijado. Aunque siempre es dañino aventurar conclusiones generales de un sólo ejemplo, se puede demostrar que E, siempre será mayor que E, en
METODOS QUE USAN INTERVALOS
129
el método de bisección. Esto se debe a que cada vez que se encuentra una aproximación a la raíz usando bisecciones como x, = (xr + (x,)/2, se sabe que la raíz exacta cae en algún lugar dentro de intervalo (x, x r ) / 2 = b / 2 . Por lo tanto, la raíz debe situarse dentro de f A x/2 de la aproximación (Fig. 4.8). Por ejemplo cuando se terminó el ejemplo 4.3 se pudo decir definitivamente que:
X,
=
0.562 5
+
-
0.062 5
FIGURA 4.8
Tres formas diferentes en que un intervalo puede agrupar a la raíz. En a) el valor verdadero cae en el centro del intervalo, mietras que en b) y c ) el valor se acerca a uno de los extremos. Nótese que la diferencia entre el valor verdaderoy el punto medio del intervalojamás sobrepasa la longitud media del intervalo, o A x / 2 .
FIGURA 4.9
Esauema gráfico del porqué la estimación del error en el método de bisección (Ax/2) esequivalente a laestimaciónactualdelaraíz (xrnueuo) menos la estimación anterior de la raíz
130
MÉTODOS
NUMÉRICOS PARA INGENIEROS
Debido a que A x/2 = xnUevo - Xanierior (Fig. 4.9), la ecuación (4.2) proporciona un límitesuperior exacto sobre elerror real. Para que se rebase este límite, la raíz reai tendría que caer fuera del intervalo que la contiene, lo cual, pordefiniciiin jamás ocurriráenelmktododebisecciijn. El ejemplo 4.7 muestra otras técnicas de localización de raíces que no siempre se portan tan eficientes. Aunque el método de bisección, en general es más lento que otrosmétodos, la elegancia del análisis de error, ciertamente es un aspecto positivo que puede hacerlo atractivo paraciertas aplicaciones de la ingeniería.
4.2.2 Programación del método de bisección El algoritmo de la figura 4.5: ahora se presenta en un programa que se muestra en la figura 4.10. El programa usa una funcicin (línea 100) que facilita la localización de laraíz y las modificaciones a la función. Ade: más, se incluye la línea 200 para verificar la posibilidad de divisiones por cero durante la evaluación del error. Tal caso se presenta cuando el intervalo está centrado respecto al origen. En este caso, la ecuación (4.2) es infinita. Si esto ocurre, el programa salta sobre la evaluación del error para esa iteraci6n. El programa de la figura 4.10 no es muy legible para el usuario; está diseñado únicamente para calcular la respuesta, el usuario debe hacerlo más fácil de usar y de entender. Dentro del paquete de NUMERICOMP asociado con este texto se proporciona un ejemplo de un programa legible al usuario para encontrar raíces de ecuaciones. El siguiente ejemplo
F
1
REID
(Verifica si XL y XU encierran una raiz) f
A.AOA H = LN NI P R I N T "NO SF ENCON'TRU L A R A I ? " PRINT YR,€A L / O GUTO 31o . . . !:u, P R I N T k N . E A . N I
74*:, P'nj
lol:, ..
_.
2"o
c.010 310
36,r ilir
PRINT "ILA R A I L E I A C I A FS =":X.R END
XR = inicial estimación de la raíz (Evaluación para determcnar que subintervalo contiene a la raizl XN = nueva aproximación a la raíz EA = error porcentual calculado (Prueba de error)
STOP END
FIGURA 4.10
P r o g r a m ap a r a
se le va a
el método de bisección.
METODOS QUE
131
muestra el uso de NUMERICOMP para encontrar raíces. También proporciona una buena referencia para valorary examinar los programas del usuario.
EJEMPLO 4.5 Localización de raíces usando la computadora
Enunciado del problema: asociado con los programas de NUMERICOMP, se encuentra un programa legible al usuario sobre el métodode bisección. Se puede usar este programa para resolver un problema de diseño asociado con el ejemplo del paracaidista analizado en el capítulo 1. Como se recordará, la velocidad del paracaidista está dada, en función del tiempo, de lasiguiente manera:
[E4.5.1] donde u es la velocidad del paracaidista en centímetros por segundo, g es la constante gravitacional cuyo valor es 980 cm / s2, m es la masa del paracaidista cuyo valores 68 100 g y c es el coeficiente de rozamiento. En el ejemplo l.1 se calculó la velocidad del paracaidista en función del tiempo para valores dados de m ,c y g. Sin embargo, supóngase que se desea controlar el movimiento del paracaidista de tal forma que se alcance una velocidad prefijada en caída libre despuésde un tiempo dado. En este caso, se debe seleccionar un valor apropiado de c que satisfaga los requisitos de diseñocuando se mantengan constantesm,g, t y u. Una ojeada a la ecuación a (E4.5.1) muestra que c no se puede calcular explícitamente en función de las variables conocidas. Supóngase que se desea que la velocidaddelparacaidista alcance un valorde 4 O00 cm/s después de7 s. De esta manera, se debe determinarun valor de c tal que:
[E4.5.2] con t = 7
S
y u = 4 O00 cm/s.
Solución: para implementar el método de BISECCIÓN, se requiere obtener un intervaloinicialque contenga alvalor de c quesatisfaga la Es conveniente seleccionar este intervalo conjuntamente ecuación (E4.5.2). con la opción de graficación de BISECCIÓN que viene con el disco (opción 3). El programa pregunta los valores mínimo y máximo de x y de f (x) generando la grdfica mostrada en la figura 4.1 l a después que se han introducido las dimensionesde la gráfica. Puede verse que existe una raíz entre 10 O00 y 15 O00 g / s . El programa BISECCIÓN pregunta por un límite máximo de iteraciones permitido, un error de convergencia E , y un límite inferior y superior
132
MÉTODOS
FIGURA 4.1 1
NUMERICOS
PARA INGENIEROS
a) Gráfica de la ecuación (E 4.5.2) b) Resultados para determinar el coeficiente de rozamiento usando BISECCION enel problema del paracaidista.
para la raíz. La figura 4.1lb muestra estos valores, junto con la raíz calculada d e 11 643.14 g / s. Nótese que con 16 iteraciones se obtiene un valor aproximado a la raíz con un error menor de E,. Más aún, la computadora muestra una verificación del error de: f(11643.14)
=
1.025391 X lo-'
para confirmar los resultados. Si la exactitud que se requiere n o se hubiera alcanzado con el número especificado de iteraciones, entonces el algoritmo habría terminado después d e 30 iteraciones. Estos ;esultados están basados en el algoritmo simple del método de BISECCION con el uso'de rutinas de entrada y salida legibles al usuario. El algoritmo usado es similar al d e la figura 4.10. El usuario debe estar listo para escribir sus propios programas sobre el método de bisección. Si tiene los programas de NUMERICOMP, entonces los puede usar como modelo y para verificar que sus programas sean adecuados.
I 4.3 MÉTODO
DE LA REGLAFALSA
Aunque el método debisección es una técnica perfectamenteválida para determinar raíces, su enfoquees relativamente ineficiente. Una alternati-
133
METODOS QUE USAN INTERVALOS
va mejorada es la del método de la regla falsa está basado en una idea para aproximarse en forma más eficiente a laraíz. Un defecto del método de bisección es que aldividir el intervalo xI a x, enmitades iguales, no se toma en consideración lamagnitudde f (x()y de f (x,). Por ejemplo, si f (XI) está mucho más cerca de cero que f (xu),es lógico que la raíz se encuentra más cerca de xI que de x, (Fig. 4.12). Este método alternativo aprovecha la idea de unir los puntos con una línea recta. La intersección de esta línea con el eje x proporciona una mejor estimación de la raíz.El reemplazamiento de la curva por una línea recta da una “posición falsa” de la raíz, de aquí el.nombrede método de la regla falsa o en latín, regula falsi. También se le conoce como método de interpolaci6n lineal. Con el uso detriángulos semejantes (Fig. 4.12), la intersección de la línea recta y el eje x se puede calcular de la siguiente manera:
que se puede resolver Dara (véase el recuadro 4.1 para mayores detalles)
FIGURA 4.12
~
~
”
Esquema gráfico del método de la regla falsa. La fórmula se deriva de
los triángulos semejantes (áreas sombreadas).
~
I
-
.
-
~
.
-. ^ _ , ~ .
l_..*_”,~-..”ll””.””
-
.
”
-
.”
134
PARA
RECUADRO 4.1 Derivacióndelmétodo Multiplicandoencruzla
Dividiendo entre
INGENIEROS
de lo regla falso
ecuación (4.3) se obtiene:
sumando y restando x, del lado derecho:
- f (x"):
xr = xuf(x1) - x,f(xu) f(X/) - f(xu) Ésta es una forma del
METODOS NUMtRICOS
método de la regla falsa. Nótese que esto permite cualcular la raíz x, en función de los -1: mites inferior, Y superior x u . Se puede Ordenar de una manera alternativa, expandiéndola:
x, = xu -
f(xu>(x/- xu) f (XI) - f(xJ
que es igual a la ecuación (4.4).Se usa esta forma ya que es directamente con el método de la secante analizado en el capítulo 5.
Esta es la fórmula de la regla falsa. El valor de xr, calculado con la ecuación (3.4), reemplaza a uno de los dos valores, x, o a x, que produzca un valor de la función que tenga el mismo signo de f (x,). De esta manera, los valores xl y x, siempre encierran a la raíz. El proceso se repite hasta que la aproximación a la raíz sea adecuada. El algoritmo es idéntico al de la bisección (Fig. 4.6) con la excepción de que la ecuación (4.4) se usa en los pasos 2 y 4. Además, se usan los mismos criterios de paro [(Ec. (4.2)] para detener los cSlculos.
b
135
M ~ O D O QUE S USAN INTERVALOS
Solución: como en el ejemplo 4.3, inícieme los cálculos con los valores iniciales x, = O y x, = 1. Primera iteración: x, = X,
o
j(x,>= 1
= 1
f(x,) = -0.632 12
El error relativo real se puede estimar como:
1 4
1
=
0.567 143 29 - 0.6127 0.567 143 29
I 1
loo%
=
8.0%
Segunda iteración:
Por lo tanto, laraíz se encuentra dentro del primer subintervalo y x, se convierte enellímite superior de la siguiente iteración, x, = 0.6127. x/ = x, = X,
=
o
fh)
=
1
0.612 7 f(x,) -0.070 8
0.612 7 -
-0.070 8(0 - 0.612 7) = 0.572 19 1 - (-0.070 8)
E, =
0.89%
El error aproximado se puede calcular como:
I 4=
I
0.572 19 - 0.612 7 0.572 19
=
7.088
Se pueden llevar a cabo iteraciones adicionales para mejorar la estimacióndelaraíz.
Puede emitirse una opinión más completa sobre la eficiencia relativa de los métodos de bisección y de la regla falsa al observar la figura 4.13 que muestra gráficas del error relativo porcentual de los ejemplos 4.3 y 4.6, Nótese cómo el error decrece mucho más rápidamente para el mé-
136
METODOS
FIGURA 4.13
NUMÉRICOS
PARA INGENIEROS
Comparación de errores relativos de los métodos de la regla falsa y de btsecciones para f ( x ) = e' - x.
todo de la regla falsa que para el de bisecciones ya que el primero es un esquema más eficiente para lalocalizaciónde raíces. Recuérdese que en el método de bisección el intervalo entre x/y x, decrece durante los cálculos. Por lo tanto, el intervalo dado por A x/ 2 = x, - x,!,' 2 proporciona una medida del error en estas aproximaciones. Este no es el caso para el método de lareglafalsaya que uno de los extremos puede permanecer fijo a lo largo de los cálculos, mientras que el otro converge a la raíz. Como en el caso, del ejemplo 4.4 donde el extremo inferior xise sostuvo en cero, mientras que x, convergió a la raíz. En tales casos, el intervalo no se acorta, sino que se mantiene más o menos constante. El ejemplo 4.6 sugiere que la ecuación (4.2) representa un criterio de error muy conservador. De hecho, la ecuación (4.2) constituye una aproximación de la discrepancia dela iteración preuia. Esto se debe a que para cada caso, tai como en el ejemplo 4.6, donde el método converge rápidamente (por ejemplo, el error se reduce casi una orden de magni~
METODOS
137
tud por iteración), la iteraciónactual es unaaproximaciónmucho mejor alvalorrealdelaraízqueelresultadodelaiteraciónprevia xYterior.Por lo tanto, el numerador de la ecuación (4.2) representa la diferencia de la iteración previa.En consecuencia, hay confianza que cuando se satisface la ecuación (4.2), laraíz se conoce con mayor exactitud superando la tolerancia preestablecida. Sin embargo, como se veenla siguiente sección, existen casos donde la regla de la posición falsa converge lentamente. En estos casos la ecuación (4.2) no es confiable y se debe desarrollar un criteriodiferentede paro.
4.3.1
Desventajasdelmétododelareglafalsa
Aunque el método de la regla falsa pareciera siempre ser el mejor de los que usan intervalos, hay casos donde funciona deficientemente. En efecto, como en el ejemplo siguiente, hay ciertos casos donde el método de bisección da mejores resultados.
EJEMPLO 4.7 Un caso donde el método de bisecciónes preferible al de4a'regla falsa
Enunciado del problema: úsense los métodos de bisección y de la regla falsa para localizar laraíz de:
entre x = O y x = 1.3. Solución: usando bisección, losresultados se resumen como:
1 2
0.975
O
0.65
3 4 5
0.975 0.975
1.3 1.3 1.3 1.1375 1.05625
-
0.65 0.975 33.3 1.1375 14.3 1.05625 1 .O1 5625 4.0
35 2.5 13.8 5.6 1.6
7.7
De esta manera, después de cinco iteraciones.El error verdadero se reduce a menos del 2%. Con la regia falsa se obtiene un esquema muy diferente
METODOS NUMERICOS PARA INGENIEROS
138
~~~
1 2 3 4 5
O
1.3 0.09430 0.094300.18176 1.3 48.1 0.18176 1.3 0.26287 30.9 0.26287 1.3 0.3381 1 22.3 0.33811 1.3 0.40788 17.1
~
90.6 81.8 73.7 66.2 59.2
Después de cinco iteraciones,el error verdadero se ha reducido ai 59%.Además, nóteseque 1 E, 1 < 1 eV 1 . De estaforma, el erroraproximado es engañoso. Se puede obtener mayor información examinando unagráfica de la función. En la figura 4.14 la curva viola una hipótesis sobre la cual
I
FIGURA 4.14 Gráfica de la función f(x)
= x"
- 1,
lenta del método de la regla falsa.
ilustración de la convergencia
139
MhODOS QUE
se basa la regla falsa; esto es, si f (x1) se encuentra mucho miis cerca de cero que f (x,), entonces la raíz se encuentra más cerca a x1 que x, (recuérdese la figura 4.12). De acuerdo a la gráfica de esta función, la inversa es verdadera.
El ejemplo anterior ilustra que en general no es posible hacer generalizaciones relacionadas con los métodos de obtención de raíces. Aunque un método como el de laregla falsa, en general es superiar al de bisección, hay, invariablemente casos especiales que violanlas conclusiones generales. Por lo tanto, además de usar la ecuación (4.2), los resultados se pueden verificar sustituyendo la raíz aproximada en la ecuación original y determinar si el resultado se acerca a cero. Estas pruebas se deben incorporar en todos los programas que localizan raíces.
4.3.2
Programa para el método de la regla falsa
Se puededesarrollardirectamente un programapara lareglafalsa a partir del código del método de bisección de la figura 4.10. La única modificación es la de sustituir la ecuación (4.4) en las líneas 130 y 190. Además, la prueba contra cero sugerida en la última sección, también se debe incorporar enel código.
4.4 BúSQUEDASCONINCREMENTOS DETERMINANDOUNA APROXIMACIóNINICIAL Además de verificar una respuesta individual, se debe determinar si se han localizado todas las raíces posibles.Como se mencionó anteriormente, en general, unagráficadelafunciónayudaráen esta tarea. Otra opción es incorporar una búsqueda incremental al principio del progrma. Consiste enempezaren un extremode laregióndeinterés y realizar evaluaciones de la función con pequeños intervalos a lo largo de la región. Cuando lafuncióncambiade signo, se supone que unaraíz cae dentro del incremento. Los valores de x de los extremos del intervalo pueden servir de valores iniciales para una de las técnicas descritas en este capituloqueusanintervalos. Un problema aunado a los métodos de búsquedas incrementales es el de escoger la longitud del incremento. Si la longitud es muy pequeña, la búsqueda puede consumir demasiado tiempo. Por el otro lado, sila longitud es muy grande, existe la posibilidad de que las raíces muy cercanas entre sí pasen desapercibidas (Fig.4.15). El problema se combina con
148
,
NUMÉRICOS
FIGURA 4.1 5
METODOS
PARA INGENIEROS
Casos donde las raíces se pueden brincar debido a que las longitudes de los intervalos en los métodos de búsquedas incrementales son dela últirna raízes múltiple y se iba a brinmasiado grandes. Nótese que car independientemente de la longitud del incremento.
la posible existencia de raíces múltiples. Un remedio parcial para estos casos en calcular la primera derivada de la función f' (x) en los extremos del intervalo. Si la derivada cambia de signo, entonces puede existir un máximo o un mínimo en ese intervalo,lo que sugiere una búsqueda más minuciosa para detectar la posibilidad de una raíz. Aunque estas modificaciones, o el empleo de un incremento muy fino pueden solucionar enparte el problema,sedebeaclararque los métodos sencillos tales como el de búsqueda incremental no son infalibles. Se debe tener conocimiento de otras informaciones que profundicen en la localización de raícesa fin decomplementar las técnicas automáticas. Esta información se puede encontrar graficando la función y entendiendo el problema físico de donde se originó la ecuación.
PROBLEMAS Cálculos a mano 4.1
Determínenselasraícesreales f(x)
=
de:
- 0 . 8 7 4 ~+ ~ 1 . 7 5 ~+ 2.627
a) GrSrficamente b) Usando la fórmulacuadrática c ) Usando el método de bisección hasta tres iteraciones para determinar la raíz m& alta. Empléense como valores iniciales xi = 2.9 y x, = 3.1.Calcúlese elerror estimado ea y el errorverdadero E,, después de cada iteración.
141
METODOS QUE USAN INTERVALOS
4.2
Determínense las raíces reales de
f(x) = - 2 . 1
+
6.21~ - 3 . 9 ~ '+ 0 . 6 6 7 ~ ~
a) Gráficamente b) Usando bisección para localizar la raíz más pequeña. Empléense como valores iniciales x, = 0.4 y x, = 0.6 e itérese hasta que el error estimado F, se encuentre abajo de t , = 4%
4.3
Determhense las raíces reales de: f(x) = -23.33
+
7 9 . 3 5 ~ " 8 8 . 0 9+~4~1 . 6 ~ ~8 . 6 8 ~ + ~0 . 6 5 8 ~ ~
a Gráficamente b) Usando bisección para determinar la raíz más alta para es = 1 W . Empléese como valores iniciales x, = 4.5 y x , = 5. c) Realícense los mismos cálculos de b) pero usando el método de la regla falsa.
4.4
Determínense las raíces reales de:
f(x)
=
9.36 - 2 1 . 9 6 3 ~+ 16.2965~'- 3 . 7 0 3 7 7 ~ ~
a)
Gráficamente b) Usando el método de la regla falsa con un valor de es correspondiente a tres' cifras significativas para determinar laraíz más baja.
4.5
Localícese la primer raíz diferente de cero de tanx = 1.1.x donde x está en radianes. Úsese una técnica gr6fica y bisección con valores iniciales O. l y O.G. Realícense los cálculos hasta que E, sea menor del es = 10%. Verifíquense también los errores sustituyendo la respuesta final en la ecuación original.
4.6
Determínese la raíz real de In x = 0.5 a)
Gráficamente b) Usando el método de bisección con tres iteraciones y valores iniciales x) = 1 y x, = 2. c) Usando el método dela regla falsa con tres iteraciones y los mismos valores iniciales del inciso anterior.
4.7
Determínese la raíz real de:
f(x)
..
1 -0.6~ =
X
i
a) Analíticamente b) Gráficamente C) Usando el método dela regla falsa con tres iteraciones y valores iniciales de 1.5 y de 2.0. Calcúlese el error aproximado E, y el error verdadero E, después de cada iteración.
142
NUMÉRICOS PARA INGENIEROS
MÉTODOS
4.8
Encuéntrese laraíz cuadrada positiva de 10 usando el método de la regla falsa con = 0 . 5 % . Empléense los valoresiniciales de x, = 3 y x, = 3.2.
E,
4.9
Encuéntrese laraízpositivamás
x'
1
sen
XI
=
pequeña dela función (x está dada en radianes) :
4
usando el método de la regla falsa. Para localizar la región en que cae la raíz, primero grafíquese la función para valores de x entre O y 4. Realícense los cálculos hasta que eo haga que se cumpla es = 1 B . Verifíquese la respuesta final sustituyéndola en la función original.
4.10 Encuéntrese laraízrealpositiva
de:
+
!(x) = x4 - 8 . 6 ~ ~3 5 . 5 1 ~ '
464x
-
998.46
usando el método de la regla falsa. Úsese una gráfica para determinar los valores iniciales y realizar los cálculos con e , = O. 1 % .
4.11 Determínese laraízreal f(x) a)
= x3 -
de:
100
Analíticamente
b) Con el método de lareglafalsa 4.12 La velocidaddelparacaidista
con es
=
0.1 %
está dada por la fórmula:
donde g = 980. Para un paracaidista de masa m = 75 O00 g calcúlese el coefic con u = 3600 cm/s en t = 6 s . Úseseelmétodo de cientederozamiento lareglafalsa paradeterminar c con es = O. 1 % .
Problemas para resolver con computadora 4.13 Vuélvase a programar lafigura 4.10 de forma tal que sea más legible al usuario.
Entreotras cosas: Documéntese indicando la funciónde cada secciór. b) Etiquétense las entradas y lassalidas c) Agréguese una prueba que verifique si los valores iniciales x, y x,, encierran a laraíz. d ) Agréguese una prueba de verificación para que laraíz obtenida se sustituya en la ecuación originalpara comprobar si el resultado final se ace:ca a cero. a)
4.14 Pruébese el programa del problema 4 . 1 3 duplicando los cálculos del ejemplo 4.3. 4.15 Úsese el programa del problema 4 . 1 3 para repetir desde el problema 4 . 1 al 4.6.
MÉTODOS
143
QUE
4.16 Repítanse los problemas 4 . 1 4 y 4.15 usando los programas de NUMERICOMP dis-
ponibles con el texto. Úsense las capacidades gráficas de este programa para verificar los resultados.
4.17 Úsense los programas de NUMERICOMP para encontrar las raíces reales de dos
funciones polinomiales cualesquiera. Grafíquense las funciones sobre un rango definido para obtener los límitesinferior y superior de las raíces.
4.18 Repítase el programa 4.17 usando dos funciones trascendentales 4.19 En este problema se usan solamente las capacidades gráficas de los programas NUMERICOMP disponibles con el texto. LOSprogramas trazan la función sobre inter-
valos más y más pequeños para incrementar la cantidad de cifras significativasque se quieraestimar una raíz. Empiécese con f(x) = e-' sen (10 x). Grafíquese la funcióncon un rango a escala completa desde x = O hasta x = 2.5. Estímese laraíz. Trácese nuevamente la funciónsobre el rango x = 0.5 a x = 1.0.Estímese la raíz. Finalmente, grafíquese la función sobre un rango de 0.6 a 0.7. Esto permite estimar laraíz con dos cifras significativas.
4.20 Desarróllese un programa legible al usuario para el método de la regla falsa basado en la sección 4 . 3 . 2 . Pruébese el programa con el ejemplo 4.6.
4.21 Úsese el programa del problema 4 . 2 0 para probar los cálculos del ejemplo 4.7. Realícense corridas de 5, 10, 15 y más iteraciones hasta que elerrorrelativo porcentual sea menor del O . 1%. Grafíquense los errores relativos porcentualesapro-
ximados contra el número de iteraciones sobre papel semilogarítmico. Interprétense los resultados.
C A P í T U L OC I N C O MÉTODOS ABIERTOS
En los métodos del capítulo anterior que usan intervalos, laraíz se encuentra dentro del mismo, dado porun límite inferior y otro superior. La aplicación repetida de estos métodos siempre genera aproximacionesmás y más cercanas ala raíz. A tales métodos se les conoce como conuergentes ya que se acercan progresivamente a laraíz a medida que crece el número de iteraciones (Fig. 5.l a ) .
FIGURA 5.1
Esquema gráfico de las diferencias fundamentales entre los métodos que usan intervalos a) y los métodos abiertosb) y c) en la localización de raíces. En a), que ilustra elmétodo debisección, la raíz está registrada dentro del intervalo dodo por x, y x,. En contraste, con los métodos abiertos, ilustrados en b) y c), se usa una fórmula para proyectarxi a xi+, con un esquema iterativo. De esta manera, el método puede divergir b) o converger c) rápidamente, dependiendo del punto inicial.
146
MÉTODOS
NUMÉRICOS
PARA INGENIEROS
En contraste con éstos, los métodos abiertos que se describen en este capítulo, se basanenfórmulasquerequierende un solo valor x o de un par de ellos pero que no necesariamente encierran a la raíz. Como tales, algunas veces diuergen o se alejan de la raíz a medida que crece el número de iteraciones (Fig. 5.lb). Sin embargo, cuando los métodos abiertos convergen (Fig. 5.IC),en general lo hacen mucho más rápido que los métodos que usan intervalos. Se empieza el análisis de los métodos abiertos con una versión simple que es útil para ilustrar su forma general y también para demostrar el concepto de convergencia.
5.1
ITERACIóN DE PUNTOFIJO Como se mencionó anteriormente, los métodos abiertos emplean una fórmula que predice una aproximación a laraíz.Talfórmula se puede desarrollarparalaiteracióndepunto fijo, rearreglando laecuación f(x)=O de talformaque x quede delladoizquierdo de la ecuación: x =
[5.11
Esta transformación se puede llevar a cabo mediante operaciones algebraicas o simplemente agregando x a cada lado de la ecuación original. Por ejemplo: x2-2x+3=o se puede reordenar para obtener: x = ” -x2
+3 í!
mientrasquesen x = O puedetransformarseenlaformadelaecuación (5.1)sumándole x a ambos lados para obtener: x = senx
+
x
La utilidad de la ecuación (5.1) es que proporciona una fórmula para predecir un valor de x en función de x. De esta manera, dada un aproximación inicial a la raíz, xi, la ecuación (5.1) se puede usar para obtener una nueva aproximación x i + l , expresada porlafórmulaiterativa:
Como con otras fórmulas iterativas del libro, el error aproximado de esta ecuación se puedecalcularusandoelestimador de error [Ec. (3.5)1:
147
MhODOS ABIERTOS
EJEMPLO 5.1 Iteración de punto fijo
Enunciado del problema: úsese iteración raíz de f(x) = e “x “x.
de punto fijo para localizar
la
Solución: lafunción se puede separar directamente y expresarse enla forma de ecuación (5.2) como = e-”. Empezandocon un valor inicial de x,,=-O, se puede aplicar esta ecuación iterativa y calcular: I
Iteraci6n. i
O 1 2 3 4 5 6 7 8 9 10 I
X
O
100.01 .oooooo 171.8 0.367879 46.9 0.692201 38.3 0.500473 17.40.606244 11.20.545396 5.90 0.57961 2 3.48 0.5601 15 0.571 143 0.564879
1.93 1.1
1 O0 76.3 35.1 22.1 11.8 6.89 3.83 2.20 1.24 O. 705 0.399
1
De esta manera, cada iteración acerca cada vez más alvalorestimado con elvalorverdadero de laraíz, o sea 0.567 143 29.
RECUADRO 5.1
Convergencia de la iteración de punto fiio
AI analizar la figura 5.3, se debe notar que la iteración de punto fijo converge si en la región de interés g’ ( x ) < 1. En otras palabras, la convergencia ocurre silamagnitud de la pendiente de g ( x ) es menor que la pendiente de la línea f( x ) = x. Esta observaciónse puede demostrar teóricamente. Recuérdese que la ecuación aproximada es: Xi+l
[B5.1.2]
= g(xi)
Supóngase que la solución verdadera es:
x, = S(&) Restando estas dos ecuaciones se obtiene: xr -
Xi+l
= g(xJ - g(xJ
En el cálculo, existe un principio llamado teorema del valor medio (sección 3.5.2).Dice que si una función g ( x ) y su primera derivada son continuas sobre un intervalo a < x < b, entonces existe un valor de x = { dentro del intervalo para el que:
[B5.1.1]
El lado derecho de esta ecuación es la pendiente de la línea que une a g ( a ) y g ( b ) , De esta manera, el teorema del valor medio dice que hay al menos un punto entre a y b que tiene una pendiente, denotada por S({), que es paralelaa la línea que une g(a) con g ( b ) (Fig. 3.5). Ahora, si se hace a = xi y b = x, el lado derecho se puede expresar como: de la ecuación (B5.1.2)
MÉTODOS
148
NUMÉRICOS
PARA INGENIEROS
Por consiguiente, si g’ ( ) < 1, entonces los errores decrecen. con cada iteración. Si g ’ ( ) > l , entonces los donde 4 se encuentra en alguna Parte dentro de x, Y x,. errores crecen. Nótese también que sila derivada es posiEste resultado se puede sustituir en la ecuación (B5.1.2) tiva,los emores serán positivos, y por lo tanto, la solucióo para obtener: iterativa será monótona (Figs. 5.3a y c). Si la derivada es [B5.1,31 negativa, entonces los errores oscilarán (Figs. 5.3b y d ) . X, - xi+1 = (X, - xi) S’([) Un corolario de este análisis demuetra que cuando Si elerrorverdaderoparalaj-ésimaiteración se define como: el método converge, el error es casi proporcional a y menor que el error del paso anterior. Por esta razón, la iteraEt,! = x, - xi ción de punto fijo se dice que es linealmente conuergente. S k r ) - g(xJ =
(xr
- Xi) g ‘ ( 8
<
entonces la ecuación (B5.1.3) se convierte en: Et,i+l
= S’(()
Et,¡
5.1.1
Convergencia
Nótese que el error relativo exacto en cada iteración del ejemplo 5.1 es casi proporcional (por un factor de 0.5 a 0.6) al error de la iteración anterior. Esta propiedad, conocida como convergencia lineal, es característica de la iteración de punto fijo. En el recuadro 5.1 se presenta una base teórica para esta observación.
FIGURA 5.2
Dos métodos gráficos alternativos paro determinar la raíz de f(x) = e ‘-x. a) Raíz en el punto donde ésta cruza aleje x ; b) raíz en la intersección de las funciones componentes.
METODOS
149
ABIERTOS
Además de la “velocidad” de convergencia, se debe hacer hincapié en este momento sobre la“posibilidad” de convergencia. Los conceptos de convergencia y de divergencia se pueden ilustrar gráficamente. Recuérdese que enla sección 4.1 se graficó una función para visualizar su estructuray su comportamiento (Ej. 4.1). Esta función se vuel5.2a. Un planteamientográficodiferente es el ve a graficarenlafigura desepararlaecuación f ( x ) = O endospartes, como en: flk)
= f2 (x)
Entonces las dos ecuaciones: Y1
=fl(4
r5.31
Y2
= f2 (x)
P.41
Y
se pueden graficar por separado (Fig. 5.2b). Los valores de x correspondientes a las intersecciones de estas funciones representan las raíces de f(x) = o.
EJEMPLO 5.2 El método gráfico de dos
curvas
Enunciado del problema: sepárese la ecuación e “x tes y determínese suraíz gráficamente.
-x
= O en dos par-
Solución: reformúlese la ecuación como yl = x y y 2 = e -’. Calcúlense los siguientes valores: X
Y1
Y2
0.0 0.2 0.4 0.6 0.8 1 .o
0.0 0.2 0.4 0.6 0.8
1.O00 0.819 0.670 0.549 0.449 0.368
1 .o
Estos puntos se gráfican en la figura 5.2b. La intersección de las dos curvas indica una aproximación dex = 0.57, que correspondeal punto donde cruzaal eje x. la curvaoriginal en lafigura 5 . 2 ~
METODOS NUMERICOS
150
PARA INGENIEROS
El método de las dos curvas se puede usar ahora para ilustrar laconvergencia y divergencia de la iteración de punto fijo. Enprimerlugar,la ecuación (5.1) se puede expresar como un par de ecuaciones: y , = x y y2= g (x). Estas dos ecuaciones se pueden graficar por separado. Tal fue el caso de las ecuaciones (5.3) y (5.4) las raíces de f ( x ) = O sonigualesalvalordela abscisa enla intersección de las dos curvas. Enlafigura 5.3 se graficanlafunción y , = x y cuatro esquemas diferentesde la función y2= g(x).
FIGURA 5.3
__I__
Esquema gráfico de la convergencia a) y b) y la divergencia c) y d) de la iteración de punto fino. A las grafips a) y c) seles conoce como patrones monótonos, mientras que a b) y d) se les conoce.como patrones oscilatorios o en espiral. Nótese que la convergencia se obtiene cuando 1 g’(x) 1 < 1.
_LI_I_-^. .
~
MnODOS ABIERTOS
lb1
Enelprimer caso (Fig. 5 . 3 ~ 4el, valorinicial x, se usa para determinar el punto correspondiente a la curva yz, [xg, g(xo)]. El punto [x1, xl] se encuentra moviendo la curva y1 a la izquierda y horizontalmente. Estos movimientos son equivalentes a la primera iteración del método de punto fijo:
De esta manera, en la ecuación y en la gráfica se usa un valor inicial x. para obtener la aproximación xI. La siguiente iteración consiste en moverse al punto [xl,g (xl)]b después a [x2, x2]. Esta iteración es equivalente a la ecuación:
La solución en la figura
5.3a es convergente ya que la aproximación de
x se acerca más a laraíz con cada iteración. Lo mismo se cumple para
la figura 5.3b. Sin embargo, éste no es el caso para las figuras 5 . 3 y~d , en donde las iteraciones divergen de la raíz. Nótese que la convergencia ocurre únicamente cuando el valor de la pendiente de y2 = g ( x ) es menor alvalor de la pendiente de yI = x, esto es, cuando 19' ( x ) I c 1. En el recuadro 5.1 se presenta una derivación teórica de este resultado.
5.1.2
de punto fijo
Programaparalaiteración
El algoritmo para la computadora de la iteración de punto fijo es extremadamente simple. Consiste en un ciclo que calcula iterativamente nuevas aproximaciones junto con una declaración lógica que determina cuando se hacumplidoelcriterio de paro.
FORTRAN
,
BASIC
lFunc16n a la que se desea calcular la raizl
1X I I Iü
Ill I N P U rX R . E S . 1213 F O RN I = 1 TU In 130 XN = F N F C X R ) 140 I F XN = 0, THEN 170 150 E A = AB5 ( I X N X R ) I X N ) e-.
f
-
1W
160 I F E A \ 1.70 XR = XN 180 NEXT N I I90 P R I N T" N O 200 NNII
I70 1 so 2 a10
a
210 URITE~6.3?XN,EA,NI F O R M h ,TZCF' I 0 . 3 , I S f
220
-
= ES THEN 210
I
SE
ES = errorporcentualaceptable
IM = niutm e mrd aeae xrcm ol oon e s XN = aproximact6n a laraíz EA = aproximaci6nporcentualdel
-
error ( p r u e b ad e
ENCONTRO L A R A I L "
P R I N TX N . E A . N I END
STOP END
FIGURA 5.4
Programa parala iteración de punto fijo.Nótese general es similar al de los métodos abiertos.
que este algoritmo
METODOS NUMERICOS PARA INGENIEROS
152
En la figura 5.4 se presentan los programas en FORTRAN Y BASIC para el algoritmo. Se pueden programar de manera similar otros métodos abiertos, simplemente cambiando la fórmula iterativa (declaración 130).
5.2 MÉTODO
DE NEWTON-RAPHSON
Tal vez, dentro delas fórmulas paralocalizar raíces, la fórmula de NewtonRaphson (Fig. 5.5), sea la más ampliamente usada. Si el valor inicial de el punto la raíz-es x,, entonces se puede extender una tangente desde [x;, f (xi)].El punto donde esta tangente cruza al eje x representa una aproximación mejorada a la raíz. El método de Newton-Raphson se puede derivar geométricamente (una forma de hacerlo es mediante el uso de la serie de Taylor, descrita en el recuadro 5.2). Como en la figura 5.5, la primera derivada en x es equivalente a la pendiente.
que se puede reordenar para obtener:
a la que se conoce como fórmula de Newton-Raphson.
FIGURA 5.5
Esquemagráfico del métododeNewton-Raphson. Se extrapolauna tangente a la función enel punto xi [esto es, f'(x;)] hasta el eje x para obtener una estimación de la raíz en x, + !.
_ l _ _ l
~~.~ ~
153
METODOS ABIERTOS
EJEMPLO 5.3 Método de Newton-Raphson
Enunciadodelproblema:úseseelmétododeNewton-Raphsonpara - x empleando elvalorinicialde x. = O. calcular laraíz de e "x
Solución: laprimeraderivada de lafunción se puede evaluar como: f'(x) = -e-x
1
-
que se puede sustituir, junto con la función original en la ecuación (5.6) para dar: p
Xi+l
= xi -
-e-x'
i
xi -
-
1
h J
,
Empezando con el valor inicial x. = O , se puede aplicar la ecuación iterativa para calcular:
O
0.500000000 0.566311003 0.567143165 0.567143290
1O0
11.8 0.147 0.0000220 <10
De esta manera, el planteamiento converge rápidamente a laraíz real. Nótese que el error relativo en cada iteración decrece mucho más rápido que como lo hace la iteración de punto fijo (compárese con el ejemplo5.1).
5.2.1
Criterios de paro y estimación de errores
Como con los otros métodos de localización de raíces, la ecuación (3.5) se puede usar como un criterio de paro. Además, la derivación del métodocon la seriedeTaylor(recuadro 5.2) proporciona un conocimiento teórico relacionado con la velocidad de convergencia expresado como: Ei+ = O (Ei*).De esta forma, el error debe ser casi proporcional al cuadrado del error anterior.En otras palabras, el número de cifras significativas se duplica aproximadamenteen cada iteración. Este comportamiento se examina enel siguiente ejemplo.
METODOS
154
RECUADRO 5.2
NUMERICOS
Derivación y análisis del error del método de Newton-Raphson a partir de la serie de Taylor
Además de laderivación geométrica [ecuaciones (5.5) y (5.6)], el método de Newton-Raphson se puede derivar también con usoel de la serie Taylor. Esta derivación alternativa es muy útil en el sentido de que muestra la Denetración en la velocidad de convergencia del método. Recuérdese delcapítulo 3 que la serie de Taylor se puede representar como:
0 = f (Xi) + f '(Xi)
(xr
- Xi)
"(O (xr - X,)' + f2
en donde t: se encuentraen parte de1intervalo entre xiy x i + ,. Truncando la serie de Taylor después de la primera derivada, se obtiene unaversión aproximada:
+ f '(Xi)(X¡+l
-
(85.2.3) para obtener:
L
+ f '(Xi)(Xi+l
-
Xi)
[B5.2.4] Ahora, notando que el
es igual a la diferencia entre
xi+l y elvalor real, x, como en: Ev.i+l=xr"xi+l
Xi)
En la intersección con el eje x,f(xi+,) debe ser igual a cero, o:
0 = f (Xi)
[B5.2.3]
L~ ecuación (B5.2.2) se puede restar de la ecuación
"(47 + f( x ~ + I- X¡)' [B5.2.1] 2
f (Xi+l) -- f (Xi)
PARA INGENIEROS
y la ecuación (B5.2.4) se puede expresar como:
[B5.2.2]
que se puede resolver para:
[B5.2.5] L
Si se supone que hay convergencia, entonces xi y t: se deberían aproximar a la raíz x,, y la ecuación (B5.2.5) se
que es idéntica a la ecuación (5.6). De esta forma, se ha derivado el método de Newton-Raphson usando la serie de Taylor. Además de la derivación, la serie de Taylor se puede usar para estimar el error de la fórmula. Esto se puede lograr alutilizar todos los términos de la ecuación B5.2.1 con el resultado exacto. Por esta situación xi+l= x,, en donde x, es el valor exacto de la raíz. Sustituyendo este valor, junto con f(x,) = O en la ecuación (B5.2.1)se obtiene:
puede reordenar para obtener:
[B5.2.6] De acuerdo a la ecuaci6n (B5.2.6) el errores casi proporcional al cuadrado del error anterior. Esto significa que el número de cifras decimales correctas se duplica aproximadamente en cada iteración. A este comportamiento se le llama conoergencia cuadráfica. El ejemplo 5 . 4 ilustra esta propiedad.
EJEMPLO 5.4 Análisis de error en el método de Newton-Raphson
Enunciado del problema: como se dedujo enel recuadro 5.2, el método d e Newton-Raphson es convergente cuadráticamente. Esto es, el error es aproximadamente proporcional al cuadrado del error anterior, dado por: CE5.4.11
1 SS
MÉTODOS ABIERTOS
Examínese esta fórmula y véase si es aplicable a los resultados del ejemplo 5.3. Solución: laprimeraderivada
de !(x) = e
”x
es:
--e-’1
f ‘(x) =
que se puedeevaluaren f’(0.567 143 29)
=
143 29 para dar:
x,= 0.567
-1.567 143
29
La segunda derivada es: fff(x)= e-x
que se puede evaluar, para obtener: f’(0.567 143 29)
=
0.567 143 29
Estos resultadosse pueden sustituir en la ecuación (E5.4.1) para obtener: EV ,’l + l = -
0.567 143 29 Z(”1.567 143 29)
Ev,i2
O
- 0.180 95 E,,i2
€ , , i t 1-
Del ejemplo 5.3, el error inicial fue de Et,0= 0.567 143 29, que se puede sustituirenla ecuación del error para obtener: E,,l
0.18095(0.56714329)2
=
0.058 2
que se acerca al error real de = 0.067 143 29. En la siguiente iteración: 0.180 95(0.06714329)2
Ev,2
=
0.000 815 8
que también se compara favorablemente con el error real de 0.000 832 3. Enla tercera iteración: = 0.180 95(0.000832
=
0.000 O00 125
que es exactamente el error obtenido en el ejemplo 5.3. La estimación del error mejora de esta manera ya que está más cercano a la raíz, xi y 4 se aproximan mejor mediante x, [recuérdese la suposición manejada al derivar la ecuación (B5.2.6) a partir de la ecuación (B5.2.5), en el recuadro 5.21. Finalmente: Eu,4=
0.180 95(0.000 O00 125)2 = 2.83
X
De esta manera este ejemplo ilustra que el error en el método de NewtonRaphson es en este caso, de hecho, casi proporcional (por un factor de O. 180 95) al cuadrado del error en la iteración anterior.
156
MÉTODOS N U M É R I C O S PARA INGENIEROS
5.2.2
Desventajas delmétodo
de Newton-Raphson
Aunque el método de Newton-Raphson en general es muy eficiente, hay situaciones en que se porta deficientemente. Un caso especial -raíces múltiples- se analiza al final del capítulo. Sin embargo, aun cuando se trate de raíces simples, se encuentran dificultades, como en el siguiente ejemplo.
EJEMPLO 5.5 Ejemplo de una función que converge lentamente con el método de Newton-Raphson
Enunciado del problema: determínese la raíz positiva de f ( x ) = x10 - 1 usando el método de Newton-Raphson con un valor inicial de x = 0.5. Solución: la fórmula del método de Newton-Raphson es en este caso:
que se puede usar para calcular:
O
1
2 3 4
5
0.5
51.65 46.485 41.8365 37.65285 33,887565
De esta forma, después de la primera predicción deficiente, el método converge a laraíz 1, pero con una velocidad muy lenta.
Además de la convergencia lenta, debida a la naturaleza de la función, se puedenoriginar otras dificutades,como se ilustra en la figura 5.6. Por ejemplo, la figura 5.6a muestra el caso donde un punto de inflexión -esto es, f ' ( x ) = 0- ocurre en la vecindad de una raíz. Nótese que las iteraciones que empiezan en x divergen progresivamente de la raíz. En la figura 5.6b se ilustra la tendencia del método de Newton-Raphson a oscilar alrededor de un punto mínimo o máximo local. Tales oscilaciones persisten, o, como en la figura 5.6b, se alcanza una pendiente cercana a cero, después de lo cual la solución se aleja del área de inter&. En la figura 5.6c, se ilustra como un valor inicial cercano a una raíz puede sal-
METODOS ABIERTOS
157
tar a una posición varias raíces lejos. Esta tendencia de alejarse del área de interés se debe a que se encuentran pendientes cercanas a cero. Obviamente, unapendiente cero Lf'(x) = O] es un realdesastrequecausa
METODOS NUM~RICOS PARA INGENIEROS
158
una división por cero en la fórmula de Newton-Raphson [Ec. (5.6)]Gráficamente (Fig. 5.6d), esto significa que la solución se dispara horizontalmente y jam& toca al eje x. La única solución en estos casos es la de tenerun valor inicial cercano a la raíz. Este conocimiento, de hecho, lo proporciona el conocimiento físico del problema o mediante el uso de herramientas tales como las gráficas que proporcionan mayor claridad en el comportamiento de la solución. Esto sugiere tambiOn que se deben diseñar programas eficientes que reconozcan la convergencia lenta o la divergencia. La siguiente sección está enfocada hacia estos temas.
5.2.3
Programa para
el método de Newton-Raphson
Con sólo sustituir la línea 130 de la figura 5.4, se obtiene el método de Newton-Raphson. Nótese, sin embargo, que el programa se debe también modificar para calcular la derivada. Esto se puede llevar a cabo simplemente incluyendo una función definida por el usuario. Además, de acuerdoa las discusiones anteriores sobrelos problemas potenciales del método de Newton-Raphson,el programa se debe modificar incorporándole algunos rasgos adicionales:
1.Si es posible, se debe incluir una rutina de graficación dentro del programa.
2.A1 final de los cálculos, la aproximación a la raíz siempre se debe sustituir en la función original para calcular en qué casosel resultado se acerca a cero. Esta prueba protege contraaquéllos casos donde se observa convergencia lenta u oscilatoria, la cual puede llevar a valores pequeños de E,, mientras que la solución puede estar aún muy lejos de una raíz. 3. El programa siempre debeincluir un límite m6ximosobre el número permitido de iteraciones para estar prevenidos contra las oscilaciones y la convergencia lenta, o las soluciones divergentespersistirán interminablemente.
5.3 MÉTODO
DE LA SECANTE
Un problema fuerte enla implementación del método deNewton-Raphson es el de la evaluación de la derivada. Aunque esto no esun inconveniente para los polinomios y para muchas otras funciones,existen algunas de éstas cuyas derivadas pueden ser extremadam-ente difíciles de evaluar. En estos casos, la derivada se puede aproximar mediante una diferencia divida, como (Fig. 5.7):
159
METODOS ABIERTOS
FIGURA 5.7
Esquemagráfico del métodode la secante. Esta técnica es similar a la del método de Newton-Raphson(Fig. 5.5) en el sentido de que una aproximación a la raíz se calcula extrapolando una tangente de la función hasta el eje x . Sin embargo, el método de la secante usa una diferencia en vez de la derivada para aproximar la pendiente.
Esta aproximación se puede sustituir en la ecuación (5.6) obteniendo la ecuacióniterativa:
La ecuación (5.7)es la fórmula para el método de la secante. Nótese que el planteamiento requiere de dos puntos inicialesde x. Sin embargo, debido a que no se requiere que f(x) cambie de signo entre estos valores, a este método no se le clasifica como aquellos que usanintervalos.
EJEMPLO 5.6 EL método de
la secante
Enunciado del problema: úsese el método de la secante para calcular la raíz de f ( x ) = e-x - x. Empiécese con los valoresinicialesde x-1 = o y x0 = 1.0.
METODOS NUMERICOS PARA INGENIEROS
160
Solución: recuérdeseque laraíz reales 0.567 143 29 . Primera iteración:
x1=1-
"0.632 12(0 - 1) 1 "("0.63212)
=
/€,I
0.612 70
=
8.08
Segunda iteración: x0 =
1
x1
0.61270
=
-0.632 12 f(x1) = -0.070 81
f(xo)
(Nótese que las dos aproximaciones se encuentran del mismo lado que la raíz.) x2 =
0.612 7 0 -
(E,( =
"0.070 81 (1-0.612 70) -0.632 12 - (-0.070 81)
=
0.563 84
\
0.58%
Terceraiteración:
x2 =
0.61270 0.563 84
x3 =
0.563 84
x1
IE, /
5.3.1
=
=
f(x1) = -0.070 81
0.005 18 0.005 18 (0.612 70-0.563) 84 "0.070 81 - (0.005 18)
f(x2) =
-
=
0.567 17
0.0048%
Diferencias entre los métodos de
la secante y de la regla falsa
Nótese la similitud entre los métodos de la secante y de la regla falsa. Por ejemplo, las ecuaciones (5.7) y (4.4)son idénticas término a término. Ambas usan dos estimaciones iniciales, para calcular una aproximación a la pendiente de la función que se usa para proyectar hacia eleje x una nueva aproximación a la raíz. Sin embargo, existe una diferencia crítica entre ambos métodos y ésta estriba en la forma en que uno de los valores iniciales se reemplaza porla nueva aproximación.Recuérdese que en el método de la regla falsa, la Gltima aproximación de la raíz reemplaza a aquel valor cuya función tenía el mismo signo de f ( x l ) .En consecuencia, las
METODOS
ABIERTOS
161
dos aproximaciones siempre encierran a laraíz. Por lo tanto, en todos los casos prácticos, el método siempre convergeya que la raíz se encuentra dentro del intervalo. En contraste, el mdtodo de la secante reemplaza los valores en una secuencia estricta, con el nuevo valor xi+lse reemplaza a xi y xi reemplaza a xi-l. Como resultado de ésto, los dos valores pueden caer de un mismo lado de la raíz. En algunos casos, ésto puede provocar divergencia. 1
EJEMPLO 5.7
,’
Comparación de la convergencia en los métodos de la secante y la’ regla falsa.
Enunciado del problema: úsense los métodos de la secante y de la regla falsa para calcular la raíz de f(x) = In x. Háganse los cálculos con los valores iniciales x/= xi- l . 0.5 y x, = xi= 5.0. Solución: enel método de la regla falsa, usando la ecuación (4.4)y los criterios de obtención de la raíz en el intervalo mediante el reemplazo de los valores correspondientes en cada aproximación, se generan las siguientes iteraciones: I
lteraciin
1 2 3
XI
9.5
es es
XU
x,
5.8 1.8546 1.2163
1.8546 1.2163 1 .@585
Como se puede ver (Figs. 5.8a y c), las aproximaciones convergen a la raíz real = 1. En el método de la secante usando la ecuación (5.7) y el criterio secuencial para reemplazar las aproximaciones se obtiene:
1 2
0.5 5.8
5.@ 1.8546
Como se muestraenlafigura divergente.
1.8546 -4.18438
5.8d, el comportamiento del método es
t
162
METODOS NUMERICOS
FIGURA 5.8
PARA INGENIEROS
Comparación entre los métodos de la regla falsa y de la secante. Las primeras iteracionesa) y b) de ambos métodosson idénticas. Sin embargo, en las segundas c) y d), los puntos usados son diferentes. En consecuncia, el método de lasecante puede divergir, como lo muestra dl.
Aunque el método de la secante sea divergenteen algunos casos, cuando converge lo hace más rápido que el método de la regla falsa. Por ejemplo, en la figura 5.9, que se basa en los ejemplos 4.3, 4.6, 5.3 y 5.6, se muestra la superioridad del métodode la secante. La inferioridad del método de la regla falsa ;e debe a que un extremo permanece fijo y de esta manera mantiene a laraíz dentrodelintevalo.Esta propiedad, que es una ventaja porque previene la divergencia, es una desventaja en relación a la velocidad de convergencia; esto hace que la aproximación con diferencias divididas sea menos exacta que la derivada.
5.3.2 Programa para el método de
la
secante
Como con los otros métodos abiertos, se obtiene un programa del método de la secante simplemente modificando la línea 110, de tal forma que se puedan introducir dos valores inicialesy sustituyendo la ecuación (5.7) enlalínea 130 de lafigura 5.4.
163
METODOS ABIERTOS
FIGURA 5.9
Comparación de los errores relativos porcentuales t y para cada uno de los métodos en la determinación de las raíces de f(x) = e - x - x.
Además, las opciones sugeridas en la sección 5.2.3 para el método de Newton-Raphson se pueden aplicar al programa de la secante para obtener tales ventajas.
5.4 RAíCES MÚLTI PLES Una raiz múltiple corresponde a un punto donde una función es tangencia1al eje x. Por ejemplo, dos raíces repetidas resultan de: f ( x ) = (x - 3)(x - l)(x - 1)
o, multiplicando términos,
f ( x ) = x3
- 5x2
+ 7x - 3
L a ecuación tiene una raíz doble porque un valor de x anula dos términos de la ecuación (5.8).Gráficamente, esto significa que la curva toca
164
MÉTODOS
NUMERICOS PARA INGENIEROS
tangencialmente al eje x enlaraíz doble. Véase la figura 5 . 1 0 ~ en x = 1. Nótese que lafunción toca al eje pero no locruzaenlaraíz. Una raiz triple corresponde al caso en que un valor de x se anula en tres términos de la ecuación, como en: f(x) = (x - 3)(x - l)(x - l)(x - 1)
o , multiplicando, )(X)
= x 4 - 6x3
+ 1 2 ~ -' 1 0 +~ 3
Nótese que el esquema gráfico (Fig. 5.10bJ indica otra vez que la función es tangencia1al eje enlaraíz pero que en este caso sí cruzael eje. En general, la multiplicidad impar de raíces cruza el eje, mientras que la multiplicidad par no lo cruza. Por ejemplo, la raíz cuádruple en la figura 5 . 1 0 ~ nocruzael eje. Las raíces múltiples ofrecen ciertas dificultades a los métodos numéricos expuestos enla parte 11:
l. El hecho de que la función no cambia de signo en una raíz de multi-
plicidad par impide el uso de los métodos confiables que usan intervalos, discutidosenelcapítulo 4. De esta manera, de los métodos incluidos en este texto, los abiertos tienen la limitación de que puedendivergir.
FIGURA 5.10 Ejemplos de raíces múltiples tangentes al eje X. Nótesequelafunción no cruza el eje en casos de mu!tiplicidad par a) y c), mientras que para multiplicidad impar sí lo hace b).
2. Otro posible problema se relaciona con el hecho de que no sólo f(x) se aproxima a cero. Estos problemas afectana los métodos de NewtonRaphson y al de la secante, los que contienen derivadas (o aproximaciones a ella) en el denominador de sus respectivas fórmulas. Esto provocaría una división entre cero cuando la solución se acerque a la raíz. Unaformasimpledeevitar estos problemas, que se ha demostrado teóricamente (Ralstony Rabinowitz, 1978), se basa en el hecho de que f(x). Por lo tanto, si se verifica f l x ) contra cero, dentro del programa, entonces los cálculos se pueden terminar antes de quef'(x) llegue a cero. 3. Se puede demostrar que el método de Newton-Raphson y el de Id secante convergenen forma lineal, en vez de manera cuadrática,cuando hay raíces múltiples (Raltsony Rabinowitz, 1978). Sehan propuesto y Rabinoalgunas modificaciones para aliviar este problema. Ralston witz (1978) proponen que se haga un pequeño cambio en la formulación para que retorne su convergencia cuadrática, como:
xi+l= xi
-
f (x,1 f '(Xi)
m-
en donde m es la multiplicidad de laraíz (esto es, m = 2 parauna raíz doble, m = 3 para una raíz triple, etc.). De hecho, puede resultar insatisfactorio porque presupone el conocimiento de la multiplicidad delas raíces.
165
METODOS ABIERTOS
Otra alternativa, también sugerida por Ralston y Rabinowitz (1978), es la de definir una nueva función u(x), que es el cociente de la función y su derivada, esto es: [5.10]
Se puede demostrar que esta función tiene raíces en las mismas posiciones que la función original. Por lo tanto, la ecuación (5.10) se puedesustituir en la ecuación (5.6)y de esta forma desarrollar una forma alternativa del método de Newton-Raphson: [5.11J
Se puede derivar la ecuación (5.10),obteniendo: [5.12]
Se pueden sustituir las ecuaciones (5.10)y (5.12) en la ecuación (5.11)
[5.13]
EJEMPLO 5.8
Método de Newton-Raphson modificado para el cálculo de raíces múltiples.
Enunciado del problema: úsenselos dos métodos, el estándar y el modificado de Newton-Raphson para evaluar la raíz múltiple de la ecuación (5.9), con un valor inicial de xo= O. Solución: la primera derivada de la ecuación (5.9) esf(x) = 3x2 - lox + 7, y por lo tanto, el método de Newton-Raphson para este problema [Ec. (5.6)]es: Xi+l
=
x, -
xi3 - 5Xi2 + 7xi - 3 3xi* - loxi + 7
que se puede resolver iterativamente para obtener:
166
MÉTODOS
i
1€“I
Xi
O
0
1 2 3 4 5 6
0.428571 57 429 0.68571 4286 31 0.832865400 17 3328983 0.91 0.955783293 4.4 0.977655101 2.2
NUMÉRICOS PARA INGENIEROS
Ojo
1 O0
8.7
Como ya se había anticipado, el método converge linealmente hasta el valor verdadero de 1 .O. Para el caso delmétodomodificado,lasegundaderivada es f” ( x ) = 60 x - 10, y larelacióniterativa es[Ec. (5.13)]: Xi+l
= xi -
+ 7xi - 3) (3Xi2 - loxi + 7) (3xi2 - lOxi + 7)2 - (xi3 - 5xi2 + 7x, - 3) (6xi - 10) (Xi3
- 5xi2
que se puede resolver para obtener: i
xi
lk”l
O
0
1 2 3
l . 105263158 1.003081 664 1 .O00002382
1 O0 11 0.31 0.00024
De esta forma, el método modificado converge cuadráticamente.Se puedenusarambosmétodosparabuscar laraízsimpleen x = 3. Usando un valorinicial de xo= 4 se obtienen los siguientes resultados: i
Estándar,
o
4
1 2 3 4 5
cy
(33%) 3.4 (13%) 3.1 (3.3%) 3.008 695652 (0.29%) 3.000 074 641 (2.5 X 3.000000 O06 (2x
Modificado l
t ~ l
4(33%) 2.636 363 2.820 224 211 2.961 728 2.998 478 2.999 997
(1 637 2%) (6.0%) 720 (1.3%) 719 %) (0.051 682X (7.7
De esta forma, ambos métodos convergen rápidamente, siendo el método estándar más eficiente.
METODOS
167
ABIERTOS
El ejemplo anterior ilustra los factores de mayor importancia involucrados al escoger el método de Newton modificado. Aunque es preferible y requiere más esen raíces múltiples, algunas veces es menos eficiente fuerzo computacional que el método estándar parael caso de raíces simples. Se debe notar que se puede desarrollar una versión modificada del método de la secante para raícesmúltiples sustituyendola ecuación (5.10) en la ecuación (5.7). La fórmula resultante es (Ralston y Rabinowitz,1978):
PROBLEMAS Cálculos a mano 5.1
Úsese el método de Newton-Raphson para determinar laraízmayor
de:
f ( x ) = - 0 . 8 7 5 ~+~1 . 7 5 ~+ 2.625 Empléese un valor inicial de xi = 3 . l. Realícese los cálculos hasta que E,, sea menordel E, = 0.01% . También verifíquense los errores enla respuesta final. 5.2
Determínenselasraícesreales
f(x) = -2.1 a)
de:
+ 6 . 2 1 ~- 3
. 9+ ~ 0~. 6 6 7 ~ ~
Gráficamente
b) Usando el método de Newton-Raphsonhastaque 5.3
=
0.01%
Empléese el métododeNewton-Raphsonparadeterminarlasraícesreales !(X)
= -23.33
de:
+ 7 9 . 3 5 ~- 8 8 . 0 9 ~-k ~4 1 . 6 ~- ~8 . 6 8 +~ ~0 . 6 5 8 ~ ~
usando el valor inicial de a) xi= 3.5; b) x = 4.0 y c) x,= 4.5. Pruébense y úsense los métodos gráficos para explicar cualquier peculiaridad en los resultados. 5.4
Determínese laraízreal
menor de:
f(x) = 9.36 - 21.963~+ 1 6 . 2 9 6 5 ~-~3 . 7 0 3 7 7 ~ ~ a) Gráficamentg
b) Usando el método de la secante, hasta un valorde es, correspondiente a tres
cifrassignificativas. 5.5
Localícese la raíz positiva f(x) = 0 . 5 ~ sen x
de:
168
MÉTODOS
NUMERICOS PARA INGENIEROS
donde x está dada en radianes. Usese un método gráfico y después calcúlese tres iteracionesconelmétodo de Newton-Raphsoncon un valorinicial de xi= 2.0 para calcular laraíz. Repítanse los cálculos pero con un valorinicial de x i = 1.0. Úsese el método gráfico para explicar los resultados. 5.6
Encuéntrese laraízrealpositiva
de:
f(x) = x4 - 8 . 6 -~3~5 . 5 1 ~ + ~4 6 4 ~-- 998.46 usando el método de la secante. Empléense los valores iniciales de xi., = 7 y xi= S y calcúlense cuatro iteraciones. Calcúlese E, e interprétense los resultados. 5.7
Realícense los mismos cálculos del problema5.6 pero usando el método de NewtonRaphson, con un valorinicial de x,= 7 .
5.8
Encuéntrese laraíz cuadrada positiva de 10 usando tres iteraciones con: a) El método de Newton-Raphson, con un valorinicialde xi= 3. b) El método de la secante, convaloresiniciales de = 3 y x,=3.2.
5.9
Determínese laraízreal
f(x)
=
de:
1- 0 . 6 ~ X
usando tres iteraciones y el método de la secante con valores iniciales xi., - 1.5 y xi = 2.0. Calcúlese el error aproximado E, después de la segunda y la tercera iteración. 5.10 Determínese laraízreal
!(x)
= x3
de:
- 100
con el método dela secante, con es=
5.11
Determínese laraízrealmayor
0. 1% .
de:
x3 - 6x2 + l l x - 6 a) Gráficamente b) Usandoel método de bisección (dos iteraciones, XI= 2.5 y X=, 3.6). C) Usandoel método de lareglafalsa (dos iteraciones, X/= 2.5 Y X=, 3.6). d) UsandoelmétododeNewton-Raphson(dos iteraciones, x i = 3.61. e) Usando el método de la secante (dos iteraciones, x;-l= 2.5 y X,= 3.6).
5.12
Úsese el método de Newton-Raphson para determinar todas las raíces de :(x) = x2+ 5.78 x - 11.4504 con e,= 0.001%.
5.13
Determínese laraízrealmás
pequeña de:
!(x) = 9.36 - 2 1 . 9 6 3 ~+ 16.296 5x2 - 3.703 77x3
MÉTODOS
169
ABIERTOS
a) Gráficamente b) Usando el método c) Usando el método d) Usando el método e) Usando el método
de bisección (dos iteraciones, x,= 0 . 5 y xu= 1.1). de la raglafalsa (dos iteraciones, x,= 0 . 5 y x,= 1.1). de Newton-Raphson (dos iteraciones, xi= 0.5). de la secante (dos iteraciones, xi-,= 0 . 5 y xi= 1.1).
5.14 Determínese laraízpositiva
realmás pequeña de:
f ( x ) = 4X4 - 2 4 . 8 ~ + ~57.04~' - 5 6 . 7 6 ~+ 20.57 a) Gráficamente b ) Usando el método disponiblemás eficiente. Empléense los valores'iniciales de x, = x , . ~= 0 . 5 y x, = x, = 1.5 y realícense los cálculos hasta que E,= 15%
5.15
Determínense las raíces de !(X) =
x3
- 3 . 2 ~- ~1 . 9 2 ~+ 9.216
a) Gráficamente b) Usando el método disponiblemás eficiente con E,=
0.1%
5.16 Repítase el problema 4 . 1 2 , pero usando el método de Newton-Raphson 5.17 Repítase el problema 4 . 1 2 , pero usando el método de la secante.
Problemas relacionados con la computadora 5.18 Desarróllese un programaparael método de Newton-Raphson basado en la figura 5.4 y en la sección 5.2.3. Pruébese el programa duplicando los cSlculos del ejemplo 5 . 3 5.19 Úsese elprogramadesarrolladoenelproblema 5.18 y duplíquense los cálculos del ejemplo 5.5. Determínese laraíz usando un valorinicial de xi= 0.5. Realícense 5, 10, 15 o más iteraciones hasta que el errorrelativo porcentual exacto sea menor del O. 1 B. Grafíquense los errores relativos porcentuales exacto y aproximado contra el nlirnero de iteraciones sobre papel semilogarítmico. Interprétense los resultados. 5.20 Úsese el programa desarrollado en el problema 5.18 para resolver los problemas 5.1 al 5.5. En todos los casos, realícense los cálculos dentro de la tolerancia de E S = 0.001%. 5.21
Desarróllese un programa para el método de la secante basado en lafigura 5.4
y en la sección 5.3.2. Pruébese el programa duplicando los cálculos del ejemplo
5.6.
5.22 Úsese el programa desarrollado enelproblema 5.21 para resolver los problemas 5.6, 5.9 y 5.10. En todos los casos, realícense los cálculos dentro de la tolerancia de es= 0.001%.
CAPíTULO SEIS CASOS DE LA PARTE DOS: RAíCES DE ECUACIONES
La finalidad de este capítulo es la de usar los procedimientos numéricos analizados en los capítulos 4 y 5 para resolver problemas reales de ingeniería. Los métodos numéricos son importantesen la práctica ya que frecuentemente los ingenierosencuentranproblemasqueno se pueden plantear desde un punto de vista analítico. Por ejemplo, algunos modelos matemáticos quese pueden resolver analíticamente no son aplicables en los problemas prácticos. Debido a esto, se deben usar modelos más complicados. En estos casos, es conveniente implementar un método numérico que se pueda usar en una microcomputadora.En otros casos, los problemas requerirán soluciones explícitas enecuaciones muy complicadas (recuérdese la sección 11.1.2 y el ejemplo 4.5). Los siguientes casos de estudio son una muestra de aquellos que en forma rutinaria se encuentran durante los estudios superiores o de licenciatura. MAS aún, son problemas representativos de aquéllos que se encontrarán en la vida profesional. Los problemas van desde la ingeniería económica en general, hasta las especialidadesde la misma: química, civil, eléctrica y mecánica. Estos casos deestudioilustranalgunosde los factores de más importancia entre las técnicas numéricas. Por ejemplo, el caso 6.1 hace uso de todos los métodos, con excepción del método de Newton-Raphson para analizar puntos de equilibrio que resulteneconómicos. El método de Newton-Raphson nose usó porque la función en an6lisis es difícil de derivar. Entre otras cosas, en el ejemplo se demuestra como puede divergir el método de la secante, sielvalor inicial no se encuentra lo suficientemente cerca de laraíz. El caso 6.2 tomado de la ingeniería química, muestra un ejemplo excelente de cómo se pueden aplicar los métodos para la búsqueda de raíces de fórmulas quese presentan en la práctica de la ingeniería. Además, este ejemplo demuestrala eficiencia del método de Newton-Raphsoncuando se requiere un gran número de cálculos en la localización de la raíz. LOScasos 6.3, 6.4 y 6 . 5 son problemas de ingeniería de diseño, tomados del área de civil, eléctrica y mecánica. El caso 6.3 aplica tres métodos diferentes para determinar las raícesde un modelo de crecimiento
INGENIEROS METODOS
172
NUMÉRICOS PARA
demográfico. En el cuso 6.4, se realiza un análisis semejante de un circuito eléctrico. Finalmente, el caso 6.5 analiza las vibraciones de un automóvil. Además de analizar la eficiencia de cada uno de los métodos, este ejemplo tiene una característica adicional, que es la de ilustrar cómo los métodos gráficos sirven de ayuda en el proceso de localización de raíces.
CASO 6.1
ANALISISDE PUNTO DE EQUILIBRIO (INGENIERíAENGENERAL) Antecedentes: en la práctica de la ingeniería óptima se requiere que los proyectos, productos y la planificación de los mismos sean enfocados de tal manera que resulten económicos. Porlo tanto, a un ingeniero con experiencia deben serle familiares los análisis de costos. El problema que se trata en esta sección se conoce como “problema de puntos de equilibrio”. Se usa para determinar el punto en el cual dos alternativas tienen valores equivalentes. Estos problemas se encuentran en todos los campos dela ingeniería. Aunque el problema se enfoca en términos personales, se puede tomar como prototipo de otros problemas de análisis de puntos de equilibrio, que se encuentran a menudo en la vida profesional. Se está considerando la compra de una o dos microcomputadoras: La “Micro-uno’’y la “Micro-dos”. En el cuadro 6.1 se encuentran resumidas algunas características, los costos aproximados y los beneficios de cada una de ellas. Si se puede pedir un préstamo con un interés del 20% (i = 0.20), ¿cuánto tiempo se deberá poseer las máquinas, de manera que tengan un valor equivalente? En otras palabras, ¿cuál es el punto de equilibrio medido en años? Solución: como es común en problemasde economía, se tiene una mezcla de costos presentes y futuros. Por ejemplo, en la figura 6.1 se muestra que la compra de la Micro-uno involucra un gasto inicial de $3 000. Además de este desembolso, también se requiere dinero para el mante-
CUADRO 6. l
Costos y beneficios de dos microcomputadoras.Los signos negativos indican un costoo una perdida mientras que un signo positivo indica una ganancia COMPUTADORA Micro-dos Micro-uno compra, Costo de $ Incremento en el mantenimiento del costo por año, $/año/año Ganancias y beneficios anuales, $/año
-3000
-1 0,000
-200
-50
1000
4000
FIGURA 6.1
Diagrama de fluio de efectivos de costos y beneficias de la Micro-uno. La abscisa muestra el número de años que se posee la computadora. El fluio de efectivos se mide en lo ordenada, con los beneficios positivos y los costos negativos.
nimiento anual de la máquina. Debidoa que estos costos tiendena aumentar a medida que la máquina se usa más y más, se supone que los Costos de mantenimiento crecen linealmente con el tiempo. Por ejemplo, alrededor del décimoaño se requieren $2 O00 anuales para mantenerla máquina en condiciones de trabajo (Fig. 6.1). Finalmente y además de estos costos se deben deducir beneficios del propietario de la computadora. Las la Micro-uno se caracterizan por ganancias y las prestaciones derivadas de un ingresoanualconstante de $ 1 000. Para valorar las dos opciones estos costos se deben convertir en medidas comparables. Una manerade hacerlo es expresando todos los costos individuales como si fuesen pagos anuales, estoes, el costo equivalente por año sobretoda lavida útil de la computadora. Las ganancias y las prestaciones yase encuentran en este formato.Se puede disponerde las fórmulas de economía para expresar los costos de compray de mantenimiento de la misma forma. Por ejemplo, el costo de la compra inicial se puede transformar en una serie de pagos anuales mediante la fórmula (Fig. 6 . 2 ~ ) :
A, = P
i(1 + i)" (1 + i)" - 1
en donde A, es el monto del pago anual, P es el costo dela compra, i es la tasa de interés y n es el número de años. Por ejemplo, el pago
M~TODOS NUMERICOS PARA INGENIEROS
174
FIGURA 6.2
Esquemagráficodel uso deunafórmuladeeconomía, a ) Tranformación de un pago en una serie de pagos anuales equivalentes usando la ecuación (6.1) y b) transformación de una serie de gradiente aritmético en una serie de pagos anuales equivalentes usando la ecuación (6.2).
inicial de la Micro-uno es de $-3 000, en donde el signo negativo indica pérdidas. Si la tasa de interés es del 20% (i = 0.2), entonces:
Ap = -3000
O.Z(l.2)"
1.2" - 1
Por ejemplo, si los pagos iniciales se extienden hasta 10 años ( n = lo), se puede usar esta fórmula para calcular que el pago anual equivalente sería de $-715.57 por año. A los costos de mantenimiento seles conoce como serie de gradiente aritmético porque crecen a un promedio constante. La conversión de estas series a una tasa anual A se puede calcular con la fórmula:
en dondeG es la tasa de crecimiento en el mantenimiento. Como se puede ver en la figura 6.26 esta fórmula transforma el costo de mantenimiento creciente en una serie equivalente de pagos anuales constantes. Estas ecuaciones se pueden combinarde forma tal que se pueda expresar el valor de cada computadora en términos de una serie uniforme de pagos Por ejemplo, para la Micro-uno:
A,= -3 O00 valor total =
[1
-200
0.2(1.2)" 1.2" - 1
"
- 1
1.2" 0.2
-costo de compra -
costo de
mantenimiento
1
+ 1 O00
+ ganancias
en donde A, denota el valor anual total. Agrupando términos, esta ecuación se puede simplificar:
A, =
-600( 1.2)" 200n 1.2" - 1 1.2" - 1
+
~6.31
Si después de poseer la Micro-uno durante dosaños se decide descartar-
la, entonces sustituyendo n = 2 en la ecuación (6.3) resultará que el costo es de$1055 por año. Si la computadorase descarta después de poseerla 10 años (n = lo),la ecuación muestra un costo de $330 por año. De manera similar, para la Micro-dos se puede desarrollar una ecuaciónparael costo anual, dadapor:
A, =
-2 OOO(1.2)" 1.2" - 1
+
50n 1.2" - 1
+ 3750
~6.41
Los valores de la ecuación (6.4) para n = 2 y n = 10 sonde $-2 568 + 1461 por año, respectivamente. De estamanera, aunque la Microdos es más costosa en base a periodos cortos, si se posee por periodos largos, no sólo es más barata, sino que producirá ganancias al propietario. En la figura 6.3a se muestran las ecuaciones (6.3) y (6.4)para varids valoresde n . La identificación del punto enel que las dos máquinas tienen valores iguales indica cuando la Micro-dos viene a ser la mejor compra. Gráficamente, esto corresponde a la intersección de las dos curvas en la figura 6.3~1.Desde un punto de vista matemático, el punto de equilibrio es el valor de n para el que las ecuaciones (6.3)y (6.4)son equivalentes, esto es: y$
-600(1.2)" 1.2" - 1
+
200n - -2 OOO(1.2)" 1.2" - 1 1.2" - 1
+
50n + 3 750 1.2" - 1
pasando todos los términos de un lado, el problema se reduce a encontrar la raíz de la función:
f(n) =
- 1 400( 1.2)" 1.2" - 1 -
-
150n 1.2" - 1
+
3 750 = O
~6.51
Nótese que debidoa la forma en que se ha derivado la ecuación, la Microuno es más efectiva en cuanto a costos cuando f (n) < O y la Micro-dos lo es cuando f (n) > O (Fig. 6.3b). Las raíces de la ecuación (6.5) no se pueden determinar analíticamente. Por el otro lado, los pagos anuales equivalentes son fáciles de calcular dada una n. De esta forma, como en el
176
MÉTODOS NUMÉRICOS PARA INGENIEROS
FIGURA 6.3
a) Curvas del costo neto de las computadorasMicro-uno[Ec. (6.3)]y Micro-dos [Ec. (6.4)]. b) La función de punto de equilibrio [Ec. (6.5)J.
estudio de la sección 11.1.2 y el ejemplo 4.5, los aspectos considerados en la elaboración de este problema crean la necesidad de un planteamiento numérico. Las raíces de la ecuación (6.5)se pueden calcular usando algunos de los métodos numéricos descritos en los capítulos 4 y 5. Se pueden aplicar los métodos que usan intervalos y el método de la secante con un esfuerzo mínimo, mientrasque el método de Newton-Raphson es embarazoso ya que consume muchotiempo al determinar d f / d n de la ecuación (6.5). En base a la figura 6.3, se sabe que la raíz se encuentra entre n = 2 y n = 10. Estos valores se pueden usar en el método de bisección. L a bisección d e intervalos se puede llevar a cabo 18 veces para obtener un resultado en donde E, sea menor de 0.001%. El punto de equilibrio ocurre a los n = 3 . 2 3 años. Este resultado se puede verificar sustituyéndolo en la ecuación (6.5) para ver que f (3.23) = O. Sustituyendo n = 3 . 2 3 ya sea en la ecuación (6.3)o en la (6.4)se muestra que en el punto de equilibrio el costo de cualquiera de ellas es
íCES
CASOS DOS:
LA PARTE
DE ECUACIONES
177
de $542 por año. Más allá de este punto, la Micro-dos es más efectiva en cuanto a costos. Por consiguiente, si se piensa comprar una máquina y poseerla por más de 3.23 años, la Micro-dos es la mejor compra. El método de la regla falsa se puede aplicar fácilmente a este problema. Se obtiene una raízsimilar después de 12 iteraciones enelmismo intervalo inicial de2 a 10. Por otro lado, el método de la secante converge a una raíz de -24.83 con el mismo intervalo inicial. Sin embargo, si el intervalo se reduce desde 3 hasta 4, entonces el método de la secante converge a 3.23 en sólo cinco iteraciones. Es interesante notar que el método de la secante también converge en forma rápida siel intervalo inicial es de 2 a 3, el cual no encierraa la raíz. Estos resultados son típicos de los factores de importancia que se deben tomar en consideración y que se estudian posteriormente en el epílogo. Entonces el mejor método numérico para este problema depende del juicio emitido respecto a los factores de importancia, tales como eficiencia numérica, costo de las computadoras y laconfiabilidaddel método.
CASO 6.2
LEYES DE LOS GASESIDEALES Y NO IDEALES (INGENIERíA QUíMICA) Antecedentes: la ley d e los gases ideales está dada por:
en donde p es la presión absoluta, V es el volumen y n es el número de moles. R es la constante universal de los gases y T es la temperatura absoluta. Aunque esta ecuación la usan ampliamente los ingenieros y científicos, sólo es exacta sobre un rango limitado de presión y temperatura. Más aún, la ecuación (6.6)es más apropiada para algunos gases que para otros. Una ecuación alternativa del estado de los gases está dada por: r6.71
a la que se le conoce con elnombre de ecuación de van der Waals. u = V / n es elvolumenmolal y a y b son constantes empíricas que dependen de un gas en particular. Un proyecto de ingeniería química requiere que se calcule exactamente el volumen molal (u) del bióxido de carbono y del oxígeno para combinaciones diferentes de la temperatura y de la presión, de tal forma que se pueda seleccionar una vasija apropiada que los contenga. Asimismo, es importante examinar que tan bien se apega cada gas a laley de los
178
NUMERICOS
METODOS
PARA INGENIEROS
gases ideales, comparandolos volúmenes molales calculados conlas ecuaciones (6.6) y (6.7). Se proporcionan los siguientes datos:
R = 0.082 054 1 . atm/(mol . K) a = 3.592 b = 0.042 67 a = 1.360 b = 0.031 83
bióxido de carbono
Las presiones de interés en el diseño son de 1, 10 y 100 atm. para combinaciones de la temperatura de 300, 500 y 700°K. Solución: los volúmenes molares de ambos gases se calculan con la ley de los gases ideales, con n = 1. Por ejemplo, si p = 1 atm y T = 300°K, entonces: v = - = -
n
RT = 0.082 054 P
I atm 300 K m o l . K I atm
v = 24.616 2 l/mol Estos cálculos se repiten para todas las combinaciones de presión y temperatura y se presentan en el cuadro 6.2. Los cálculos del volumen molar a partir de la ecuación de van der Waals se pueden llevar a cabo usando cualquier método numérico que encuentre raíces de los estudiados en los capítulos 4 y 5, de la siguiente manera:
CUADRO 6.2
Cálculos del volumen molar del caso de estudio 6.2 VolumenmolalVolumenmolalVolumenmolal (ley de los (van der Waals) (van der Temperatura Preridn gases ideales) bióxido de Waals) oxígeno K atm llmol llmol llmol carbono
300 500
700
1 10 1O0 1 4.0578 10 1 O0 1 5.7242 10 0.5575 1 O0
24.6162 2.46 16 0.2462 1.0270 40.982 4 4.1027 0.4 0.3663 1 03 57.41 57.4378 5.7438 0.5744
24.5126 2.3545 0.0795 1
79
24.5928 2.4384 0.2264 4 1 .O259 4.1016 0.4116 57.4460 5.7521 0.5842
179
CASOSDE LA PARTE DOS:RA~CES DE ECUACIONES
En este caso,la derivada d e f ( u ) se determina fácilmente y es conveniente implementar el uso del método de Newton-Raphson. La derivada de f respecto a u está dada por: a
2ab
+f’(U) = p - 3 u3 El método de Newton-Raphson se describe mediante la ecuación (5.6) como:
la cual se puede usar en el cálculo de la raíz. Por ejemplo, usando el valor inicial de 24.616 2,el volumen molal del bióxido de carbono a 300°K y a 1 atm se calcula como 24.512 6 I/mol. Este resultado se obtuvo después de dos iteraciones y con un E,, menor de O. O01 %. En el cuadro 6.2 semuestran resultados similares para todas las combinaciones de presión y de temperatura para ambos gases. Se observa que los resultados obtenidos con la ecuación de van der Waals difieren en ambos gases de los de la ley de los gases ideales, de acuerdo a los valores específicos de p y de T . Más aún, ya que algunos de estos resultados son significativamente diferentes, el diseño de las vasijas que contendrán a los gases sería muy diferente, dependiendo de qué ecuación de estado se haya usado. En este caso, al usar el método de Newton-Raphson se examinó una ecuación del estado gaseoso complicada. Los resultados variaron significativamente en varios casos usando la ley de los gases ideales. Desde un punto de vista práctico, el método de Newton-Raphson fue apropiado en este casoya que f’( u ) fue fácil de calcular. De esta manera, se pueden explotar las propiedades de rápida convergencia del método de NewtonRaphson. Además de demostrar su potencia en un simple cálculo, el método de Newton-Raphson ilustra en este caso de estudio lo atractivo que es cuando se requiere unagran cantidad de cálculos. Debido a la velocidad de las microcomputadoras, la eficiencia de cada uno de los métodos en la solución de la mayor parte de raíces de ecuaciones se vuelve indistinguible en un cálculo simple. Aun la diferencia de decenas entre el método eficiente de Newton-Raphson y el método poco. refinadode bisección no significa una gran pérdida de tiempo cuando se realiza un solo cálculo. Sin embargo, supóngase que se desea calcular una raíz millones de veces para resolver un problema. En este caso, la eficiencia del método puede ser un factor decisivo al escogerlo. Por ejemplo, supóngase que es necesario diseñar un sistema de control automático computarizado de un proceso de producción de sustancias químicas. Este sistema requiere una aproximación exacta de volúmenes
180
MÉTODOS NUMERICOS PARA INGENIEROS
molales con basea un medio esencialmente continuo para fabricar convenientemente el producto final. Se instalan calibradores que proporcionan lecturas instantáneas dela presión y la temperatura. Se deben obtener evaluaciones de u para toda la variedad de gases que se usan en el proceso. Para estas aplicaciones, los métodos que usan intervalos, tales como el de bisección o de la regla falsa, posiblemente consuman mucho tiempo. Además, los valores iniciales que se requieren con estos métodos generarían un retraso enel procedimiento. Este inconveniente igualmente afecta al método de la secante, que también necesita dos valores iniciales. En contraste, el método de Newton-Raphson requiere 6nicamenteun valor inicial de la raíz. Se puede usar la ley de los gases ideales paraobtener este valor al inicio del proceso. Después, suponiendo que el tiempo empleado sea lo bastante corto como para que la presión y la temperatura no varíen mucho durante los cálculos, la solución de laraíz anterior se puede usarcomo valor inicial de la siguiente. De esta forma, se tendría disponible de forma automáticaun valor aproximado cercano a la solución, requisito indispensable en la convergencia del método de Newton-Raphson. Todas estas consideraciones favorecerán de manera considerable al método de Newton-Raphson en estos problemas.
CASO 6.3
DINÁMICA DEL CRECIMIENTODEMOGRÁFICO (INGENIERíA CIVIL) Antecedentes: la dinámica del crecimiento demográfico es de importancia en todos los planes de estudio de ingeniería. Los progamas de consa gran escala, tales trucción y dedistribuciónderecursosenproyectos como el abastecimiento de agua y sistemas de transporte dependen en gran medida de las tendencias dela población. Además, las tendencias deotrotipode poblaciones, tales como los microbios, son importantes en muchos procedimientos de ingeniería,como en el tratamiento de basura, enel manejo dela fermentación y enla elaboración de productos farmacéuticos. Los modelos de crecimiento en un grupo de microbios suponen que el promedio de cambio de la población (p)es proporcional a la población existente en un tiempo ( t ) :
La población crece en un medio enel que existe alimento suficiente de manera que k no es una función de la concentración. (Véase el caso 12.2 que muestra un ejemplo en donde k depende del nivel alimenticio.)Cuando el alimento no escasea, el crecimiento se limita sólo por el consumo de productos tóxicos o de espacio, si es que el tamaño de la población crece demasiado. Con el tiempo, estos factores retardan la tasa de creci-
CASOS DE
DE
DOS: RAiCES
ECUACIONES
181
miento de la población y la detienen completamente cuando ésta alcanza una densidad máxima de pmex. En este caso, se modifica la ecuación anterior de la siguiente manera:
en donde las unidades de K son litros por célula por día. Esta ecuación diferencial se puede integrar de forma analítica dando:
en donde p ( t = O) = po. A la ecuación (6.9) se le conoce como el modelo de crecimiento logístico. Como se muestra en la figura 6.4, este modelo genera unacurva de p ( t ) enformade S. Como se puede ver, el modelo simula un crecimiento inicial lento, seguido por un periodo de crecimiento rápido y finalmente, un crecimiento limitado a una densidad demográfica muy alta. Como ejemplo de aplicación de este modelo en el área de la ingenieun ría civil, considérese el crecimiento de una población bacteriológica en lago. El crecimiento se comporta como lodefine la ecuación (6.9). La población es pequeñaen la primavera del año en donde f = O, p(f = O) = 10 célulasporlitro.Essabidoque la poblaciónalcanzaunadensidad de 15 O00 células Dor litro cuando t = 60 días y que la tasa de crecimien-
FIGURA 6.4
Un modelo logístico de crecimiento demográfico. El modelo simuiaun crecimiento inicial lento, después una aceleración en éI mismo seguido por un periodo de nivelación en una densidad poblacional alta.
METODOS
182
NUMÉRICOS
PARA INGENIEROS
to K esde 2 X litrosporcélulapor día. Se requierecalcularla densidad de la población bacterial cuando t = 90 días. Si su número excede de 40 O00 células por litro, entonces la calidad estándar del aguarequiere la implementación de algún procedimiento para disminuirlas y proteger a las personas que se introduzcanal agua.
Solución: sustituyendo la información conocida enla ecuación (6.9) se obtiene:
15 O00
=
P m6x
[6.10]
I
lacualtiene sólo unaincógnita, pmdx. Si la ecuación (6.10) se pudiera entonces p(t = 90) se podría determinar fácilmente resolver para pmAx, de la ecuación (6.9).Sinembargo,yaque pmsxes implícita,nosepuede obtener directamente de la ecuación (6.10).Por lo tanto, se debe usar un método numérico de los capítulos 4 y 5. No se usará el método de NewtonRaphson ya que la derivada de la ecuación (6.10)es difícil de determinar. Sin embargo, se pueden aplicar fácilmente los métodos de bisección, de la regla falsa y de la secante. Con un error relativo del 0.01% los valores iniciales dados de 60 O00 y 70 O00 células por litro generan las siguientes aproximaciones de pmsx. Método empleado Bisección Regla falsa
Secante
Resultado
lteracioner
63 198 63 199
11
63 200
5 4
Nótese que los métodos de la regla falsa y de la secante convergen a la mitaddel número de iteraciones del método de bisección. Ahora, de la ecuación (6.9),con pmdx= 63 200:
P(90) =
63 200 e-2x10-6(63
= 58 930 células por litro 200)(90)
Este nivel demográfico sobrepasa el límite estándar en cuanto a calidad del agua que es de 40 O00 células por litro y por lo tanto, se debe tomar algunamedida de corrección. Este ejemplo, ilustra la eficiencia computacional relativa de tres métodos diferentes para encontrar raícesde ecuaciones en un problema de diseño de ingeniería civil. Sin embargo, como se menciona anteriormente, el esquema general tiene una aplicación amplia en todos los campos
CASOS DELAPARTE
183
DOS: RAiCESDE ECUACIONES
de la ingeniería que tengan que ver con el crecimiento de organismos, incluyendo a los humanos.
CASO 6.4
DISEÑODE UNCIRCUITO ELÉCTRICO (INGENIERíA ELÉCTRICA) Antecedentes: los ingenieros electrónicos usan a menudo laley de Kirchoff para estudiar el comportamiento de los circuitos eléctricos en estado estacionario (que no varían con el tiempo). Enel caso 9.4 se analiza el comportamiento de estos estados estacionarios. Otro tipo de problemas son los de corriente momentánea e implica a los circuitos donde súbitamente suceden cambios temporales. Esta situación ocurre cuando se cierra el interruptor de la figura 6.5. En este caso, después de cerrar el interruptor hay un periodo de ajuste hasta que se alcanza un estado estacionario. La longitud de este periodo de ajuste está relacionada con las propiedades de almacenamiento de carga del capacitor y con el almacenamiento de energía dentro del inductor. El almacenamiento de energía puede oscilar entre estos dos elementos durante un periodo transitorio. Sin embargo, la resistencia en el circuito disipa la magnitud de las oscilaciones. El flujo de corriente a través de la resistencia causa una caída de voltaje (V,) dado por:
VR = iR en donde i es la corriente y R es la resistencia del circuito. Cuando las unidades de R e i son ohm y amperes, respectivamente, entonces la unidad de V es elvolt. De manera semejante, un inductor resiste el cambio enla corriente, de forma tal que la caída de voltaje (V,) alcruzarlo es de: di vr = Ldt ,
.
A
Interruptor -
Batería
y'; 7-4
v0
,a
' +
-
+
Capacitor
Inductor
Resistencia
FIGURA 6.5
Un circuito eléctrico. Cuando se cierra el interruptor, la corriente experimenta una serie de oscilaciones hasta que se alcance un nuevo estado estacionario.
184
INGENIEROS MÉTODOS
NUMÉRICOS
PARA
en donde L es lainductancia.Cuandolasunidadesde L e i sonhenrios y amperes, launidadde V, es elvolt y launidadde t es el segundo. La caída de voltaje a través del capacitor (V,) depende de la carga (4) sobreelmismo:
c
vc = 9
en donde C es la capitancia. Cuando las unidades de carga se expresan en culembios, launidad de C es el faradio. La segunda ley de Kirchoff indica que la suma algebraica de las caídas de voltaje en un circuito cerrado es cero. Después de cerrar el interruptor se tiene: di
L - + R i + - =9 O clt C Sin embargo, la corriente está dada enfuncióndela
.
I=-
carga como:
d9 dt
Por lo tanto:
Esta es una ecuación diferencial ordinaria de segundo orden que se puede resolver usando los métodos de cálculo. La solución está dada por:
FIGURA 6.6
La carga en un capacitor en función del tiemp o que se presenta enseguidade cerro:el interruptoren la figura
6.5.
donde t = O , q = qo = VoC, y Vo es el voltaje enla batería.La ecuación (6.11) describe lavariación de la carga enel capacitor enfunción del tiempo. Lasolución q(t) se gráficaenlafigura 6.6. Un problema de diseño típico en ingeniería eléctrica, puede necesitar que se determina la resistencia apropiada para disipar energía a una velocidad constante, con los valores de L y C conocidos. En este caso se supone que la carga se debe disipar al 1% desuvalororiginal (q/q,, = 0.01) en t = 0.05 S , con L = 5 H y C = lO-"F.
_ l _ _ _ _ _ - ~ _ _ l l l . " " " ~.~ " "
A
CASOS DE
DE
DOS: RAiCES
ECUACIONES
185
Solución: es necesarioresolver para R la ecuación (6.11), usando los valores conocidos de q , qo, L y C. Sin embargo, se debe emplear un método numérico ya que R es una variable implícita de la ecuación (6.11). Se usará el método de bisección para este propósito. Los otros métodos estudiados en los capítulos 4 y 5 también son apropiados, aunqueel método de Newton-Raphson tiene desventajas debido a que la derivada de la ecuación (6.11)es muy complicada. Reordenando la ecuación (6.11) se obtiene:
o, usando los valores numéricos dados:
f ( R ) = e-o.oo5R cos(d2000 - 0.01R20.05) - 0.01
C6.121
Examinando esta ecuación puede verse que un rango inicial razonable de R es de O a 400 Q (ya que 2 O00 - 0.01R2 debe ser mayor de cero). La figura 6.7, gráfica de la ecuación (6.12),lo confirma. Con vein-
FIGURA 6.7
Gráfica de la ecuación (6.12) usada en la obtención de valores iniciales de R que encierren a la raíz.
1 86
NUMERICOS
MÉTODOS
PARA INGENIEROS
tiún iteraciones del método de bisección se obtiene R = 328.1515, con un errormenor al 0.000 1%. De esta forma, se puede especificar una resistencia con este valor en el diagrama de lafigura 6.5 y esperar que ladisipación sea consistenno se tecon los requisitosdelproblema.Esteproblemadediseño puederesolvereficientemente sinusarlos métodos de loscapítulos 4 y 5.
CASO 6.5
I resorteirnasa
ANALISIS DE VIBRACIONES (INGENIERIA MECANICA) Antecedentes: las ecuaciones diferenciales se usan a menudo para modelar el comportamiento de sistemas en ingeniería. Uno de tales modelos, que se aplica ampliamente enlamayorpartede los campos de la ingeniería, es el oscilador armónico. Algunos ejemplos bdsicos deloscilador armónico son el péndulo simple, una masa atada a un resorte y un circuito eléctrico inductor-capacitor (Fig. 6.8). Aunque estos son sistemas físicos muy diferentes, sus oscilaciones se pueden describir mediante un mismo modelo matemático. De esta manera, aunque este problemaanaliza el diseño de un amortiguador para un automóvil, el comportamiento general se aplica a una gran variedad de problemas en todos los campos de la ingeniería. Como se ilustra en la figura 6.9, un conjunto de resortes sostienen un auto de masa m . Los amortiguadores presentan una resistenciaal movimiento del auto la cual es proporcional a la velocidad vertical (movimiento ascendente-descendente) del mismo. La alteración del equilibrio del auto provoca que el sistema oscile como x@). En un momento cual; quiera, las fuerzas que actúan sobre la masa m son la resistencia de los resortes y la capacidad de absorber el golpe de los amortiguadores. La
'n corriente
circuito LR
FIGURA 6.8 Ejemplos de tres osciladores armónicos. Las flechas dobles indican las oscilaciones de cada sistema.
FIGURA 6.9
Un auto de masa m.
CASOS DE LA PARTE DOS: RAfCES DE ECUACIONES
187
resistencia de los resortes es proporcional a la constante de los mismos (k) y a la distancia al punto de equilibrio ( x ) : resorte
del
= "kx
Fuerza
[6.13]
en donde el signo negativo indica que la fuerza de restauración regresa al auto a su posición de equilibrio. La fuerza de amortiguación está dada por: Fuerza de amortiguación =
dx dt
" c -
en donde c esun coeficiente de amortiguamiento y dx/dt es la velocidad vertical. El signo negativo indica que la fuerza de amortiguación actúa en dirección opuesta a la velocidad. Las ecuaciones de movimiento para el sistema están dadas por la segunda ley de Newton (F = ma), que en este problema está expresada como: d2x -
m
dx dt
-
dt
Masa x aceleración
=
"c -
fuerza de amortiguación
+
(-W
+ fuerzadelresorte
O
-d2x + " - +c"dx X=ok dt2
m dt
m
Esta es una ecuación diferencial ordinaria de segundo ordenque se puede resolver con los métodos del cálculo. Por ejemplo, si el auto encuentra por casualidad un hoyo en el camino en t = O de tal forma que se desplaza del punto de equilibrio x = x. y dx/dt = O , entonces: x ( t ) = e-"' (xocos pt
+
n -
P
sen pt)
[6.14]
donde n = c / ( 2 m ) , p = dk/m-c2/(4m2) v k/m > c2/(4m2).La ecuación (6.14) proporcionala velocidad vertical del auto en función del tiempo. Los valores de los parámetros son c = 1.4 por lo7 g / s , m = 1 . 2 por lo6 g y k = 1.25 por lo9 9/s2. Si x. = 0.3. las consideraciones de diseño enla ingeniería mecánica requieren que se denlos estimados en las tres primeras ocasiones que el auto pase a través del punto de equilibrio.
1 88
INGENIEROS MÉTODOS NUMÉRICOS
PARA
Solución: este problema de diseño se puede resolver usando los métodos numéricos de Tos capítulos 4 y 5. Se prefieren los métodos que usan intervalos y el de la secante ya que la derivada de la ecuación (6.14) es complicada. Lasaproximacionesa los valores iniciales seobtienenfácilmente con base a la figura 6.10. Este caso de estudio ilustra cómo los métodos gráficos proporcionan a menudo información muy importante para aplicar satisfactoriamente los métodos numéricos. La gráfica ilustra que este problema es complicado debido a la existencia de varias raíces, por lo que en este caso, se deben usar intervalos pequeños para evitar traslapes de raíces. En el cuadro 6.3 se enlistan los resultados obtenidos porlos métodos de bisección, la regla falsa y la secante, con un criterio de paro del O. 1% . Todos los métodos convergen rápidamente. Como era de esperarse,los métodos de la regla falsa y de la secante son más eficientes que el de bisección. Nótese que para todoslos métodos los errores relativos porcentuales aproximados son mayores que los errores reales. De esta forma, los resultados son exactosal menos hasta el criterio de paro, el O. 1%. Sin embargo, puede observarse también que el método de la regla falsa y el de
FIGURA 611O
Gráfico de lo posición de un amortiguador respecto altiempodespués que lo rueda del auto cae enun hoyo del camino.
" .
"
..
189
CASOS
CUADRO 6.3 Resultados obtenidosal usar los m6todos de bisecciin, regla falsay de la secante para localizar las primeras tres raíces delas vibraciones de un amortiguador. Seu d un crfterio de paro del 0.1 para obtener estos resultados. N6tese quelos valores exactos de las raíces son0.055 209 532 9, 0.1 54 178 13 y 0.253 1 4 6 726 ~
-~
MBtodo
Valor inicial Valor inicial Aproximaciin Número de inferior superior a la M ~ Z
Bisección
0.0
o. 1
0.1
0.3
0.2 0.0
Regla falsa
o. 1
Secante
0.0
0.0552246 0.1541992
0.2
0.1
0.2 0.3 o.1
0.2
o. 1 0.1541780 0.2
0.0552095 0.069 O. 1541790 0.043 0.2531475 0.0552095
0.2
0.3
0.2531465
ERROR RELATIVO PORCENTUAL iteraciones Aproximado Verdadero 110.027 0.014 10
0.088 0.063
5
0.002
4 4
5 5 5
0.0001 0.0006
0.0003 0.038 0.020 0.017
0.0001 0.0001 0.0001
la secante son muy conservadores en esta relación. Recuérdese el análisis de la sección 4.3 en que elcriterio de paroconstituye esencialmente una aproximación a la diferencia con la iteración anterior. De esta forma, para esquemas de convergencia rápida como los métodos Cte la regla falsa y de la secante, la mejora en exactitud entre dos iteraciones sucesivas es tan grande que E" será, en general, mucho menor que E,. El significado práctico de este comportamiento es de poca importancia cuando se va a determinar sólo una raíz. Sin embargo, si se requiere calcualar varias rakes, la convergencia rápida viene a ser una propiedadmuy valiosa como para tomarla en cuenta cuando se escoge un método en particular.
PROBLEMAS Ingeniería en general 6.1
Usando los programas propios, reprodúzcanse los cálculos realizados en el caso 6.1.
6.2
Realícense los mismos cálculos del caso de estudio 6.1, pero usando una tasa de interés del 17% (i = 0.17). Si es posible, úsense los programaspropios para determinar los puntos de equilibrio. De otra manera, úsese cualquiera de los métodos analizados en los capítulos 4 y 5 y realícense los cálculos. Justifíquese el uso del método escogido.
6.3
Enel caso 6.1, determínese el número de años que se debe poseer laMicro dos para que genere ganancias. Esto es, calcúlese elvalor de n en el cual A, de la ecuación (6.4) sea positivo.
METODOS NUMERICOS PARA INGENIEROS
190
6.4
Usando un esquema similar al del caso 6.1, se puede desarrollar la siguiente ecuación para determinar el costo anual neto de una microcomputadora:
-3000(1.2),
A"
+-
12" - 1
175n 12" - 1
+
5000
Encuéntrese el valor de n tal que A, sea cero. 6.5
Supóngase que se desea comprar un automóvil y est6 limitado a dos opciones. Como en el caso 6.1, el costo anual neto de poseer cualquiera delos dos vehiculos está compuesto por el costo de compra, costo de mantenimiento y de las ganancias:
Costo de compra, $ Costo de mantenimiento, $/año/aiio -200
Modelode lu/o
Modelo econ¿mico
- 15,000
-5000
-400
Ganancias anuales y beneficios, $
7500
Si la tasa de interés es del 12.5% ( i para los automóviles. 6.6
0.125),calcular el punto de equilibrio (n)
Si se compra una pieza de equipo en$20 O00 en abonos, pagando $5 O00 duranel costo te 5 años. ¿Qué tasa deinterés se está pagando?La fórmula que relaciona actual (P),los pagos anuales ( A ) ,el número de años (n)y la tasa de interés es:
A = P 6.7
=
3000
i(l
+
(1 +
i)"
i)"
Debido a que las tablas de economía se desarrollaron hace mucho tiempo, no se programaron para las tasas altas de interés que prevalecen hoy en día. Además, no se planearon para manejar tasas de interés fraccionarias. Como e n el problema siguiente, se puedenusar métodos numéricos para deteminar las estimaciones económicas en estas situaciones. Un nuevo centro dediversiones cuesta $10 millones de pesos y produce una ganancia de $2 millones. Si la deuda se debe pagar en 10 años ¿a qué tasa de , el pago anual (A) y la tasa interés debe hacerse el préstamo? El costo actual (P) de interés (i)se relacionan entre sí mediante la siguiente fórmula:
P
- -
(1
A
+
i)"
-
i(l
+
i)"
1
donde n es el número de pagos anuales. Para este problema,
P
10000000
-
= 5 2000000 A Por lo tanto, la ecuación se transforma en: "
5 =
(1
+ i(1
- 1
i)'O -
i)
PARTECASOS
LA
DOS: RAiCES DE ECUACIONES
191
La tasa de interés que satisface esta ecuación se puede determinar encontrando la raíz de:
j(i) = a)
(1
+
- 1
¡)'O
+ i)
i(l
-5
Dibújese j(i) contra i y para obtener una estimación gráfica de laraíz.
b) Cacúlese i usando el método de bisección (contar las iteraciones).
c) Calcúlese i usando el método de la regla falsa (contra las iteraciones) En los incisos (b) y (c) úsense los valoresiniciales de i = 0.1 y 0.2. Obténgase
un niveldel errordel 2% en ambos casos.
Ingeniería química 6.8
Usando losprogramas propios, realícense los cálculos del caso 6.2.
6.9
Ejecútense los mismos cálculos del caso 6 . 2 , pero con el alcohol etílico (a = 12.02 y b = 0.084 07) a una temperatura de 350" K y una p de 1.5 atm. Compárense los resultados con los de la ley de los gases ideales. Si es posible, úsense los programas propios para determinar el volumen molar. De otraforma, úsense cualquierra de los métodos numéricos analizados en los capítulos 4 y 5 para realizar los cálculos. Justifíquese el método escogido.
6.1 O Repítase el problema 6.9 con óxido nitroso (a = 3.782 y b = 0.044 15) a una temperatura de 450" K y una p de 2 atm. 6.11
La temperatura (en grados Kelvin) de un sistema, varíadurante el díade acuerdo con:
T
=
400
+
200
COS
27rt ~
1440
en donde t se expresa en minutos. La presión sobre el sistema esta dada por p = e-t'1440. Desarróllese un programa que calcule el volumen molar del oxigeno en intervalos de un minuto a lo largo del día. Grafíquense los resultados. Si se tiene capacidad gráfica en la computadora grafíquense los datos. Si no es así, grafíquense los resultados a intervalos de 60 minutos. Los antecedentes de este problema se pueden econtrar en el caso 6 . 2 . 6.12
En ingeniería química, los reactores de flujo (es decir, aquéllos en que un fluido va de un extremo al otro con una mezcla mínima a lo largo del eje longitudinal) se usan a menudo para convertir reactivos en productos. Se ha determinado que la eficiencia de la conversión se puede mejorar a veces reciclando una parte del flujo del producto de manera que regrese a la entrada para un paso adicional a travésdel reactor (Fig. P6. 12). La tasa de reciclaje se define como:
R =
volumen de fluido regresado a la entrada volumen de fluido que deja el sistema
Supóngase que se est&procesando una sustancia químicaA para generarun producto B. Para el caso en que B de acuerdo a una reacción autocatalítica.
192
MÉTODOS NUMERICOS PARA INGENIEROS
FIGURA P6.12
Representaciónesquemática de u n reactor d e fluioconreciclaje.
(esto es, en la que uno de los productos actúa como catalizador o de estimulante en la reacción), o
A + B
- B + B
se puede demostrar que una tasa óptima de
reciclaje debe satisfacer
en donde X,, es la fracción del reactante A que se convierteal producto B . La tasa óptima de reciclaje corresponde aun reactor de tamaño mínimo, necesario para alcanzar el nivel de conversión deseado. Úsese el método de bisección para determinar las tasas de reciclaje necesarias que minimicen al tamaño del reactor en conversiones fraccionales de U ) X,, = 0.99 b ) X , = 0.995 c)XA/ = 0.999
6.13 En un proceso químico, el vapor de agua (HzO) se calienta a una temperatura lo suficientementealta para que unaporción significativa del agua sedisocie o se rompa en partes para formar oxígeno (O,) e hidrógeno (Hz):
Si se supone que es la única reacción que se lleva a cabo, la fracción molar (x) de HzO que se separa puede representarse como: k, = 1 - x
[P6.13]
en donde k, es la constante d e equilibrio de la reacción y p t es la presi6n total de la mezcla. Si p t = 2 atm. y k, = 0.045 68, determínese el valor de x que satisface a la ecuación (P6. 13).
Ingeniería civil 6.14 Usando los programas propios, repítanse
los cálculos del caso 6 . 3
CASOS DE LA PARTE DE DOS: RAíCES
193
ECUACIONES
6.15 Efectúense los mismos cálculos del caso 6.3, pero con una tasa de crecimiento de 1.5 por lo6 litros por célula por día.
6.17 La concentración de la bacteria contaminante C en un lago decrece de acuerdo a la relación:
Determínese el tiempo requerido para que la bacteria se reduzca a 10, usando un médoto gráfico y b) el método de Newton-Raphson.
a)
6.18 Muchos campos de la ingeniería requieren estimaciones exactas, de la población. Por ejemplo, para la transportación, los ingenieros consideran necesario determinar por separado la tendencia del crecimiento demográfico de una ciudad y de los suburbios adyacentes. La población del área urbana declina en función deltiempo de acuerdo con
mientras que la población suburbana crece, de acuerdo
a
en donde Pu,m6x, k,, Pu,mín, , Ps,max, Po y k, son parámetros derivados de forma empírica. Determínese el tiempo y los valores correspondientes de P,(t) y de P,(t)cuando las poblaciones son iguales. Los valores de los parámetros son Pu,,,&= 60 000; k, = 0.04 año"; Pu,mín = 12 000; Ps,mdix = 5 O00 y k, = 0.06 año"'Para obtener las soluciones, úsese a) un método gráfico y b) el método de la regla falsa. 6.19 El movimiento de una estructura se define mediante una oscilación amortiguada:
la siguiente ecuación para
y = 10e-kf cos w t
donde k = 0.5 y w = 2. a) osese el método gráfico, para obtener unaestimación inicial del tiempo necesario para que el desplazamiento baje hasta 4. b) Úsese el método de Newton-Raphson para determinar laraíz hasta un E, =
0.01%. c) Úsese
el método de la secante para determinar la raíz hasta un es
=
0.01%.
194 -
METODOS NUMtRICOS PARA INGENIEROS
6.20 La figura P6.20 muestra un canal abierto de dimensiones constantes con un área transversal A . Bajo condiciones de flujo uniforme, se cumple la siguiente relación basada en la ecuación de Manning: Q
=
"(
n
B
+
2y,
)
23
su2
[P6.7]
B es el ancho del en donde Q es el flujo, y, es la profundidadnormal, para medir los efectos de canal, n es un coeficiente derugosidadusado lafriccióndel materialen el canal y S es la pendiente del canal. L a ecuación se usa en ingeniería de fluidos y recursos de agua para determinar la profundidad normal. Si este valor es menor que la profundidadcrítica: FIGURA P6. 20. en donde g es la aceleración de la gravedad (980 cm/s2),entonces el flujo es subcrítico. Úsese un método gráfico y el método de bisecciónparadeterminar y,, si Q = 14.15 m3/s; B = 4.572 m ;n = 0.017 y S = 0.001 5. Señálese siel flujo es sub o supercrítico.
Ingeniería eléctrica 6.21 Úsense los programaspropios para repetir los cálculosdel caso 6.4. 6.22 Efectúense los mismos cálculos del caso 6 . 4 suponiendo que la carga se debe disiparal 2% de su valororiginalen 0.04 s. 6.23 Efectúense los mismoscálculosdel caso 6 . 4 , determinando el tiempo necesario para que el circuito disipe el 10% suvalor original, dado R = 300 Q C = lop4 FyL = 4H. 6.24 Efectúense los mismos cálculos del caso 6 . 4 determinando el valor de L necesario para que elcircuitodisipe al 1% de su valororiginalen t = 0.05 S, dado R = 300 Q y c = F. 6.25 Una corriente oscilatoriaen un circuito eléctrico se describemediante I = 1Oe" sen(27rt)
en donde t está dado en segundos. Determínense todos los valores de t tales que I = 2.
Ingeniería mecánica 6.26 Usando los programas propios, repítanse los cálculos realizadosen el caso 6 . 5 . 6.27 Efectúense los mismos cálculos del caso 6 . 5 , usando k = 1.5 por lo9 g/s2 y m = 2 por lo6 g .
c =
1.5 por
lo7 g/s,
PARTECASOS
LA DE
DOS: RAíCES
ECUACIONES
195
6.28 Efectúense los mismos cálculos del caso 6.5, pero determinando el valor de k de forma tal que la primera raíz se encuentre en t = 0.08 s. 6.29 Efectúense los mismos cálculos del caso 6.5, pero determinando el valor de m de tal forma que la primera raíz se encuentre en t = 0.04 s. 6.30 Efectúense los mismos cálculos del caso 6.5 pero determinando el valor de c de tal forma que la segunda raíz se encuentre en t = 0.2 s. 6.31 Léanse todos los casos del capítulo 6. En base a la lectura y a la experiencia obtenida, concíbase un caso de estudio en cualquier campo dela ingeniería. Esto implica la posibilidad de modificar o expresar de forma diferente alguno de los casos anteriores. Sin embargo, también puede ser totalmente original. AI igual que los ejemplos anteriores, se debe redactar desde el contexto de los problemas de ingeniería y debe demostrar el uso de los métodos numéricos en la solución de raíces de ecuaciones. Descríbanse los resultados empleando los casos anteriores como modelo.
EPíLOGO: PARTE I I
11.4
ELEMENTOS DE JUICIO El cuadro 11.3 proporciona un resumen de los factores de mayor importancia quese emplean en la solución de raíces deecuacionesalgebraicasy trascendentales. Aunque los métodos gráficosconsumen tiempo, son muy útiles para comprenderel comportamiento de la función y para identificar valores iniciales y problemas potenciales,como las raíces múltiples. Par lo tanto, si el tiempo lo permite, un bosquejo rápido (o mejor aún, una gráfica por computadora) ayuda arelacionar información útil asociada al comportamiento de la función. Los métodos numéricos se dividen en dos categorías generales: métodos que usan intervalosy métodos abiertos. Los primeros requieren dos valores #I Esta conteniniciales quecontenganalaraíz. ción" se respeta a medida que la solución avanza, y de esta forma, estos métodos siempre son convergentes. Sin embargo, tiene el inconveniente que la velocidad de convergencia es demasiado lenta. De los métodos que usan intervalos, el método de la regla falsa, en general, es el método de preferencia ya que en la mayor parte de los problemas converge muchomás rápido que el método de bisección. Los métodos abiertos se distinguen de los que usan intervalos en que requieren informaciónúnicamente de un punto (o de dos, pero que no contengan a la raíz necesariamente) para extrapolar una nueva aproximación a la raíz. Esta propiedad es una espada de doble filo. Aunque conduce a una convergencia más rápida, también permitela posibilidad de divergencia. En general, la convergencia de los métodos abiertos depende parcialmente de la calidad del valor inicial. Entre más cercano se encuentre éste de la raíz, más probable es que converja a la misma. De los métodos abiertos, el de Newton-Raphson se usa más a menudo, debido a su propiedad de convergencia cuadrática. Sin embargo, su mayor desventaja estriba en que la derivada de la fun-
198
METODOS NUMÉRICOS PARA INGENIEROS
I
e
C
S O ._
O
M
z
W
3
m
O + C
2
.-O
U
i N
199
EPíLOGO PARTE I I
ción se debe obtener de forma analítica. Para algunas funciones esto es impráctico. En estos casos, el método de la secante proporciona una alternativa viable empleandoun método de diferencias finitas para representar la derivada. Debido a la aproximación, la velocidad de convergencia del método de la secante es menor que la del método de Newton-Raphson. Sin embargo, a medida que la aproximación a la raíz se hace más y más exacta, la aproximación a la derivada se convierte en una mejor representaciónde la derivada exacta y la velocidad de convergencia aumenta rápidamente. En el caso de raíces múltiples, se puede usar el método de Newton-Raphson modificado para alcanzar una convergencia rápida. Sin embargo, este método y la segunda derequiere de una expresión analítica de la primera rivadas. Todos los métodos numéricos son fáciles de programar sobre unamicrocomputadora y requieren de un tiempo mínimo para determinar una raíz. En base a esto, se concluye que los métodos tales como la bisección son suficientes para propósitos prácticos. Esto sería verdadero si se estuviese interesado únicamente en una raíz de una ecuación. Sin embargo, existen muchos casos dentro de la ingeniería en donde se requiere encontrar varias raíces en cuyo caso la velocidad viene a ser un factor muy importante. Enestos casos, los métodos lentos consumen mucho tiempo y por lo tanto se vuelven costosos. Por el otro lado, los métodos rápidos pueden divergir ylos retardos ocasionados por esto se pueden volver también costosos. Algunos algoritmos pretenden aprovecharlas ventajasde ambos métodos, empleando inicialmente un método que use intervalos para acercarse a la raíz y en ese momento cambiar a un método abierto para refinar rápidamente la raíz. Mientras se use sólo un método o una combinación de ellos, los factores a tomarse en consideración entre la convergencia y la velocidadson la base en la elección del método para localizar raíces.
11.5 RELACIONES Y FóRMULAS IMPORTANTES El cuadro 11.4 resume la información más importante que se analiza en la parte II. Este cuadro se puede consultar para tener acceso rápido a alguna relación o fórmula importante.
11.6 MÉTODOS AVANZADOS Y ALGUNAS REFERENCIAS ADICIONALES Los métodos de este capítulo han sido limitados para determinar las raíces de una ecuación algebraicao trascendental, basados en el co-
METODOS
200
NUMERICOS
PARA INGENIEROS
CUADRO 11.4 Resumen de la informacidn más importante presentada en la parte I1 Mdtodo
Formulación
Interpretación gráfica
Errores y criterios paro de
MOtodos que usan intervalos: Bisección
x/ ixu
xr = -
Criterio de paro:
2
Criterio de paro:
Regla falsa
nueva
pesada
Métodos abiertos: Newton-Raphson
1
x;+;,+; x,
Error:
Secante
1
Criterio de paro:
E,,.l
100% Ie, =
:
O(€?)
Criterio de paro:
EPíLOGO PARTE II
201
nocimiento previo de su posición aproximada. Existen otras técnicas para deteminar raíces complejas y todas las raíces de un polinomio. Algunas referencias recomendables al respecto son Ralston y Rabinowitz (1978) y Carnahan, Luther y Wilkes (1969). James, Smith y Wolford (1977) y Gerald y Wheatley (1984) resumen algunos de los métodos y proporcionan sus programas. En cuanto a técnicas específicas el método de Newton-Raphson se puede usar en ciertos casos para localizar raíces complejas en base a una aproximación inicial compleja. Ya que la mayor parte de las computadoras no llevan acabo operaciones complejas, algunas veces el método se ve limitado. Sin embargo, Stark (1970) ilustra una manera de eludir este dilema.
El método de Muller es parecido al método de la regla falsasólo que este usa interpolación cuadrática, en vez de lineal, para localizar la raíz. Este planteamiento se puede emplear en la determinación tanto de raíces complejas como de reales (Muller, 1956; Gerald y Wheatley, 1984; Rice, 1983). Existen varios métodos para determinar todas las raíces de un polinomio. El método de Bairstow requiere una buena aproximación inicial para la localización eficiente de raíces (Gerald y Wheatley, 1984 y James, Smith y Wolford, 1977). El método de Graeffe (Scarborough, 1966 y James, Smith y Wolford, 1977) y el algoritmo de/cociente de diferencias ( Q D ) (Henrichi, 1964 y Gerald y Wheatley, 1984) determinan todas las raícessin una aproximación inicial.Ralston y Rabinowitz (1978) y Carnahan, Luther y Wilkes (1969) contienen también análisis de los métodos mencionados anteriormente, así como de las otras técnicas para la localización de las raíces de un polinomio. En resumen, el análisis anterior va enfocado a proporcionaral lector formas de explorar más a fondo los temas. Además, todas las referencias anteriores proporcionan descripciones de las técnicas básicas cubiertas en la parte II. Es importante quese consulten estas fuentes de información para ampliar el conocimiento de los métodos numéricosen la localización de raíces.*
* El autor hace aquísólo una referencia alos libros, al final del texto se presenta una bibliografía completa.
104
MhODOS NUMERICOS PARA INGENIEROS
cuatro o más ecuaciones la solución se torna difícil y se debe utilizar una computadora. Históricamente, la imposibilidad de resolverestos sistemas a mano, excepto sistemas muy pequeños, limitó el alcance de problemas dirigidos a muchas aplicaciones de ingeniería. Antes del uso de las computadoras, las técnicas para solucionar sistey eran mas de ecuaciones algebraicaslineales requerían mucho tiempo muy difíciles. Estos planteamientos creaban restricciones sobre la creatividad ya que los métodos eran difíciles de implementar y de entender. Be ahí que se hacía hincapié en las técnicas, a costa de otros aspectos del proceso de solución al problema,tales como la formulación y la interpretación (recuérdese la figura 1.1 y el análisis que la acompaña).
El advenimiento de computadoras personales de fácil acceso haceposible y práctica la solución de grandes sistemas de ecuaciones algebraicas lineales. De esta manera, se pueden plantear problemas más complejos y más realistas. Además, habrá más tiempo de examinar las habilidades creativas ya que se hará más hincapie en la formulación e interpretación del problema.
FIGURA 1 1 1 . 1
Dos tipos de sistemas que pueden ser modelados usando sistemas de ecuaciones algebraicas lineales: a) sistema macrovariable que involucra un conjunto acoplada de componentes finitas y b) sistema microvariable que involucra continuidad.
SISTEMAS
205
LINEALES ECUACIONES ALGEBRAICAS
I I I. 1 . 2
Ecuaciones algebraicas lineales y su práctica en la ingeniería
Muchas de las ecuaciones fundamentales de la ingeniería se basan en las leyes de conservación (recordar el cuadro 1 1 . 1 ) . Algunas cantidades familiares que forman partede estas leyes son la masa,la fuerza, la energía y el momento. En términos matemáticos, estos principios llevan a ecuaciones de equilibrio que estudian el comportamiento del sistema; estas ecuaciones consideran las incógnitas a obtener del modelo matemático: los niveles o respuestas de la cantidad que se está modelando, las propiedades o características del sistema, y los estímulos externos que actúan sobre el sistema. Como un ejemplo, la conservación de la masa se puede usar para formular un balance de masa en un conjunto de reactores químicos (Fig. Ill. 1 a). En este caso la cantidad que se modela es la masa de la sustancia en cada reactor. Las propiedades del sistema son las características de la reacción de lasustancia además de los tamaños de los reactores y la velocidad de flujo. Los estímulos externos son los suministros de sustancias al sistema. En la parte anterior del libro,se ve cómo sistemas de un solo componente generan una ecuación que se puede resolver con las técnicas de localización de raíces.Los sistemas con componentes múltiples generan un conjunto de ecuaciones matemáticas acopladas que deben resolverse simultáneamente. Las ecuaciones están acopladas porque las partes individuales delsistema influyen sobre otras partes. Por ejemplo, en la figura 1 1 1 . 1 a, el reactor 4 recibe sustancias de los reactores 2 y 3. En consecuencia, su respuesta depende de la cantidad de sustancia de estos reactores. Cuando estas dependencias se expresan en forma matemática, las ecuaciones resultantes, a menudo, son de la forma algebraica de la ecuación (Ill.1). Las x , usualmente, miden las magnitudes y respuestas de los componentes individuales. Con la figura Ill.la como ejemplo, x , puede medir la cantidad de masa en el primer reactor, x:, la del segundo, etcétera. Las a, representannormalmente las propiedades y características que se refieren a las iteraciones entre las componentes. Por ejemplo, lasa en la figura Ill. 1 a pueden reflejar las velocidades de flujo de masa entre los reactores. Finalmente, las c representan los estímulos externos que actúan sobre el sistema, tal como los suministros de sustancias en la figura 111.1 a. Los casos de estudio en el capítulo 9 muestran otros ejemplos de tales ecuaciones, derivadas de la práctica de la ingeniería. Los problemas de componentes múltiples como los tipos anteriores resultan de modelos matemáticos discretos (macro-) o continuos
206
MÉTODOS
NUMÉRICOSPARA INGENIEROS
-__
(micro-) (Fig. 1 1 1 . 1 ) . Los problemas de variables discretas implican componentes finitos acoplados como las armaduras (caso9.3))reactores (Fig. III.la) y circuitos eléctricos (caso 9.4). Estos tipos de problemas usan modelos que proporcionan a grandes rasgosel comportamiento de un sistema en función de ciertas variables. Por el contrario, los problemas microescalados intentan describir las características de los sistemas con una base continua o semicontinua. La distribución de sustancia sobre un reactor rectangular alargado (Fig. III. 1 b) es un ejemplo de un modelo de variable continua. Las ecuaciones diferenciales derivadas de las leyes de conservación especifican la distribución de la variable dependiente para tales sistemas (caso 9.2). Estas ecuaciones diferenciales se pueden resolver numéricamente para convertirlas a un sistema equivalente de ecuaciones algebraicas simultáneas. La solución de este conjunto de ecuaciones reprelos senta una importante aplicación enel área de ingeniería para métodos de los capítulos siguientes. Estas ecuaciones están unidas porque las varihbles en cierta posición dependen de las variables de rea la mitad del reactor giones adyacentes. Por ejemplo, la concentración es una función de la concentración en regiones adyacentes. Se pueden desarrollar ejemplos similares para la distribución de la temperatura o del momento. Además de los sistemas físicos, las ecuaciones algebraicas lineales simultáneas también aparecen en una variedad de contextos en problemas matemáticos. Esto resulta cuando se requiere que las funciones matemáticas satisfagan varias condicionesde manera simultánea. Cada condición da como resultado una ecuación quecontiene coeficientes conocidos y variables incógnitas. Las técnicas expuestas en esta parte se pueden usar para encontrar los coeficientes de los sistemas cuando las ecuaciones sean linealesy algebraicas. El análisis de regresión (capítulo 10) y la interpolación cúbica segmentaria (spline, capítulo l l ) son algunas de las técnicas ampliamente usadas que utilizan ecuaciones simultáneas.
111.2 FUNDAMENTO§ MATEMÁTICOS
En todas las partes de este libro se requieren algunos fundamentos matemáticos. Son últiles, en la parte Ill, la notación matricial y el álgebra, ya que ofrecen una forma concisa de representar y manipular sistemas de ecuaciones algebraicas lineales. Si se está familiarizado con las matrices, puede pasarse por alto la sección 111.3. Para quienes no están familiarizados o requieren una repasada, el siguiente material proporciona una breve introducción al tema.
SISTEMAS
207
LINEALES ECUACIONES ALGEBRAICAS
111.2.1 Notación matricial U n a matriz-consta de un arreglo rectangular de elementos representados por un símbolo simple. Como se puede ver en la figura 111.2, [A] es la notación abreviada para la matriz y uiirepresenta un elemento individual de la matriz.
Al conjunto horizontal de elementosse le llama renglón y al conjunto vertical se le llama columna. El primer subíndice i siempre denota el número del renglón en quese encuentra el elemento. El segundo subíndice j denota la columna. Por ejemplo, el elemento 023 está en el renglón 2 y en la columna 3. La matriz de la figura 111.2 tiene m renglones y n columnas y se dice que es dimensión m por n (o m X n). Se le conoce como una matriz m por n. Las matrices con dimensión m =
1 en el renglón, tales como
[B] = [b,b2 . . . b"] seles llama vectores renglón. Nótese que el primer subíndice. Las matrices con dimensiónn
FIGURA 111.2
Una matriz.
=
1
por simplicidad, se omite
en la columna, tales como
208
MÉTODOS
NUMERICOS PARA INGENIEROS
se les conoce como vectores columna. Por simplicidad se omite el segundo subíndice.
A las matrices donde m plo, una matriz
[Al =
4
por
=
4
n se les llama matrices cuadradas. Por ejem-
es
a11 a12
a13
a 1 4
a22
023
024
a21
:[ 2 2: 24
Se le llama diagonal principal de la matriz a la diagonal consistente de los elementos a , , , aZ2,q 3 y ad4. Las matrices cuadradas son particularmente importantes en la solución de sistemas de ecuaciones lineales simultáneas. Para tales sistemas, el número de ecuaciones (correspondiente a los renglones) y el número de incógnitas (correspondientea las columnas)deben ser iguales en orden para que sea posible unasolución única. Por consiguiente, las matrices cuadradas se encuentran al trabajar con tales sistemas. Algunos tipos especiales de matrices se describen en el recuadro 1 1 1 . 1 .
RECUADRO 1 1 1 . 1 Tipos especiales de matrices cuadradas Hay algunas formas especiales de matrices cuadradas Nótese que se deian en blanco los bloques grandes de que son importantes y se deben mencionar: elementos que son cero. Una matriz simétrica es aquella donde ai; = qij para Una matriz identidad es una matriz diagonal donde totoda toda i y ;. Por ejemplo, dos los elementos dediagonal la principal son iguales a 1 , como en
[A] =
[i 1 a]
es una matrizsimétrica 3 por 3. Una matriz diagonal es una matriz cuadrada donde todos los elementos fuera de la diagonal principal son iguales a cero, como en
[/I =
rll 1 1
11
El símbolo [ I ] denota la matriz identidad. Esta matriz a la unidad.
tiene propiedades
Una matriz triangular superior es aquella donde todos sus elementos baio la diagonal principal son cero, como
I
[all all
[Al =
L
a13
I
a141
a33 a34 a23
(7441
SISTEMAS
209
LINEALES ECUACIONES ALGEBRAICAS
Una motriz triangular inferior es aquella donde todos sus elementos arribadeladiagonalprincipal son cero, como
cero, con la excepción de una banda centrada sobre la diagonalprincipal:
Una motriz banda tienetodos los elementosiguales a
le da un nombre especial,
La matriz anterior tiene un ancho de banda de 3 y se motr;z tr;d;agonal,
111.2.2 Reglas de operación sobre
matrices
Ahora que se ha especificado lo que significa una matriz, se pueden definir algunas reglas de operación que gobiernansu uso. Dos matrices m por n son iguales, si y sólo si, cada elemento de la primera es igual a cada elemento de la segunda; esto es [A] = [B] si a;, = bjjpara toda i, j. La suma de dos matrices, [A] y [B], se realiza sumando los elementos correspondientes de cada matriz. Los elementos de la matriz [C]resultante se calculan como:
parai =
1, 2,.
. .,m y i =
1 , 2,
- . . , n.
De forma similar, la resta de dos matrices, do los términos correspondientes, como:
d.. 'I 'I = e.."..
[E]y [ F ] , se obtiene restan-
'I
..
para i = 1 , 2, . . . , m y j = 1 , 2, . , n. De la definición anterior, se sigue inmediatamente que la suma y la resta se puede llevar a cabo sólo entre matrices que tienen las mismas dimensiones. La suma y la resta son conmutativas:
Y
210
MÉTODOS
NUM~RICO PARA S INGENIEROS
La suma y la resta también son asociativas, esto es,
La multiplicación de una matriz [A] por un escalar g se obtiene multiplicando cada elemento de [A] por g, como en
El producto de dos matrices se representa como [C]= [A][B],en donde los elementos de [C]se definen como (véaseel recuadro 111.2 donde se expone el concepto simple de la multiplicación matricial) n
C;; =
k= 1
a r k bk;
[111.2]
Donde n = la dimensión de las columnas de [A] y la dimensión de los renglones de [B].
RECUADRO 111.2 Método simple para multiplicardosmatrices Aunque la ecuación (111.2) está bien definida para implementarse en una computadora, no es la forma más simple de visualizar la mecánica de multiplicación de dos matrices. En seguida se presenta una expresión más tangible sobre este concepto. Supóngase que se desea multiplicar [A] por [B] y obtener [C]:
Ahora la respuesta [C]se puede calcular en el espacio vacante deiado por[B]. Este formato tiene utilidad porque alinea los renglones apropiados y las columnas que se van a multiplicar. Por ejemplo, de acuerdo a la ecuación (111.2) el elemento c1 se obtiene multiplicando el primer renglón de [A] por la primera columna de [B]. Esto es equivalente a sumar el producto de al producto de y b , , como
U n a forma simple de representar el cálculo de [C]es elevar [B], como en
y
bl,,
2 91
7=22
For io tanto, c l , , es igual a 22. El elemento c2,,se puede calcular en una forma similar, como
14".:',
21 1
LINEALES SISTEMAS ALGEBRAICAS DE ECUACIONES
[A]+
8 6
x5+6~7=82
+[C]
o 4
El calculo se puede continuar deesta manera, siguiendo la alineación de renglones y columnas, para obtener el resultado:
Nótese que este método esclarece el porqué es imposible multiplicar si el número de columnas de la primera matriz no es igual al número ¿e renglones de la segunda. Nótese cómo demuestra que el orden de la mdtiplicación coincide también. De la misma manera ilustra estos puntos el problema 7.3.
Esto es, el elemento cji se obtiene sumando el producto de elementos individuales del i-ésimo renglón de la primera matriz, en este caso [A],por la i-ésima columna de la segunda [B]. De acuerdo a esta definición, la multiplicación de dos matrices sólo se puede realizar si la primera matriz tiene tantas columnas como renglones la segunda. Por lo tanto, si [A] es una matriz m por n, [B] deberá ser una matriz n por p. En este caso, la matriz [C]resultante tendrá dimensión m por p. Sin embargo, si [B] fuese una matriz p por n, la multiplicación no se podría llevar a cabo. La figura 111.3 muestra una forma fácil de verificar si se pueden multiplicar dos matrices.
Si las dimensiones de las matrices son compatibles, la multiplicacion matricial es asociativo:
FIGURA 111.3
Una manera simple de comprobar si es posible multiplicar dos matrices.
212
MhODOS NUMÉRICOS PARA INGENIEROS
y distributiva:
Sin embargo, en general la multiplicación no es conmutativa:
[AI[Bl Estoes,el
+ [BI[AI
orden de multiplicación es importante.
Aunque la multiplicación es posible, la división matricial aún no está definida. Sin embargo, si una matriz [A] es cuadrada, hay otra matriz [A]", llamada la inversa de [A], tal que
[A]" [A]
[A]= [A]"
= [I]
[111.3]
De esta forma, la multiplicación de una matriz por su inversa, es análoga a la división, en el sentido de que un número dividido por sí mismo es igual a uno. Esto es, la multiplicación de una matriz por su inversa es igual a la matriz identidad (recuérdese el recuadro 111.1). La inversa de unamatriz cuadrada bidimensional se puede representar simplemente como:
[A)"
1
= 0 1 1 a22
- a12 9 1
[
e 2 - 9 1
-a12
al,]
[111.4]
Las matrices de dimensión mayor son mucho más difíciles de expresar. La sección 8.2 se dedica a estudiar una técnica que calcula la inversa de tales sistemas. Las operaciones finales de las matrices que tienen utilidad en este análisis son las de transposición y de matriz aumentada. La transpuesta de una matriz comprende la transformación de sus renglones en columnas y sus columnas en renglones. La transpuesta de la matriz:
SISTEMAS
213
LINEALES ECUACIONES ALGEBRAICAS
denotada por
[AlT, se define como:
En otras palabras, el elemento a;;de la transpuesta es igual al elemento ai;de la matriz original, o ai = ai;. La matriz transpuesta tiene una gran variedad defunciones en el álgebra matricial. Una ventaja simple es la de permitir escribir un vector columna como vector fila. Por ejemplo, si:
entonces
en donde el superíndice T denota transposición. Esto puede ahorrar espacio al escribir un vector columna en un manuscrito. Además, la matriz transpuestatiene una gran variedad deaplicaciones en las matemáticas. Una matriz aumentada es el resultado de agregarle una columna (o más columnas) a la matriz original. Por ejemplo, supóngase que se tiene una matriz:
Si se desea aumentar esta matriz [A] con una matriz identidad (recuérdese el recuadro Ill. 1 ), entonces se obtiene una matriz 3 por 6 dimensional, dada por:
214
MhODOS NUMERICOS PARA INGENIEROS
-
Esta expresión tiene utilidad cuando se desea realizar un conjunto de operaciones idénticas sobre dos matrices. De esta forma, se pueden llevar a cabo las operaciones sobre una matriz aumentada en vez de hacerlo sobre dos matrices independientes.
111.2.3 Representaciónenformamatricial
de sistemas de
ecuaciones algebraicas lineales Debe ser claro que las matrices proporcionan una notación concisa en la representación de ecuaciones simultáneas lineales. Por ejemplo, la ecuación ( 1 1 1 . 1 ) se puede expresar como:
donde
[A] es una matriz cuadrada n por n de coeficientes:
[Al =
[C]es
unvector columna n por
[C]T = y
c2 c3
[Cl
. . . cn]
[Aes un vectorcolumna [XIT = [xx1x23
1 de constantes:
..
n por 1 de incógnitas:
xn]
Recuérdese la definición de la multiplicación matricial [Ec. (111.2) o recuadro 111.21 para comprobar laequivalencia de las ecuaciones( 1 1 1 . 1 ) y (111.5).También, nótese que la multiplicación matricial (111.5) es válida ya que el número de columnas ( n ) de la primer matriz ([A])es (n) de la segunda matriz igual al número de renglones
([A).
[A.
En esta parte del libro se resuelve la ecuación (111.5) para Una manera formal de obtener una solución usando álgebra matricial es la de multiplicar cada lado de la ecuación por la inversa de [A] para obtener:
Ya que [A]” vierte en:
[A] es la matriz identidad, la ecuación anterior se con-
[XI = [Al”[Cl
1
[111.6]
SISTEMAS
21 5
ECUACIONES LINEALES ALGEBRAICAS
[A.
Por lo tanto, la ecuación se ha resuelto para Este es otro ejemplo del juego de la matriz inversa similar a la división en el algebra matricial. Finalmente, algunas veces es útil aumentar [A] con [C].Por ejemplo, si n = 3 el resultado es una matriz 3 por 4 dimensional, dada por:
[111.7] Expresar de esta manera la ecuación tiene utilidad, ya que varias de las técnicas en la solución de sistemas lineales hacen operacionesidénticas a una fila de coeficientes y a la constante correspondiente del lado derecho. Como se expresó en la ecuación (lll.7), se pueden realizar algunas operaciones sobre un renglón de la matriz aumentada en lugar de hacerlo separadamente sobre la matriz de coeficientes y el vector del lado derecho.
111.3 Antes de considerar los métodos numéricos,es útil mencionar alguna orientación adicional. A continuación se muestra superficialmente el material analizado en la parte Ill. Además, se han formulado algunos objetivos para ayudar a enfocar los esfuerzos cuando se estudie el material.
111.3.1 Metasyavances En la figura 111.4 se proporciona un esquema de la parteIll. El capitulo 7 muestra la técnica fundamental en la solución de sistemas alge-
braicoslineales:laeliminacióngaussiana.Antesdeentrar en los detalles de esta técnica, se incluye una sección que menciona algunos métodos simples para sistemas pequeños. Esto se hace con el fin de dar una ideavisual y debido a que uno delos métodos -la eliminación de incógnitases la base de la eliminación gaussiana. Después de presentar los antecedentes, se analiza la eliminación gaussiana simple. Se inicia con esta versión ya que permite la elaboración del método completo sin mayores complicaciones. Después,en las siguientes secciones, se analizan posibles problemas que usen el método simple presentando ciertas modificacicnes que minimiceny eviten estos problemas. AI final del capítulo, se dedica un recuadro a una formamuy
216
MÉTODOS NUMÉRICOS PARA INGENIEROS
FIGURA 111.4
Esquema de organización de braicas lineales.
la parte Ill: Sistemas de ecuaciones alge-
eficiente de la eliminación gaussiana que puede mas tridiagonales.
ser usado en siste-
En el capítulo 8 se empieza con el análisis del método de Gauss-Jordan. Aunque esta técnica es muy parecida a la eliminación gaussiana, se analiza porque permite calcular la matriz inversa que tiene una utilidad inmensa en la ingeniería.
SISTEMAS DE ECUACIONES ALGEBRAICAS LINEALES
21 7
La eliminación gaussiana y el método de Gauss-Jordan son métodos directos. AI final del capítulo 8 se estudia un método diferente conocido como método de Gauss-Seidel. Éste es parecido a los métodos de aproximación de raíces de ecuaciones quese estudiaron en el capitulo 5. Esto es, la técnica implica dar una aproximación inicial a la solución y mediante iteraciones obtener un valor meiorado. En el capítulo 9 se demuestra como se pueden aplicar los métodos en la solución de problemas. Así como en otras partes del libro, se examinan aplicaciones extraídasde todos los campos de la ingeniería. Finalmente, al terminar la parte Ill se incluye un epílogo. Este repaso incluye el análisis de los elementos de juicio importantes en la implementación de los métodos en la ingeniería práctica. En esta sección también se resumen las fórmulas de mayor importancia y los métodos avanzados relacionados conlas ecuaciones algebraicas lineales, por lo que se pueden usar para estudiar antes de un examen o como repaso cuandose tenga necesidad de utilizar las ecuaciones algebraicas lineales en la vida profesional. Las capacidades de cómputo automático se integran en la parte Ill en una variedad de formas. Primero, en NUMERICOMP, se encuentran disponibles programas amables con el usuario de la eliminación IBM-PC.También se gaussiana para la microcomputadora Apple-ll e proporcionan los programas en FORTRAN y BASIC de la eliminación gaussiana directamente en el texto. Esto le d a al usuario la oportunidad de copiary aumentar los programas para implementarlos en su microcomputadora o supercomputadora. También se incluyen los diagramas de flujo o los algoritmos en la mayor parte de los métodos descritos en el libro. Este material puede formar la base de un paquete de programas que el mismo usuario puede desarrollar y aplicar a una gran cantidad de problemas de ingeniería.
111.3.2 Metas y objetivos Objetivos de estudio. AI terminar la parte Ill, el usuario debe ser capaz de resolver la mayor parte de problemas que impliquen utilizar ecuaciones algebraicas lineales y poder visualizar las aplicaciones de estas ecuaciones en todos los campos de la ingeniería. El usuario debe hacer lo posible por dominar variastécnicas y valorar la confiabilidadde lasmismas. Debe entenderlasventajasydesventajas involucradas en la selección del "mejor" método (o métodos) en cualquier problema particular. Además de estos objetivos generales, se deben asimilar y dominar los conceptos específicos enumerados en el cuadro 1 1 1 . 1 .
218
MÉTODOS
NUMÉRICOS
PARA INGENIEROS
Objetivos de c6rnputo. El objetivo fundamental en cuanto a cómputo, es el de ser capaz de usar en forma satisfactoria un programa para resolver sistemas de ecuaciones algebraicas lineales. Debe quedar claro el uso de los programas de NUMERICOMP, o también saber cómo copiar y usar el programa de laeliminacihn gaussianasimple dado en el texto. Estos programas le permitirán manejar adecuadamente muchos problemas prácticos que impliquen utilizar varias ecuaciones algebraicas lineales simultáneas. A medida quese avance en los problemas que contengan más ecuaciones, se pueden usar los programas, diagramas defluio y algoritmos proporcionados en la parte Ill. Eventualmente, se puede incorporar a los programas el pivoteo parcial, el cálculo de determinantes y la evaluación de condiciones. También se pueden obtener los programas paralos métodos de Gauss-Jordan y de Gauss-Seidel.
CUADRO 111.1
Objetivos de estudios específicos de la parte 111
1 . Entender las interpretaciones gráficas de sistemas mal condicionados y su relación con el determinante del sistema. a la primera versión de la eliminación gaussiana. 3 . Familiarizarse con la terminología: eliminación hacia atrás, sustitución hacia atrás, normalización, ecuación pivotal y pivote. 4 . Entender los problemas de división por cero, errores de redondeo y mal condicionamiento. 5 . Saber cómo evaluar la condición del sistema. 6 . Saber cómo calcular determinantes usando la eliminación gaussiana. 7 . Entender las ventajas del pivoteo; entenderlas diferencias entre el pivoteo parcial y el pivoteo total. 8. Saber cómo aplicarlas técnicas de corrección de errorespara mejorar las sohciones. 9 . Entender por qué las matrices banda son relativamente eficientes en su solución. 1 O . Saber la diferencia fundamental entre la eliminación gaussianay el método GaussJordcn. 1 1 . Entender cómo se usa el método deGauss-Jordan para calcular la matriz inversa. 1 2 . Saber interpretar los elementos de la matriz inversa en la evaluación de las incágnitas en ingeniería. 1 3 . Comprender el uso de la matriz inversa en la evaluación de la condición del sistema. 1 4 . Entender por qué el método de Gauss-Seidel es particularmente apropiado para sistemas grandes de ecuaciones. 1 5 . Entender par qué el valor de la diagonal de un sistema de ecuaciones influye en que el método pueda ser resuelto mediante el método de Gauss-Seidel. 1 6. Entender la razón existente detrás del concepto relajación;saber dónde es más apropiada la subrelajación y dónde la sobrerelajación.
2 . Entender por qué se le llama "simple"
CAPíTULO SIETE ELIMINACIóN GAUSSIANA
En este capítulo se analizanlas ecuaciones algebraicas lineales simultáneas que en general se pueden representar como: allxl
+ a12x2 +
a21x1
+ a22x2 + . . .
anlxl + 0~2x2+
*
*
+ al,x, =
c1
+ a2,xn = c2
- + a,,x, = c, *
endondelas a son coeficientes constantes y las c son constantes. A la técnica que se describe en este capítulose le conoce como eliminación gaussiana porque involucra una combinación de ecuaciones a las que se les eliminan las incógnitas. Aunque éste es uno de los métodos más antiguos en la soluciónde ecuaciones simultáneas, permanece hasta nuestros días como uno de los algoritmos de mayor importancia.En particular, es fácil de programary de aplicar con el uso de microcomputadoras.
7.1 SOLUCIÓN DE POCASECUACIONES Antes de entrar a los métodos que usan computadora, se describen algunos que son apropiados en la solución de pequeños grupos de ecuacionessimultáneas ( n I3) quenorequierendeunacomputadora.Estos son los métodos gráficos,la regla de Cramer y la eliminación de incógnitas.
7.1 .l Método gráfico Se obtiene una solución gráfica de dos ecuaciones representándolas en coordenadas cartesianas con un eje correspondiente a x1 y el otro a x2. Ya que el problema es para sistemas lineales, cada ecuación representa
220
METODOS NUMÉRICOS
unalínea recta. Esto puede ilustrarse fácilmente por las nerales: QlXl
+ a12xz
PARA INGENIEROS
ecuaciones ge-
= c1
a21x1 + a22x2 =
c2
Ambas ecuaciones se pueden resolver para x2:
De esta manera, las ecuaciones se encuentran ahora en la forma de líneas rectas; esto es, x2 = (pendiente) x1 + intersección. Estas líneas se pueden graficar en coordenadas cartesianas con x2 como la ordenada y x1como la abscisa. Los valores de x1y x2 enla intersección de las líneas representan la solución.
EJEMPLO 7.1 El método gráfico
para dos ecuaciones
Enunciado del problema:úsese el métodográficopararesolver 3x1 -x1
+ 2x2 = 18 + 2x2 = 2
[E7.1.1]
[E7.1.2]
Solución: sea x1 la abscisa. AI resolver la ecuación (E7.1.1) para x2:
que, al graficarse en la figura 7 . 1 , da una línea recta con una intersección en 9 y pendientede -3/2. La ecuación (E7.1.2) se puederesolverparax2: x2 = (1/2)x, + 1 la cual también se grafica enlafigura 7.1. La solución es la intersección delasdoslíneasen x1 = 4 y x2 = 3. Este resultado se puede verificar sustituyendo estos resultados en las ecuaciones originales para obtener:
I
3(4)
+ 2(3) = 18
-4
+ 2(3) = 2
22 1
ELlMlNAClON GAUSSIANA
De esta manera, los resultados son equivalentes a los lados derechos de las ecuaciones originales.
FIGURA 7.1
Solución gráfica de un conjunto de dos ecuaciones algebraicas lineales simultáneas. l a intersección ¿e las líneas representa la solución.
Para tres ecuaciones simultáneas, cada ecuación representa un plano en el sistema de coordenadas tridimensional. El punto en donde se intersecten los tres planos representa la solución. Más alládetres ecuaciones, los métodos gráficos no funcionany , por consiguiente, la solución deecuacciones algebraicas tiene muy poco valor práctico. Sin embargo, algunas veces resultan útiles para visualizar propiedades de la solución. Por ejemplo, lafigura 7.2 muestra tres casos que se pueden abordar cuando se desea resolver un conjunto de ecuaciones lineales. La figura 7.2a muestra el caso en que la dos ecuaciones representan dos líneas paralelas. En estos casos, no existe solución ya que las dos líneas jamás se cruzan. La figura 7.2b representa el caso enque las dos líneas coinciden. En este caso existe un número infinito de soluciones. A estos dos tipos de sistemas se les llama singular. También los sistemas que son casi singulares causan problemas (Figura 7 . 2 ); a estos sistemas se les k m a mal condicionados. Gráficamente, indican que el punto exacto de intersección de ambas rectas es muy difícil devisualizar. Como se veenlas siguientes
222
MÉTODOS
FIGURA 7.2
NUMÉRICOS
PARA INGENIEROS
Esquema gráfico de sistemas mal condicionados: a) no hay solución, b) hay una infinidadde soluciones y c) un sistema mal condicionadoen donde las pendientes son muy parecidas en el punto de intersección y es difícil de detectar fácilmente la solución.
secciones, los sistemas mal condicionados también tienen problemas cuando ?e encuentran en la solución numérica de ecuaciones lineales.
7.1.2 Determinantes y la regla de Cramer La regla de Cramer es otra técnica de solución aplicablea pocas ecuaciones. Antes de describir estemétodo, se menciona brevementeel concepto de determinantes, que se usanenla implementaciónde la reglade Cramer. Además, el determinante es útil enla evaluación de mal condicionamiento de unamatriz. Determinantes. Se puede ilustrar un determinante mediante un conjunto de tres ecuaciones:
o. enformamatricial:
en donde [ A ] es lamatriz de coeficientes: all
a12
a13
223
ELlMlNAClON GAUSSIANA
El determinante D de este sistema se forma con los coeficientes la deecuación, de la siguiente manera:
Aunque el determinante D y lamatriz [A] se componen de los mismos elementos, tienen conceptos matemáticos completamente diferentes. Para denotar la matriz se usan corchetes y para los determinantes se usan barras verticales. En contraste con una matriz, el determinante es un número. Por ejemplo, elvalordel determinante de segundo orden:
D=
all
a12
(a21
se calcula mediante:
En el caso de tercer orden [Ec. (7.2)], se puede calcular el valor del determinante como:
en donde a los determinantes de 2 por 2 se lesllama menores.
EJEMPLO 7.2
Determinantes
Enunciado del problema: calcúlense los valores de los determinantes de lossistemasrepresentadosenlasfiguras 7 . 1 y 7.2. Solución: para lafigura 7.1:
Para lafigura 7 . 2 ~ 1 :
1
=
-1/2 1-1,2
1 -1 11 = -(l) 2
-
1 1(%)
=
o
224
I I
INGENIEROS
PARA
Para lafigura
7.2b:
Para lafigura
7.2~:
MÉTODOS
NUMÉRICOS
En el ejemplo anterior, los sistemas singulares tienen un valor de cero. Además, elresultadoindicaqueelsistemacasisingular (Fig. 7 . 2 ~ ) tiene un determinante cercano a cero. Estas ideas se seguirán manejando posteriormente en los análisis de mal condicionamiento (sección 7.3.3). Regla de Cramer. Esta regla dice que cada incógnita de un sistema de ecuaciones algebraicas linealesse puede expresar como el cociente de dos determinantes con el denominador D y con el numerador obtenido de D reemplazando la columna de coeficientes de la incógnita en cuestión porlasconstantes cl, c2, . . . , c,. Por ejemplo, x1 se calcula como:
EJEMPLO 7.3 Regla de Cramer
Enunciado del problema: úsese
lareglade
Cramer para resolver:
+ x3 = -0.01
+
0 . 3 ~ 1 0.52~2
+
0 . 1 ~ 1 O.3X2
+ O.5X3 = -0.44
Solución: el determinante D se puedeescribir como [Ec. (7.2)]: 0.3 0.52 1
D = 0.5 1 0.1
0.3
1.9
0.5
ELlMlNAClON
GAUSSIANA
225
Los menores son:
1 10.3 0.5 0.1 0.5 A3 = 10.1 =
1.9 = l(0.5) - 1.9(0.3)= -0.07 0.5 1.9 = 0.5(0.5)- 1.9(0.1)= 0.06 0.5 1 = 0.5(0.3) - l(O.1) = 0.05 0.3
Éstos se pueden usar para evaluar el determinante, como en la ecuación
(7.4):
D
=
0.3(-0.07) - 0.52(0.06) + l(0.05) = -0.002 2
Aplicando la ecuación (7.5),la solución es:
-0.01 0.52 1 0.67 1.9 1
x1 =
x3
I -o.44
I
-= .-0.032 78
-0.002 2 0.3 -0.01 1 0.67 1.9 0.5
0.3 0.52 -0.01 10.5 1 O. 67 1O.l = "0.002 2
-0.002 2
-
=
-14.9
-0.043 56 = 19.8 -0.002 2
Para más de tres ecuaciones, la regla de-Crameres imprdctica ya que a medida que crece el número de ecuaciones, los determinantesse vuelven dificiles de evaluar a mano. Por consiguiente, se usan otras alternativasmás eficientes.Algunas de estasalternativas se basanenlaúltima técnica cubierta en este libro que no usa computadora, la eliminación de incógnitas.
7.1.3 La eliminación de incógnitas La eliminación de incógnitas mediante la combinación de ecuaciones es un esquema algebraic0 que se puede ilustrar para un conjunto de ecuaciones:
226
MhODOS NUMÉRICOS
PARA INGENIEROS
c7.61
La estrategia básicaes multiplicar lasecuaciones por constantes para que una de las incógnitas se elimine al combinar las dos ecuaciones. El resultado es una ecuación que se puede resolver para la incógnita restante. Este valor se puede sustituir en cualquiera de las ecuaciones originales para calcular la otra variable. Por ejemplo, la ecuación (7.6) se puede multiplicar por a21y la ecuación (7.7) por all paradar:
Restando la ecuación (7.8) de la ecuación (7.9),se eliminael término
x1 de la ecuación para obtener:
que se puede resolver por [7.10]
La ecuación 7.10 se puede sustituir en la ecuación (7.6),que se puede resolver por [7.11]
Nótese que las ecuaciones (7.10) y (7.11) se calculan directamente por la regla de Cramer, que establece:
XI =
1°C: I;:
- c1a22 - a12c2 alla22 - (3112a21
ELIMINACION
GAUSSIANA
227
EJEMPLO 7.4 Eliminación de incógnitas
Enunciado del problema: úsese la eliminación de incógnitas para resolver (recuérdese el ejemplo 7.1) : 3x1 + 2x2 = 18 -x1 + 2x2 = 2
Solución: usando las ecuaciones (7.11) y (7.10) x1
=
x2 =
2(18) - 2(2) =4 3(2) - 2(-1) 3(2) - (-1)18 =3 3(2) - 2(-1)
las cuales son consistentes con la solución gráfica (Fig. 7.1) La eliminación de incógnitas se puede extender a sistemas con más de dos o tres ecuaciones. Sin embargo, los cálculos numerosos que se requieren para sistemas grandes vuelven rnuy tedioso al método como para realizarlo a mano. Sin embargo, como se describe en la siguiente sección, el método se puede formalizar y programar fácilmente en una microcomputadora.
7.2 ELIMINACIóN GAUSSIANA SIMPLE En la sección anterior, se usa la elirninación de incógnitas para resolver un par de ecuaciones simultáneas. El procedimiento consta de dos pasos:
1. Se manejan las ecuaciones para eliminar una incógnita de una ecuación. El resultado de este paso de eliminación es una sola ecuación con una incógnita.
2. Por consiguiente, esta ecuación se puede resolver directamente y el resultado se sustituyehaciaatrás encontrar la incógnita restante.
en las ecuaciones originales para
Este comportamiento básico se puede extender a sistemas grandes de ecuacionesdesarrollando un esquema sistemático para eliminar incógnitas y sustituir hacia atrás. La eliminación gaussiana es una de las técnicas más comunes.
228
MhODOS NUMÉRICOS PARA INGENIEROS
7.2.1 Algoritmo para la eliminación gaussianasimple Se incluye en esta sección la técnica sistemática de eliminación haciaadelante y la sustitución hacia atrás que comprende la eliminación gaussiana. Aunque estas técnicasse adaptan perfectamentea las condiciones de implementación sobre una microcomputadora,se requieren algunasmodificaciones para obtener un algoritmo legible. En particular, el programa debe evitar divisiones por cero. Al método siguiente se le llama eliminación gaussiana "simple" porque no evita estas contingencias. Enlas siguientes secciones se muestran algunos rasgos adicionales necesarios para tener un programa efectivo. El procedimiento estáplaneado para resolver un conjunto de n ecuaciones:
+ a13x3+ + al,xn = c1 a21x1+ a22x2 + ~ 1 ~+~ x 3+ aZnxn = c2
allxl +
~112x2
* *
'
*
*
C7.1201 [7.12b]
[7.12c]
Como en el caso de solución de dos ecuaciones, el método para n ecuaciones consiste de dos fases: la eliminación de las incógnitas y su solución mediante sustitución hacia atrás. Eliminación hacia adelante de incógnitas. La primera fase reduce elconjunto de ecuaciones a un sistema triangular superior (Fig. 7 . 3 ) .El paso inicial del procedimiento consiste en dividir la primera ecuación[Ec. 7.12a1 porel coeficiente de laprimer incógnita, all: x1
+ "a12x 2 + a11
*
. + Q" lxn , al 1
c1
=-
all
A este procedimiento se le conoce como normalización y tiene como finalidad convertir el primer coeficiente de la ecuación normalizada en 1. En seguida se multiplica la ecuación normalizada por el primercoeficiente de la segundaecuación [Ec. ( 7 . 1 2 b ) ] ,a21: [7.13]
Nótese que el primer término de la primera ecuación es ahora idéntico alprimertérmino de la segunda ecuación. Por consiguiente, se puede eliminar la primera incógnita de la segunda ecuación restando la ecuación (7.13) de la (7.12b) para obtener
229
ELlMlNAClON GAUSSIANA
FIGURA 7.3
Esquema gráfico de lasdos partes del método de eliminación gaussiana. La eliminación hacia adelante reducela matriz de coeficientes a una forma triangular superior. Después, se usa la sustitución hacia atrás para encontrar las incógnitas.
O
ahax? +
* * *
+ ahnxn= c$
en donde el apóstrofo indica que los elementos han cambiado sus valores originales. El proceso se repite hasta que se elimina la primera incógnita de las ecuaciones restantes. Por ejemplo, la ecuación normalizada se multiplica por a31 y el resultado se resta de la tercera ecuación para obtener a&x2 + aj3x3
+
*
. + a&,x,, = c$
Repitiendo el procedimiento para el resto de ecuaciones da como resultado el siguiente sistema modificado: [7.14a] [7.14b] [7.14c]
[7.14d]
METODOS NUMERICOS PARA INGENIEROS
230
De ahora en adelante, a la ecuación (7.12a) se le llama ecuación pivotal y a all se le llama pivote. En seguida se repite el proceso para eliminar la segunda incógnita de hasta la (7.14d). Para hacerlo, se usa como ecualas ecuaciones (7.14~) normalizándola y dividiéndola por el pición pivotal la ecuación (7,14b) votea'22. Multiplicando la ecuación normalizada por a'32 y restando el resultado a la ecuación ( 7 . 1 4 ~se) elimina la segunda incógnita. Repitiendo el proceso conlas ecuaciones restantes se obtiene:
a"n3 x3
+
*
. + axnx, = c:
en donde el apóstrofe doble indica que los coeficientes se han modificado dos veces. El procedimiento se puede continuar usando las ecuaciones restantes como pivotales. La operación final de esta secuencia es la de usar la (n- 1)-ésima ecuaciónparaeliminar el términode la n-ésima ecuación. En ese momento el sistema se transforma en un sistema triangular superior (recuérdese el recuadro 111.1). [7.15a] [7.15b] [7.15c]
[7.15dj Sustitución hacia atrás. La ecuación (7.15d)se puede resolver para x,: 1
17.161 Este resultadose puede sustituir en la (n- 1) -ésima ecuacióny resolverse éstapara x,,~- El procedimiento se repite evaluando las x restantes, éste se puede representar mediante la fórmula:
23 1
ELlMlNAClON
[7.17]
para i = n-1,
n-2, . . . , 1.
EJEMPLO 7.5 Eliminación gaussiana simple
Enunciado del problema: úsese
3x1
-
0.1~1+
la eliminación gaussiana para resolver: [E7.5.lj
0.1~2- 0 . 2 ~ 3= 7.85
7x2
-
[E7.5.2]
O.3X3 = -19.3
~ ~lox3 = 71.4 0 . 3~ 0~ . 2 +
rE7.5.31
Efectúense 10s cálculos con seis cifras significativas. Solución: la primera parte del procedimientoes la eliminación hacia adelante. La normalización de la ecuación ( € 7 . 5 . 1se) lleva a cabo dividiéndola por el elemento pivotal, obteniendo: XI -
0,033 333 3x2
-
0.066 666 7x3
=
2.616 67
[E7.5.4]
En seguida, multiplíquese la ecuación (E7.5.4) por 0.1 y t6stese el resultado de la ecuación (E7.5.2) se tiene:
7.003 33x2 - 0.293 333x3
=
-19.561 7
[E7.5.5]
Por lo tanto almultiplicarla ecuación (E7.5.4) por O.1 y al restarla a la ecuación (E7.5.3) se elimina xl. Después de estas operaciones, el conjunto de ecuaciones es
3x1
--
o.lx,
- 0.2X3 = 7<65
rE7.5.61
7.003 33x2
-
0.293 333x3
=
- 19.561 7
[E7.5.7]
-0.190 000x2
+
10.020 Ox3
=
70.615 O
[E7.5.8]
Paraterminar la eliminaciónhaciaadelante xp debe desaparecer de la ecuación (E7.5.8).Para llevarlo a cabo, normalícese la ecuación (E7.5.7) dividiéndola por 7.003 33:
x2 - 0.041 884 8x3
=
-2.793 20
[E7.5.9]
Después, multiplíquese la ecuación ( € 7 . 5 . 9 por ) -0.190 O00 y réstese el resultado de la ecuación (E5.7.8). Con esto se elimina x2 de la tercera ecuación y reduce el sistema a la forma triangular superior, dada por:
232
METODOS
3x1 -
O.lx,
PARA INGENIEROS
0 , 2 ~= 3 7.85
-
7.003 33x2
NUMÉRICOS
-
0.293 333x3
10.012 Oxg
=
-19.561 7
[E7.5.10]
70.084 3
=
[E7.5.11]
Ahora se pueden resolver estas ecuaciones porsustituciónhacia atrás. Enprimer lugar, la ecuación (E7.5.11)se puede resolver, dando:
03
x3
=
7.000
[E7.5.12]
Esteresultado se puede sustituirenla
7.003 33x2
-
ecuación (E7.5.10),para dar:
0.293 333(7.000 03)
=
-19.561 7
que se puede resolver para
x2
=
"2.500 O0
[E7.5.13]
Finalmente, las ecuaciones (E7.S.12) y (E7.5.13)se pueden sustituir en la ecuación (E7.5.6) para dar:
3x1
-
0.1(-2.500 00)
-
0.2(7.000 03)
=
7.85
que se puede resolver para: x1 = 3.000 O0
Aunque hay un pequeiio error de redondeo enla ecuación (E7.5.E ) , los resultadosson muy cercanos a lasoluciónexactade x1 = 3, x2 = -2.5 y xg = 7 . Esto se puede verificar sustituyendo las respuestas en el conjunto de ecuaciones originales, para dar:
3(3) - 0.1(--2.5) - 0.2(7.00003)
=
7.84999
= 785
0.1(3) + 7("2.5)
-
=
-19.300 O
=
0.3(3) - 0.2(-2.5)
+
=
71.4003
= 71.4
0.3(7.00003) lO(7.000 03)
7.2.2 Programa del método de
-19.3
eliminación gaussiana simple
La figura 7.4 muestra los programas de la eliminación gaussiana simple. Los programas constan de cuatro partes: entrada de dabs, eliminación hacia adelante, sustitución hacia atrás e impresión de datos. Nótese que la matriz de coeficientes se aumenta por las constantes del lado derecho. Esta información se almacena en la matriz A. Ya que esta matriz es aumen-
ELlMlNAClON
GAUSSIANA
233
tada, el hecho de que susdimensionesseande 15 por 16 significa que el programa puede manejar hasta15 ecuaciones simultáneas de esta forma.
FORTRAN
Elim1nac16n hacia adelante
sun-0
I-N-NN IP=I+l
Sustracci6n hacia atrAs
[)O 1 2 2 0J = I P , H SLlN-SUM+A( I , J >*X( J 1220 C O N T I N U E
,
~ ~ I ~ = ~ ~ ~ l , ~ ~ - s u M ~ , ' a ~ l , I ~
1 2 4 0C O N T I N U E
RETURli END
FIGURA 7.4
Programas simple.
FORTRAN y BASIC delmétododeeliminacióngaussiana
Nótese también que se ha programado el cuerpo principal del algoritmo como una subrutina. Se hizo así porque además de la solución directa de los problemas de ingeniería, la eliminación gaussiana tambihn tiene utilidadformandoparte de otros algoritmos. Enlaúltima parte de este capítulo se desarrollan técnicas de corrección de errores que requieren una subrutina para la elimiflación gaussiana. Además, en el capítulo 10 se necesita resolver ecuaciones algebraicas lineales como parte de la técy polinomial. nica de ajuste de curvas llamada regresión múltiple
234
METODOS NUMÉRICOS
PARA INGENIEROS
El programa de la figura 7.4 no es legible al usuario. En el problema 7 .16 al final del capítulo, se presenta la tarea de hacer un bosquejo del Pr.ogramaparahacerlofácilde Gsar y de entender.
EJEMPLO 7.6 Solución de ecuaciones algebraicas
lineales usando computadora
Enunciado del problema:los programas de NUMERICOMP contienen uno que implementa la eliminación gaussiana enun programa legibleal usuario. Se puede usar este programa para resolver problemas asociados con el ejemplo del paracaidista discutido en el capítulo 1. Supóngase que un grupo de tres paracaidistas se conecta por medio de cuerdas muy ligeras mientras caen a una velocidad de 5 m/s (Fig. 7.5). Calcúlese la tensión en cada sección de la cuerda y la aceleración del grupo, dada la siguiente información:
Paracaidista
70
Coeficientes de rozamiento,
Masa, kg
.~ .." . . ~
kg/s
..
1 2 3
14 17
60 40
Solución: los cuerpos de los paracaidistas se muestranenlafigura 7.6. Considerando las fuerzas en dirección vertical y usando la segunda ley de Newton se obtiene un conjunto de tres ecuaciones lineales simultáneas: mlg m2g
-
+
T - clu T'c2u - R
=
mla
=
m2a
Estas ecuaciones tienen tres incógnitas: a , T y R. Después de sustituir¡os valores conocidos, las ecuaciones se pueden expresar en forma matricial (ya que g = 9.8 m/s2). FIGURA 7.5 Tres paracaidistas en caídc libre conectados por cuerdas de peso despreciable.
236
MÉTODOS
FIGURA 7.7.
NUMÉRICOS
PARA INGENIEROS
(Continuación) b) Prueba de exactitud obtenida al sustituir la solución en las ecuaciones originales para comprobar que los resultados son iguales a las constantes del vector de términos independientes original.
Los resultados anteriores se basan en un algoritmo simple del método de la eliminación gaussiana con rutinas legiblesal usuario sobre entrada y salida de datos. El algoritmo empleado es similar al de la figura 7.4. El usuario debe ser capaz de escribir un programa para el método de la eliminación gaussiana. Si ya lo tiene, use el programa anterior para comprobar la exactitud del propio.
7.3 DESVENTAJAS DE LOS MÉTODOS
DE ELIMINACIóN
A pesar de que existen muchos sistemas de ecuaciones que se pueden resolver con la eliminación gaussiana simple. Hay algunas desventajas que se deben de analizar antes de escribir un programa que implemente el método. Aunque el siguiente material habla Gnicamente del método de eliminación gaussiana simple, esta información también es importante para otras técnicas de eliminación.
7.3.1 División entre cero La razón principal por la que se le ha llamado “simple” al método anterior, es porque durante las fases de eliminación y sustitución es posible que ocurra una división entre cero. Por ejemplo, si se usa el método de eliminación gaussiana simple para resolver el sistema:
237
ELlMlNAClON GAUSSIANA
la normalización de la primer ecuación implica una división entre all = O. El problema se presenta también cuando el coeficiente es muy cercano a cero. Se ha desarrollad? una estrategia del pivote0 para evitar parcialmenteestosproblemas.Este se describeenla sección 7.4.2.
7.3.2. Errores deredondeo Aun cuando la solución del ejemplo 7 . 5 se acerca mucho a la solución real, hay una pequeña diferencia enel resultado de x3 [Ec. (E7.5.12)]. Esta diferencia, que significa un error del -0.000 43%, se debe al uso de seis cifras significativas durante los cálculos. Si se hubieran usado más cifras significativas, el error se habría reducido aún más. Si se hubieran usado fracciones en vez de decimales (y por consiguiente se hubieran evitado los errores de redondeo), la respuesta habría sido exacta. Sin embargo, ya que las microcomputadoras manejan sólo un número limitado de cifras significativas ( = lo), pueden ocurrir los errores de redondeo y se deben considerar al evaluar los resultados.
EJEMPLO 7.7 Efecto de los errores de redondeo en la eliminación gaussiana
Enunciado del problema: resuélvase el mismn problema del ejemplo 7 . 5 , usando tres cifras significativas durante los cálculos. Solución: la eliminación de x1 de la segunda y tercera ecuación y la eliminación de x2 de la tercera llevaalsiguientesistematriangular: 3x1 - 0.1~2-
0.2~3= 7.85
7.00~2- 0.293~3= -19.6 9.99~3= 70.1
Compárese este sistema con el obtenido previamente usando seis cifras significativas [ecuación(E7.5.10) hasta la (E7.5.121. Sepuede usar la sustituciónhaciaatráspararesolverel sistema, obteniendo:
x2
= -2.51
IE,~ I E, 1
x3
= 7.02
1 E, I
x1 = 3.17
=
5.7%
=
0.4%
=
0.29%
238
NUMERICOS
METODOS
PARA INGENIEROS
Sustituyendo estos valores enlas ecuaciones originales se obtiene: 3(3.17) - 0.1(-2.51)
-
0.2(7.02) = 8.36 # 7.85
0.1(3.17) + 7(-2.51)
-
0.3(7.02) = -19.4 # -19.3
0.3(3.17) - 0.2(-2.51)
+ lO(7.02) = 71.7 #
71.4
Aunque el uso de tres cifras significativas dentro del ejemplo 7.7 hace del mismo un ejemplo fuera de la realidad, el problema de los errores de redondeo sí es real y puede ser de mucha importanciaal resolver grandes cantidades de ecuaciones. Esto se debe a que cada resultado depende de todos los resultados anteriores. Por consiguiente, un error en los primeros pasos tiende a propagarse, esto es, causa errores en los siguientes pasos. Es muy complicado especificar el tamaño del sistema en donde los errores de redondeo vienen a ser significativos ya que dependen del tipo de computadoray de las propiedades del sistema. Una regla muy general es la de suponer que los errores de redondeo son de importancia cuandose trata de sistemas de 25 a 50 ecuaciones. En cualquier evento, siempre se deben sustituir las respuestas en las ecuaciones originales y verificar si ha ocurrido un error sustancial.Sin embargo, como se menciona más adelante la magnitud de los coeficientes mismos puede influir en los errores al buscar un resultado aceptable.
7.3.3 Ill-Sistemas mal condicionados La obtención de la solución depende de la condición del sistema. Enla sección 7.1.1 se muestra un esquema gráfico de la condición de un sistema. En sentido matemático, los sistemas bien condicionados son aquellos en los que un cambio en uno o más coeficientes provoca un cambio similarenla solución. Los sistemas mal condicionados son aquellos en donde cambios pequeños en los coeficientes provocan cambios grandes en la solución. Una interpretación diferente del mal condicionamiento es que un rango amplio de respuestas puede satisfacer aproximadamente al sistema. Ya que los errores de redondeo pueden inducir cambios pequeños en los coeficientes, estos cambios artificiales pueden generar errores grandes en la solución de sistemas mal condicionados como se ilustra en elsiguiente ejemplo.
b
EJEMPLO 7.8 Ill-Sistemas mal condicionados Enunciado del problema:resuélvase el siguientesistema:
ELlMlNAClON
239
GAUSSIANA
+ 2x2 = 10
x1
[E7.8.1]
1 . 1 ~ 1+ 2x2 = 10.4
[E7.8.2]
Después, resuélvase nuevamente, con el coeficiente de x1 de la segunda ecuaciónmodificadolevemente a 1.05. Solución: usandolas ecuaciones (7.10) y (7.11), la solución es:
x1
=
2(10) - 2(10.4) =4 l(2) - 2(1.1)
x2 =
l(10.4) - 1.1(10) = 3 l(2) - 2(1.1)
Sin embargo, con el cambio al coeficiente do cambia drásticamente a: x1
=
2(10) - 2(10.4) =8 l(2) - 2(1.05)
x2
=
l(10.4) - 1.05(10) =1 l(2) - 2(1.05)
a21 de
1 . 1 a 1.05, el resulta-
Nótese que la razón principal de la diferencia entre los dos resultados es que el denominador representa la diferencia de dos nfimeros casi iguales. Como se explica previamente enel ejemplo 3.4, estas diferencias sonmuy sensitivas a pequeñas variacionesen los números que se están manejando. En este punto, se podría sugerir que la sustitución de los resultados en las ecuaciones originales alertaría al lector en el problema. Desafortunadamente, este no es el caso en sistemas mal condicionados. La sustitución de valores erróneos de x1 = 8 y x2 = 1 en las ecuaciones (E7.8.1) y (€7.8.2) lleva a:
+ 2(1) = 10 = 10 1.1(8) + 2(1) = 10.8 = 10.4 8
Por lo tanto, aunque x1 = 8 y x2 = 1 no son las soluciones reales al problema original, la prueba de error es casi igual, lo que puede provocar el error al hacer creer que las soluciones son correctas.
Como se hizo previamente enla sección de métodos gráficos, se puede desarrollar una representación visual del mal condicionamiento graficando las ecuaciones (E7.8.1)y (E7.8.2) (recuérdese lafigura 7.2). Debido a que las pendientes de las líneas son casi iguales, visualmente es difícil de ver exactamente donde se intersectan. Esta dificultad. visual se refleja
240
MÉTODOS
NUMÉRICOS PARA INGENIEROS
cuantitativamente en los resultados inciertos del ejemplo 7.8. Esta situación se puede caracterizar matemáticamente escribiendo las dosecuaciones en su forma general:
Dividiendo la ecuación (7.18)por a12 y la ecuación (7.19) por aZ2y ordenando términos se obtienen las versiones alternativas del formato de unalínearecta [x? = (pendiente) x1 + intersección].
x2
=
a21
x1
"
a22
+
c2 "
a22
Por consiguiente, silas pendientessoncasiiguales, -all =-
021
012
a22
entonces:
o , multiplicandoencruz: alla22
= a21a12
que se puede expresar también como: alla22 - a 1 2 ~ 2 1 =
0
r7.201
Ahora, recordando que a l l a22 - a12a21 es el determinante del sis, puede obtener la conclusión general tema bidimensional [Ec. ( 7 . 3 ) ]se de que un sistema mal condicionado es aquel en que su determinante se aproxima a cero. En efecto, siel determinante es exactamente igual a cero, las dos pendientes son idénticas, lo que produce de forma indistinta o ninguna solución o un número infinito de ellas, como enel caso del sistema singular mostrado enlafigura 7 . 2 1 y b. Es difícil especificar qué tan cerca debe estar el determinante de cero de manera que indique mal condicionamiento. Esto se complica por el hecho de que un determinante puede cambiarsu valor simplemente multiplicando una o más ecuaciones por un factor escalar sin alterar la solucicin. Por consiguiente, el determinante esun valor relativo que se modifica conlamagnitudde los coeficientes.
241
ELlMlNAClONGAUSSIANA
EJEMPLO 7.9 Efecto de escalamiento en el determinante
Enunciadodelproblema:evalúeseeldeterminantedelossistemas guientes:
Si-
a) Del ejemplo 7.1:
3x1 -x1
+ 2x2 = 18 + 2x2 = 2
[E7.9.1] [E7.9.2]
b) Del ejemplo 7.8:
+ 2x2 = 10 1.lxl + 2x2 = 10.4 x1
c) Repítase b) multiplicandolas ecuaciones por
[E7.9.3] [E7.9.4]
10.
Solución: a) El determinante de las ecuaciones (E7.9.1) y (E7.9.2) que es un sistema bien condicionado, es:
D
=
3(2)
-
2(-1) = 8
b) El determinante de las ecuaciones (E7.9.3)y (E7.9.4),que es un sistema mal condicionado, es:
D c)
= l(2) - 2(1.1) = -0.2
Los resultados de a) y de b) parecen corroborar el argumento de que los sistemas mal condicionados tienen determinantescercanos a cero. Sin embargo, supóngase que el sistema mal condicionado b) se multiplicapor 10, para obtener:
+ 20x2 = 100 11x1 + 20x2 = 104 10x1
La multiplicación de una ecuación por una constante no tiene efecto en la solución. Además, aún está mal condicionado. Esto se puede verificar multiplicando por una constante que no tenga efecto en la solución gráfica. Sin embargo, el determinanteresulta muy afectado.
D
1
= lO(20) - 20(11) = -20
No sólo se han elevado dos órdenes de magnitud, sino que el determinante es el doble del sistema bien condicionado a ) .
242
INGENIEROS MÉTODOS
NUMÉRICOS
PARA
Como se ilustra en el ejemplo anterior, la magnitud de los coeficientes interpone un efecto de escalamiento que complica la relación entre la condición del sistema y el tamaño del determinante. Una manera de evitar parcialmente esta dificultad es la de escalar las ecuaciones de forma tal que el elemento máximo de cualquier renglón sea 1.
EJEMPLO 7.1 O Escalamiento
Enunciado del problema: escálenselos sistemas de ecuaciones del ejemplo 7.9 a un valor máximo de 1y calcúlense de nuevo sus determinantes. Solución: a) En el sistema bien condicionado, el escalamiento genera
+ 0.667~2= 6 + x2 = 1
XI
-0.5x1
cuyo determinante es:
l(1)
-
0.667(-0.5)
=
1.333
b) En el sistema mal condicionado, el escalamiento genera:
+ X2 = 5 0.55~1+ X:, = 5.2 0.5X1
cuyo determinante es:
0.5(1) - l(0.55) = -0.05 c ) En el último caso, e! escalamiento modifica el sistema de la misma forma que b ) . Por lo tanto, el determinante también es 0.05, y el escalamiento no afecta.
En la sección anterior (sección 7.1.2),se dijo que el determinante es difícil d e evaluar para más de tres ecuaciones simultáneas. Por lo tanto, parece ser que noexiste una manera práctica de determinar la condición de un sistema. Sin embargo, como se muestra en el recuadro 7.1, existe un algoritmo simple que resulta de la eliminación gaussiana y que se puede usar en la evaluación del determinante. Además del planteamiento usado en el ejemplo anterior para calcular la condición de un sistema, existen otras formas de hacerlo. Por ejemplo, existen métodos alternativos para la normalización de elementos ( d a s e
ELlMlNAClON
GAUSSIANA
143
Stark, 1970).Además, como se ve en el capítulo siguiente (sección 8.2.2), la matriz inversa puede usarse en la evaluación de la condición de un sistema. Finalmente, unapruebasimple (pero que consume mucho tiempo) consisteenmodificar un poco los coeficientes y repetirlasolución. Si estas modificaciones generan resultados drásticamente diferentes, el sistemaprobablementeestámalcondicionado. Como se puede deducir del análisis anterior, definitivamente no existe un método simple para evaluar el mal condicionamiento. En la elimi-
RECUADRO 7.1 Evaluación de determinantesusando la eliminacion gaussiana En la sección 7.1.2, se dijo que la evaluación de los determinantes por expansión de menores era impráctica para conjuntos grandes de ecuaciones. De esta forma, se concluye que la regla de Cramer sólo es aplicable para sistemas pequeños. Sin embargo, como se dijo en la sección 7.3.3, el determinante tiene sentido cuando valorala condición de un sistema. Por lo tanto, sería útil poseer un método práctico para calcular esta cantidad. Afortunadamente, la eliminación gaussiana proporciona una forma simple de hacerlo. El método se basa en el hecho de que el determinante de la matriz triangular se puede calcular simplemente con el producto de los elementos de su diagonal:
D
= a11a22a33. .
. ann
[B7.1.1]
La validez de ,esta fórmula se puede ilustrar en sistemas de 3 por 3:
D
=
a11a22m
- ado)
+ a d o ) = a11a~~a33
Recuérdese que el paso de eliminación progresiva de la eliminación gaussiana genera un sistema triangular superior. Ya que el valor del determinante se puede evaluar simplemente al final de este paso:
D
= a11a&a&. . . a?;')
[B7.1.2]
en donde los superíndices indican que los elementos se han modificado durante el proceso de eliminación. Por lo tanto, se puede aprovechar el esfuerzo que se ha hecho al reducir el sistema a su forma triangular, y por añadidura obtener una aproximación al determinante. Hay una pequeña modificación en el planteamiento anterior cuando el programa usa pivote0 parcial (secEn este caso, el determinante cambia de ción 7.4.2). signo cada vez que un renglón se usa como pivotal. Una manera de representar esto es modificando la ecuación
(B7.1.2):
D en donde el determinante se puede evaluar como [recuérdese la ecuación (7.4)]
o, evaluando por menores (esto es, los determinantes 2 por 2).
= alla&?a:3 . . . ak-l)(-l)p
[B7.1.3]
en donde p representa el número de veces en que los renglones se usan como pivotales. Esta modificación se puede incorporar de forma simple enun programa: únicamente se toma en cuenta el número de pivoteos que se llevan a cabo durante los c6lculos y después se usa pata evaluar el determinante. la ecuación (B7.1.3)
244
MÉTODOS
NUMÉRICOS
PARA INGENIEROS
nacióngaussiana.serecomiendaescalar el determinante como en el ejemplo 7.10. Afortunadamente, la mayor parte de las ecuaciones algebraicas obtenidas de problemasde ingeniería por naturaleza son sistemas bien condicionados. Además, algunas de las técnicas desarrolladas en la siguiente sección ayudan a aliviarel problema.
7.4 TÉCNICAS DE MEJORAMIENTOEN LAS SOLUCIONES LES sipientzs técnicas se pueden incorporar al algoritmo de la eliminac i h gaussiana simple para evitar algunas de las desventajas analizadas en la secciónprevia.
7.4.1 Uso de más cifras significativas El remedio más simple para el mal condicionamiento es el de usar más cifras significativas en los cálculos (compárense los ejemplos 7.5 y 7.7). Si la computadora tiene la capacidad de extender el tamaño de las cifras significativas aumentando el tamaño de la palabra, esta característica reduce mucho el problema.
7.4.2 Pivoteo Como se dijo al principio de la sección 7.3, los problemas obvios ocurren cuando un elemento pivotal es cero, debido al paso de normalización lo cual origina una división por cero. Estos problemas se obtienen cuando el elemento pivotal es cercano a cero en vez de ser exactamente igual, por lo que si la magnitud del elemento pivotal es pequeño comparado con los otros elementos, entonces se introducenerrores de redondeo. Por lo tanto, antes de normalizar cadarenglón, es ventajoso determi-. nar el coeficiente mayor disponible.Entonces se pueden intercambiar los renglones de tal forma que el elemento mayor sea el pivotal. A este método se le conoce conelnombre de piuoteo parcial. Si se busca tanto en las columnas como en los renglones el elemento mayor y se intercambian, entonces el procedimiento es de piuoteo total. El pivoteo total se usa muy raramente en programas elementales, ya que el intercambio de columnas cambia el orden de las x y, por consiguiente, aumenta la complejidad de los programas, generalmente,sin justificación. El siguiente ejemplo ilustra la ventaja del pivoteo parcial. Además de evitar la división por cero, el pivoteo también minimiza el error de redondeo. Como tal, sirve también como remedio parcial almal condicionamiento.
EJEMPLO 7.1 1 Pivoteo parcial
Enunciado del problema: úsese
la eliminación gaussiana para resolver:
245
ELlMlNAClON GAUSSIANA
0.000 3x1
+ 3.000 0x2
=
2.000 1
1.000 0x1
+
=
1.000 o
1.000 0x2
Nótese que en esta forma el primer elemento pivotal, a l l = 0.000 3 , es muy cercano a cero. Después repítanse los cálculos con pivote0 parcial pero invirtiendo el orden de las ecuaciones. La solución exacta es x1 =
1/3 y
x2 =
2/3.
Solución: normalizando laprimer ecuación se obtiene: x1
+
10 000x2
=
6 667
lacual se puede usar para eliminar
-9 999x2
=
x1 de la segunda ecuación:
-6 666
que se puede resolver para: x2 = 2/3
Este resultado se puede sustituirenlaprimer x1 =
ecuación y evaluar xl:
2.000 1 - 3(2/3) 0.000 3
[E7.11.1]
Sin embargo, el resultado es muy sensitivo al número de cifras significativasincluidasenel cálculo:
Cifras significativas
3 4
5 6 7
Valor absoluto del error relativo x?
0.667 0.666 7 0.666 67 0.666 667 666 0.666 7
X1
-3.33 0.000 0.300 O0 0.330 O00 0.333 O00 O
¿e x1
porcentual
1 099
1 O0 10 1
o. 1
Nótese que la solución para x1 depende mucho del número de cifras significativas. Esto se debe a que en la ecuación (E7.11.1), se restaron dos números casi iguales (recuérdeseel ejemplo 3.4). Por el otro lado, si se resuelven las ecuaciones en orden inverso, se normaliza el renglón con el elemento pivotal mayor. Las ecuaciones son:
246
INGENIEROS METODOS
1.000 Ox1 + 1.000 ox*
=
1.000 o
+
=
2.000 1
0.000 3x1
3.000 0x2
NUMERICOS
PARA
La normalización y la eliminación produce x2 = 2/3. Para cantidades diferentes de cifras significativas, x1 se puede calcular de la primera ecuación,como:
[E7.11.2] Este caso es mucho menos sensitivo al número de cifras significativas en los cálculos:
Cifras significativas
x2
X1
Valor absoluto del error relativo porcentual de x1
0.667 0.666 7 0.666 67 0.666 667 0.666 666 7
0.333 0.333.3 0.333 33 0.333 333 0.333 333 3
0.1 0.01 0.001 0.000 1 0.000 o1
De esta forma, la estrategiapivotalesmuchomássatisfactoria.
Los programas de NUMERICOMP de propósitos generales que acompaiían este libro, incluyen a menudo una estrategia pivotal.La figura 7.8 muestra un algoritmoparaimplementarestaestrategia.Esteprograma se puede integrar al de la figura 7 . 4 para incorporar el pivote0 parcial en los programas del usuario.
7.4.3 Escalamiento En la sección 7.3.3 se dedujo que el escalamiento influye en la estandarización del valor del determinante. Más allá de esta aplicación, tiene utilidad en la minimización de los errores de redondeo para aquellos casos en donde alguna de las ecuaciones de un sistema tiene unos elementos mucho más grandes que otros. Estas situaciones se encuentran frecuentemente en la ingeniería cuando se usan ampliamente unidades diferentes en el desarrollo de ecuaciones simultáneas. Porejemplo, en problemas de circuitos eléctricos, los voltajes desconocidos se pueden expresar en
ELlMlNAClON
247
GAUSSIANA
FORTRAN
BASIC .m = t B : AB', 1 A l I .t.. I I 3ü:xj FOR 1 = I + I TLJ N 3ü4<:, I W = ABS I A ( I I., # ) 3 0 5 . > I F P - BF' . =- ü THEN 3ü8U :üad E c BF' pivotel el
31:103
302hj
.
K
= r e p r er seen eng lptliadvno t a l ( A l m a c e n a el valor absoluto del pivote actual)
ICiclo que compara
los elementos de las
contra columnas otras
31171'1 I.) . ... ~
308o
IF ( 6 - B P . G E . O . X O T O &=RP . .
.
308U
.. -
.I .I= I
303r) C O N T I N U E ?O90 I F ( J J - K . E O . O . 0 ) O0 3140 J-K,Nl TE=&< J J . J ) fi(JJ,J>-R(K,J) A f K , J )=TE 3140 CONTINUE 3150 C O N T I N U E RETURN END
FIGURA 7.8
= . I biEx r I
-, . ~C.1'90 I F J.1 -- I, *: 3 1 1 0 I€ = A l IJ. ..I1
COTO 3 1 5 0
ü THLN 3150
313ü A l b ~ d )= 1E 3140 N t k l J 3150 Rtll.lFIN
escogido pivote(Si el entonces regresa principal)
es el m a y o r ,
al programa
(Si no es asl, este ciclo lntercambia los renglones1 (Regresa al programa principal a continuar c o n la eliminacidnl
Programa en
FORTRAN y BASIC para implementar el pivoteo parcial.
unidades que varían desde microvolts hasta kilovolts. Se pueden encontrar ejemplos similares en todoslos campos de la ingehiqría. Mientrascada una de las ecuaciones sea consistente, técnicamentd el sistema será correcto y tendrá solución. Sin embargo, el uso de unidades completamente diferentes puede generar coeficientes de magnitudes que difieran ampliamente entre sí. Esto puede tener un impacto sobre el error de redondeo ya que afecta al pivoteo, como se puedeverenelsiguiente ejemplo.
EJEMPLO 7.12
Efectos del escalamiento en el pivoteo y el redondeo Enunciado del problema: a ) Resuélvase el siguiente conjunto de ecuaciones usando la eliminación gaussiana y la estrategia del pivoteo: 2x1
+
100 000x2
=
100 O00
x1
+
x2
=
2
b) Repítase la solución anterior después de escalar las ecuaciones de tal forma que el coeficiente máximo en cada renglón sea 1. En ambos casos, reténganse sólo tres cifras significativas. Nótese que las respuestas correctas son x1 = 1 .O00 02 y x2 = 0.999 98 o, con tres cifras significativas, x1 = x2 = 1.00.
248
MÉTODOS
NUMÉRICOS
Solución: a) Sin escalar,, se aplicalaeliminaciónhaciaadelante
2x1
+
I
100 000x2 -50 000x2
=
100 O00
=
-50 O00
quesepuederesolverporsustituciónhacia
PARA INGENIEROS
y se obtiene:
atrás, para obtener:
x:, = 1.00 x1
=
0.00
Aunque x2 es correcta, x1 tiene un 100% de error debido al redondeo. b ) El escalamientotransformalas ecuaciones originales en: 0.000 02x1
+
x2
=
1
x1
+
x2 =
2
Por lo tanto, se debe aplicar el pivote0 a los renglones y colocar el valormayorsobrela diagonal. IC1
0.000 02x1
+
x:, = 2
+
x2 =
1
Laeliminaciónhaciaadelante x1
genera:
+ x2 = 2 x1 = 1.00
que se puede resolver para: x1 = x:, = 1 ~
~
~
De esta forma, el escalamientoproduceunarespuesta
correcta.
AIigual que enel ejemplo anterior, el escalamiento aquí tiene utilidad para minimizar los errores de redondeo. Sin embargo, se debe notar que el escalamiento mismollevaimplícito un error de redondeo. Por ejemplo, dada la ecuación:
2x1
+
300 OOOXZ
=
1
y usando tres cifras significativas, el escalamiento
0.000 006 67x1
+
x2
=
1
produce:
249
ELlMlNAClON GAUSSIANA
Por lo que e l escalamiento introduce un error de redondeo en el primer coeficiente. Por esta razón, algunas veces se sugiere que el escalamiento sólo se emplee en casos donde realmente sea necesario, esto es, cuando el sistema involucre coeficientes de magnitudes muy diferentes.
7.4.4 Corrección de errores En algunos casos, el pivote0 parcial y el escalamiento no son suficientes para asegurar resultadosprecisos. Por ejemplo, recuérdese el ejemplo 7.7, que tenía los elementos mayores en la diagonal, pero que debido a los errores de redondeo,la solución final aún presentaba errores. Estos errores, en general se pueden reducir con el siguiente procedimiento. Considérese un sistema de ecuaciones lineales de la forma:
[7.21]
anlxl + aax2
+
*
*
+ a,,x, = c,
Supóngase que se tiene un vector solución aproximado dado por kl, kz, . . . , k,,.Estos resultados se sustituyen en la ecuación (7.21), para dar :
[7.22]
Ahora supóngase que la solución exacta xlr xz, . . . , x , se expresa en función de 21, 2 2 , . . . , k,, y de los factores de corrección Ax,, Ax2, . . . , Ax,, en donde
[7.23] x, = R,
-. - .
.
"
..
+ Ax,
250
NUMERICOS
Si estos resultados se sustituyenenla cuencia el siguiente sistema:
Ahoralaecuación obtener: allAxl
ecuación (7.21) da como conse-
(7.22) se puederestarde
+ a12Ax2 +
azlAxl + a22Ax2
* *
+
* *
PARA INGENIEROS
METODOS
la ecuación (7.24) para
+ alnAx,= c1 - El
=
+ az,Ax, = c~ - E2
= €2
El
[7.25]
anlAxl+ ~ ~ ~ 2 + 6 x* 2
+ a,,Ax,, = c, - E,
=
E,
Este sistema en sí mismo es un conjunto de ecuaciones lineales simultáneas que se puede resolver obteniendo con ello los factores de corrección. Estos factores se pueden aplicar para mejorar la solución especificada porla ecuación (7.23).
EJEMPLO 7.13
Uso de las ecuaciones de error para corregir los de redondeo
Enunciado del problema: recuérdese que en el ejemplo 7.7 se usa la eliminación gaussiana con tres cifras significativas para resoher
0.1~1+ O.3X1 -
,
7x2
-
0 . 3 ~ 3= -19.3.
0 . 2 ~ 2+ 10x3
71.4
Debidoalnúmerolimitadodecifrassignificativas,lasolucióndifierede la verdadera (x1 = 3 , x2 = -2.5, x3 = 7) en:
25 1
ELlMlNAClON
x1
=
3.17
E,
5.7%
x2
=
-2.51
E,
=
0.4%
x3
=
7.02
E,
=
0.29%
Úsense las ecuaciones del error para refinar estas aproximaciones. Solución: la sustitución de las soluciones en el conjunto original de ecuaciones produce el vector de términos independientes:
[elT= [8.36 -19.4 71.71 que no es igual al valor real. Por lo tanto, se puede desarrollar un vector de error:
Ahora, se puede generar un conjunto de ecuaciones error [Ec. (7.25)]:
3AX1 - 0.1Ax2 - 0.2Axs = -0.51 O.lAx1
+
7AX2
- 0.3Ax3 = 0.1
O.3Ax1 - 0.2A~2+ 1OAx3 = -0.3 que se puede resolver (usando tres cifras significativas de forma tal que exista consistencia con elproblema original), para obtener:
[AX]'
=
7 -0.02461
[-0.1710.015
los cuales se pueden usar para corregir las XI
=
3.17
-
0.171
=
3.00
x2 =
-2.51
+
x3 =
7 O2
0.024 6
-
soluciones, dando:
0.015 7
que se aproximanmuchomás
=
-2.49 7.00 a la soluciónverdadera
Ecuaciones del error en los programas. Se pueden integrar las ecuaciones del error en los programas de la eliminación gaussiana. En la figura 7.9 se delinea un algoritmo que realiza esta tarea. Nótese que para hacer más efectiva la corrección de sistemas altamente mal condiciona-
252
MÉTODOS
FIGURA 7.9
NUMÉRICOS
PARA INGENIEROS
Algoritmo de eliminacióngaussianaqueincluyecorreccióndeerrores.
dos, las E en la ecuación (7.25)se deben expresar en aritmética de doble precisión. Esto se hace fácilmente en FORTRAN pero en algunas implementaciones de BASIC no esposible hacerlo.
7.5 RESUMEN En resumen, este capítulo se ha dedicado a la eliminación gaussiana, el método fundamentalen la solución de sistemas deecuaciones algebraicas lineales. Aunque ésta es una de las técnicas más antiguas desarrolladas para este propósito, aún es un algoritmo muy efectivo en la obtención de solucionesdemuchosproblemas de ingeniería.Ademásde suutilidad práctica, proporciona un contexto enel estudio general de temas tales como los errores de redondeo, escalamiento y condicionamiento. Las respuestas que se obtienen mediante el método de eliminación gaussiana se pueden verificar sustituyéndolas en las ecuaciones originales. Sin embargo, esto no siempre representa una prueba confiable si el sistema está mal condicionado. Por lo tanto, si se sospecha de un error de redondeo, entonces se debe calcular alguna medida de la condición tal como e l determinante del sistemaescalado. Dos opciones que aminoy eluso de ran los errores de redondeo son el uso del pivote0 parcial
ELlMlNAClON
GAUSSIANA
253
más cifras significativas en los cálculos. Si el problema parece ser sustancial, la corrección de errores (sección 7.4.4) se puede usar algunas veces para mejorar la solución. Existen otros planteamientos y variaciones de la eliminación gaussiana para satisfacer las necesidades particulares. Por ejemplo, como se explica en el recuadro 7.2, se puede formular una versión muy eficiente de la eliminación gaussiana para sistemas tridiagonales. El capítulo 8 se encarga de mostrar dos métodos diferentes,el de Gauss-Jordan y GaussSeidei. RECUADRO 7.2 Sistemas de banda: el caso tridiagonal Una matriz banda es una matriz cuadrada que tiene todos sus elementos iguales a cero, con excepción de una banda centrada sobre la diagonalprincipal (recuérdese Ill. 1). En el caso en que el ancho de banda es 3, a lamatriz se le conoce con un nombre especial: matriz tridiagonal. Los sistemas tridiagonales se encuentran frecuentemente en la ciencia y en la ingeniería. Por lo general resultan de las
d3X2
+ e3x3 + f3x4
Nótese que se ha cambiado la notación de los coeficientes del sistema tridiagonal de las a y las c a las d, e , f y g. Esto se hizo para evitar el almacenamiento de cantidades grandes de ceros en la matriz de a. Esta modificación que ahorra espacio, es muy ventajosa ya que el algoritmo resultante requiere menos espacio en memoria. Como era de esperarse, los sistemas bandados sepueden resolver con una técnica similar a la eliminación gaussiana. Sin embargo, debido a la estructuraúnicadel
FORTRAN
I "IO
I"-"
soluciones en diferencias finitas de ecuaciones diferenciales parciales. Además hay otros métodos numéricos tales como la interpolación cúbica segmentaria (sección 11.4) que requieren la solución de sistemas tridiagonales. Un sistematridiagonal es aquél en el que los coeficientes están ordenados enforma tridiagonal, como en:
c
sistema, la implementación del algoritmo de la eliminación gaussiana se puede simplificar mucho y las soluciones se obtienen deuna manera muy eficiente. Para el sistema tridiagonal los pasos de eliminación progresivase simplifican ya que la mayor parte de sus elementos son cero. En seguida las incógnitas restantes se evalúan por sustitución hacia atrás. El algoritmo completo se expresa de forma concisa en los programas siguientes:
254
MÉTODOS
NUMÉRICOS
PARA INGENIEROS
PROBLEMAS Cálculos a mano 7.1
Escríbase el siguiente conjunto de ecuaciones ennotaciónmatricial:
Escríbase la transpuesta de la matriz.
7.2
Algunas matrices
[Al =
[
se definen como:
1 5 6 2 131 4 0 5
[ ;;;] 4 3 1
[Bl
=
[Cl =
[a]
5 4 3 6
[GI
=
[ 8 6 41
Respóndase a lassiguientespreguntasde acuerdo a las matrices anteriores: o) ¿Cuáles sonlas dimensiones de lasmatrices? b) Identifíquenselasmatrices cuadradas, columna y renglón. c) Cuáles son los valores de los elementos: 012
b23
d32
e22
112
912
d) Efectúense lassiguientes operaciones
7.3
Se definen tres matrices
como:
Efectúense todas lasmultiplicacionesposibles que se pueden llevar a cabo eptre parejas de estas matrices. b) Usese el método del recuadro 111.2 para justificar por qué las parejas restantes no se pueden multiplicar
a)
ELlMlNAClON
GAUSSIANA
c) Úsense los resultados de lasmultiplicaciones. 7.4
a)
e ilústresepor qué es importanteelorden
255
de
Úsese el método gráfico para resolver: 4x1 - 6x2
+
-xl
= "22
12x2 =
58
verifíquense los resultados sustituyéndolos en las ecuaciones originales 7.5
Dado el sistema de ecuaciones:
+ xp = 14.25 1 + ~ ~ 1 . 6 ~ = ~22.1
o.75X1 1 . a)
Resuélvase gráficamente.
b) En base a la solución grAfica, 'qué
se espera acerca de la condición del sistema? c) Resuélvase por eliminación de incógnitas. d ) Verifíquense las respuestas sustituyéndolasen las ecuaciones originales. 7.6
Para el conjunto de ecuaciones:
a)
Calcúlese su determinante.
b) Usese la regla de Cramer y resuélvase para las
x.
c) Sustitúyanse los resultados en la ecuación original y compruébense los mismos. 7.7
Dadas las ecuaciones: 0.5~1 -
x2
= -9.5
0 . 2 8 ~ 1- 0 . 5 ~ 2= -4.72 a)
Resuélvanse gráficamente.
b) Después de escalarse, calcúlese su determinante. c) En base a a) y b) ¿qué se puede esperar de la condicióndelsistema?
d ) Resuélvanse poreliminación de incógnitas. e ) Resuélvanse otra vez, pero modificando all a 0.55. Interprétense los resultados de acuerdo al análisis de mal condicionamiento de la sección 7.1.1.
7.8
Dado el sistema "12x1
+
x1 -
-2x1
-
x2 -
6x2 x2
+
+
7x3 = -80 4x3 = 13 =
92
256
MÉTODOS
NUMÉRICOS
PARA INGENIEROS
a) Resuélvase con el uso de la eliminación gaussiana simple. Muéstrense todos los pasos de los cálculos. b) Sustitúyanse los resultados enlas ecuaciones originales y compruébense las respuestas
7.9
úsese la eliminación gaussiana para resolver: 4x,
+
5x2 - 6x,{
=
28
7x3
=
29
ZX,
-
- 5 ~ 1 - 8x2
-64
=
Empléese el pivoteo parcial y compruébense las respuestas sustituyéndolas en las ecuaciones originales. 7.10 Úsese la eliminación gaussiana para resolver:
3x2 Zx,
-
13~,$= -50
-
6x2 + x:(
4x,
+
8x,:
=
44
=
4
Empléese el pivoteo parcial. Compruébense las respuestas sustituyéndolas en las ecuaciones originales. 7.11 Repítase el ejemplo 7.6 con el coeficiente de rozamiento al doble. 7.12 Resuélvase el siguientesistematridiagonal:
4x,
x2
7.13
-
5x,
+
4x2
3x,
+
7x,3 = 3
+ 12x,, +
-
6x3
=
25
4x4
=
17
2x,
=
36
Efectúense los mismos cálculos del ejemplo 7.6, pero usando cinco paracaidistas conlassiguientes características:
Paracaidista
Masa, kg
Coeficientes de rozamiento, kgls 15 14 18
1
60
2
80
3
75 75 90
4
5
12 10
Los paracaidistas tienen unavelocidad de 10 m / s
ELlMlNAClON
GAUSSIANA
257
Problemas para resolver con una computadora 7.14
Escríbase un programa general para multiplicar dos matrices, esto es, [X] = [y][ Z l donde [X]es m por n y [ Z l es n por p. Pruébese elprogramausando
7.15
Escríbase un programa que genere la transpuestadeunamatriz.
Pruébese con
7.16 Reprográmese la figura 7 . 4 de tal forma que sea más legible al usuario. Entre otras cosas: Intégrese lafigura 7 . 8 al programa de tal forma que éste realice pivote0 parcial. b) Documéntese el programa para identificar cada sección. c) Etiquétese la entrada y la salida. d) Escálense las ecuaciones de talforma que el coeficiente mayor en cada renglón sea 1. Calcúlese el determinante como una medidadela condicióndelsistema (opcional). a)
7.17 Pruébese el programa desarrollado en el problema 7.16 duplicando los cálculos del ejemplo 7 . 5 y 7 . 6 . 7-18 Úsese el programa desarrollado en el problema 7 . 1 6 y repítanse los problemas 7 . 8 al 7.11. 7.19 Repítanse los problemas 7 . 1 7 y 7 . 1 8 usando los programas de NUMERICOMP disponibles con el texto. Usese también NUMERICOMP para realizar una prueba de error para cada problema. 7.20 Desarróllese un programa para sistemas tridiagonales legibles al usuario y basándose en el recuadro 7.2. 7.21
Pruébese el programa desarrollado en el problema 7 . 2 0 resolviendo el problema 7.12.
7.22
Resuélvase el problema 7.13 usando los programas desarrollados en el problema 7.16.
CAPíTULO OCHO GAUSS-JORDAN, INVERSIóN DE MATRICES Y GAUSS-SEIDEL
En estecapítulo se describendosmétodosadicionalespararesolver ecuaciones lineales simultáneas.El primero de ellos, el método de GaussJordan es muy similar al de la eliminación gaussiana. El motivo principal para introducir estatécnica, estriba en que proporcionauna forma simple y conveniente de calcular la inversa de una matriz. La inversa tiene un gran númerodeaplicaciones enla ingeniería.Estemétodotambién proporciona los medios para evaluar la condición de un sistema. El segundo de ellos, el método de Gauss-Seidel es fundamentalmente diferente al deeliminacióngaussiana y al de Gauss-Jordan porque es un método de aproximaciones iteratiuas.Esto es, emplea un valor inicial y mediante iteraciones obtieneuna aproximación más exacta a la solución. El método de Gauss-Seidel se adapta, en particular a grandes sistemas de ecuaciones. En estos casos, los métodosdeeliminaciónestán sude jetos a los errores de redondeo. Ya que elerrorenelmétodo Gauss-Seidel se puede controlar mediante el número de iteraciones, los errores de redondeo no tienen quever con esta técnica. Sin embargo hay ciertos casos en que el método de Gauss-Seidel no converge a la respuesta y otros elementos correcta. Se discutenenlassiguientespáginasestos de juicio para escoger entre la eliminación y los metodos iterativos.
8.1 MÉTODO
DE GAUSS-JORDAN
El método de Gauss-Jordan es una variación de la eliminación gaussiana. La principal diferencia consiste en que el método de Gauss-Jordan cuando se elimina una incógnita no sólo se elimina de las ecuaciones siguientes sino de todas las otras ecuaciones. De esta forma, el paso de eliminación una matriz triangular (Fig. 8.1). genera una matrizidentidadenvezde Por consiguiente, no es necesario emplear la sustitución hacia atrás para obtener la solución. El método se ilustra mejorcon un ejemplo.
260
MÉTODOS
FIGURA 8.1
NUMÉRICOS
PARA INGENIEROS
Esquema gráfico delmétodo de Gauss-Jordan. Compárese con la figura
7.3 y nótese la diferencia entreeste método y el de eliminación gaussiana.
LOS asteriscosindicanqueelvector modificado varias veces.
de términosindependientes
se ha
EJEMPLO 8.1 Método de Gauss-Jordan
Enunciado del problema: úsese el método de Gauss-Jordan para resolver el mismo sistema del ejemplo 7.5: 3x1 - 0.1~2- 0 . 2 ~ 3= 7.85
0.1~1+
7x2 - 0 . 3 ~ 3 =
-19.3
0 . 3 ~ 1- 0.2~2+ 10x3 = 71.4
Soluci6n: en primer lugar, se expresan los coeficientes y el vector de términos independientes como una matriz aumentada:
3
-0.1 7 0.3 -0.2
[os
-0.2 -0.3 10
-19.3 71.4
En seguida se normaliza el primer renglón dividiéndolo por el pivote 3, para obtener:
INVERSldN GAUSS-JORDAN,
DE MATRICES Y GAUSS-SEIDEL
26 1
1 -0.033 333 3 -0.066 666 7 I I I -0.3 0.1 7 10 0.3 -0.2 I
2.616 67 -19.3 71.4
1
El término x1 se puedeeliminardelsegundorengónrestando 0.1 veces el primerodelsegundorenglón. Deuna manerasimilar,restando 0.3 veces el primero del tercer renglón se elimina el término con x1 del tercer renglón:
1 -0.033 333 3 -0.066 666 7 O 7.003 -0.293 33 333 O -0.190 O00 10.020 O
[
I 2.616 67 I -19.561 7 70.615 O
~
1 1
En seguida, se normaliza el segundo renglón dividiendolo entre 7.003 33:
1 -0.033 333 3 -0.066 666 7 -0.041 884 8 1 10.020 o [Oo "0.190 O00 ~
~
Reduciendolostérminos obtiene:
2.61667 "2.793 20 70.615 O
en x2 de laprimera y la tercera ecuación se
1 O -0.068 062 9 O 1 -0.041 884 8 o o 10.012 o
I
2.523 5 6 1 -2.793 20 I 70.084 3 ~
El tercerrenglón se normalizadividiéndoloentre
10.012 O:
1 O -0.068 062 91 2.523 56 O 1 -0.041 884 81 -2.793 O 0 1 Finalmente, los términos con x3 se puedenreducirdelaprimera gunda zcuación para obtener:
1 o o O 1 O I O O 1
~
~
3.000 O0 2.500 O 1 7.000 03
1
y se-
De esta forma, como se muestra en la figura 8.1: la matriz de coeficientes y la solución se ha obtenido se ha transformadoenlamatrizidentidad en el vector de términos independientes. Nótese que nose necesita sustituciónhaciaatrásparaobtenerlasolución.
262
MÉTODOS
NUMÉRICOS
PARA INGENIEROS
Todo el materialdelcapítulo 7 relacionadocon las ventajas y desventajas de la eliminación gaussiana se aplican también al método de Gauss-Jordan. Por ejemplo, se puedeusar una estrategia similar al pivoteo para evitar divisiones por cero y reducir el error de redondeo. Aunque los métodos de Gauss-Jordan y de eliminación gaussiana pueden parecer casi idénticos, el primero requiere aproximadamente de 50 % menos operaciones. Por lo tanto, la eliminación gaussiana es el método simple por excelenciaen la obtención de soluciones exactas a las ecuaciones lineales simultáneas. Una de las principales razones para incluir en este capítulo el método de Gauss-Jordan, es la de proporcionar un método directo de obtener la matriz inversa, tal como se describe en la sección 8.2
8.1.1 Algoritmo del método de Gauss-Jordan Enla figura 8.2 se muestra un algoritmo del método de Gauss-Jordan sin pivote0 parcial. Un esquema con pivoteomuy parecido al que muestra e n la figura 7.10 se puede incorporar a este algoritmo.
8.2 INVERSIóN DE MATRICES Enla introduccióna las operacionesconmatrices(sección 111.2.2) se menciona que si una matriz es cuadrada, entonces existe otra matriz, [A]- I , llamada la matriz inversa de [ A ] ,para el cual [Ec. (111.3)]: [A] [A]" = [A]" [A] = [I] También se demuestra que la inversa se puede usar para resolver conjunto de ecuaciones simultáneas, si se toma [Ec. (111.6)J:
un
[CI @.11 La aplicación de la inversa ocurre cuando es necesario resolver varios sistemas de ecuaciones de la forma:
[XI= [Al"
que difieren únicamente en el vector de términos independientes [ C ] .En vez de resolver cada sistema por separado, unaalternativa diferente consiste en determinar la inversa de la matriz de coeficientes. Entonces, se puede usar la ecuación (8.1)para obtener las soluciones, simplemente multiplicando la matriz [A] por el vector de términos independientes correspondiente [ C ] .Ya que la multiplicación matricial es mucho más rápida que la inversión, el consumo de tiempo se lleva a cabo sólo una vez y después se obtienen las soluciones adicionales de una manera eficiente. También, como se menciona en la sección 8.2.1, los elementos de la inversa son extremadamente útiles en sí mismos.
FIIGUI e flu¡ G'auss dl
V(,te0
1.2 Di( irama
?Imeí'O(d 0 de .dan, cial.
SIin
pi-
264
MÉTODOS
FIGURA 8.3
NUMÉRICOS
PARA INGENIEROS
Esquema gráfico del métodode Gauss-Jordan, con inversiónde matrices.
Con el método de Gauss-Jordan se puede calcular directamente la inversa. Para hacerlo, la matriz de coeficientes se aumenta con una matriz identidad (Fig. 8.3).Posteriormente se aplicael método de GaussJordan para reducirla matriz de coeficientes a la matriz identidad. Cuando se completa esta tarea, el lado derecho de la matriz aumentada contiene lamatriz inversa.Esta técnica seilustraenel ejemplo siguiente.
EJEMPLO 8.2 El uso del método de Gauss-Jordan en el cálculo de la matriz inversa Enunciado del problema: determínese la matriz inversa del sistema resuelto en el ejemplo 7.5. Obténgase la solución multiplicando [ A ]-1Por el vector de términosindependientes: [CIT = [ 7.85 -19.3 71.4 1. Además, obténgase la solución para un vector de términos independientes diferente: [CIT = [20 50 151. Solución: auméntese la matriz de coeficientes con una matriz identidad:
3
-0.1
0.3
-0.2
-0.2 -0.3 10
I 1 o o I O 1 O] j
O O
1
Usando all como pivote, el renglón 1 se normaliza y se usa para eliminar a x1 de los otros renglones
1 -0.033 333 3 -0.066 666 7 I 0.333 333 O 7.003 33 -0.293 333 1-0.033 333 3
o -0.190
O00
10.020 o
~
-0.099 999 9
o
1
GAUSS-JORDAN, MATRICES INVERSldN DE
265
Y GAUSS-SEIDEL
En seguida, se usa aZ2como pivote y xp se elimina de los otros renglones
,
1 O -0.068057 O 1 -0.041706 1
o o
I
~
10.012 1
0
0.333 175 0.004 739 329 -0.004739330.142 -0.100 0.027 90 014 2
180
O11
Finalmente, se usa a33como pivote y x3 se elimina de los renglones restantes:
1 O O O 1 O 0 0 1
I I I
0.332 489 0.004 922 97 0.006 798 13 -0.005 1640.142 4 293 0.004 183 46 "0.010 077 9 0.002 698160.099 880 1
1
Por lo tanto, lainversa es: 0.332 489 0.004 922 97 0.142 293 -0.005 164 4 "0.010 077 9 0.002 698 16
0.006 798 13 0.004 183 46 0.099 880 1
Ahora, la inversa se multiplica por el primer vector de términos independientes, obteniendo la solución: x1
=
7.85 (0.332 489) - 19.3(0.004 922 97)
=
3.000 411 81
x2 =
7.85(-0.005 164
4) - 19.3(0.142 293)
+
71.4(0.006 798 13)
+
71.4(0.004 183 46)
- 2.488 096 40 x3 = =
7.85(-0.010 077
9) - 19.3(0.002 698 16)
+
71.4(0.099 880 1)
7.000 25314
La segunda solución, simplemente se obtiene realizando otras multiplicaciones, como: x1 = = x2 =
= X3 =
=
20(0.332489) 6.997 900 45
+ 50(0.00492297) + 15(0.006 798 13)
í!O(-0.005 164 4) 7.074 113 9
+ 50(0.142 293) + 15(0.004 183 46)
20(-0.010 O77 9) 1.431 55150
+ 50(0.002 698 16) + 15(0.099880 1)
266
MÉTODOS
NUMÉRICOS
PARA INGENIEROS
8.2.1 Cálculos estírnulo-respuesta Como sedijo enla sección III.1.2, muchos de los sistemaslinealesde ecuaciones usados en ingeniería se derivan de las leyes de conservación. La expresión matemática de estas leyes es un tipo de ecuaciónes de balance que asegura que se conserve una propiedad en particular; masa, fuerza, calor, momento u otras. En el equilibrio de fuerzas de una estructura, las propiedades pueden tener componentes horizontales y verticales de las fuerzas que actúan sobre cada nodo de la estructura (véase el caso de estudio 9.3). Para un balance de masas, las propiedades pueden ser la masa en cada reactor de un proceso químico. Existen ejemplos similaresen otros campos de la ingeniería. Se puede escribir una ecuación simple de balance para cada una de las partes del sistema, generando un conjunto de ecuaciones que definen el comportamiento del sistema completo. Estas ecuaciones se interrelacionan o se acoplandemaneraque cada ecuaciónincluyeuna o más de las variables de las otras ecuaciones. En muchas ocasiones, los sistemasson lineales, y por lo tanto, dela forma exacta que se ha tratado en estecapítulo:
Ahora, en ecuaciones de balance, los términos de la ecuación (8.2) tienen interpretación física definida. Por ejemplo, los elementos- de [X] representan los valores de las variables que se están equilibrando para cada unadelaspartesdel sistema. Enelequilibrio de fuerzas de la estructura, representan las fuerzas verticales y horizontales de cada miembro. En el balance de masas, son las masas de sustancia química en cada uno de los reactores. En cualquier caso, representan las respuestas o estados del sistema que está tratando de determinar. El vector [ C ]de términos independientes contiene aquellos elementos del balance que son independientes del comportamiento delsistema, esto es, son constantes. Como tales, representan las fuerzas externas o los estímulosquemanejan al sistema. Finalmente, la matriz [ A ] de coeficientes contiene, en general los parámetros que expresancomo interactúa el sistema o su acoplamiento. Por consiguiente, la ecuación (8.2) se puedereexpresar como: [Iteraciones] [respuestas]
=
[estímulos]
Ahora, como se ha visto en este capítulo, existen muchas formas de resolver la ecuación (8.2).Sin embargo, elusodelamatrizinversalleva a un resultado particularmente interesante. La solución formal [Ec. (8.1)] se puede expresar como:
Y GAUSS-SEIDEL
INVERS16N GAUSS-JORDAN,
267
o (recordandola definición de multiplicaci6n matricial del recuadro 111.2):
De esta forma, se ha encontrado que la matriz invertida misma, además de proporcionar una solución, tiene propiedades muy útiles. Esto es, cada uno de sus elementos representa la respuesta de una parte simple del sistema a un estímulounitarioencualquierpartedelmismo. Nótese que estas formulaciones son lineales y , por lo tanto, se cumplela superposición y la proporcionalidad. La superposición indica que si un sistema está sujeto a varios estímulos diferentes (las c) , las respuestas se pueden calcular individualmentey sumarse los resultados para obtener la respuesta total. La proporcionalidad indica que si se multiplica el estímulo por una cantidad genera una respuesta respecto al estímulo multiplicadaporlamisma cantidad.Deesta forma, el coeficiente all' es una constante deproporcionalidadqueproporcionaelvalorde x1 debido al nivel un'ttario cl. Este resultado es independiente de los efectos de c2 y c3 sobre xl, los cuales se reflejan sobre a A 1 2y a A 1 3respectivamente. Por lo tanto, se puede llegar a la conclusión general de que el elemento a -llj de la matriz invertida representa el valor de x1 debido a la cantidad unitaria de cj. Usando el ejemplo de la estructura, el elemento a A gde la matriz inversa representa la fuerza en el miembro i debido a una fuerza externa individual en el nodo. j. Aun para sistemas pequeños, los comportamientos de las interacciones estímulo respuesta individuales no son obvios. Por lo que, la matriz inversa proporciona una técnica potente para comprender las interrelaciones de partes componentes de sistemas complicados. Esta potencia se demuestra enel caso deestudio 9.3.
8.2.2 La inversa y el malcondicionamiento Además de sus aplicaciones a la ingeniería, la inversa también suministra una manera de discernir cuando los sistemas están mal condicionados. Existentresmétodosparaestepropósito: 1.
2.
Escalar lamatriz decoeficientes [ A ] ,detalformaqueel elemento mayor en cada renglón sea 1. Si los elementos de [ A ] son varias órdenes de magnitud más grandes que los elementos de lamatriz original, entonces probablementeéstaesté mal condicionada. Multiplicarlainversaporlamatrizde coeficientes original y estimar si el resultado se encuentra cerca de la matriz identidad. Si no lo está, entonces haymal condicionamiento.
-'
268
MÉTODOS
3.
NUMÉRICOS
PARA INGENIEROS
Invertirlamatrizinvertida y estimar siel resultado está lo suficientemente cerca de la matriz original. Si no lo está, nuevamente el sistema está mal condicionado.
8.2.3 Algoritmo
para la inversión matricial
El algoritmo de la figura 8 . 2 se puede modificar para calcularla matriz inversa.Estoimplica,aumentar lamatriz de coeficientesconuna matriz identidad al principio del programa. Además, alguno de los indices que manejan un ciclo se debe aumentar al doble para que los cálculos se Ileven a cabo en todas las columnas de la matriz de coeficientes aumentada. Si se incorpora el pivote0 parcial en el algoritmo de Gauss-Jordan, entonces se requieren algunas modificaciones adicionales. Esto se debe a que cada vez que un renglón de lamatrizusa un pivote, lacolumnd de lamatriz inversa se debe ajustar de forma similar. La figura 8.4 ilustra este fenómeno. Por ejemplo si el renglón 3 se usa como pivote o se mueve a la posiciónentre los renglones 1 y 2 , se o “interpretación” del renglón2 de la matriz modifica también el “significado” invertida. En vez de indicar el efecto de un cambio unitariode c2 sobre las x , se debe indicar el efecto de un cambio unitario de c3 sobre las x. Además de las características anteriores, el programa debe diseñarse para que calcule las soluciones de un gran número de vectores de términos independientes, como se menciona al principio de la sección8:2. Esto se puede llevar a cabo, simplemente colocando un ciclo después de calcular la matriz inversa. Este ciclo puede llevar a usar un vector de términos independientes, puede entoncesmultiplicarse por la matriz [A] para obtener la solución. El procedimiento se continúa hasta que el usuario indique que no requiere más soluciones.
-’
FIGURA 8.4
Esquema gráfico del cambio que se produce en los elementos de la matriz inversa resultante al mover un renglón de la matriz de coeficientes.
8.3 MÉTODO
DE GAUSS-SEIDEL
Los métodos de eliminación directa analizados en las secciones previas se pueden usar para resolver aproximadamente de 25 a 50 ecuaciones lineales simultáneas. Esta cantidada veces se puede aumentar si el siste-
INVERS16N GAUSS-JORDAN,
269
DE MATRICES Y GAUSS-SEIDEL
ma está bien condicionado, si se emplea la estrategia pivotal, si se usan las ecuaciones del error o silamatriz es disprsa. Sin embargo, debido a loserroresde redondeo, losmétodos de eliminaciónalgunas veces son inadecuados para sistemas muy grandes. En este tipo de problemas, sepuedenusarlos métodos iterativos o deaproximaciónconalguna ventaja. En el capítulo 5 se usan tipos similares de técnicas para obtener raíces de una ecuacion. Aquellos planteamientos consistenen el uso de un valorinicial a partirdel cual, medianteuna técnica sistemática se obtiene una mejor aproximación a laraíz.Debido a que en esta parte del texto se enfrenta un problema similar "la obtención de valores para satisfacer simultáneamente un conjunto de ecuaciones- se espera que puedan ser útiles tales métodos de aproximación dentro de este contexto. La razónporlacuallos métodos iterativos son útiles en la disminución de los errores de redondeo en sistemas, se debe a que un método de aproximación se puede continuar hasta que converja dentro de alguna tolerancia de error previamenteespecificada. De esta forma, el redondeo no es un problema, ya que se controla elniveldeerror aceptable. El método de Gauss -Seidel es el método iterativo más usado.Supóngaseque se hadado un conjuntode n ecuaciones:
si los elementos de la diagonal son diferentes de cero, la primera ecuación se puede resolver para x l , la segunda para x2,etcétera, lo que lleva a:
[8.3a] [8.3b] [8.3c]
X"
=
cn - anlxl - an2x2 ann
*
-
an,n-&-1
[8.3d]
Ahora, se puede empezar el proceso de solución usando un valor inicialparalas x . La solución trivial puedeservirdevalor inicial, esto es, todas las x valen cero. Estos ceros se puedensustituir en la ecuación (8.3a), que se puede usarparacalcular un nuevovalorde x1 = c1 / a l l . Lue-, g o , se sustituye el nuevo valor de x l , con x3,...,x,, aunen cero, enla con la cual se calcula un nuevo valor de x2. Este proceecuación (8.3b) so se repite en cada una de las ecuaciones hasta llegara la ecuación (8.3d)
270
MÉTODOS
NUMÉRICOS
PARA INGENIEROS
la cual calcula un nuevo valor de x,. En seguida se regresa a la primera ecuación y se repite todo el proceso hasta que la solución converja bastante cerca de los valores reales. La convergencia se puedeverificar usando el criterio [recuérdese la ecuación (3.5)]: E . = a,1
1
I
'1
.
x{
100% < Es
para toda i en donde j y j
-
~8.41
1 denotan la iteración actual y la anterior.
EJEMPLO 8.3 Método de Gauss-Seidel
Enunciado del problema: úsese el método de Gauss-Seidel y resuélvase el sistema del ejemplo 7.5 y 8.1: 3x1 - 0.1~2- 0 . 2 ~ = 3 7.85
0 . 1 ~ 1+
7x2 - O.3X3 = -19.3
0.3~1- 0 . 2 ~ 2 + 10x3 = 71.4 Recuerdese que la solución real es x1
=
3, x2
Solución: en primer lugar. se despejan cada una la diagonal: x1 =
x2 = x3 =
7.85
[E8.3.2]
7 -
7.85
-=
3
0.3~1+ 0 . 2 ~ 2 10 x2
7.
[E8.3.1]
-19.3 - 0 . 1 ~ 1 +
71.4
=
de las variables sobre
3
[E8.3.3]
y x3 son cero, la ecuación (E8.3.1) puede usarse
2.616 666 667
Este valor,juntocon el de (E8.3.2) obteniendo: x2 =
-2.5 y x?
+ 0 . 1 ~ 2+ 0 . 2 ~ 3
Suponiendo que para calcular: x1 =
=
=
O, puede sustituirse en la ecuación
-19.3 - 0.1(2.616 666 667)
7
+
O ="2,794
523 810
INVERSIóN GAUSS-JORDAN, MATRICES
DE
271
Y GAUSS-SEIDEL
La primera iteración se completa sustituyendo los valores de xI y x2 calculadosenla ecuación (E8.3.3), obteniendo:
666 + 667) 0.2("2.794 10
71.4- 0.3(2.616
x3 =
7.005
=
609
524
Enla segunda iteración, se repiteelmismo x1 = =
x2 =
=
proceso obteniendo:
+810) 0.2(7.005
609
524)
556 +508) 0.3(7.005 7 624 ( 684 E " I = 0.015%
609
524)
7.85+ 0.1(-2.794
523 3
2.990
556
508) l e u ( = 0.31%
-19.3 - O.l(Z.990 -2.499
=
x3
523 810)
71.4- 0.3(2.990
=
556
+ 508) 0.2(-2.499
624
684)
10
7.000
290 l
~ 81 v = l
0.004
2%
El método, por lo tanto, converge a la solución real. Para mejorar las soluciones se deben aplicar algunas iteraciones mds. Sin embargo, en este problema, no se debería saber la respuesta a priori. Por consiguiente, la ecuación (8.4) proporciona un medioparaestimarelerror:
2.990 I
=
%,2
=
6.
=
€0,
-2.499
-u, J I)
I 7.000 I
556 -508 2.616 666 667 100 = 12.5% 2.990 556 508 624 -684 (-2.794 523 810) 100 = 11.8% -2.499 624 684 290 -811 7.005 7.000 290 811
609
I
I
524 = 0.076% *""
Nótese que, aligual que cuando se determinan raíces de una ecuación, en general dan una evala formulaciones tales como la ecuación (8.4), luación conservadora de la convergencia. De esta manera, cuando funcionan, aseguranqueelresultadoseconozca al menos dentrode la tolerancia especificada por E,.
272
METODOS NUMÉRICOS
PARA INGENIEROS
Nótese que el método de Gauss-Seidel, a medida que secalcula un nuevo valor x, este mismo se usa inmediatamente en la siguiente ecuación que a su vez determina una nuevax. De esta forma, si la solución es convergente, se emplea la mejor aproximación posible. Un planteamiento diferente, al cual se le conoce como iteración de Jacobi, usa una táctica un poco diferente. En vez de usar el Qltimo valor calculado de las x,usa la ecuación (8.3)para calcular un nuevo valor de x en base a la aproximación anterior de las x. De esta forma, al generar un nuevo valor n o se usa de inmediato sino que se almacena para la siguiente iteración. La diferencia entre los métodos de Gauss-Seidel y la iteración d e J a cobi se muestra en la figura 8.5.Aunque existen algunos casos en donde el método de Jacobi converge más rápido,el uso de la Gltima aproximación disponible convierte al método de Gauss-Seidel en el método preferido.
8.3.1 Criterios de convergencia en
el métododeGauss-Seidel
Nótese que el método de Gauss-Seidel es similar en proceso al método simple de iteración de punto fijo usado en la sección 5.1 en la solución de raíces de una ecuación. Recuérdese que la iteración de punto fijo tiene dos problemas fundamentales: l) algunas veces no converge y 2) cuar.do lo hace, e s a menudo, muy lento. El método de Gauss-Seideltambién puede tener estas fallas.
FIGURA 8.5
Esquema gráfico de la diferencia entre a) el método de Gauss-Seidel y en la solución de ecuaciones algebraicas lineales simultáneas.
b) el metododeiteracióndeJacobi,
NVERSIóN GAUSS-JORDAN,
273
Y GAUSS-SEIDEL
Una condición de convergencia es que los coeficientes sobre la diacJonal de cada una delas ecuaciones sea mayor que la suma de los otros coeficientes en la ecuación. Una expresión cuantitativa de este criterio es: I
b i r l
=-wJL,I
~3.51
En donde la sumatoria varía desde j = 1 hasta n , excluyendo j = i . La ecuación (8.5)es un criterio de convergencia suficiente pero no necesario. Esto es, aunque el método trabaje algunas veces sin que la ecuación (8.5)se cumpla, se garantiza la convergencia siempre y cuando (8.5)si se cumpla. A los sistemas donde se cumple la ecuación (8.5)se les conoce como diagonalmente dominantes. Afortunadamente, muchos problemas de ingeniería de importancia práctica llenan este requisito.
8.3.2. Mejoramiento enla
convergencia usando relajación
La relajación representa una pequeña modificación del método de GaussSeidel y está diseñada para aumentar la Convergencia. Después que cada nuevo valor de x se calcula usando la ecuación ( 8 . 3 ) ,el valor se modifica mediante un promedio pesado de los resultados de las iteraciones anteriores y actuales: X , n U e L o - AX,nueL'o +
(1 - ~ ) x , ~ a s a ~ ~ o
P .61
en donde X es u n factor de peso al cual se le asigna un valor entre-O y 2. Si X = 1,(1 - X ) es igual a cero y el resultado permanece inalterado. Sin embargo, si a X se le asigna un valor entre O y 1, el resultado es un promedio pesado de los resultados previos y actuales. A este tipo de modificación se le conoce como sobrerrelajación. Por lo general, esta opción se emplea paraconvertir un sistema divergente en uno convergente. Si X se encuentra entre1 y 2 se considera otro peso enel valor actual.. En este ejemplo, existe una suposición implicita de que el nuevo valor se mueve en la dirección correcta hacia la solución real pero con una velocidad muy lenta. De esta forma, el peso agregado a X intenta mejorar la aproximación empujándola hacia la real. Por lo que este tipo de modificación, al cual se le llama sobrerrelajación, está diseñado para acelerar la convergencia de un sistema que ya es convergente. La elección de un valor adecuado de X es un problema altamente específico y a menudo se determina por prueba y error. En general es inecesario en la solución de un sistema. Sin embargo, si el sistema bajo estudio se va a resolver varias veces, entonces puede ser de gran importancia una buena elección de X. Algunos ejemplos son los sistemas m u y grandes de ecuaciones diferenciales parcialesque a menudo tratan de modelar cambios en sistemas de variable continua (recuérdese el sistema a rnicroescala mostrado en la figura 1II.lb). El segundo caso de estudio del capítulo 9 muestra un ejemplo del empleo de la relajación dentro de un contexto de problemas de ingeniería.
2 74
INGENIEROS MÉTODOS NUMÉRICOS
PARA
8.3.3 Algoritmo del método de Gauss-Seidel En la figura 8.6 se muestra un algoritmo del método de Gauss-Seidel con relajación. Nótese que este algoritmo no está garantizado para obtener resultados adecuados si las ecuaciones no son de tipo diagonalmente dominante. Una manera demodificar el algoritmo para tomar un poco en cuenta esta desventaja es la d e buscar los coeficientes de cada ecuación durante cada una delas iteraciones e identificar el mayor de ellos. La ecuación en turno se resuelve para el va!or de x asociada con el coeficiente. En el siguiente cálculo, se rastrean los coeficientes de los valores restantes de x y se encuentra el coeficiente mayor. La ecuación se resuelve para el valor correspondiente de x. Procediendode esta manera,seaumentan al máximo las oportunidades de alcanzar unadominanciadiagonal. Sin embargo el esquemano garantiza éxito en sistemas de alta divergencia.Porotra parte, no sería fácil de programar un algoritmo que implemente este esquema
8.3.4 Problemas de contexto en el método de Gauss-Seidel Además deevitar el problema del redondeo, el método de Gauss-Seide! tiene otras ventajas quelo hacen particularmente atractivo en el contexto de ciertos problemas de ingeniería. Por ejemplo, cuando lamatriz en cuestión sea muy grande y muy dispersa (esto es, que la mayor parte de los elementos son ceros,los métodos deeliminación gastan una gran cantidad d e memoria para almacenar los ceros. En el recuadro 7.2, se muestra como puede evitarse este problema si la matriz de coeficientes es banda. Para sistemas diferentes, no es fácil evitar el uso de cantidades grandes de memoria, cuando se usan métodos deeliminación. Ya que todas las computadoras tienen una cantidad finita de memoria, esta ineficiencia puede llegar a ser una restricción real en el tamaño del sistema para el que, los métodos de eliminación resultan prácticos. Aunque un algoritmo general como el de la figura (8.6)está propensa a la misma restricción, la estructura d e las ecuaciones de Gauss-Seidel [€c. (8.3)]permite desarrollar programas concisos para sistemas específicos. Ya que en la ecuación (8.3)se necesita almacenar sólo los coeficientesdiferentes de cero, es posible ahorrargrandescantidades de memoria. Aunque esto impone mayor costo en la inversión de desarrollo de programas, las ventajas a largo plazo son sustanciales cuando se manejansistemas grandes sobre los que se pueden realizar varios procesos. Los sistemas macro-y microvariables pueden generar matrices grandes y dispersaspara las cuales se utilizael método de GaussSeidel. En el caso de estudio 9.2 se trabaja un poco más sobre estos puntos.
FIGURA 8.6 Diagrama de fluio del método de Gauss-Seidel con relajación. 275
276
MÉTODOS
NUMÉRICOS PARA INGENIEROS
PROBLEMAS Cálculos a Mano 8.1
Úsese el método de Gauss-Jordan para resolver el problema 7 . 6
8.2
Determínese la matriz inversa del problema 7.6. Compruébense los resultados multiplicando [A] por[A]" y obténgase lamatriz identidad.
8.3
Usando el método de Gauss-Jordan, repítase el problema 7 . 9
8.4
Determínese la matriz inversa del problema 7.9. Compruébense los resultados verificando que [A][A]" = [!] . Evítese el uso de la estrategia del pivoteo.
8.5
Usando el método de Gauss-Jordan, con pivoteo parcial, calcúlese lamatriz inversadelproblema 7.10. Ordenando la inversadetal forma, que los renglones y las columnas conformenla secuencia de la matriz original anterior al pivoteo (véase lafigura 8.4 y el análisis de la sección 8.2.3).
8.6
Úsese el método de Gauss-Jordan para resolver:
10x1 - 3x2 1x1
"2x1
+ 8x2 + 4x2
+ 6x3 = 24.5 -
2x3
- 9x3
= -9
-50
8.7
Determínese lamatriz inversa del problema 8.6. Úsese la inversa para resolver el problema original así como para resolver el caso adicional en donde el vector de términos independientes es [CIT= [110 55 - 1051.
8.8
Resuélvase el problema 8.6 usando el método de Gauss-Seidel con un criterio de paro del E, = 10 % .
8.9
Resuélvase el problema 7 . 8 usando el método de Gauss-Seidel con un criterio de paro del t, = 10 % .
- 6 ~ 1+ 4x1 - x2 6x1
+ 8x2
12x3 = 60 x3 = -2 =44
GAUSS-JORDAN, MATRICES INVERSldN DE
277
Y GAUSS-SEIDEL
8.12 Resuélvase el siguiente conjunto de ecuaciones:
usando a) eliminación gaussiana, b) el método de Gauss-Jordan y c) el método de Gauss-Seidel (es = 5 % ) . 8.13 Resuélvase el siguientesistema de ecuaciones:
usando a) eliminación gaussiana, b) el método de Gauss-Jordan y de Gauss-Seidel (E, = 5 % ) .
C)
el método
Problemas relacionados con la computadora 8.14 Desarróllese un programa amable con el usuario para el método de Gauss-Jordan, basado en lafigura 8 . 2 . Agréguese u n esquema similaral mostrado en la figura 7 . 1 0 empleando pivoteo parcial. 8.15 Pruébese el programa del problema anterior duplicandolos cálculos del ejemplo 8 . 1 8.16 Repítanse los problemas 7.6 y 7 . 8 hasta el 7 . 1 1 usando los programas desarrollados enel problema 8 . 1 4 . 8.17 Desarróllese un programa amable con el usuario para el método de Gauss-Jordan, con inversión de matrices y pivoteo parcial. Inclúyanse dentro del programa las características sugeridas en la sección 8 . 2 . 3 . 8.18 Repítanse los problemas 8 . 5 y 8.7 usando los programas desarrollados en el problema anterior. 8.19 Desarróllese un programa amable con el usuario para el método de Gauss-Seidel basado en la figura 8.6. Hágase de tal forma que compruebe el criterio de convergencia expresado por la ecuación (8.5). Además, inclúyaserelajación como en la ecuación (8.6). 8.20 Pruébese el programa desarrollado en el problema anterior usando un duplicado del ejemplo 8.3. 8.21 Usando el programa del problema 8.19, repítanse los problemas 8.8 hasta el 8.11.
C A P í T U LNOU E V E CASOS DE LAPARTE TRES: SISTEMAS DE ECUACIONES ALGEBRAICAS LINEALES El propósito de este capítulo, es el de usar los procedimientos analizados en los capítulos 7 y 8 en la solución de sistemas de ecuaciones algebraicas lineales en algunas aplicaciones de ingeniería. Estos métodos numéricossistemáticos,son de importanciapráctica ya que losingenieros encuentran frecuentemente problemas que implican la solución de sistemas de ecuaciones demasiado grandes para resolverse a mano. Los algoritmos numéricos son particularmente convenientes en estas aplicaciones ya quepuedenimplementarseenmicrocomputadoras. Entre otras cosas, los casos de estudio se han elaborado de manera que proporcionen ilustraciones reales de las características yfactores de importancia mencionados en los capítulos teóricos. Por ejemplo, el caso 9.1 muestra una ilustración simple decómo usar las ecuaciones algebraicas lineales para satisfacer de forma simultánea cierta cantidad decondiciones independientes.Además, se usa ecte caso de estudio para mostrar la utilidad de la matriz inversa como una herramienta analítica, dentro del contexto de estos problemas. Aunque se ha tomado este ejemplodel campo de la ingeniería general, la idea básica tiene importancia en una gran variedadde contextos técnicos y analíticos. El caso 9.2, tomado de la ingeniería química, es un ejemplo de un sistema de variable continua (o microvariable). El caso de estudio ilustra cómo se pueden emplear las diferencias finitas en la transformación de ecuaciones diferenciales en algebraicas. Al hacerlo así, se puedenusar los métodos de solución desarrollados en los capítulos 7 y 8 y obtener las soluciones. Aunque el ejemplo pertenece a la predicción de temperaturas en sólidos, se utiliza el planteamiento general para simularla distribución continua de muchas otras variables de la ingeniería tales como la velocidad, lafuerza y la masa. En contraste, los casos 9.3, 9.4 y 9.5 analizan sistemas de variable discreta (o macrovariable). El caso 9.3 hace hincapié en el uso de la matriz inversa en la determinación del complejo de las reacciones al aplicar cargas a una estructura. El caso 9.4 es un ejemplo del uso de las leyes de Kirchhoff en el cálculo de corrientes y voltajes en un circuito de resis-
280
MÉTODOS
NUMÉRICOS
PARA INGENIEROS
tencias. Finalmente, el caso 9.5 muestra cómo se emplean las ecuaciones lineales para determinar la dinámica de partículas y cuerpos rígidos.
CASO 9.1
DISTRIBUCIóN DE RECURSOS(INGENIERíA ENGENERAL) Antecedentes: todos los campos de la ingeniería enfrentan situacionesen las que la distribución correcta de recursos es un problema critico. Estas situaciones se presentan al organizar inventarios de construcción, distribución de productos y recursos enla ingeniería. Aunque los problemas siguientes tienen que ver con la fabricación de productos, el análisis generaltieneimportanciaen un ampliopanoramadeotrosproblemas. Un ingenieroindustrialsupervisalaproduccióndecuatrotiposde computadoras. Se requieren cuatro clases de recursos -horas-Hombre, metales, plásticos y componentes electrónicos- enla producción. En el cuadro 9.1 se resumen las cantidades necesarias para cada uno de estos recursos enla producción de cada tipo de computadora. Si se dispone diariamente de 504 horas-hombre, 1970 kg de metal, 970 kg de plástico y 601 componentes electrónicos, ¿cuántas computadoras de cada tipo se pueden construir por día?. Solución: la cantidad total producida de cada computadora está restringida al total de recursos disponibles en cada categoría diariamente. Estos recursos totales se distribuyen entre los cuatro tipos de computadoras. Sea xl,x,,x,,y x4la cantidad total de computadoras producidas diariamente de cada clase. Se sabe que la cantidad total de horas-hombre disponibles diariamente es de 504. Por lo tanto, la suma de las distribuciones de horas-hombre enla producción de cada una de las computadoras debe ser menor o igual que 504. Por lo tanto (usando los datos del cuadro 9. l),
3x1 + 4x2 Delamisma
+ 7x3 + 20x4 5 504
r9.11
manera para los metales, plásticos y componentes:
+ 25x2 + 40x3 + 50x4 5 1970 10x1 + 15x2 + 20x3 + 22x4 5 970 loxl + 8x2 + lox3 + 15x4 5 601
20x1
Cada una de estas ecuaciones se debe satisfacer de forma simultánea de otra manera, se acabaría uno o más de los recursos necesarios en la producción de los cuatro tipos de computadoras. Silos recursos disponibles, representadospor el vectordetérminosindependientesde las ecuaciones anteriores, se reducen todos a cero simultáneamente, entonces se
CASOS PARTE DE LA
281
TRES: ECUACIONES ALGEBRAICAS SISTEMAS DELINEALES
CUADRO 9.1
Recursos necesarios para producir cuatro tipos de computadoras Metales Horas/ ComponenPlásticos hombre, kglcompukglcompuCompukglcompu- tadora tadora tadora
10
10 15
1 2 3
3 4 7 20
4
10 15
20 25 40 50
20 22
tes, unidadeslcompu-
a
puede reemplazar el signo menor o igual por el de igual. En este caso, la cantidad total de cada tipo de computadora producida se puede calcular resolviendo un sistema de. ecuacionesde 4 por 4 usando los métodos de los capítulos 7 y 8. Ya que este sistema no es diagonalmente dominante, el método de Gauss-Seidel puede divergir. Sin embargo, se puede aplicar la eliminación gaussiana o el método de Gauss-Jordany calcular: x1 = 10 x2 = x3
= =
12 18 15
Esta información se usa en el cálculo de las ganancias totales.Por ejemplo, supóngase que las ganancias correspondientes a cada computadora están dadas por p1,p2, p3,y p4. La ganancia total asociada con un día de actividad (P)está dada por
p
= PlXl
+ P2X2 + P3X3 + P4x1
P.51
Se sustituyen los resultados de x,= 10,x2= 12,x, = 18 y x4= 15 en la ecuación (9.5)y se calcula una ganancia de (usando los coeficientes del cuadro 9.2) :
P CUADRO 9.2
=
1 OOO(l0)
+
700 (12)
+
1 lOO(18) + 400(15)
Ganancias correspondientesa cada una de las cuatro computadoras. Computadora
1
2 3
Ganancias $ I computadora
1 O00 700 1 100
=
44 200
282
MÉTODOS
NUMERICOS PARA INGENIEROS
De esta forma, se puede obtener una ganancia de $ 4 4 200 diarios, con los recursos especificados enel problema. Ahora, supóngasequeexiste laposibilidad de aumentarcualquiera de los recursos disponibles. Un objetivo es el de valorar qué recursos se deben escoger de tal forma que generen la mayor ganancia. Una manera de hacerlo es el de incrementar cada uno de los cuatro recursos individualmente, calcularlasganancias y posteriormentecomparar los resultados. Una alternativa más simple se basa en la matriz inversa, que se puede calcularusando el métodode Gauss-Jordan, como:
[A]" =
-0.081 7
0.039 6
0.106 6 -0.136 8 0.088 8
-0.225 6 0.172 8 -0.021 3
[
-0.146
5
0.191 8
0.408 5 0.010 7 "0.190 9 -0.113 7 0.007 1 0.008 9
1
Cada uno de los elementos aij~'indica el crecimiento en la computadora i debido al crecimiento unitario del recurso j. Por ejemplo, el elemento alyl especifica un incremento unitario de 0.039 6 de la computadora 1 cuando se agrega un kilogramo de metal. Nótese que algunos de los coeficientes son negativos, indicando que un incremento unitario en algunos recursos bajalaproduccióndeesetipodecomputadora. Ahora, con esta información como antecedente, se puede llevara cabo un evaluación rápida sobre los beneficios obtenidos al incrementar cada uno de los recursos multiplicando los elementos de cada columna por la ganancia unitaria del cuadro 9.2. Por ejemplo, enlaprimera columna:
API
+
7 ( 1 000) 0.106 6(700) - 0.136 8(1 100) +0.088 8(400) = -122.04
= -0.081
en donde A Pj es el incremento en ganancias debido a un incremento al recurso j . De esta forma, un incremento unitario enhoras-hombre baja en $122.04 las ganancias. Se pueden llevar a cabo cálculos similares sobre los otros recursos, para obtener: Ap2 = $ 63.24
A% = $-67.70
AP4 = $ 77.78 De esta forma, un incremento de componentes 0' = 4 genera una mayor ganancia, seguida por el aumento en los metales 0' = 2). El análisis indica también que un incremento en los plásticos 0' = 3) genera pérdidas. El problema anterior es una variación del análisis general sobre economíaconocidocorno modelo de entrada-salida. Este ejemplo, difiere de la aplicación clásica de esta técnica en la cuantificación de transferencia de material entre los sectores dela economía. Sin embargo, el USO de la matriz inversa profundiza en interacciones complejas de sistemaslineales y es muy representativo del proceso del modelo de entrada-salida.
PARTE : CASOS LA DE
283
ECUACIONES ALGEBRAICAS LINEALES
Como tal, ayuda a ilustrar cómo los métodos numéricos aumentan la comprensión al manejar sistemas acoplados muy grandes.
CASO 9.2
CALCULO DEDISTRIBUCIóNDETEMPERATURAS (INGENIERíA QUíMICA)
Antecedentes: la mayor parte de los diferentes campos de la ingeniería manejan distribuciones de temperatura en materiales sólidos. Estos problemas son tan variadoscomo la distribución de temperatura en un cono de proareentrante y la temperatura de un río bajo una planta de energía productora de hielo. La distribución de temperatura en estadoestacionario bidimensional se define por la ecuación de Laplace:
-a2T + - = a2T o ax2 ay2
~9.61
en donde T es la temperatura y x y y son las coordenadas. Las derivadas de la ecuación (9.6)se aproximan usando diferencias finitas (véase la sección 3.5.4). La figura 9.1 muestra una malla bidimensional,esquema útil en las aproximaciones desarrolladas para la ecuación (9.6). Las aproximaciones por diferencias divididas de las derivadas son:
Ax
Ax
aT dx
AT -
="
?;+l,j
-
T.,
y de manera similar,
En seguida, suponiendo que A x = A y , la ecuación de Laplace se puede aproximar como:
T + 1,j + T - I , ,
+
T,j +
1
+ T,j - 1 - 4T,j = O
P .71
lacual es aplicable a cada nodo i , j de lafigura 9.1. Parece ser que al aplicar la ecuación (9.7) a cada nodo resulta un sistema de ecuaciones acopladas, ya que la temperatura envarias posiciones aparece enmás de una ecuación. Esto produce un sistema de ecuaciones algebraicas lineales simultáneas, que se pueden resolver usando los métodos descritos en los capítulos 7 y 8 . Considérese la placa plana de la figura 9.2 Los lados de la placa se mantienen a temperaturas constantes de O" y looo C , como se muestra
284
MÉTODOS
FIGURA 9.1
FIGURA 9.2
NUMÉRICOS
PARA INGENIEROS
Malla bidimensional que se usa enel desarrollo de aproximaciones por diferencias finitas de la temperatura sobre una placa plana.
Placaplana en donde se mantienen los iodos a temperaturas constantes de 100°C, como se indica en la figura.
'O
y
CASOS PARTE DE LA
TRES: DE SISTEMAS
285
ECUACIONES ALGEBRAICAS LINEALES
en la figura. La distribución de la temperatura dentro de la placa se puede aproximar en nueve puntos internos aplicando la ecuación de Laplace en cada punto. Esto genera el siguiente conjunto de ecuaciones dado en notaciónmatricial: r
-
4 1 0 1
o
0 0 0
L o
1 0 1 0 0 - 4 1 0 1 0 1 - 4 0 0 1 0 0 - 4 1 0 1 o 1-4 1 0 1 0 1 - 4 0 0 1 0 0 0 0 0 1 0 1
o
o
o
o
1
0 0 0 1
o
0 4 -
o
0 0 0 0 1 0 1 4 1 -
0 0 0 0
o
1 0 1 4
T2
T3 T2i
T22 T23
TH
I I I II
- 100 - 100
-200 O O - 100
O O
- 100
Solución: se observa que elsistemaresultante de ecuaciones es diagonalmente dominante y , por lo tanto, compatible con el método de GaussSeidel del capítulo 8. En este caso, se garantiza la convergencia ya que se satisface la ecuación (8.5).Se aseguratambiénexactitudyaque los errores de redondeo no son problema en el método de Gauss-Seidel. Usando una E , = 0.05% después de 13 iteraciones se obtienen los resultados siguientes:
FIGURA 9.3
Distribución de la temperatura sobreunaplaca Gauss-Seidel.
plana, calculadacon el método de
286
INGENIEROS
PARA
MÉTODOS
NUMERICOS
Los resultados se muestran en la figura 9.3. La simulación se lleva a cabo con el método estándar de Gauss-Seidel. Debido a que estesistema es convergente, la relajación puede servir para acelerar la convergencia. Por lo tanto, serepiten dos veces más los cálculos, usando X = 1.25 y X = 1.5. Los resultados, que se grafican en la figura 9.4, sugieren un valor de X en la vecindad de 1.25. Usando las técnicas descritas en el capitulo 11 (nótese que se puedeusar un bosquejo para obtener un valor aproximado), se ajusta una ecuación cuadrática alos puntos de la figura (9.4). Esta ecuación es: n = 96A2 - 236A
+ 153
en donde n es el número de iteraciones correspondiente aun valor particular de X. Se puede determinar un mínimo derivando la ecuación y obteniendo:
FIGURA 9.4
Gráfica delnúmero de iteracionescontra X, elcoeficiente de relajación. Los trespuntos proporcionados como datos sugieren un número mínimo de iteraciones en la vecindad de X = 1.25. Ajustando una parábola a los datos, se puede calcular que el número mínimo de iteraciones corresponde al valor de X = 1.23.
DECASOS
287
TRES: ECUACIONES ALGEBRAICAS SISTEMAS DELINEALES
dn -
192A
"
dA
-
236
Elmínimo se encuentra cuando dn / dh es cero, lo cual lleva al punto donde la pendiente de la figura 9.4 es nula. En este caso, se determina un valor de h = 1.23 Volviendo a realizar los cálculos con estecoeficiente de relajación se obtiene la solución en sólo ocho iteraciones. De esta forma, si se van a realizar más cálculos para este problema en particular, se debeemplearunavalorde h = 1.2 para alcanzar los resultados más eficientes.En este caso, el ahorro de tiempo en un solo cálculo es despreciable. Sinembargo, en la simulación múltiple de sistemas grandes, la elección acertada deh posiblemente redituará ahorros sustanciales. Este tipo de procedimientose puede extender a problemas máscomplejos que incluyen esquemas geométricos irregulares. Los problemas prácticos de este tipo requieren algunas capacidades de cálculo automáticas, pero, excepto en casos de sistemas extremadamente grandes, una microcomputadora llenará todos los requisitos.
CASO 9.3
ANALISIS DE U N A ARMADURA ESTATICAMENTE DETERMINADA (INGENIERíA CIVIL) Antecedentes: un problema de importancia en ingeniería estructural es el de encontrar las fuerzas y reacciones asociadas con una armadura estáticamente determinada. La figura 9.5 muestra un ejemplo de tales armaduras.
FIGURA 9.5
Fuerzas que actuánsobreunaarmadura
estáticarnente determinada.
288
INGENIEROS MÉTODOS
NUMÉRICOS
PARA
Las fuerzas ( F ) representan ya sea las tensiones o las compresiones de los elementos dela estructura. Las reacciones externas (H2 V2 V,) sonfuerzasquecaracterizan cómo interacciona la armadura con la superficie que la soporta. El gozne del nodo2 puede transmitir fuerzas horizontales y verticales a la superficie, mientras queel rodillo del nodo 3 sólo transmite fuerzas verticales. Se observa que el efecto de la carga externa de 1 O00 kg se distribuye a todos los elementos de la armadura. Solución: este tipo de estructuras se pueden describir como un sistema de ecuaciones algebraicas lineales acopladas. En la figura 9.6 se muestran los diagramas de cuerpo libre sobre cada nodo. La suma de las fuerzas en las direcciones vertical y horizontal debe ser cero en cada nodo, ya que el sistema se encuentra en reposo. Por lo tanto, para el nodo 1:
XFV= O
=
-Flsen 30"
-
F3sen60"
+ F1,"
P.91
para el nodo 2:
XFv = O
=
Fl sen 30"
+ Fz, + VZ u
[9.11]
F3sen 60"
+ F3,"+ V3
[9.13]
para el nodo 3:
XFv = O
FIGURA 9.6
=
Diagramas de cuerpo libre en los nodos de laarmadura estáticamente determinada.
DECASOS
289
ECUACIONES TRES: ALGEBRAICAS SISTEMAS DE LINEALES
en donde Fj,hes la fuerza horizontal externa aplicada al nodo i (una fuerza positiva va de izquierda a derecha) y F;,"es la fuerza vertical externa aplicada al nodo i (una fuerza positiva va de arriba hacia abajo). De esta manera, en este problema, la fuerza hacia abajo de 1 O00 kg sobre el nodo 1 corresponde a F,," = - 1 000. En este caso lasfuerzasrestantes Fj,v,F;,h son cero. Nótese que la dirección de las fuerzas y reacciones internas son desconocidas. La aplicación correcta de la segunda ley de NewtonrequiereGnicamentequelassuposicionesrelacionadasconlas direcciones sean consistentes. Si las direcciones no se toman correctamente, entonces la solución será negativa. También nótese que en este problemalasfuerzasde todos los elementos se supone que están entensión y que actúan jalando a lavez a los nodos adyacentes. Este problema se puede escribir como el siguiente sistema de seis ecuaciones con seis incógnitas:
-
0.866 O -0.5 O 0 0 O O O O 0.866 0.5 -1 o o O -0.866 -1 o -1 o -0.5 O 0 O 0 0 1 0.5 O O O -1 O O -0.866
i
- 1000
-
-
o
O 0
E9.141
J
Nótese que, como se formula en la ecuación (9.14), se requiere-pivote0 parcial para evitar divisiones porcero sobre los elementos de la diagonal. Empleando una estrategia de pivoteo, el sistema se puede resolver usando las técnicas de eliminación analizadas en los capítulos 7 y 8. Sin embargo, debido a queesteproblemaes un caso deestudioidealpara demostrar la utilidad de la matriz inversa, seusa el método de Gauss-Jordan para obtener:
y lamatrizinversa
es:
0.866
[A]-1 =
0.5 O 0 0 0 O O 1 O 0.25 -0.433 O O O - 0.5 O 0.866 -1 -1 O o -1 o O -1 O O -0.433 -0.25 0.433 -0.75 O O O -1
Ahora, supóngase que el vector de términos independientes representa las fuerzas horizontales y verticales aplicadas externamente a cada nodo, como:
290
INGENIEROS MÉTODOS
NUMÉRICOS
PARA
Debido a que las fuerzas externas no tienen efecto sobre la matriz de coeficientes, el método de Gauss-Jordan no senecesita implementar una y otra vez para analizar el efecto de las fuerzas externas diferentes sobre la armadura. En vez de esto, todo lo que se tiene que hacer es multiplicar la matriz inversa por cada uno de los vectores de términos independientes para obtener soluciones alternativas diferentes. Por ejemplo, podría desearse estudiar el efecto de las fuerzas horizontales producidas por el viento que sopla de izquierda a derecha. Si la fuerza eólica se puede representar como dos fuerzas puntuales de 1 O00 kg cada una sobre los nodos 1 y 2 (Fig. 9.7),entonces el vector de términos independientes es: [Vector de términos independiente^]^ = [ 1 O00 O
1 O00 O O O]
que se puede multiplicar por la matriz inversa para dar:
Fl
=
866
H* = -2000
F2
v 2
= 250 = -433
F3 =
v. =
-500 433
Para un viento de derecha, Fj,h = - 1 000, F 3 , h = demás fuerzas externas son cero, resultando:
FI
H,
= -866 = 2000
F2 = -1250
v,
=
433
F3
- 1 000,
y todas las
500
v, = -433
Los resultados indican que los vientos han tenido marcados efectos diferentes sobre la estructura. Ambos casos se muestran en la figura 9.7. Los elementos individuales de la matriz invertida tienen también utilidad directa en el esclarecimiento de las interacciones carga-respuesta de la estructura. Cada uno de los elementos representa el cambio de una de las variables hacia un cambio unitario de uno de las cargas externas.Por ejemplo, e] elemento aG1 indica que la tercera incógnita F3) cambiará 0.866
"~
FIGURA 9 . 7
Dos casos de carga que muestran a) vientos de izquierda y b) vientos de derecha.
29 1
ES AS DE CASOS
debido a la carga unitaria de la segunda carga externa F1,”). De esta forma, sila carga vertical en el primer nodo se aumenta en uno, entonces F3 se incrementa en 0.866. El hecho de que los elementos sean cero indica que ciertas incógnitaspermanecen inalteradas por alguna de lascargas externas. Por ejemplo, a = O significaque F , nosealterapor cambios en FZ,h. Esta habilidad de aislar interacciones tiene una cantidad de aplicaciones enla ingeniería incluyendo la identificación de aquellos componentes que son más sensibles a las cargas externas y, por lo tanto están más propensos a lafalla. El planteamiento anterior vienea ser particularmente útil cuando se aplica a estructuras complejas. Enla práctica de la ingenieria puede necesitarse la solución de estructuras con cientos o tal vez miles de elementos estructurales. Las ecuaciones lineales son una herramienta útil en la comprensión del comportamiento de estas estructuras.
CASO 9.4
il
Nodo ”
I
i,
.
‘2
R if
’
”
Antecedentes: un problema común en la ingeniería eléctrica es aquel que implica la determinación de corrientes y voltajes en varias posiciones de circuitos complejos de resistencias. Estos problemas se resuelven con la ley de corriente de Kirchhoffy la ley de Ohm. La ley de la corriente dice un nodo debe ser que la suma algebraica de todas las corrientes sobre cero (Fig. 9.8a), o
Cik = O
a)
Y .”.,‘
CORRIENTESY VOLTAJESENCIRCUITOSRESISTIVOS (INGENIERíA ELÉCTRICA)
1:
, *
[9.16]
en donde todas las corrientes que entran al nodo tienen signo positivo. La ley de Ohm dice que la corriente a través de una resistencia está dada en función del cambio de voltaje y de la resistencia (Fig. 9.8b),
‘i /
b)
[9.17]
FIGURA 9.8 Representación esquemáticade la a)leyde la corrientede Kirchhoff y b)ley de Ohm.
OR
3
R=lOR
2
R=5R
v,
= 200 v
R=5n
R=l5R
FIGURA 9.9
Solucióndelcircuito táneas.
R=20R
6
& =ov
deuna resistencia usando ecuaciones algebraicas linealessirnul-
292
MÉTODOS NUMÉRICOS PARA INGENIEROS
2
3
1
-
'65
154
c-
4
FIGURA 9.10
6
5
Direccionesen las cuales se supone quecircula la corriente.
Solución: los problemas de este tipo generan sistemas de ecuaciones algebraicas lineales simultáneasya que los ciclos dentro de un circuito están acoplados con los otros. Por ejemplo, considérese el circuito mostrado en la figura 9.9. Se desconoce la magnitud y la dirección de las corrientes asociadas con este circuito. Esto no presenta gran dificultad ya que simplemente se supone una dirección para cada corriente. Si la solución resultante de la ley de Kirchhoff es negativa, entonces la dirección dada es incorrecta. Por ejemplo, la figura 9.10 muestra las corrientes supuestas. Dadas estas ecuaciones, las cuatro ecuaciones de las corrientes para cada nodo están dadas por: iI2
+
+
=
O
o i43 - i32 = o
i& - is2 -
i54
-
i.54 =
i43 = O
y las seis ecuaciones del voltaje como:
v5 - v 4 . v5 - v, - 152 = 5 15 10 en donde la corriente fluye del voltaje más alto al más bajo. Estas ecuaciones son equivalentes a la siguientenotaciónmatricial:
=
1
o
200 -
1
o
0 0 0 0 1 0 5 0 0 0 O O 0 0
o
o
v,
.
154
0 0 0 1 0 0 - 1 1 - 1 o 1 1 0 0 0 0 - 1 1 0 0 0
o
O
0
o
0
0
0
o
o
o
0 0
0 0
0 0
0 1 1 0 0 -
0 0 1 1 1
1 - 1
0 0 0 0 1 0 5 0 0 0 0 1 0 1 5 0 O 0 O 0 0 2 0 0 0 0 o O 0 1 0 1 o
o
o
=
I
O
O O
O
o
ZOO O O O
O
DECASOS
293
V=
i ’ =169.23
153.85
V = 200
: c
8
V=O I/= 123.08
li = 146.15
FIGURA 9.1 1
Solución de voltajes y corrientesobtenidos
usando un método de eliminación.
que representa un sistema de 10 ecuaciones con 10 incógnitas. Aunque es impráctico resolver este sistema a mano, se puede resolver fácilmente usando un método de eliminación tal como la eliminación gaussiana o el métodode Gauss-Jordan. De esta manera, la solución es:
6.153 8
i12
=
¡32
= -1.538 5
= - 1.538 iS4 = -1.538 i43
5 5
¡a = -6.153 8 i52 V2 V3
= = =
-4.615 4 169.23 153.85
V4 = 146.15
V, = 123.08
Por lo tanto, con una interpretación apropiada de los signos en los resultados, lafigura 9.11 muestra las corrientes y los voltajes en el circuito. Evidentemente se obtendrían mayores ventajas si se usaran algoritmos numéricos y microcornputadoras en este problema.
CASO 9.5
FIGURA 9.12 Tres bloques conectados por cuerdos de peso despreciable sobreun plano inclinado.
DINÁMICA DE PARTíCULAS Y CUERPOS RíGIDOS (INGENIERíA MECANICA) Antecedentes: la dinámica del movimiento de partículasy de los cuerpos rígidos juega un papel muy importante en muchos problemasde mecánica y otros campos de la ingeniería. Este movimiento se puede describir de Newton para mediante las leyes de Newton. La aplicación de las leyes partículas simples genera dos ecuaciones. Sin embargo, si algunas partículas del sistema afectan a otras, entonces se puede generar un gran número de ecuaciones simultáneas. Por ejemplo, considérese el sistema mostrado en la figura 9.12. Hay tres bloques atados por una cuerdade peso despreciable apoyados sobre unasuperficielisainclinada45O respecto a lahorizontal.El coeficiente de fricción entre el plano y la masa de 100 kg es de 0 . 2 5 y entre las masas de 50 y 2 0 kg es de 0.375. Solución: en la figura 9.13 se muestran los diagramas de cuerpo libre de los tres bloques. Las unidades de las fuerzas son newtons (kilogramos por
294
MÉTODOS NUMÉRICOS
T
100
FIGURA 9.13
X
9.8
=
980
PARA INGENIEROS
R
50 x 9.8 = 490
20
X
9.8 = 196
Diagramas de cuerpo libre para los bloques sobre un planoinclinado.
metro por segundo al cuadrado), m es la masa en kilogramos y a es la aceleración en metros por segundo al cuadrado. Sumando fuerzas en direcciónparalela al plano y usando la segunda ley de Newton
(F
=
ma),
692.96 - 173.24 - T = lOOa 346.48 - 129.93 +
T-R 138.59 - 51.97 + R
=
50a
=
2 0 ~
o. en forma matricial:
Resolviendo este sistema con eliminación gaussiana, se obtiene: a = 4.840 5 m/s2
T = 36.667 1 N R = 10.190 6 N El expresar las ecuaciones del movimiento enforma matricial es un planteamientogeneral y adaptableparaproblemas de este tipo. Aunque el problema que se resolvió aquí fue fácil, el caso de estudio sirve para ilustrar el planteamientogeneral e inspirar, al menoseso se espera. las aplicaciones a problemas más difíciles. Cuando se juny unamicrocomputadora, son una tan con un métodonumérico usaren una granvariedad de herramientamuy útil quesepuede problemascomplejos.
295
DE ECUACIONES ALGEBRAICAS LINEALES
DE CASOS
PROBLEMAS Ingeniería en general 9.1
Repítanse los cálculos del caso 9 . 1 usando los programas propios.
9.2
Efectúense los mismos cálculos del caso 9.1, cambiando los totales de horashombre, metales, plásticos y componentes a 856 h, 3 050 kg, 1 450 kg y 948 unidades respectivamente.
9.3
Un ingeniero supervisa la producción de tres tipos de automóviles. Se requieren tres clases de materiales "metal, plástico y caucho- para la producción. La cantidad necesaria para producir cada automóvil es de
Auto-
móvil
1500 1700 1900
1
2 3
Plirtiro, Cauchor kglauto kglauto
Metalr kglauto
25 33 42
1 O0 120 160
Si se dispone de un total de 106 toneladas de metal, 2.17 toneladas de pltistico y 8.2 toneladas de caucho diariamente, ¿cuántos automóviles se pueden producir
por día?.
9.4
Un ingeniero requiere 4 800 m 3 de arena, 5 810 m3 de gravafina y 5 690 m 3 de grava gruesa para la construcción de un proyecto. Existen tres bancos donde se pueden obtener estos materiales. La composición en cada banco es de: ~~~
Banco
Arena
Grava fina,
TO
010
010
banco 1
50 banco 2 banco 3 20
52 20 25
30
Grava
gruesa
O/o
18 30 55
¿Cuántos metros cúbicos se debe tomar de cada banco para cumplir con las necesidades del ingeniero?
Ingeniería química 9.5
Repítanse los cálculos del caso 9.2 con los programas propios.
9.6
Efectúense los mismos cálculos del caso 9.2 cambiando la temperatura de la pared a 200°C.
INGENIEROS MÉTODOS
296
9.7
NUMÉRICOS PARA
Usando elmismo planteamiento del caso 9.2, calcúlese ladistribución de temperatura en una varilla calentada en ambos extremos, como se muestra en la figura P9.7. Aplíquese la formaunidimensionalde la ecuación (9.6):
d2T
-__- 0
dx2
en donde x es la distancia a lo largo de lavarilla. Grafíquese
FIGURA P9.7
T contra x.
Una varilla unidimensional se mantieneoislado a u n a temperaturaconstante en sus extremos. Los puntos indican las posiciones en donde debe aplicarse la forma unidimensional de la ecuaciól (9.6)para calcular la distribución de la temperatura a lo largo de la varilla.
9.8
Repítase el problema 9 . 7 incluyendounapérdida
de caloren la ecuación:
en donde r es el coeficiente de pérdida de calor, igual a 0.01 cm de lavarilla es de 10 cm. Grafiquese T contra x. 9.9
-’y la longitud
La figura P9.9 muestratres reactores ligados por tubos.Como se puede ver. la velocidad de transferencia de sustancias químicas a través de los tubos es igual a la velocidad de flujo (Q, con unidades de metros cúbicos por segundo) mul~iplicada por la concentración del reactor del cual surge el flujo (c. con unidades de miligramos por metro cúbico). Si el sistema es estacionario, la transferencia en cada reactor balancea la transferencia de salida. Por ejemplo. enel reactor 1. (entrada) = (salida), o: 500 +
Q21C2
= Q12C1
+
Q13~1
o , usando las velocidades de flujo especificadas como en lafigura € 9 . 9 :
500
+
2 0 ~ 2= 8 0 ~ 1+ 4 0 ~ 1
en donde 500 es una entrada directa (miligramos por segundo). Desarróllense ecuaciones de balance de masas comparables para cada unode los otros reactores y resuélvanse las tres ecuaciones algebraicas lineales simultáneas para la concentraciónen los reactores.
DECASOSDE SISTEMAS TRES: LA PARTE
FIGURA P9.9
ECUACIONES ALGEBRAICAS LINEALES
297
Tres reactores ligados por tubos. La velocidad de transferencia de masa a lo largo de cada tubo esigual al producto del fluio Q y la concentración c del reactor donde se origina el fluio.
9.10
Empleando el mismo planteamiento básico del problema 9.9, determínese la concentración de cloruro en cada uno de los Grandes Lagos con la información de la figura P9.10.
Ingeniería civil 9.11
Repítanse los cálculos del caso 9.3 con los programas propios.
298
MÉTODOS
9.12
45
PARA INGENIEROS
Efectúense los mismos cálculos del caso 9.3cambiando el ángulo del nodo 2 a 40° 3 a 55”. II
y el del nodo
..~”..
NUMÉRICOS
i
9.13 Efectúense los mismos dálculos del caso 9.3,con la estructura mostrada en la figura P9.13.
45 .
I P
9.14
FIGURAP9.13. 180
Efectúense los mismos cálculos del caso 9.3,con la estructura de lafigura P9.14.
500
FIGURA P9.14.
Ingeniería eléctrica 9.15
Repítanse los cálculos del caso 9.4,usando losprogramas propios.
9.16
Efectúense los mismos cálculos del caso 9.4, cambiando la resistencia entre los no dos 3 y 4 a 15 Q y cambiando el voltaje V6 a 50 V .
9.17
Efectúense los mismos cálculos del caso 9.4.con el circuito mostrado en la figura
P9.17.
FIGURA P9.18.
ARTE CASOS LA DE
ECUACIONES ALGEBRAICAS LINEALES
299
Ingenieríamecánica 9.19 Repítanse los cálculos del caso 9.5, usando los programas propios. 9.20 Efectúense los mismos cálculos del caso 9 . 5 , cambiando el ángulo a 55O respecto a la horizontal. 9.2 1 Efectúense los mismos cálculos del caso 9 . 5 , cambiando el coeficiente de fricción de la masa de 100 kg a 0 . 5 y el de las masas de 50 y 2 5 kg a 0.25.
FIGURA P9.24.
9.22
Efectúense los mismos cálculos del caso 9.5, cambiando las masas de 100, 50 y 20 kg a 4 5 , 2 0 y 80 kg, respectivamente.
9.23
Efectúense los mismos cálculos del caso 9.5, para el sistema mostrado en la figura P9.23.
9.24
Efectúense los mismos cálculos del caso 9.5, con el sistema mostrado en 13 figura P9.24. (los ángulosson de 45').
9.25
Léanse todos los casos del capítulo 9 . En base a la lectura y a la experiencia elabórense los propios casos en cualquier campo de la ingeniería. Esto puede implicar modificar o reexpresar alguno de ellos; sin embargo, pueden ser también totalmente originales. Como los ejemplos de este libro, se deben inspirar en el contexto de la ingeniería y se debe demostrar el uso de los métodos numéricos para solucionar sistemas de ecuaciones algebraicas lineales. Escríbanse los resultados usando los casos de este capítulo como modelos.
E P [LOGO: PARTE Ill
111.4
ELEMENTOS DE JUICIO En el cuadro 111.2 se muestra un resumen de los elementos de juicio implicados en la solución de ecuaciones algebraicas lineales simultáneas.Hay tres métodos; gráfico, regla de Cramer y manipulación algebraica que están limitadas a pocas ecuaciones (n I3) y por lo tanto tienen poca utilidad práctica en la solución de problemas. Sin embargo, estas técnicas son herramientasdidácticasmuyútilesen la comprensión del comportamientodesistemaslinealesen general. Los métodos numéricos mismos se dividen en dos categorías generales: métodos exactos y métodos aproximados. Como su nombre lo indica, los primeros obtienensolucionesexactas. Sin embargo, ya que se ven afectados por los errores de redondeo, en algunas ocasiones ofrecen resultados erróneos. La magnitud del error de redondeo varía de sistema a sistema y depende de una serie de factores. Estos incluyen las dimensiones del sistema, su condición y s i la matriz de coeficientes es dispersa o completa. Además, la precisión de la computadora influye en el error de redondeo. En general, se escogen los métodos exactos para resolver pocas ecuaciones (esto es, aquellos sistemas menores de 50 ecuaciones).
Se usancomúnmente dos métodos; la eliminación gaussiana y el método de Gaus-Jordan. Se recomienda emplearlaestrategia de pivote0encualquier implementación que se haga de estos métodos sobre una computadora. Con la ayuda de estaestrategia, los errores de redondeo disminuyen y se evitan problemas como la división por cero. Aunque en todos los demás sentidos son iguales, la eliminación gaussiana es preferible a Gauss-Jordan, ya que la primera es un 50% más rápida. Sin embargo, el método de GaussJordan sigue siendo útil ya que se puede modificar un poco de manera quese pueda obtener la matriz inversa como beneficio adicional en los cálculos. Aunque los métodos de eliminación tienen una granutilidad, eluso de toda la matriz de coeficientes puede ser un factor lirnitante cuandose trata de sistemas muy grandes y dispersos. Esto se debe a que grandes porciones de memoria en la computadora deben almacenar ceros sin sentido. Para sistemas en forma de banda, existen métodos disponibles para la implementación de la eliminación gaussiana sin tener que almacenar la matriz de coeficientes completa. En el recuadro7.2 sedes-
302
MÉTODOS NUMÉRICOS PARA INGENIEROS
C
U C c ..-E J
m
303
EPíLOGO PARTE I l l
"
N
O
U
o
i
e,
U
2
O u)
O u)
O O O
a,
oa, ? ul VI
3
s
304
MÉTODOS
NUMÉRICOS
PARA INGENIEROS
cribe un algoritmo muy simple para llevar a cabo lo anterior en sistemas especiales con forma de banda; el caso tridiagonal.
AI
método que se describe en este libro se le conoce con el nombre de GaussSeidel. Es diferente del método exacto en cuanto a que éste emplea un esquema iterativo en la obtención progresiva de aproximaciones más cercanas a la solución. Por lo tanto, el efecto del redondeo es un punto discutible dentro del método de Gauss-Seidel, ya que las iteraciones se pueden prolongar tanto como sea necesario para obtener la precisión deseada. Además, la versión del método de Gauss-Seidel puede desarrollarse de manera que se pueda ahorrar espacio en memoria para sistemas dispersos. Por lo tanto, el método de Gauss-Seidel es el método preferencial en sistemas grandes de ecuaciones en donde los errores de redondeo y los requisilas tos dealmacenamientovienena ser u n problemasignificativopara técnicas exactas.
(loo),
La desventaja del método de Gauss-Seidel es que no siempre converge a la solución exacta o algunas veces lo hace de manera muy lenta. Unicamentees confiable para aquellos sistemas dominantes diagonalmente. Sin emestas b a r g o , se dispone de los métodos de relajación que a veces ignoran restricciones. Además, ya que muchos sistemas algebraicos lineales originados de problemas físicos muestran dominancia diagonal, el método de GaussSeidel tiene gran utilidad en la solución de problemas de ingeniería. Enresumen, se conjuntanunaseriedefactoresenlaseleccióndeuna técnica p a r a resolver un problema en particular que involucre ecuaciones algebraicas lineales. Sin embargo,comoya se mencionó, el tamaño y ladispersióndelsistemasonfactoresparticularmenteimportantesal determinar la elección.
111.5
RELACIONES Y FóRMULAS IMPORTANTES C a d a u n a d e las partes de este libro contiene una sección que resume las fórmulas de mayor importancia. Aunque la parte Ill no menciona fórmulas simples, se ha usado el cuadro 111.3 p a r a resumir los algoritmos que se han cubierto. La tabla proporciona una visión global que resulta útil en la revisión y en la clarificación de las diferencias principales entre los métodos.
111.6
MÉTODOS AVANZADOS Y ALGUNAS REFERENCIAS ADICIONALES Los métodos de este texto se han limitado a solución de ecuaciones lineales simultáneas.
las técnicas más simples en la
EPíLOGO PARTE 111
305
d
II II
II
*"*"st
fi
"_
I I
m
N
N
l
x- ,x( 5 " & 8-
-SN
"_
l
306
MÉTODOS
NUMÉRICOS
PARA INGENIEROS
Existen otros mgtodos que uscin elmismocontexto de los problemas así como también otros que tratan sobre valores propios y ecuaciones simultáneas no lineales. Descomposición LU (Llamado también método de Cholesky o método de Crout) es una técnicaparticularmenteeficienteenlasolucióndealgunosproblemas que se han mencionado en la parte I l l . Se encuentran buenas descripciones y algoritmos de computadora para este método en James, Smith y Wolford ( 1 977) y Gerald y Wheatley (1984).
Existen una variedad d e tkcnicas para determinar los valores propios. James, Smith y Wolford (1 977); Gerald y Wheatley (1 984) y Hornbeck (1975) proporcionan una introducción al tema. El tema se trata más a fondo en Ralston y Rabinowitz (1978); Householder (1 964) y en Wilkonson (1 965). Las ecuaciones simultáneas no lineales a veces se pueden resolver usand o el método de Gauss-Seidel. Además, una versión multidimensional ofrece un esquema más eficiente, aunque más complicado del método de Newton-Raphson. En los libros de Carnahan, Luther y Wilkes ( 1 969); G e rald y Wheatley ( 1 984) y James, Smith y Wolford (1977) se analizan los métodos. El libro de Ortega y Rheinboldt (1970) ofrece un trabajo muy completo acerca del tema.
En resumen, la información anterior intenta introducir al lector en estudios posteriores más profundos sobre el tema y áreas afines. En todas las referencias anteriores se proporcionan descripciones de las técnicas básicas d e la parte Ill. Además, Ralston y Rabinowitz ( 1 978) proporcionan un análisis más profundo y en Stark (1 970) se incluye un estudio de temas tales como el mal condicionamiento.El lector debe consultar estas fuentes alternativas para complementar el material de este libro y enriquecer sus conocimientos sobre ecuaciones algebraicas lineales simultáneas. *
'Aqui
sólo
se hace referencia a los libros por autor; al finaldel texto se halla una bibliografía completa.
’
!
C ~ J A T R O
PARTE
IV.1 M O T I V A C I ~ N
-AJUSTE DE CURVAS
A menudo se proporcionan datosmediante .un conjunto de puntos discretos. Sin embargo, a veces se requieren estimaciones de puntos entre esos valores discretos. Esta parte del libro describe algunas técnicas de ajuste de curvas de manera que con tales datos se obtengan aproximaciones intermedias. Además, a veces se requiere una versión simplificada de una función muy complicada. Una manera de hacerloes la de calcular valores de la función en’un conjunto de valores discretos a lo largo del rango de interés. Después se puede obtener una función mas simple ajustando estos valores: A estas dos apticaciones se les conoce con el nombre de ajuste de curvas. Hay dos esquemas generales en el ajuste de curvas que se distinguen entre s í en base a la cantilos datos.Primero, dad deerrorasociadacon donde los datos muestran un grado significativo de’error o “ruido”, la estrategia es derivar una curva simple que repre.sente el comportamiento general de los datos. Ya que cada punto in’dividual puede estar incorrecto, no es necesario intersec,tar cada punto individual puedeestar incorrecto, no es necesario intersectar cada uno de ellos. En vez de esto, la curva se diseña de tal manera que siga un patrón sobre los puntos tomados como un todo. A un procedimiento de esta naturaleza se le conoce conel nombre de regresión con mínimos cuadrados (Fig. IV.l a).
x
Segundo, donde se conoce que los datos son muy exactos, el proceso es ajustar una curva o una serie de curvas que pasen exactamente por cada uno de los puntos. Estos datos generalmentese derivan de tablas. Algunos ejemplos son los valores de la densidad del agua y de la capacidad de calor de los gases como una función de la temperatura. A la estimación de valores entre puntos discretos conocidos se le conoce con el nombre de interpolación (Fig. IV. l b y c).
308
____-
FIGURA IV.l
MÉTODOS
-
NUMÉRICOS
PARA INGENIEROS
Tres intentos de ajustar la "mejor" curva a troves de los cinco dotos o) regresión con mínimos cuadrados, b) interpolación lineal y c) interpolación curvilínea.
IV.l . l . Métodos de ajuste de curvas antes del uso dela
microcomputadora
El método más simple de ajustar una curva a un conjunto de datos esel de trazar los puntos y unirlos con una línea recta. Aunque esta es una alternativa válida y se utiliza cuando se requiere hacer estimaciones rápidas, los resultados son dependientes, desde un punto de vista subjetivo, de la persona que traza la curva. Por ejemplo, en la figura IV.l se muestran diferentes trazos sobre un mismo conjunto de datos hechos por tres estudiantes. El primero no intenta conectar los puntos, en vez de eso caracteriza el crecimiento
309
AJUSTE DE CURVAS
de los datosmedianteunalínearecta(Fig. IV.l .a). El segundo estudiante usó segmentos de línea recta o interpolación lineal en la conexión de los puntos (Fig. IV.l h ) . Esta técnica es muy común en ingeniería. Si los valores se acercan realmente al caso lineal y están espaciados muy cerca entre sí, entonces esta aproximación ofrece una estimación adecuada en muchos cálculos de ingeniería. Sin embargo, en donde la relación subyacente es altamente curvilínea o en donde los datos están muy separados entre sí, se pueden introducir errores significativos enla interpolación lineal.El tercer estudiante usó curvas que intentan capturar el comportamiento sugerido por los datos (Fig. IV.l c ) . U n cuarto o quinto estudiante desarrollaría un ajuste diferente. Obviamente, la meta aquí es la de desarrollar métodos sistemáticos y objetivos con el propósito de derivar tales curvas.
IV.1.2 Ajuste decurvas en ingeniería El primer enfrentamiento del ingeniero con el ajuste de curvas pudo ser el de determinar un valor intermedio de datos contenidos en una tabla por ejemplo, de tablas de interés en la economía o de tablas de vapor en termodinámica. A lo largo de la profesión de un ingeniero, frecuentemente se presentan ocasiones en las que se deben calcular valores intermedios de estas tablas. Aunque muchas de las fórmulas utilizadas ampliamente en ingeniería ya han sido tabuladas, existe otra gran cantidad delos que no tienen aplicación al hacerlas de esta forma. Los casos especiales y los problemas nuevos de contexto requieren a menudo quese obtengan datos propios y que se desarrollenrelacionespredictivas,tambiér! propias. Se pueden encontrar, en general, dos tipos de aplicaciones cuando se ajustan datos experimentales: el análisis de tendencias y la prueba de hipótesis.
El análisis de tendencias representa el proceso de usar el patrón de los datos y hacer predicciones. Para los casos en que los datos se mi-
den con alta precisión, se pueden usar polinomios de interpolación. Los datos imprecisos, en general, se analizan con regresión de mínimos cuadrados.
El análisis de tendencias se puede usar para predecir o pronosticar valores de la variable dependiente. Esto a veces involucra extrapolar más allá de los límites de los datos observados o interpolar dentro del rango de datos. Generalmente, en todos los campos de la ingenieria se encuentra este tipo de problemas. Una segunda aplicación a la ingeniería del ajuste de curvas experimentales es la prueba de hipótesis. Aquí se compara un modelo matemático existente con los datos medidos. Si los coeficientes del mo-
310
MÉTODOS
NUMÉRICOS
PARA INGENIEROS
delo se desconocen, a veces es necesario determinar valores que se ajusten mejor a los datos observados. Por el otro lado, si las estimaciones de los coeficientes del modelo se encuentran disponibles puede ser apropiado comparar los valores predecidos del modelo con los valores observados y así probar la eficiencia del método. A menudo, se comparan modelos alternos y se selecciona "el mejor" en base a observaciones empíricas. Además de las aplicaciones anteriores a la ingeniería,el ajuste de curvas es importante en otros métodos numéricostales como la integración y la solución aproximada de ecuaciones diferenciales. Finalmente, los métodos de ajuste de curvas se pueden usar para derivar funciones simples y aproximar funciones complicadas.
IV.2
FUNDAMENTOS MATEMÁTICOS Los fundamentos matemáticos necesarios para la interpolación se encuentran en las expansiones de la serie de Taylor y diferencias divididas finitas introducidos en el capítulo 3. En la regresión con mínimos cuadrados se requieren conocimientos de estadística. Si el lector está sufamiliarizado con los conceptos de media, desviación estándar, ma residual de cuadrados ydistribución normal, entonces puede omitir las siguentes paginas e ir directamente a la secciónIV.3. Si no conoce estos conceptos o si necesita recordarlos, entonces se recomienda leer el siguiente material como una breve introducción a estos temas.
IV.2.1
Estadísticasimple
Supóngase que enun curso de ingeniería se hacen varias medidas de una determinada cantidad. Por ejemplo, el cuadro IV.l contiene 24 lecturas del coeficiente de expansión térmica de un acero estructural. AI observar estos valores, proporcionan una cantidad limitada de información, esto es, el rango de valores va desde un mínimo de CUADRO IV. 1
Coeficientes obtenidos al medir la expansión térmica de un acero estructural ( x 1 O-6 pulg/pulg/°F)
6.495 6.665 6.755 6.565 6.595 6.505
6.625 6.51 5 6.61 5 6.435 6.71 5 6.555
6.635 6.625 6.575 6.395 6.485 6.71 5
6.655 6.775 6.555 6.655 6.605 6.685
31 1
AJUSTE DE CURVAS
6.395 hasta un máximo de 6.775. Se puede profundizar en el conocimiento de los mismos agrupando los datos en una o mas medidas es-
tadísticas conocidas que proporcionen tanta información como sea posible acerca decaracterísticas específicasdel conjunto de datos. Estas medidas estadísticas descriptivas se seleccionan más a menudo para representar 1 ) la posición central de la distribución de datos y 2) el grado de dispersión del conjunto de datos. La medida estadística más común es la medida. La media (y) de una muestra se define como la suma de los datos individuales (y;) .. . dividido por el número de puntos (n), o:
[IV.l] en donde la sumatoria va desde i =
1 hasta n.
La medida mas común de la dispersión de una muestra es la desviaestándar (sJ, en función de la media:
ción
[IV.2] I
I
en donde S es la suma total de los cuadros de puntos y la media, esto es:
S, =
c (y, -
los residuos entre los [IV.3]
Por lo tanto, si las medidas individuales se dispersan muy lejos de la media, S, (y, por lo tanto sy) crecerá. Si se agrupan muy cerca de la media entonces la desviación estándar será pequeña. La dispersión también se puede representar por el cuadrado de la desviación estándar, a la cuál se le llama varianza:
[IV.4] Nótese que el denominador en ambos casos es n - l. Esto toma en consideración que un promedio derivado previamente de los datos (esto es, la media) se usó para determinar S,. Formalmente, se dice que se pierde un grado ¿e Iibedad. Otra justificación de dividir por n - 1 es que no hay dispersión en un solo dato. Por lo tanto, en el caso donde n = 1, la ecuación (IV.4) proporciona un resultado sin sentido o infinito.
METODOS NUMERICOS PARA INGENIEROS
312
Una medidaestadística final que tiene utilidad en la cuantificación de la dispersión de los datos es el coeficiente de variación (c. v). Esta medida estadística es el cociente d e la desviación estándar dela media. Como tal, proporciona una media normalizada de la dispersión. A menudo se multiplica esta cantidad por 100, de tal manera que se pueda expresar en forma porcentual:
[ ; I C.V.
=
= 100%
[IV.5]
Nóteseque elcoeficiente devariación essimilaralerrorrelativo porcentual ( t u ) mencionado en la sección 3.3. E s decir, el cociente de una medida de error (S,,) entre una estimación del valor verdadero
(a.
EJEMPLO IV.l Tratamiento estadístico sencillo de una muestra Enunciadodelproblema: calcúlense lamedia,varianza,desviación estándar y coeficiente de variación de los datos del cuadro Solución: los datos se suman (cuadro para calcular [Ec.(lV.l)]:
-
158.400 24
=
IV.l.
IV.2) y los resultados se usan
6.6
Como enel cuadro IV.2, la suma de los cuadrados de los residuos es 0.21 7 00, que se puede usar en el calculo de la desviación estándar [Ec.(lV.2)]:
II I
1
sy =
,/T =
0.097 733
y la varianza [Ec.(lV.4)]: S’,
=
0.009 435
y los coeficientes de variación [Ec.(lV.S)]: C.V.
=0.097
6.6
331 00%
=
1.47%
AJUSTE DE CURVAS
Cuadro IV.2
313
Cálculos para la obtención de las medidas estadísticas e histograma delas lecturas del coeficiente de expansión térznica
INTERVALO I
6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24
z
Y;
6.395 6.435 6.485 6.495 6.505 6.515 6.555 6.555 6.565 6.575 6.595 6.605 6.615 6.625 6.625 6.635 6.655 6.655 6.665 6.685 6.715 6.715 6.755 6.775 158.400
(Y;
- 7,’
Frecuencia
0.042 025 0.027 225 0.013 225 0.011 025 0.009 025 0.007 225 0.002 025 0.001 225 0.000625 0.000025 0.000025 0.000225 0.000625 0.000625 0.001 225 0.003 025 0.003025 0.004 225 0.007 2251 0.013 225) 0.013 225 0.024 025 0.030 625
i
Limite límite inferior Superior
6.36 6.40
6.40 6.44
4
6.48
6.52
2
6.52
6.56
3
6.56
6.60
5
6.60
6.64
3
6.64
6.68
3
6.68
6.72
6.72 6.76
6.76 6.80
0.217 O00
IV.2.2 La distribución normal La característica final que se menciona en este análisis es la distribución de datos, es decir, el comportamiento con el cual los datos se distribuyen alrededor de la media. Un histogrurnu proporciona una representación visual simplede la distribución. Como el cuadro IV.2, un histograma se construye ordenando los datos en intervalos. Los intervalos se grafican sobre el eje ¿e las abscisas y la frecuencia de ocurrencia de estos se grafica en el eje de las ordenadas. Por lo tarito, cinco de las medidas caen dentro del intervalo 6.60 y 6.64. Como en la figura IV.2, el histograma sugiere que la mayor parte delos datosse agrupan cerca de la media.
Si se tiene un conjunto grande de datos, a menudo el histograma se transforma de un diagrama de barras en una curva suave. La curva
314
MÉTODOS
FIGURA IV.2
NUMÉRICOS
PARA INGENIEROS
Uso de un histograma para delinear la distribución de los datos. A medida que el número de puntos aumenta, el histograma tiende a una curva uniforme y sin discontinuidades llamada distribución normal.
simétrica y homogénea sobrepuesta a la figura IV.2 muestra una de estas curvas características; la distribución normal. Si se proporcionaran medidas adicionales suficientes, entonces el histograma eneste caso en particular, tendería eventualmente a la distribución normal.
los conceptos de media, desviación estándar, suma residual de cuadrados y distribución normal tiene una gran importancia dentro de la ingeniería. Un ejemplo muy simple essu uso en la cuantificación de la confiabilidad que se le puede atribuir a un dato particular. Si unacantidad está distribuidanormalmente, el rangodefinidopor y - S, a y S, abarcará aproximadamente el 68% del número total de datos. De la misma manera, el rango definido por y - í's, a y 2 S,, abarcará aproximadamente el 95%
+
+
Por eiemplo, en los coeficientes de expansión térmica del cuadroIV. 1 (y = 6.6 y S, 0.097 133), se puededecir que aproximadamente el 95% de los datos se encuentra entre 6,405 734 y 6.794 266. Si alguien dijo que se midió un valor de 7.35, entonces se puede esperar que este dato sea erróneo.
l o anterior es sólo un ejemplo muy simple de cómo se pueden usar las estadísticas para dar juicios acerca de la certeza de los datos. Estos conceptos también tienen importancia directaen el análisis de modelos de regresión. Se puede consultarcualquierlibro bdrsico de estadística (por ejemplo, Ang y Tang, 1975, o Laping, 1983) para obtener información adicional sobre el tema.
31 5
AJUSTE DE CURVAS
IV.3 ORIENTACION Antes de pasar a los métodos numéricos en el ajuste de curvas, puede ser útil una orientación. Lo que sigue está enfocado a dar una visión general del material analizado en la parte IV. Además, se han formulado algunos objetivos para ayudar al aprendizaje del lector cuando estudie el material.
316
INGENIEROS MÉTODOS
NUMÉRICOS
PARA
IV.3.1 Avance y alcance En la figura IV.3 se muestra una visión global del material que se cubre en la parte IV. El capítulo 70 se dedica a la regresión con mínimos cuudrudos. Primero se aprenderá a ajustar “la mejor” línea recta a través de un conjunto de datos inciertos. A esta técnica se le conoce con el nombre de regresión lineal. Además del análisis sobre el cálculo de la pendiente y punto de intersección de la línea recta, se presentan también métodos cuantitativos y visuales para la evaluación los resultados. de la validez de Además de ajustar una línea recta, se estudia también una técnica general para ajustar “al meior” polinomio. Por lo tanto, se aprenderá a derivar un polinomio cuadrático, cúbicoo de orden superior que se ajuste de manera adecuada a los datos inciertos. La regresión lineal es un subconjunto de este esquema más general, al cual se le conoce con el nombre de regresión polinornial. Finalmente, el último tema cubierto en el capítulo 10 es la regresión lineal múltiple. Que está diseñada para casos en que la variable dependiente y sea una función lineal de dos o más variables independientes xl, x2, ..., x,. Este esquema tiene una utilidad especial en la evaluación de datos experimentales en donde la variable de interés depende de un conjunto de factores. En el capítulo 7 7 se describeunatécnicaalternativa de ajuste de curvas a laque se le llamainterpolación, Como se dijoanteriormente,lainterpolación se usa para estimularvaloresintermedios entre datos conocidos. En el capítulo 11 se derivan polinomios que cumplen este propósito. Se introduce el conceptobásicode y parábolasparaconecinterpolaciónpolinominalusandorectas tarpuntos.Después, se desarrolla un procedimientogeneral para ajustar un polinomio de n-ésimo orden. Se presentan dos formatos diferentes para expresar estos polinomios en forma de ecuaciones. E s preferible el primero de ellos,llamado polinornio de interpolación deNewton,cuando se desconoce el ordencorrectodelpolinomio. El segundo, llamado polinornio de interpolación de Lagrunge tiene algunasventajas cuando el ordendelpolinomio se conoce deantemano. La Última sección del capítulo 11 se dedica a una técnica diferente en el ajuste preciso de datos. Esta técnica, llamada interpolación segrnenturia (en inglés spline),ajusta los datos a polinomios pero por intervalos. De ahí que sea particularmente útil cuando se ajusten datos que en general son homogéneos,pero muestrancambioslocales abruptos.
317
AJUSTE DE CURVAS
En el capitulo 72 se desarrollan casos de estudio que ilustran la utilidad de los métodos numéricos dentro de contextos de la ingeniería. Se muestran algunos ejemplos tanto de la ingeniería en general como de las cuatro ramas más importantes de la misma: química, civil, eléctrica y mecánica. Finalmente, se incluye un epílogo al final de la parte IV. Este incluye un resumen de las fórmulas y conceptos más importantes relacionados con el ajuste de curvas, así como un análisis de los factores de mayor importanciaentre las técnicas y sugerenciaspara estudios posteriores. En la parte IV se incluyen algunas opciones de cálculo por computadora. Primero, el paquete de programas NUMERICOMP que acompaña al texto contiene programas que son legibles al usuario sobre regresión lineal e interpolaciónde Lagrange. Alternativamente,se incluyen en el texto programas escritos en FORTRAN y en BASIC. Esto le proporciona al lector la oportunidad de copiar el programa para implementarlo en su propia microcomputadora o supercomputadora. También se incluyen los diagramas de fluio y los algoritmos para la mayor parte delos métodos descritos en el texto. Este materialpuede servir de base en la construcciór! de un paquete de programas que el lector puede desarrollar y aplicar a los problemas de ingeniería.
IV.3.2
Metas y objetivos
Objetivos de estudio. Después de terminar la parte IV, el lector debe haber aumentado en gran medida sus capacidades en el ajuste de curvas con datos. En general, se deben dominar las técnicas, se debe haber aprendido a valorar la confiabilidad delas respuestas y ser capaz de escoger el mejor método (o métodos) para cualquier problema. Además de estas metas generales, se deben asimilar y dominar los conceptos específicos del cuadro IV.3. Objetivos de cómputo. El lector debe tener un conjunto de programas simples decomputadora, algoritmosy diagramasde flujo queimplementen los métodos analizados en laparte IV. Todos ellos comoherramientasdeaprendizaje.
El paquete opcional de programas NUMERICOMP, incluye los programas de regresión lineal de interpolación de Lagrange. Las gráficas asociadas con este paquete le ayudarán al lector a visualizar el problema además delas operaciones matemáticas asociadas. Las gráficas son una parte crítica en la apreciación sobre la validez de una regresión. También proporcionan una guía relacionada con el orden
318
MÉTODOS
CUADRO IV.3
Objetivos de estudios específicos de
NUMfRICOS PARA INGENIEROS
la parte IV
1 . Entender la diferencia fundamental entreregresión
einterpolaciónydarse cuenta que el confundirlos puedeacarrear serios problemas. 2. Entender la derivación de la regresión lineal con mínimos cuadradosy ser capaz devalorar la confiabilidad del ajuste usando gráficas a apreciaciones cuantitativas. 3. Saber linealizar datos para llevara cabo transformaciones. 4. Entender lassituacionesen dónde es apropiado usar regresiónpolinomial o múltiple. 5. Entender que hay uno y sólo un polinomio de grado n o menor que pasa exactamente a través de los R 1 puntos. 6. Saber como derivar el polinomio de interpolación de Newton de primer orden. 7. Entender laanalogía entreel polinomio de Newton y la expansión de la serie de Taylor y cómo se relacionancon el error de truncamiento. 8 . Reconocer que las ecuaciones deNewton y de Lagrange sonmeramente formulaciones diferentesdelmismo polinomio de interpolación y de entenventajas y desventoias. der sus respectivas 9. Observar que se obtienenresultadosmásexactos si los puntosusados para interpolación se centran alrededor y cerca de la incógnita. 10. Reconocer que los puntosnotienen porqué estarigualmente espaciados nienningún orden enparticular para los polinomios de Newton y de Lagrange. 1 1 Conocer el por qué las fórmulas de interpolación igualmente espaciados tienen utilidad. 12. Reconocer las limitaciones y las incertidumbres asociadas con la extrapolación. 13. Entender por quélasfuncionessegmentariastienenutilidad para datos con áreas locales de cambios significativos.
+
correcto de una interpolación polinomialy s i es confiable efectuar la extrapolación. El paquete es muy fácil de aplicarse en la solución de problemas prácticos y se puede usar en la verificación de los resultados de cualquier programa que el lector haya desarrollado por sí mismo. Además, se incluyen los programas de computadora, los algoritmos o los diagramas de flujo para la mayor parte de los métodos de la parte IV. Esta información le permitirá ai lector expander su biblioteca de programas incluyendo técnicas que van más allá de la regresión lineal y de la interpolación de Lagrange. Por ejemplo, puedeser útil, desde un punto de vista profesional, tener un paquete de programas que incluya regresión polinomial, polinomio de interpolación de Newtone interpolación cúbicasegmentaria (del inglés cubic spline).
CAPíTULO DIEZ REGRESI~N CON MíNIMOS CUADRADOS
Cuando se asocia un error sustancial con los datos, la interpolación poiinomial es inapropiada y puede llevar a resultados no satisfactorioscuando se usa para predecir valores intermedios. Los datos experimentales a menudo son de este tipo. Por ejemplo, en la figura 10. l a se muestran siete datos obtenidos experimentalmente que muestran una variación significativa. La inspección visual de los datos sugiere una relación positiva entre y y x . Es decir, la tendencia total indica que a valores mayores de y se le asocian valores mayores a x. Ahora, si se ajusta un polinomio interpolante de sexto orden a estos datos (Fig. l O . l b ) , pasará exactamente por todos los puntos. Sin embargo, debido a la variabilidad de los datos, la curva oscila ampliamente en los intervalos entre puntos. En particular, los valores interpolados x = 1.5 y x = 6 . 5 parecen ir más allá d e l rango sugerido por los datos. Una estrategia más apropiada en estoscasos es la de obteneruna función aproximada que ajuste “adecuadamente” el comportamiento o la tendencia general delos datos, sin coincidir necesariamente con cada punto en particular. La figura 10. ICmuestra una linea recta que puede usarseen la caracterización de la tendencia delos datos sin pasar sobreningún punto en particular. Una manera de determinar la línea de la figura 1 0 . 1 ~ es inspeccionarvisualmente los datosgraficados y luegotrazarla “mejor” línea a través de los puntos. Aunque este enfoque recurre al sentido común Y esválidoparacálculos“asimplevista” es deficiente ya quees arbitrario. Es decir, a menos que los puntosdefinanunalínearecta perfecta (en cuyo caso la interpolaciónsería apropiada), cadaanalista trazará rectas diferentes. La manera de quitar esta subjetividad es considerar un criterio que cuantifique la suficiencia del ajuste. Una forma de hacerlo es obtener una curva que minimice la diferencia entre los datosy la curva. En este capítulo se analiza un método para llevar a cabo este objetivo al que se le llama regresión con minimos cuadrados.
320
MÉTODOS
FIGURA 1O. 1
NUMÉRICOS PARA INGENIEROS
a) Muestra de datos con un error significativo. b) Ajuste polinomial con oscilaciones que violan el rango de los datos, c) se obtienen resultados más satisfactorios usando el ajuste de mínimos cuadrados.
32 1
REGRESldN CON MíNIMOS CUADRADOS
10.1 REGRESIóN LINEAL Ei ejemplo más simple de una aproximación por mínimos cuadrados es el ajuste de una línea recta a un conjunto de parejas de datos observadas: ( x 1 ,y l ) , (xp, y2), .. . ,(x,,, y,,). La expresión matemática de una línea recta es: y =
a0
[10.1]
+ alx + E
en donde a. y al son coeficientes que representan la intersección con el eje de las abscisas y la pendiente, respectivamente y E es el error o residuo entre el modelo y las observaciones, que se puede representar reordenando la ecuación (10.1)como:
E
=
y - a0 - alx
Por lo tanto, el error o residuo es la diferencia entre el valor real de y y el valor aproximado, a. a, x, predicho por la ecuación lineal.
+
10.1.1 Criterio para un
/ /
mejor” ajuste
Una estrategia que obtiene la “mejor” línea a través de los puntos debe minimizar la suma de los errores residuales, como en: [10.2] i=1
i=l
Sin embargo, este criterio es inadecuado, como se puedever en la figura 10.2a, en donde semuestra la línea recta que ajusta dos puntos. Obviamente, la mejor línea ajustada esaquella que conecte ambos puntos. Sin embargo, cualquier línea que pasa por el punto medio de la línea que los conecta (excepto unalínea perfectamente vertical) genera un valor mínimo en la ecuación (10.2) igual a cero ya que los errores se cancelan. Otro criterio sería minimizar la suma de los valores absolutos de las diferencias, esto es: n
n
161 i= 1
=
2IM
- a0 -
alxil
i= 1
En la figura 10.21 se muestra por qué este criterio también es inadecuado. Con los cuatro puntos mostrados, cualquier línea recta que se encuentre dentro de las líneas punteadas minimiza el valor absoluto de la suma. Por lo que este criterio aún no produceel mejor ajuste que sea único. Una tercera estrategia en el ajuste de una línea óptima es el criterio de minimax. En este método, la línea se escoge de tal manera que minimice la distancia máxima a la que se encuentra un punto de la linea rec-
322
MbODOS NUMÉRICOS
PARA INGENIEROS
"
FIGURA 10.2
Ejemplos de algunos de los criterios de "meior ajuste" que son inadecuados en la regresión: a) minimización de la suma de los residuos; b) minimización de la suma de los valores absolutos de los residuos y c) minimización del error máximo de cualquier punto individual.
ta.Comose muestra en lafigura lo.&, está estrategia está mal condicionada pararegresión ya que influye de maneraindebida sobre un punto externo, aislado, cuyo error es muy grande. Se debe notar que el criterio minimax algunas veces estábien condicionado paraajustar una función simple a una función complicada (Carnahan, Luther y Wilkes,
1969). Una estrategia que ignora las restricciones anteriores es la d e minimizar la suma de los cuadrados de los residuos, S,, de la siguiente manera: S, =
n
n
¡= 1
i=l
2 E? =
( y i- a0 - alxi)2
E10.31
323
REGRESIóN CON MíNIMOS CUADRADOS
Este criterio tiene muchasventajas, incluyendoel que ajusta una linea única analizar estas propiedades, se muesa un conjunto dado de datos. Antes de tra un métodoquedetermina los valoresde a. y al que minimizanla ecuación (10.3).
10.1.2 Ajuste deunarectautilizando
mínimos
cuadrados
Para determinar los valores de las constantes a. y a l , se deriva la ecuación (10.3) conrespecto a cadaunodelos coeficientes:
Nótese que se hansimplificadolossímbolosdelasumatoria; a menos que otra cosa se indique, todas las sumatorias van desde i = 1 hasta n . Igualando estas derivadas a cero, se genera un mínimo S,. Si se hace así', las ecuaciones anteriores se expresarán cómo:
Ahora, considerando que C a. = nao, las ecuaciones se pueden expresar como un conjunto de dosecuaciones lineales simultáneas con dosincógnitas (ao y al): nao
+ C xial =
yi
[10.4] [10.5]
A estas ecuaciones se les conoce como ecuaciones normales.Se pueden resolversimultáneamente y obtener [(recuérdese la Ec. 7.10)]:
[10.6] Este resultado se puede usar junto conla ecuación (10.4) para obtener: [10.7] en donde ..... ." .
l l l _ _
..
v y X sonlamedid¿+de
y y x , respectivamente.
324
INGENIEROS MÉTODOS
NUMÉRICOS PARA
EJEMPLO 1O. 1
Regresión lineal
Enunciado del prblema: ajústese una línea recta a los valores x y y de las primeras dos columnas del cuadro 10. l. CUADRO 1O. 1
Cálculos para el análisis del error del ajuste lineal
1 2 3 4 5 6 7
0.5 2.5 2.0 4.0 3.5 6.0 5.5 -
c.
24
8.5765 0.8622 2.0408 0.3265 0.0051 6.6122 4.2908 22.7143
0.1687 0.5625 0.3473 0.3265 0.5896 0.7972 0.1993 2.991 1
Solución: sepuedencalcularlassiguientescantidades:
n
2 yi
=7
=
2 xjyj = 119.5
24
xf = 140
24 J = - = 3.428 571 429 7
Usandolas ecuaciones (10.6) y (10.7),
an =
3.428 S71 429 - 0.839 285 714(4)
=
Por lo tanto, el ajuste con mínimos cuadrados y = 0:071 428 57
0.071 428 57 es:
+ 0.839 285 7 1 4 ~
La línea, juntocon los datos, se muestra enla
figura 1 0 . 1 ~ .
325
REGRESldN CON MíNIMOS CUADRADOS
10.1.3 Cuantificación del error enla
regresión lineal
Cualquier línea recta diferente a la que se calculó en el ejemplo 10.1 genera una mayor suma de cuadradosde los residuos. Por lo tanto, la línea es única y en términos del criterio escogido es “la mejor” línea a través de los puntos. Se puede derivar un gran número de propiedades adicionales de este ajuste, examinando más de cerca la manera como se calcularon los residuos. Recuérdese que la suma de los cuadrados se define como [Ec. (10.3)]: I
S , = 2 ( y i - a. - alxi)*
110.81
i= 1
Nótese la similitud entre las ecuaciones (IV.3)y (10.8).En el primer caso, los residuos representabanla diferencia entrelos datos y una aproximación simple de la medida de la tendencia central; la media. En la ecuación (10.8),los residuos representanel cuadrado de la distancia vertical entre los datos y otra medida de la tendencia central; la línea recta (Fig. 10.3). La analogía se puede extender más paracasos en donde 1) la dispersión de los puntos alrededorde la recta son de magnitud similar a lo largo del rango entero de los datos y 2) la distribución de estos puntos alrededor de la línea es normal. Se puede demostrar que si este criterio se cumple, la regresión con mínimos cuadrados proporciona la mejor(es decir, la más probable) aproximación de a. y al (Draper y Smith, 1981). A esto se le conoce como principio de probabilidad máxima dentro de la estadística. Además, si este criterio se cumple, una “desviación estándar” de la línea de regresión se puede determinar como [compárece con la Ec. (IV.2)]:
FIGURA 10.3
El residuo en la regresiónlinealrepresenta el cuadrado de la distancia y la línea recta. verticalentreunpunto
326
M ~ T O D ONUM~RICOS S PARA lNGENlEROS
[10.9]
en donde sy,x se llama error estándar de la aproximación. La notación con subíndice “y/x” indica que el error es para un valor predicho de y correspondiente a un valor particular de x. También, nótese que ahora ladivisión es por n - 2 ya que se usan dos aproximaciones obtenidas de los datos; a. y a, para calcular S; por lo tanto, se han perdido dos grados de libertad.Como con el análisis de desviación estándar en lasección IV.2.1,otra justificación de dividir por n - 2 es que no existe una “dispersión de los datos” alrededor de una línea recta que conecta dos puntos. De esta manera, para el caso cuando n = 2 , la ecuación (10.9) no proporciona un valordeinfinitoelcual no tiene sentido. Así como con la desviación estándar,el error estándx de la aproximacióncuantifica ladispersión de los datos. Sin embargo, cuantificala dispersión alrededor de la linea de regresión, como se muestra en la figura 10.4, contrario a la desviaciónestándaroriginal, S, quecuantifica la dispersión alrededor d e la media. Los conceptos anteriores se pueden emplear para cuantificarla “eficiencia” del ajuste. Esto es particularmente útil en la comparación de varias regresiones (véase la Fig. 10.5). Para hacerlo se regresa a los datos originales y se determina la suma de los cuadrados alrededorde la media para la variable dependiente (en este caso, y ) . Se le puede llamar a esto
327
REGRESldN CON MíNIMOS CUADRADOS
FIGURA 10.5
Ejemplos de la regresión lineal con a) errores residuales pequeños y grandes.
b)
la suma total de los cuadrados, S,. Esta es la cantidad de dispersión en la variable dependiente que existe antes de la regresión. Después de Ilevar a cabo la regresión lineal, se puede calcular S,, que es la5uma de los cuadrados de los residuos alrededorde la linea de regresión. Este presenta la dispersión que existe despuésde la regresión. La diferencia entre lasdos cantidades, o St - S, cuantifica la mejora enla reduccióndel error debido al modelo de la línea recta. Esta diferenciase puede normalizar al error total y obtener:
[10.10]
en donde r es el coeficiente de correlación y r 2 es el coeficiente de determinación. Para un ajuste perfecto, S, = O y r 2 = l, indicando que la línea recta explica el 100 % de lavariabilidad. Si r 2 = O, entonces el ajuste no representa mejorías.
328
MhODOS NUMÉRICOS
EJEMPLO 10.2 Estimación de los
PARA INGENIEROS
errores en el ajuste por mínimos cuadrados lineal
Enunciado del problema: calcúlese la desviación estándar total, el error estándar de la aproximación y el coeficiente de correlación de los datos del ejemplo 10.1. Solución: las sumatorias se muestranenel estándar total es [Ec. (IV.2)]
cuadro 10.1. L.a desviación
y el error estándar de la aproximación es IEc.
(10.9)]:
por lo tanto, ya que S , , < S,, el modelo de regresión lineal es aceptable. El alcance dela mejoríasecuantificamediante [Ec. (10.lO)l )-2
=
O
r =
22.714 3 - 2.991 1 = 0.868 22.714 3 = 0.932
Estos resultados indican que el 86.8% de la incertidumbre original se ha
explicadomediante el modelo lineal.
Antes de proceder con el programa de computadora para el método de regresión lineal, son necesarios algunos comentarios. Aunque el coeficiente de correlación proporciona un medio fácil de medir la efectividad del ajuste, se debe tener cuidado de no atribuirle significado garantizado. El que r esté “cercano” a 1 , no significa que el ajuste sea necesariamente “bueno”. Por ejemplo, es posible obtener un valor relativamente alto de r cuando la relación mencionada entre y y x ni siquiera es lineal. Draper y Smith (1981) proporcionan una guía y material adicional que sirve para valorar los resultados de una regresión lineal. Además, como mínimo, se debe inspeccionar siempre una gráfica de los datos con una línea de regresión cuando se ajusten curvas de regresión. Como se verá en la siguiente sección, los programas de NUMERICOMP contienen estas opciones.
10.1.4 Programadecomputadoraparalaregresión
lineal
Es relativamente sencillo desarrollarun programa para la regresión lineal. La figura 10.6 muestra las versiones en FORTRAN y BASIC. Ya que las opciones gráficas de una microcomputadora
329
REGRESION
BASIC
FORTRAN DATA SX/O./,SU/O./,XZ/O./,XY/O./
READ(5rl)N FORHAT ( I5 Do 170 I=l,N READ(5,2)X,Y fOiWAT(2F10.0) 9!=SX*X
sY=sv+Y x2=X2+x~x
sY=xY+x'Y CONTINUE XY=SX/N
YM=SY/N
kl=(N~XY-SX~SY)/(N.X2-sX*Sx) .?,O=YM-Al*XH
100 INPUT N 110 FOR I = 1 TO N 120 INPUT X . Y 139 sx = sx + x 140 SY = S Y + Y 150 x2 = x2 + x -I x
number of data points X = independent variable Y variable = dependent SX = sum of X's
N
=
SY = sum of Y's
X2 = sum of square of X's 160 X Y = X Y + X O Y __2_____ X Y = sum of product of X and Y I79 NEXT I 1BO X t l = SX / N X M = mean of X's 190 YM = SY / N ( N m , YM=meanofY's 200 A I = ( N : X Y - sx t S Y ) \ A l = slope x2 - sx : SX) 210 A 0 = YM - Al I XH A0 = intercept 229 P R I N T ClO.61 i 230 END
WRITE(6t3)AOrAl F O R M A T ( ' *,2F10.3) STOP
mn
FIGURA 10.6 Programas FORTRAN y Basic para la regresión lineal.
son muy variadas, no se incluyen gráficas de estos programas. Sin embargo, como se mencionó anteriormente, esta opción es importante para el uso e interpretación efectiva de la regresión y se incluye en el paquete suplementario de NUMERICOMP. Si la computadora que el lector usa, tiene la posibilidad de graficación se recomienda que se expandan los programas de tal manera que se incluya una gráfica dey contra x que muestre los datos y la línea de regresión. La inclusión de gráficas aumenta en gran medida la utilidad de los programas dentro delcontexto de solución deproblemas.
EJEMPLO 10.3
Regresión lineal usando la computadora Enunciado del problema: el paquete de programas NUMERICOMP asociado a este texto incluye un programa legible al usuario que implementa la regresión lineal. Este progrdma se puede usar enla solución del problema de prueba de hipótesis asociado con el paracaidista analizado en el capítulo 1.Se dio un modelo matemático teórico parala velocidad del paracaidistamediante la fórmula [Ec. (1.9)]:
330
MÉTODOS
NUMÉRICOS PARA INGENIEROS
en donde u es la velocidad en centímetros por segundo, g es la constante de aceleración gravitacional de 980 cm/s’, m es la masa del paracaidista e igual a 68 100 g , y c es el coeficiente de fricción de 12 500 g/s. Comosedescribeenelejemplo l . lel, modelopredice la velocidaddel paracaidista en función del tiempo. En el ejemplo 2.1 se muestra una gráfica de lavariacióndelavelocidadenfuncióndel tiempo. Un modelo empírico para la velocidad del paracaidista está dado por la siguiente fórmula: v(t) =
c
[
t
3.75
+t
]
[E10.3.1]
Supóngase que se desea probar y comparar la suficiencia de estos dos modelos matemáticos. Esto se puede llevar a cabo midiendo la velocidad verdadera del paracaidista en intervalos de tiempo conocidos y comparando los resultados con la velocidad predicha por cada uno de los modelos. Se tiene un grupo de datos medidos experimentalmente los que se listanenla columna a) del cuadro 10.2. Las velocidades calculadas de cada modelo se listanenlas columnas b) y c). CUADRO 10.2
Velocidades medidas y velocidades calculadas para la caída del paracaidas Medida
Tiempo,
1 2 3 4 5 6 7
a
9
10 11
12 13 14 15
S
cmls (4
100 o 163 O 230 O 275 O 310 O 356 O 390 O 415 O 429 O 450 O 460 O 455 o 460 O 490 O 500 O
V Calculada, cmls [ecuación (1.9)] ( 4 895.3 1 640.5
2 260.7 2 776.9 3 206.5 3 564.1 3861.7 4109.5 4315.6 4487.2 4 630.1 4749.0 4847.9 4 930.3 4998.8
V Calculada, cmls [ecuación
(E10.3.l)l (4
1 124.0 1 857.0 2 372.9 2755.6 3 050.9 3 285.5 3 476.6 3 635.1 3 768.7 3 882.9 3981.6 4067.8 4143.7 4211.0 4 271.2
Solución: la validez de los modelos se puede probar graficando las velocidades medidas contra la velocidad calculada por el modelo. Se usala regresión lineal en el cálculo de la línea recta y se gráfica. Esta línea ten-
REGRESldN C O N MíNIMOS CUADRADOS
FIGURA 10.7
33 1
a) Resultados obtenidos usando regresión lineal en la comparación de valores medidos contra el modelo teórico calculado mediante la ecuación (1.9). b) Resultados obtenidos usando regresión lineal en la comparación de valores medidos contra el modelo empírico calculado con la ecuación
(E10.3.1).
drá una pendiente de 1 y una intersección en O si el modelo coincide con los datos perfectamente. Cualquier desviación de estos valores se usará como indicación de ser poco confiableel modelo. ~ ~grafica lalínea y los datos de la regresión de Enlafigura 1 0 . 7 se la columna a) contra las columnas b) y c) respectivamente. Estas graficas indican que la regresión lineal entre los datos y cada uno de los modelos es bastante aceptable. Ambos modelos coinciden con los datos con un coeficiente de correlación mayor de 0.99. Sin embargo, el modelo descrito por la ecuación (1.9) conforme el criterio de prueba es mucho mejor que el descrito por (E10.3.1) ya que la pendiente y la intersección estdn más cerca de 1 y de O. Por lo tanto, aunque cada una de las gráficas se describe muy bien mediante una línea de la ecuación recta, la ecuación (1.9) es un modelomejorqueel (E10.3.1). La prueba y selección de modelos sonmuy comunes y de extremada importancia en actividades llevadas a cabo en todos los campos de la ingeniería. El material presentado previamenteen este mismo capítulojunto con el paquete NUMERICOMP y los programas del usuario le permiten a éste resolver muchos problemas de este tipo.
332
MÉTODOS
FIGURA 10.8
NUMERICOS
PARA INGENIEROS
a) Datosmal condicionados en la regresión lineal con mínimos cuadrados. 6)Indicación de que una parábola es preferible.
10.1.5 Aplicaciones delaregresión relaciones no lineales
lineal;linealizaciónde
La regresión lineal proporciona una técnica muy poderosa para ajustar datos a una “mejor” línea. Sin embargo, se ha predicho que la relación entre las variables dépendiente e independiente eslineal. Este no es siempre el caso, y el primer paso en cualquier análisis de regresión es el de trazar y visualizar los datos para decidir si es correcto o aceptable el aplicar un modelo lineal. Por ejemplo, en la figura 10.8 se muestran algunos datos que, obviamente son curvilíneos. En algunos casos, técnicas como la regresión polinomial, descrita en la sección 10.2 serán apropiadas. En otros, se pueden hacer transformaciónes que expresen los datos de manera que sean compatibles con la regresión lineal. Un ejemplo es el modelo exponencial: y = aleblX
[lo.111
REGRESIóN
333
FIGURA 10.9
a) Ecuación exponencial, b) ecuación de potencias y c) ecuación del promedio de crecimiento de saturación. Las partes d), e) y fl son versiones linealizadas de aquéllas, lascualesson transformaciones simples.
en donde al y b l son constantes. Este modelo se usaen muchos campos de la ingeniería caracterizando cantidades que crecen (b,positiva) o
que decrecen (b, negativa en un promedio proporcional a su magnitud. Por ejemplo, el crecimiento poblacionaly la disminución radiactivo muestran este comportamiento. Como se muestra en la figura (10.9a), la ecuabl . O) entre y y x. ción, representaunarelaciónlineal(para Otro ejemplo de un modelo no lineal es la ecuación elevada a una potencia:
y = agxb2
[lo.121
334
NUMÉRICOS
MÉTODOS
PARA INGENIEROS
en donde a2 y b2 son coeficientes. Este modelo tiene una amplia aplicación en todos los campos de la ingeniería. Como se muestra en la figura 10.9b, la ecuación (para b2 # O o 1) es no lineal. Un tercer ejemplo de un modelo no lineal es la ecuación de promedio de crecimiento de saturación: X
y = a3b3
[10.13]
+X
en donde a3 y b3 son coeficientes constantes. Este modelo, que es particularmente útil enla caracterización de crecimientos poblacionales bajo condiciones limitantes, también representa una relación no lineal entre y y x (Fig. 10.94 que nivela, o “satura” conforme x crece. Las técnicas de regresión no lineal se usan para ajustar directamente estas ecuaciones a los datos experimentales. Sin embargo, una alternativa más simple es la de usar manipulaciones matemáticas y transformar las ecuaciones a la forma lineal. En seguida se puede aplicar la regresión lineal simple para ajustar las ecuaciones a los datos. Por ejemplo, la ecuación (10.11) se puede linealizar mediante logaritmos naturales y obtener:
In y
=
In al
+ blx In e
Pero, ya que In e
In y
=
=
1 , se tiene:
In al + blx
[10.141
Por lo tanto una gráfica semilogarítmicade In y contra x genera una línea recta con una pendiente de bl y una intersección de In al (Fig. 10.9d). La ecuación (10.12) se puede linealizar tomado logaritmos de base 10 y obtener: log y = b2 log x
+ log a2
[lo.151
De esta forma, una gráfica logarítmica de log y contra log x genera una línearectaconunapendiente de b2 y una intersección de log a2 (Fig. 10.9e). La ecuaci6n (10:13) se linealizainvirtiéndola, y se obtiene: [10.16]
Y a3 x a3 Por lo tanto, unagráficade l / y contra l/x será lineal, con pendiente b3/a3 y unaintersecciónde l/a3 (Fig. lO.9j). Estos modelos,en sus estados transformados,se ajustan usando regresión lineal para evaluar los coeficientes constantes. Después se pueden transformar a su estado original y usarse para propósitos predictivos. En el ejemplo 10.4 se ilustra este procedimiento para la ecuación (10.12). Además los casos 12.2 y 12.3 proporcionan ejemplos de este tipo de cálculos aplicados a problemas de ingeniería.
335
REGRESION
Ejemplo 10.4 Linealización de una ecuación de potencias
Enunciado del problema: ajústesela ecuación (10.12)a los datos del cuadro 10.3 usando una transformación logaritmica d e esos datos. CUADRO 10.3
Datos para ajustar en la ecuación de potencia X
1
5.7
2 3 4 5
Y
log x
log Y
0.5 1.7 3.4
O 0.301 0.477
-0.301
8.4
0.602 0.699
0.226 0.534 0.753
0.92:!
Solución: en la figura 1 0 . 1 0 ~ se~muestra una gráfica d e los punto originales en su estado sin transformación. En la figura 10.10b se muestra una
FIGURA 10.10
a) Gráfica de datos sin transformación, junto con la ecuación de potencias que ajusta los datos. b) Gráfica de los datos transformados, usados al determinar los coeficientes de la ecuación de potencias.
336
MÉTODOS
~
NUMÉRICOS
PARA INGENIEROS
gráfica log-log de los datos transformados. La regresión lineal de los datos transformados logarítmicamnte genera la ecuación: log y = 1.75 log
X
-
0.300
Por lo tanto, la intersección, log a2, esigual a -0.300, por consiguien= 0.5. La pendientetomando el mando el antilogaritmo, a2 = tees b2 = 1.75. Como consecuencia la ecuación de potencias es: y =O . ~ X ' . ~ ~
Esta curva, como lo muestra la figura 10.lob, indica un ajuste aceptable.
1O. 1.6 Comentarios generales sobre la regresión lineal Antes de continuar conla regresión curvilínea y múltiple, se debe recalcar la naturaleza introductoria del material anterior sobre regresión lineal.Se ha enfocado en la forma simple y el uso práctico de las ecuaciones para ajustar datos. Se debe estar conciente de que existen aspectos teóricos de regresión que tienen importancia en la solución de problemas pero que van más allá del alcance de este libro. Porejemplo, existen algunas hipótesis estadísticas inherentes al procedimiento de mínimos cuadrados lineales tales cómo: 1. x tiene un valor fijo; no es aleatorio y se midesinerror 2. Los valores de y son variables aleatorios independientes y tienen todaslamismavarianza. 3. Los valores de y para una x dada deben estar distribuidos de manera uniforme.
Estas hipótesis son importantes enel desarrollo y uso correcto de la regresión. Por ejemplo, laprimera hipótesis, 1) significaquelas x deben estarlibresdeerror y la segunda 2) que laregresiónde y contra x no es la misma que la de x contra y (pruébese el problema 10.4 al final del capítulo). Se sugiere consultar otras referencias talescomo Draper y Smith (1981) y de esta forma apreciar aspectos y matices de la regresión que van más alládel alcance de este libro.
10.2 REGRESIóN POLINOMIAL Enla sección 10.1 se desarrolla un procedimiento que obtiene la ecuacióndeunalínea recta usando el criterio de mínimos cuadrados. Aigu-
337
REGRES16N
nos datos de ingeniería, aunque muestren un marcado patrón como el de lafigura 10.8, se representan pobremente mediante una línea recta. En estos casos, se ajusta mejor una curva a los datos. Como se analiza enla sección anterior, un método para llevar a cabo este objetivo es el de usar transformaciones. Otra alternativaes ajustar polinomios a los datos usando regresión polinomial. El procedimiento de mínimos cuadradosse puede extender fácilmente y ajustar datos a un polinomio de m-ésimo grado: y =
a0
+ alx + a2x2 +
* *
+ a,xm
En este caso, la suma de los cuadrados de losresiduos es [compárese con la Ec. (10.3)]:
Sr =
n
(yi - a. - alxi - a2x? -
*
. - amx?)2
[10.17]
i= 1
Siguiendo el mismo procedimiento de la sección anterior, se toma la derivada de la ecuación (10.17) con respecto a cada uno de los coeficientes del polinomio, para obtener:
Estas ecuaciones se puedenigualar a cero y reordenarde tal forma queseobtenga el siguienteconjuntode ecuaciones normales:
338
MÉTODOS
NUMÉRICOS PARA INGENIEROS
en donde todas las sumatorias van desde i = 1 hasta n. Nótese que las m + 1 ecuaciones anteriores sonlineales y tienen m + 1 incógnitas: ao. al, ..., .a, Los coeficientes de las incógnitas se pueden calcular directamente de los datos observados. Por lo tanto, el problema de determinar polinomios de gradom con mínimos cuadradoses equivalente a resolver un sistemade m + 1 ecuaciones lineales simultáneas. Los métodos de solución de estos sistemas se analizanen los capítulos 7 y 8. Así como en la regresión lineal, el error en la regresión polinomial se puede cuantificar mediante el error estándar de la aproximación:
%/x
=
-u".'
n - (m
+ 1)
[10.19]
en donde m es elordendelpolinomio.Estacantidad se dividepor n- ( m + 1 ) ya que se usaron m + 1 coeficientes - a. , a l , ...,amderivadosde los datosparacalcular S ; por lo tanto, se hanperdido m + 1 grados de libertad. Además del error estándar, se puede calcular también el coeficiente de correlación en la regresión polinomial de la misma manera que para el caso lineal: r2 =
S"
-
S"
Sr
Ejemplo 10.5 Regresión polinomial
Enunciado del problema: ajústese un polinomio de segundo orden a los datosdelasdoscolumnasdelcuadro 10.4. Solución: de los datos dados: m - 2
x, = 15
2,xp = 979
n=6
y, = 152.6
x
x = 2.5
x' = 55
2 x'y,
5
x? =
-
I
= 25.433
x,y, = 585.6 =
2 488.8
225
Por lo tanto, las ecuaciones lineales simultáneas son: 6ao
+
15ao + 55ao
+
15al + 55a2 = 152.6 55al + 225a2 = 585.6 225a1 + 979a2 = 2 488.8
339
REGRESldN CON MíNIMOS CUADRADOS
CUADRO 10.4
Cálculos del análisis de error de un aiurte cuadrático con mínimos cuadrados.
13.6 27.2 40.9
I
1
'
2.1 7.7
O 1 2 3 4 5
61.1
c.
513.39 3.746 2152.6
544.44 31 4.47 140.03 3.12 239.22 1 272.1 1
O. 143 32 1 .O02 86
1.08158 0.804 91 0.61 9 51 0.094 39 57
Resolviendo estas ecuaciones conalgunadelas nacióngaussiana se obtiene:
1
a0 = 2.478 57
I
al = 2.359 29
técnicas como laelimi-
a2 = 1.860 71
1 Por lo tanto, la ecuación cuadrática con mínimos cuadrados en este caso es: y = 2.478 57
+ 2.359 29x +
1.860 71x2
El error estándar de la aproximación, basado en la regresión polinomial es [Ec. (10.191:
sy/x
=
E
= 1.12
El coeficiente de determinación es: r2
=
2 513.39 - 3.746 57
2 513.39 y el coeficiente de correlación
= 0.998 51
es:
r = 0.999 25 Estos resultados indican que el 99.851% de la incertidumbre original se ha explicadomediante el modelo. Esteresultadoapoya la conclusión de que la ecuación cuadrática representa un ajuste perfecto, como es evidente enlafigura 10.11.
340
MÉTODOS
FIGURA 10.11
FIGURA 10.12
NUMERICOS PARA INGENIEROS
Ajuste de un polinomiode segundo orden.
Algoritmopara implernentarlaregresiónpolinomial.
REGRESldN
34 1
CUADRADOS
SUBROUTINE POLREG(X,P,A) DIMEIiSION X(15),Y(15).A(15.161 ccnnoN N , I O IP=Io*1 DO 2100 I=l,IP DO 2060 J=l,IP
K=I+J-2 W 2050
L=l,N
A(I,Jl=A(I.Jl+X(L)~~K
FOR I = 1 TO I O + 1 FOR J = 1 TO I O + 1 2020K = I + J - 2 2030 FOR L = 1 TO N 2040 A ( I , J ) = A ( I , J ) + x ( L ) K2050 NEXT L 2060 NEXT J 2070 FOR L = 1 TO N 2080 A ( I , I O + 2 ) = A ( I , I O + 2 ) ,+ 2000 2010
~~
Y(L) t X ( ¡ ) NEXT L ' NEXT I 2 1 1 O RETURN A ~ 1 , I R ~ = A ~ I . I R ~ + Y ~ L I ~ X ~ L ~ ~ ~ ~ I - l ~
2050 CONTINUE
2060 CONTINUE M) 2090 L=l,N IR=lP+l
"
2090 2100
(1
"
-
1) ..
IO = order of
regression
polynolnsal
N
= number of data
oolnts
( D e t e r m l n a t l o n of coefficlents of n o r m a l equations and storage In matrix A l (Deterrnlnation of right hand side constants for normal equations and storage In last column of rnatrlx A l
2090 CONTINUE 2100 CONTINUE RETURN END
FIGURA 10.13
Subrutinasen FORTRAN y BASIC que calcula las ecuaciones normales, de la regresión polinomial, en forma matrical.
10.2.1 Algoritmo para la regresión polinomial En la figura 10.12 se muestra un algoritmo sobre la regresión polinomial. Nótese que la tarea principales la obtención de los coeficientes de lasecuaciones normales [Ec. (10.la)].(Las subrutinas que llevan a cabo esta tarea se presentan en la figura 10.13). En seguida se pueden aplicar los métodos de los capítulos 7 y 8 en la solución de estas ecuaciones simultáneas para esos coeficientes. Un problema potencial quese presenta con la implementación polinomial es que algunasveces las ecuaciones normales estánmal condicionadas. Esto se cumple en particular cuandolos sistemas son muy grandes. En estos casos, los coeficientes calculados son altamente susceptibles a los errores de redondeoy, por lo tanto, los resultados resultan inexactos. Entre otras cosas, este problema está relacionado con e!hecho de que parapolinomios de órdenes superiores las ecuaciones normales pueden tener coeficientes muy grandes y muy pequeños al mismo tiempo. Esto se debe a que los coeficientes son sumatorias de los datos elevados a potencias. Aunque algunas de las estrategias para amortiguar los errores de redondeo analizadas enel capítulo 7 , tales como el pivote0 y las ecuaciones de error, pueden ayudar a remediar parcialmente este problema, una alternativa más simple es usar una computadora de alta precisión. Este es un caso donde las microcomputadoras pueden representar desventajas en la implementación efectiva de este método numéricoen especial. Afortunadamente, la mayor parte de los problemas prácticos estdn limitados a polinomios de orden inferior en los que los errores de redondeo, en general, son despreciables. En situaciones donde se requiera polinomios de orden superior, se dispone de otras alternativas para ciertos tipos de datos. Sin embargo, estos métodos (tales como los polinomios ortogonales) van más allá del alcance de este libro. El lector debe consultar textos sobre regresión tales como el Draper y Smith (1981) para obtener información relacionada con el problema y sus posibles alternativas.
342
METODOS NUMÉRICOS PARA INGENIEROS
10.3 R E G R E S I ó NL I N E A LM ú L T I P L E Una extensión útil en la regresión lineal es el caso en que y es una función lineal de doso más variables. Por ejemplo, y pudiera ser una función lineal de x1 y x2, de la forma:
Tal ecuación es útil particularmente cuando se ajustan datos experimentales en donde la variable que se está analizando, a menudo es función de otras dosvariables. En este casobidimensional, la “línea” de regresión viene a ser un “plano” (Fig. 10.14). Como con los casos anteriores, los “mejores” valores de los coeficientes se determinan agrupando la suma de los cuadrados de los residuos: n
Sr =
(yi --‘a0 - alxl,¡ -
~
2
,
2
~
)
i=l
y derivando con respecto a cada uno
de los coeficientes:
[10.20]
Los coeficientes que generan la suma mínima de los cuadrados de los residuos se obtienen igualando cada unade las derivadas parciales a cero y expresando la ecuación (10.20) como un conjunto de ecuaciones lineales simultáneas, de la forma:
o como una matriz:
343
REGRESldN C O N MíNIMOS CUADRADOS
FIGURA 10.14
Esquema grafico de la regresión lineal múltiple en donde y es una función lineal de X I y X?.
EJEMPLO 10.6 Regresión lineal múltiple
Enunciado del problema: los siguientes datos ción y = 5 + 4x1 - 3x2.
O 2 2.5 1 4 7
O 1 2 3 6 2
5 10
9
O 3 27
Úseseregresiónlinealmúltipleparaestos CUADRO 10.5
243.5
6 48
54 54
7
datos.
Cilculos necesarios para desarrollar las ecuaciones normales del eiemplo 10.6
Y
16
se calcularon de la ecua-
4
189 76.25 E
x2
X I
5 10 9 O 3 27
O 2 2.5 1
14 54
16.5
14
O 1 2 3
2
x:
xf
O 4 5 6.25 1
0 1 4
49
9
36 4
x1x2 18
0 2
3 24
XI Y
*2Y
0 20 22.5 0 12
0 10 0 18
344
MÉTODOS
NUMERICOS PARA INGENIEROS
Solución: las sumatorias necesarias para desarrollar la ecuación (10.21) se calculan en el cuadro 10.5. Sustituyéndolas en la ecuación (10.21)se obtiene:
[
;{.5 5:::
g] 54 [
a2 =
[
g . 5 1
que se puede resolver usando un método comola eliminación gaussiana para obtener: a. = 5
al = 4
a2 =
-3
los cuáles son consistentes con la ecuación original de donde se derivaron los datos.
La regresión lineal múltiple se puede formular en el caso más general como: y = a0
+ alxl + a2x2 +
* *
. + a,xm
en dondelos coeficientes que minimizan la suma delos cuadrados delos residuos se determinan resolviendo el sistema:
[10.22]
El error estándar de la aproximación para regresiónli neal múltiple se formula de la siguiente manera:
y el coeficiente de correlación se calcula como en la ecuación (10.10). Aunque existen ciertos casos en donde una variable es linealmente dependiente de dos o más variables diferentes, la regresión lineal múlti-
345
REGRES16N CON MíNIMOS CUADRADOS
pletieneutilidadadicionalenlaobtención de la forma general:
de ecuaciones de potencias
Tales ecuaciones son extremadamente útiles cuando se ajustan datos experimentales. Además, para usar la regresión lineal múltiple, lasecuaciones se transforman tomando su logaritmo para obrener: log y = log
+ al log x1 + a2 log x2 +
a0
*
+ a,
log x,,,
Esta transformación es similar a las que se usanenla sección 10.1.3 y el ejemplo 10.4 para ajustar una ecuación de potencias en donde y era una función de una variable simple x. En el caso de estudio 12.5 se proporciona un ejemplo de esta aplicación.
PROBLEMAS Cálculos a mano 10.1
Dados los datos
0.95 1.32 1.46 1.85 2.39
1.42 1.15 1.47 1.74 1.82
1.54 1.47 1.92 1.65 2.06
1.55 1.95 1.35 1.78 2.14
1.63 1.25 1.05 1.71 2.27
determínese a) la media, b) la desviación estándar, c) lavarianza y d) el coeficiente de variación. 10.2
Constrúyase un histograma de los datos delproblema 10.1. Usese un rango de 0.6 a 2.4 con intervalos de 0.2.
10.3
Dados los datos
52 39 2 43
6 22 12 36
18 28 17 41
21 24 34 37
26 27 29 43
28 27 31 38
32 33 34 46
determínese a) la media. b) la desviación estándar, c) la variara y d ) el coeficiente de variación. e ) Constrúyase un histograma. k e s e un intervalo de O a 55 con incrementos de 5. fl Suponiendo que la distribución es normal y que la aproximación de la desviación estándar es
346
MÉTODOS
-
NUMÉRICOS PARA INGENIEROS
válida, calcúlese el intervalo (es decir,los valores inferior y superior) que abarqueel 68% de las lecturas. Determínese si ésta es una aproximación válida para los datos de este problema. 10.4
Utilicela regresión con mínimos cuadrados para ajustar una línea recta a:
I
20 10 12 13 16 18 y 1 3 2 6 5 8 7 1 0 9 1 2 1 0
x
10.5
1 3 5 7
J w t o con la pendiente y la intersección, calcúlese el error estándar de la aproximación y el coeficiente de correlación. Grafíquense los datos y la línea de regresión. En seguida repítase el problema, pero ahorax contra y; es decir, intercámbiense las variables. Interprétense los resultados. Úsese regresión de mínimos cuadrados para ajustar una línea recta a: x
y
1 1
4 6 8 10 14 16 20 22 24 28 28 34 36 38 30 18 22 28 14 22 16 8 20 8 14 14 O 8
Junto con la pendiente y la intersección, calcúlese el error estándar de la aproximación y el coeficiente de correlación. Grafíquense los datos y la línea de regresión. Si alguien realizó una medida adicional de x = 30, y = 30, ¿se esperaría basándose en una observación visual y en el error estándar, quela medida fuese válida o inválida? Justifíquense las conclusiones. 10.6
Empléese regresión con mínimos cuadrados para ajustar una línea recta a los datos:
O 2 4 4 8 12 16 20 24 28 30 34 10 12 18 22 20 30 26 30 26 28 22 20
+x
a) Junto con la pendiente y la intersección. calcúlese el error estándar de la aproximación y el coeficiente de correlación. Grafíquense los datos y la línea recta. Valórese el ajuste. b) Repítase el cálculo de a) pero usando regresión polinomial para ajustar una parábola a los datos. Compárense los resultados con los de a ) .
10.7
Ajústese un modelo de promedio de x
y
I I
crecimiento de saturacijn
a'
2.5 4 6 8 8.5 1 2 0.4 0.7 0.8 1.0 1.2 1.3 1.4
Grafíquense los datos y la ecuaciqn. 10.8
Ajústese una ecuación de potenciasa los datos del problema 10.7. Grafíquense los datos y la ecuación.
10.9
Ajústese una parábola a los datos del problelna 10.7. Grafíquense los datos y la ecuación.
REGRESION CON
347
CUADRADOS
10.10
Ajústese unaecuacióndepotencias x y
1 I
x
además de la ecuación de potencias
Ajústese un modeloexponencial
x y
I I
17.5 20 12.5 15 7.5 10 1.2 0.8 0.6 0.4 0.3 0.3
2.5 3.5 65 2 5 3.4 1.6
Grafíquese y contra 10.11
a:
a:
2.0 2.4 0.05 0.4 0.8 1.2 1.6 550 750 1000 1400 2000 2700 3750
Grafíquense los datos y la ecuación en papel estándar y semilogarítmico. Analícense los resultados. 10.12
Ajústese una ecuación de potencias a los datos del problema 10.11. Grafíquense los datos y la ecuación.
10.13
Ajústese una parábola a los datos del problema 10.11.Grafíquense los datos y la ecuación.
10.14
Dados los datos: x y
1 I
5 10 15 20 25 30 35 40 45 50 17 25 30 33 36 38 39 40 41 42
Úsese regresión con mínimos cuadrados para ajustar a) a una línea recta, b) a una ecuación de potencias, c) a una ecuación de promedio de crecimiento de saturación y d) a una parábola. Grafíquense los datos junto con todaslas curvas. ¿Alguna de ellas es mejor? Si es así justifíquese. 10.15
Ajústese a unaparabolaa:
x 1 O 2 4 9 6 282523 119 1171513 y I 1.2 0.6 0.4 -0.2 O -0.6 -0.4 -0.2 -0.4 0.2 0.4 1.2
1.8
Calcúlense los coeficientes, el error estándar dela aproximación y el coeficiente de correlación. Grafiquense los resultados y valórese el ajuste. 10.16
Úsese regresión lineal múltiple paraajustar:
X X2
y
l
I 2 12 19
O
1 2
2 0 1 4 4 6 11 24 1522
2 6
Calcúlense los coeficientes, el error estándarde decorrelacihn.
la aproximación y el coeficiente
348
MÉTODOS
10.17
Usese regresión lineal múltiple para x1 x2
y
1 1 18
1 2 2 1 12.8 25.7 20.6
NUMERICOS PARA INGENIEROS
ajustar:
2 2
3 3 4 1 2 1 35.0 29.8 45.5 40.3
4 2
Calcúlense los coeficientes, el error estándar de la aproximación y el coeficiente de correlación.
Problemas relacionados con
la computadora
10.18
Desarróllese un programa legible al usuario para regresión lineal basado en la figura 10.6. Entre otras cosas: a) Agréguense instrucciones que documenten el programa. b) Háganse más descriptivas las operaciones de entrada salida y orientadas al usuario. C) Calcúlese e imprímase el error estándar de la aproximación [Ec. (10.9)]y el coeficiente de correlación [la raíz cuadrada de la ecuación (10.10)]. d) (Opcional)Inclúyase una gráfica por computadora delos datos y de la línea de regresión. e ) (Opcional Inclúyase una opción que permita analizar ecuaciones del tipo exponencial, de potencias y depromediode crecimiento de saturación.
10.19
Desarróllese un programa que sea legible al usuario para regresión polinomial basado en las figuras 10.12 y 10.13.Pruébese el programa repitiendo los cálculos del ejemplo 10.5.
10.20
Desarróllese u n programa que sea legible al usuario para la regresión múltiple basado en lafigura 10.12, pero con lamatriz especificada como la ecuación (10.22).pruébese el progrmarepitiendo los cálculos del ejemplo 10.6
10.21
Repítanse los problemas 10.4 y 10.5 usando el programadelproblema
10.22
10.18
Úsese el paquete de programas NUMERICOMP para resolver los problemas 10.4, 10.5
y 10.6a
10.23
Repítanse los problemas 10.9, 10.13 y 10.15 usando el programa del problema 10.19.
10.24
Repítanse los problemas 10.16 y 10.17 usando el programadelproblema
10.20
C A P í T U L O ONCE
Con frecuencia se tienen que estimar valores intermedios entre valores conocidos. El método más común empleado para este propósito es la interpolaciónpolinominal. Recuérdese que la fórmula general de un polinomio de n-ésimo orden es: f(x) = a0
+ a1x + a2x2+
*
+ anxn
[11.1]
Para n + 1 puntos, existe uno y sólo un polinomio de n-ésimoorden o menor que pasa a través de todos los puntos. Por ejemplo, hay sólo una línea recta (es decir, un polinomio de primer orden) queconecta dos puntos (Fig. 11. la). De manera similar hay sólo una parábolaque conecta a tres puntos (Fig. 11. l b ) . El polinomio de interpolación consiste en determinar el Único polinomio de n-ésimo orden que se ajusta a los n + 1 puntos dados. Este polinomio proporciona una fórmula para calcular los valores intermedios. Aunque existe unoy sólo un polinomio de n-ésimo orden que se ajusta a los n + 1 puntos, existen una gran variedad de fórmulas matemáticas
FIGURA 1 1 . 1
Ejemplos de interpolación polinomial: a) Primer orden (lineal),conexión de dos puntos; b) conexión de tres puntos, segundo orden (cuadrática o parabólica) y c) conexión de cuatro puntos, tercer orden (cúbico).
350
MÉTODOS NUMÉRICOS
PARA INGENIEROS
mediante las cuales se puede expresar este polinomio. En este capítulo, se estudian dos técnicas alternativas que est6n bien condicionadas para implementarse en una microcomputadora. Estos son los polinomios de Newton y los de Lagrange.
11.1 POLINOMIOS DE INTERPOLACIÓNCON DIFERENCIAS DIVIDIDAS DE NEWTON Como ya se dijo, existe una variedad de maneras diferentes de expresar un polinomio de interpolación. El polinomio de interpolación con diferencias diuididas de Newton, entre otros, es la forma más popular además de la más útil. Antes de presentar la ecuación general, se examinan las versiones de primero y segundo orden debido a su fácil interpretación visual.
1 1. l . 1 Interpolación lineal La forma más simple de interpolación es la de conectar dos puntos con una línea recta. Este método, llamado interpolación lineal,se muestra en la figura 11.2. Usando triángulos semejantes, se tiene:
FIGURA 11.2
Esquema gráfico de la interpolación lineal. Las áreos sombreadas muestran triángulos semejantes usados en la derivación de la fórmula de interpolación lineal [ € c . ( 1 1.2)].
35 1
INTERPOLACldN
que se puede reordenar como: [11.2]
lacual es unafórmuladeinterpolaciónlineal. La notación fl(x) indica que se trata de un polinomio de interpolación de primer orden. Nótese que además de representar la pendiente de la línea que conecta los dos puntos, el término Lf(xl)- f (xo)]/(xl- xo)es una aproximación de diferencias divididas finitas a la primera derivada [recuérdese la ecuación (3.24)].En general, entre más pequeño sea el intervalo entre lospuntos, más exacta será la aproximación. Esta característica se demuestra en el ejemplo, siguiente.
EJEMPLO 1 l . 1 lnterpolación lineal
Enunciado del problema: calcúlese el logaritmo natural de 2 (In 2) usando interpolación lineal. Primero, llévense a cabo los cálculos interpolando entre In 1 = O y In 6 = 1.791 759 5. Despuésrepítanse el procedimiento, pero usando un intervalo más pequeño desde In 1 a In 4 (1.386 294 4). Nóteseque elvalorrealde In 2 = 0.693 147 18. Solución: usando la ecuación (11.2),unainterpolaciónlinealde a x = 6 da:
f,(2)
=
0
+
1.791 759 5 6-1
-
O
x = 1
(2 - 1) = 0.358 351 90
la cual representa un error porcentual de = 48.3%. Usando el intervalo más pequeño desde x = 1 a x = 4 da:
fi(2)= 0 +
1.386 294 4 - O (2 - 1) 4-1
0.462 098 13
Por lo tanto, usandoelintervalomás pequeño reduce elerrorrelativo porcentual a E, = 33.3%. Ambas interpretaciones se muestran en la figura 11.3, junto con lafunción verdadera.
1 l. 1.2 interpolación cuadrática El error en el ejemplo 11.1se debe a que se aproximó unacurva mediante una línea recta. Por consiguiente,una estrategia que mejora la apro-
352
INGENIEROS MÉTODOS
FIGURA 11.3
Dos interpolaciones lineales para aproximar In queño proporciona una mejor aproximación.
NUMÉRICOS PARA
2. Nótese cómo el intervalo más pe-
ximación es la de introducir cierta curvatura en la línea que conecta a los puntos. Si se dispone de tres datos: lo anterior se puede llevar a cabo con un polinomio de segundo orden (llamado también polinomio cuadrático o parábola). Una manera conveniente para este caso es:
Nótese que aunque la. ecuación (11.3)parezca diferente de la ecuación general de un polinomio [Ec. (11.l)], las dos ecuaciones son equivalentes. Esto se puede demostrar si se multiplican los términos de la ecuación (11.3)y obtener: A(x) = bo
+ blx - blxo + b2X2 + bzxoxl
o, agrupando términos:
f2(x) = a0 -t alx
en dónde:
+ a2x2
-
- b2XXI
~ ~ x x O
353
INTERPOLACI6N
De esta manera, las ecuaciones (11.1)y (11.3)son fórmulas alternativas equivalentes del Único polinomio de segundo grado que une a los tres puntos. Se puede usar un procedimiento simple para determinar los valores de los coeficientes. Para bo, se usa la ecuación (11.3) con x = x0 y se obtiene bo = f (xo)
[11.4]
Sustituyendo la ecuación (11.4) en la ecuación (11.3) y evaluando en x = x1 se obtiene:
[11.5]
Y por último, las ecuaciones (11.4) y (11.5)se sustituyen en la ecuación (11.3),y se evalúa ésta en x = x2 y se obtiene:
[11.6]
Nótese que, al igual que en el caso de interpolación lineal, bl aún representa la pendiente de la línea que une los puntos x0 y xl. Por lo tanto, los primeros dos términos de la ecuación (11.3)son equivalentes a la interpolación de x. a xl, como ya se especificó anteriormente en la ecuación (11.2).El Gltimo término, b2(x- xo) (x- xl), introduce la curvatura de segundo orden en la fórmula. Antes de ilustrar como se usa la ecuación (11.3), sedebe examinar la forma del coeficiente b2. Es muy similar a la aproximación por diferencias divididas finitas de la segunda derivada introducida previamente en la ecuación (3.31).Por io tanto. la ecuación (11.3)empieza a manifestar una estructura muy similar a la serie de Taylor. Esta observación se explora con más detalle cuando se relacione el polinomio de Newton con la serie de Taylor en la sección 11.1.4.Pero primero, se muestra cómo se usa la ecuación (11.3)para interpolar entre tres puntos.
EJEMPLO 11.2 Interpolación cuadrática Enunciado del problema: ajústese el polinomio de segundo orden a los tres puntos usados en el ejemplo 11.1: x0 = 1 XI = 4 x2 = 6
f(xo) = o f(x1) = 1.386 294 4 f(~2= ) 1.791759 5
354
MÉTODOS
NUMÉRICOS
PARAINGENIEROS
úsese el polinomio para evaluar In 2. Solución: aplicando la ecuación (11.4) da:
Las ecuaciones (1l .5 ) generan :
y la ecuación (11.6) da:
1.791 759 5-1.386 294 4
"o.426 098 13
6-4
b2 =
=-
0.051 873 116
6.1 Sustituyendo estos valores en la ecuación (11.3)se obtiene la fórmula cuadrática: f2(~)
O
+
0.462 098 1 3 ( ~ 1) - 0.051 873 1 1 6 ( ~ l ) ( x - 4)
que se evalúa en x
f2(2)
=
=
2 y se obtiene
0.565 84436
lo que representa un error porcentual del .E" = 18.4%.Por lo tanto, la curvatura introducida por la fórmula cuadrática (Fig. 11.4)mejora la interpolación comparada con los resultados obtenidos al usar una línea recta en el ejemplo 11.1y la figura 11.3. 11.1.3 Forma general de los polinomios de interpolación de Newton El análisis anterior se puede generalizar e n el ajuste de un polinomio de n-ésimo orden a los n + 1 puntos. El polinomio de n-ésimo orden es: jn(X) =
bo
+ bl(x - ~ g +)
* * *
+ b,(x
- XO)(X - XI) . . .
(X
- Xn-l) [11.7]
Como se hizo anteriormente con las interpolaciones lineales y cuadráticas, se usan los puntos en la evaluación de los coeficientes bo. b l , . . . . b,. Se requieren n + 1 puntos para obtener u n polinomio de n-ésimo orden: x(),x l , . . , x,. Usando estos datos, con las ecuaciones siguientes se evalúan los coeficientes: ,
[11.8] [11.9]
355
lNTERPOLACl6N
FIGURA-11.4
uso de la interpolación cuadratica para calcular In 2. Se incluye también la interpoloción lineal de x = 1 a 4 para comparación.
b2
=fb2,
x 1 7
x01
[11.10]
en donde las evaluaciones de la función entre corchetes son diferencias divididas finitas. Por ejemplo, la primera diferencia dividida finita se representa generalmente como:
[ll. 121 La segunda diferencia diuidida finita, que representa la diferencia de dos primeras diferencias dividas finitas, se expresa generalmente como: [11.13]
356
MÉTODOS
NUM~RICOS PARA INGENIEROS
Estas diferenciasse usan para evaluar los coeficientes de lasecuaciones (11.8)a la (1l.l l ) ,los cuales se sustituyen en la ecuación (11.7) para obtener el polinomiodeinterpolación:
[11.15]
Al cual se le llama polinomio de interpolación con diferencias divididas de Newton. Se debe notar que no es necesario que los datos usados en la ecuación (11.15)estén igualmente espaciados o que los valores de la abscisa necesariamente se encuentren en orden ascendente, como se ilustraenelsiguiente ejemplo. También nótese que las ecuaciones (11.12) a la (11.14)son recursivas, esto es, las diferencias de orden superior se componen de diferenciasde orden inferior (Fig. 11.5).Esta propiedadse aprovechará al desarrollar un programa eficiente para la computadora enla sección 11.1.5 queimplementeeste método.
FIGURA 11.5
Esquema gráfico de la naturaleza recursiva de una diferencia dividida finita.
EJEMPLO 11.3
Polinomios de interpolacion de Newtoncon
diferencias divididas
Enunciado del problema: enel ejemplo 11.2, se usaron los puntos en = 1 , xi = 4 y x2 = 6 paracalcular In 2 conuna parábola. Ahora, agregando un cuarto punto [x3 = 5; f(x3) = 1.609 437 91, calcúlese In 2 con un polinomio de interpolación de Newton con diferencias divididas de tercer orden.
x.
Solución: el polinomiodetercer orden, ecuación ( 1 1.3) con n
=
3 , es
357
INTERPOLACI6N
las primeras diferencias divididas del problema son [Ec. (11.12)J
294 4 - 1
f k l , x01 =
-
o
=
0.462 098 13
x11
1.791 759 5 - 1.386 294 4 6-4
=
=
o.2o2 732 55
f[X3, x21
1.609 437 9 - 1.791 759 5 5-6
=
=
o.182 321 6o
fk2,
Las segundas diferencias divididas son [Ec. (11.13)] f k 2 , x19
x01 =
0.202 732 55 - 0.462 098 13 = 6 - 1
-
fix39 x27
x11 =
0.182 321 60 - 0.202 732 55 5-4
- 0.020 950 410
=
La tercera diferencia dividida es [Ec. (11.14)] con n f b 3 , x2, x19 x01 =
=
FIGURA 11.6
"
~
-
_
I
.._"
"X.L.1
31
-0.020 410 950 - (-0.051 873 116) 5-1 0.007 865 541 5
USOde interpolación cúbica para aproximar In 2.
"
=
0.051 873 116
I
-."l"""-.-.---
358
METODOS
NUMÉRICOS
PARA INGENIEROS
Los resultados para f[xl, xo],f[x2,xl,xo] y f[x3,x2,xl,x"] representan los coeficientes bl, b2 y b3 dela ecuación (11.7). Junto con bo = f(xo) = 0.0 la ecuación (11.7) da f3(~) =
O
+ 0.462
+
0.007
098 13 (X - 1) - 0.051 873 (X 116 "1) 865 541 - 5(x l)(x - 4 ) (~ 6)
(X -
4)
conlaquesepuedeevaluar
f3(2) = 0.628
-
768
69
lo que representa un error relativo porcentual del t u = 9.3%.El polino11.6. mio cúbico completo se muestraenlafigura
11.1.4 Errores en los polinomios interpolantes de Newton Nótese que la estructura de la ecuación (1l.15)es similar a la expansión de la serie de Tayloren el sentido de que los términos agregadossecuencialmente consideran el comportamiento de orden superior dela función representada. Estos términosson diferencias divididas finitasy, por lo tanto, representan aproximaciones a las derivadas de orden superior. En consecuencia, como sucede con la serie de Taylor, si la función representativa es un polinomio de n-ésimo orden, el polinomio interpolante de n-ésimo ordenbasado en n + 1 puntosllevará a resultados exactos. También, como enel caso de la serie de Taylor, se puede obtener una formulación del error de truncamiento. Recuérdese dela ecuación (3.13)que el error de truncamiento en la serie de Taylor se expresa en forma general cómo:
R,,=
f'"'(S) (x,+1 - xi)"+' (n-+ 1) ! ..
en donde 4 es un punto cualquiera dentro del intervalo [x,, x,, ,),Una relación an6loga del error en un polinomio interpolante de n-ésimo orden está dada por: [11.16]
en donde 4 es un punto cualquiera dentro del intervalo quecontiene las incógnitas y los datos. Para uso de esta fórmula la función en cuestión debe ser conociday diferenciable. Y usualmente, esteno es el caso. Afortunadamente, existe una fórmula alternativa que no requiere conocimiento
359
lNTERPOLACl6N
previo de la función. En vez de ello, se usa una diferencia dividida finita queaproxima la (n + 1)-ésima derivada:
en donde f[x, x,, x,-1 ,. . . , xo] es la (n + 1)-ésima diferenciadividida. Ya que la ecuación ( 1 l .17) contiene la incógnita )(x), ésta no se puederesolver y obtener el error. Sin embargo, si se disponede un dato adicional f(x,+ J, la ecuación (11.17) daunaaproximacióndelerror como:
EJEMPLO 1 1.4
Estimación del error en el polinomio de interpolación de
Newton
Enunciado del problema: úsese la ecuación ( 1 1.18) para calcular e! error del polinomio de interpolación de segundo orden del ejemplo11 2 . Usense los datosadicionales f(x3) = f(5) = 1.609 437 9 para obtener los resultados. Solución: recuérdese que en el ejemplo 11.2 el polinomio de interpolación de segundo orden proporcionó una aproximación de f(2) = 0.565 844 346, que representa un error de 0.693 147 18 - 0.565 844 346 = O. 127 302 835. Si no se sabe el valor verdadero, como es en la mayor parte de los casos, se puede usar la ecuación (1l.18), junto con el valor adicional en x3, para calcular el error, como
O
R2
=
0.007 865 541 5 (X - l)(x - 4 ) ( ~ 6)
en donde el valor de la diferencia dividida finita de tercer orden se calculó previamente enel ejemplo 11.3. Esta relación se evalúa en x = 2 y se obtiene:
R2
=
0.007 865 541 5 (2
-
1)(2
-
que es delmismoordenqueelerrorverdadero
4) (2 - 6)
=
0.062 924 332
360
MÉTODOS
11.1.5 Programa de computadora para interpolación de Newton
NUMÉRICOS PARA INGENIEROS
el polinomio de
Son tres las propiedades que hacen del polinomio de interpolación de Newton un método extremadamente atractivo para usarse en una computadora:
1. Como en la ecuación (11.7),las versiones de orden superior se pueden desarrollar secuencialmente agregandoun término simplea la siguiente ecuación de orden inferior. Esto facilita la evaluación de varias versiones de orden diferente en el mismo programa. Esta capacidad es muy útil cuando no se conoce a priori el orden del polinomio. Agregando nuevos términos secuencialmente, puede determinarse cuándo se alcanza un puntode retorno, es decir, cuándo al agregar un término de orden superior no se mejora significativamente la aproximación o en ciertos casos se disminuye. Las ecuaciones de error analizadasenelpunto (3) sonútilesaldefinir un criterio objetivo en la determinacióndeestepuntodetérminos decrecientes.
2. Las diferenciasdivididasfinitas que constituyen los coeficientes del polinomio [Ec. (11.8) a la ( 11.1 l)] se calculan con una relación recursiva.Esto es, como enla ecuación (11.14) y lafigura 11.5, las diferencias de orden inferior se usan para calcular las diferencias de orden superior. Usando la información previamente determinada,los coeficientes se calculan eficientemente. El programa de la figura 11.7 contiene este esquema.
ASIC
ORTRA
DIMENSION F X C 1 0 , l O ) ~ X ~ l O ) READ<5 , l )N 1 FORRLTC I S ) DO 1 4 0 I - $ . N R E A D < S , 2 ) X FX(I,J) FORMRTC. 3 -,F10.3) 2 3 0 CONTINUE RERD+Fa WRITE(6,3)Y F h l N T EA FA-FR* WRITEC6,J)EA 3 4 0 CONTINUE 3 5 0 STOP END ~
FIGURA 11.7
Programaparacomputadoradelpolinomiointerpolante
de Newton
361
INTERPOLACldN
3. La ecuación de error [Ec. (11.18)]se expresa en términos de las diferencias divididas finitas que ya se han calculado para determinar los coeficientes del polinomio. Por lo tanto, si se guarda esta información, se calcula el error aproximado sin volver a calcular estas cantidades.
Todas las características anterioresse pueden aprovechar e incorporar en un programa general para computadora que implemente el polinomio de Newton (Fig. 11.7). Al igual que todos los programas del libro, esta versión no se documenta. Además, no incluye el error aproximado mencionado en el punto (3).Una de las tareas es la de hacer este programa más legible al usuario (véase el problema 11.11) y que incorpore la ecuación de error. La utilidad de esta ecuación se demuestra en el ejemplo siguiente.
EJEMPLO 11.5
Uso de la estimación de error para determinar el orden apropiado de interpolación
Enunciado del problema: después de incorporarel error [Ec. 11.181, utilícese el programa de computadora dado en la figura 11.7 y la siguiente informaciónparaevaluar f ( x ) = In x en x = 2. x
1 4 1.791 6 5 3 1.5 2.5 3.5
f(x) = In x O 1.386 294 4 759 5 1.609 437 9 1 .O98 61 32 0.405 4651 1 0.916 290 73 1.252 763 O
Solución: los resultados de emplear el programa de lafigura 11.7 para obtener la solución se muestranen la figura 11.8. Enla figura 11.9 se representa el error aproximado, junto con el error verdadero (basado en el hecho deque In 2 = 0.693 147 18).Nótesequeelerrorcalculado y el verdadero son similares y su coincidencia mejora a medida que crece el orden. Dela gráfica se puede concluir que las versiones de quinto orden llevan a una buena aproximación y que los términos de orden superiornoprecisansignificativamentelapredicción. Este ejercicio ilustra también la importancia de la posición y orden de los puntos. Por ejemplo, las aproximacionesde orden superior al tercero mejoran más lentamente ya que los puntos que se le agregan (en x = 4 , 6 y 5) estándistantes y a un ladodel punto en cuestión en x = 2.
362
INGENIEROS MÉTODOS -a
FIGURA 11.8
Salida del programa
NUMÉRICOS
PARA
Number of data potnts
BASIC
para evaluar In 2.
La aproximación de cuarto orden muestra mayor mejoría porque elnuevo punto en x = 3 está más cerca de la incógnita. Sin embargo, el decremento en el error más dramático está asociado con la inclusión del término dequintoordenusando los datos en x = 1.5. No sólo este punto está cerca de la incógnita sino tambiénse encuentra al lado opuesto de la mayor parte de los puntos. En consecuencia, el error se reduce casi una orden de magnitud. El significado dela posición y secuencia de los datos pueden también ilustrarse al usar los mismos datos para obtener una aproximación para In 2 , pero considerando los puntos en una secuencia diferente. Enla figura 11.9 se muestran los resultados para el caso en que se invierten el ordende los puntosoriginales, esto es, x. = 3.5, x1 = 2.5, x2 = 1.5, etc. Debido a que los puntos iniciales en este caso se encuentran más cerca y espaciados a los lados de In 2 , el error decrece mucho más rápidamente que enla situación original. Mediante el término de segundo orden, elerror se ha reducido a un nivel relativo porcentual de menos del E, = 2%. Se pueden emplear otras combinaciones para obtener diferentespromedios de converqencia.
El ejemplo anterior ilustra la importancia de escoger los puntos base. Como es obvio, los puntos deben estar tan cerca como sea posible de las incógnitas. Esta observación también se nota por simple examen de la ecuación de error [Ec. (11.17)]. Suponiendo que la diferenciadividida
FIGURA 11.9
Errores relativos porcentuales en la aproximación de In orden del polinomio de interpolación.
2 en función del
finita no varía demasiado a lo largo del rango de datos, entonces el error es proporcional al producto:(x - xo) (x - xl) . . . (x - x,,). Obviamente, mientras más cercanos estén los puntos base a las x, menor será la magnitud de este producto.
11.2 POLINOMIOS DE INTERPOLACIÓN DE LAGRANGE El polinomio de interpolación de Lagrange, simplemente es una reformulación del pqlinomio de Newton que evita los cálculos de las diferenciasdivididas.Este se puede representar concretamente cómo:
[11.19]
en donde:
364
INGENIEROS MÉTODOS
NUMÉRICOS
PARA
[11.20]
en donde I’I denota el “producto de.”. Porejemplo, la versiónlineal (n = 1) es: I
[11.21]
y la versión de segundo orden es:
[11.22]
Al igual que el método de Newton,la versión d e Lagrange tiene un error aproximado, dado por: n
La ecuación (11.19) se deriva directamente del polinomio de Newton (recuadro 11.1).Sin embargo, la razón fundamental de la formulación d e Lagrange se puede comprender directamente notando que cada término Li(x)será 1 en x = x,y O en todos los demás puntos. Por lo tanto, cada producto LJx) f(xi)toma un valor de f ( x , )en el punto x,.For consiguiente la sumatoria de todos los productos, dada por la ecuación (11.19) es el Único polinomio de n-ésimo orden que pasa exactamente por los n + 1 puntos.
RECUADRO 1 1 . 1 Derivación de la forma de Lagrange
directamente del polinomio de interpolación
de Newton
El polinomio deinterpolación de Lagrange se puede derivar directamente de la formulación de Newton. Se hará esto en el caso de primer orden,
fdx) = f(x0) + (x -
xO)f[Xl,
x01
[B11.1.1]
Para derivar la forma de Lagrange, se reformulan las diferencias divididas. Por ejemplo, la primera diferencia dividida.
f [XI, x03 = f (XI) - f (xo, x1
sepuede
- x0
reformular como:
fbl,
x03
f
= ___ (x1) x1
- x0
+
~
f (x01
x0 - XI
[B11.1.2]
365
INTERPOLACldN
a la cual se le conoce con el nombre de forma simétrica. Sustituyendo la ecuación (B11.1,2) en la ecuación ( B 1 l . l . l ) se obtiene
Finalmente, agrupando términos similares y simplificando, se llega a la forma de Lagrange,
EJEMPLO 11.6 Polinomios de interpolación de Lagrange
Enunciado del problema: úsese un polinomio de interpolación de Lagrange de primero y segundo orden para evaluar In 2 en base a los datos dados en el ejemplo 11.2: x0 =
1
f(xo) =
XI =
4
!(XI)
x2 = 6
o
=
1.386 294 4
f ( ~ 2 )=
1.791 759 5
Solución: el polinomio de primer orden es [Ec. (11.21)]
y , por lo tanto, la aproximación en x = 2 es
2-4 4 - 1l " 4
flk) =
~
O+"-
2-1
1.386 294 4
=
0.462 098 1
De manera similar, el polinomio de segundo orden se desarrolla como [Ec. (11.22)]:
+
(2 - 1)(2 - 4) 1.791 759 5 (6 - 1)(6 - 4)
=
0.565 844 37
Como se esperaba, ambosresultados coinciden muy de cerca con los que se obtuvieron previamente usando la interpolación polinomialde Newton. ~
366
MÉTODOS
NUMÉRICOS
PARA INGENIEROS
En resumen, para los casos en dondeel orden del polinomio se desconozca, el método de Newton tiene ventajas debido a que profundiza en el comportamiento delas diferentes fórmulas de orden superior. Además, la aproximación del error dada por la ecuación (1l.18),en general, puede integrarse fácilmente en los cálculos de Newton ya que la aproximación usa una diferencia dividida (Ejemplo 11.5).De esta forma, desde el punto de vista de cálculo, a menudo, se prefiere el método de Newton. Cuando se va a llevar a cabo sólo una interpolación, ambos métodos, el de Newton y el de Lagrange requieren de un esfuerzo decálculo similar. Sin embargo, la versión de Lagrange es un poco más fácil de programar. También existen casos en dondela forma de Newton es mássusceptible a los errores de redondeo (Ruckdeschel, 1981).Debido a esto y a que no requiere calcular y almacenar diferencias divididas, la forma de Lagrange se usa, a menudo, cuandoel orden del polinomio se conoce a priori.
EJEMPLO 11.7 Interpolación de Lagrange usando computadora
Enunciado del problema: en el paquete NUMERICOMP que acompaña a este texto se encuentra un programa legible al usuario que implementa la interpolación de Lagrange. Se puede usar este paquete para llevar a cabo un problema de análisis asociado con el problema de paracaidista. Supóngase que se ha desarrollado instrumentación para medir la velocidad del paracaidista. Los datos medidos para una pruebaparticular son: Tiempo, S
1 3 5
Velocidad medida v, cmls
800
2 310
7
3 090 3 940
13
4 755
El problema es determinar la velocidaddelparacaidista en t = 10 S y llenar el gran espacio de medidas entre t = 7 y t = 13 s. Se sabe que el comportamiento delos polinomios de interpolación puede ser inesperado. Por lo tanto, se construyen los polinomios de órdenes 4, 3, 2 y 1 y se comparan los resultados. Solución: el programa NUMERICOMP se usa para construir los polinomios de interpolación de cuarto, tercero, segundo y primer orden. Los resultados son
367
INTERPOLACldN
COEFICIENTEDE: Orden del polinomio orden
cuarto tercer
segundo orden orden
4 5430.195 -663.867 1813.625 -392.87 44.87501 - 1.76302 4874.838 3 1742.6561.23925876.09375-4.498586 2 4672.81 -300.1035 858.75 5 1 2989.167
primer orden
cero orden
Valor calculado de v para t = 10 S
-36.14584 135.8333
El polinomio de cuarto ordeny los datos de entrada segrafican como se muestra en la figura 11.loa. Es evidente en esta gráfica que el valor aproximado de y en x = 10 es mayor que la tendencia total de los datos.
FIGURA 11.10
Gráficas generadas por computadora, las cuáles muestran a) interpolación de cuarto orden; b) de tercer orden c) de segundo orden y d) de primer orden.
368
MÉTODOS
NUMÉRICOS
PARA INGENIEROS
Enlafigura 11.10b a la d se muestran gráficas de los resultados de los cálculos de los polinomios de interpolación de tercero, segundo y primer orden. Se nota que al disminuir el orden del polinomio de interpolación se disminuyeelvalor aproximado dela vecindad a t = 10 s. Las gráficas de los polinomios de interpolación indican quelos polinomios de orden superior tienden a descomponer la tendencia de los datos. Esto sugiere que los polinomios de primero o segundo grado son más apropiados en este análisis en particular. Se debe recordar, sin embargo, que ya que se tratadedatosinciertos, la regresiónpodríasermás apropiada.
11.3 COMENTARIOSADICIONALES Antes de proceder con la siguiente sección, se deben mencionar dos tey la mas adicionales: la interpolación con datos igualmente espaciados extrapolación. Ya que los métodos de Newton y Lagrange son compatibles con los datos espaciados en forma arbitraria, el lector debe preguntarse por qué se aborda el caso de los datosigualmenteespaciados (recuadro 11.2). Antes del advenimiento de las computadoras digitales, estos métodostuvierongranutilidadenlainterpolacióndetablas condatosigualmente espaciados. De hecho se desarrolló un esquema conocido como tabla de diferencias divididas para facilitar la implementación de estas técnicas (la figura 11.5 es un ejemplo de estas tablas). Sin embargo, y debido a que las fórmulas son un subconjunto de los esquemas de Newtonde Lagrange compatibles con la computadora y ya que se dispone de muchas funciones tabulares como rutinas de biblioteca, la necesidad de puntos equiespaciados se fue perdiendo. Por esta razón, se han incluido en esta parte del libro por su importancia en partes posteriores del mismo. En particular, se pueden emplear en la derivación de fórmulas de integraciónnuméricaqueempleancomúnmentedatos equiespaciados (capítulo 13). Ya que las fórmulas de integración numérica tienen importancia en la solución de ecuaciones diferenciales ordinarias. el material del recuadro 11.2 también tiene importanciaen el capítulo 17. RECUADRO 11.2 lnterpolación con puntos igualmente epaciados Si los datos se encuentran igualmente espaciadosy en orden ascendente, entonces la variable independiente supone valores de
En donde h es el intervalo, o tamaño del paso, entre los datos. En base a esto, las diferencias divididas finitas se pueden expresar en forma concisa. Por ejemplo, la segunda diferencia dividida es
369
INTERPOLAC16N
que se puede expresar como (y=-X"
ya que x, - x1 = x1 - x2 = (xo - x?)/2 = h . Ahora recuérdese que la segunda diferencia dividida hacia adelante A2j(xo)es igual al numerador de la [Ec. (3.3111.
A2f(x0) = f(x0) - 2f(xJ
h
Esta definición se puedeusar para desarrollar la siguiente expresión simplificada d e los términosen la ecuación
(8112.3):
+ f(x2)
Por lo tanto, la ecuación (B11.2.1)se puede representar mediante:
o. en general.
los cuales pueden sustituirse en la ecuación (B11.2.3) para dar [B11.2.2]
Usando la ecuación ( B l l . 2 . 2 ) ,el polinomio de interpolación de Newton [Ec. (11.15)] se puede expresar enel caso de datos igualmente espaciados como (a -
n
+ 1) + R,
[B11.2.4]
en donde
(x0) +-A"f (X n ! h" {X
- XO)(X -
- xo - (n -
xo -
h)
1)h)
Esta notación concisa tieneutilidad en la derivación y análisis de error de las fórmulas de integración del capítulo 13. Además de la fórmula hacia adelante, existen tamen donde el residuo es el mismo de la ecuación (11.16). bién lasfórmulas centrales y hacia atrásdeNewtonEsta ecuación se conoce como fórmula de Newton o fórmula Gregory. Se puedeconsultar Carnahan, Luther y Wilkes hacia adelante d e Newton - Gregory. Esta se puedesim- (1969)para mayor información acerca de la interpolación de datos igualmente espaciados. plificar más aún definiendo una nueva cantidad, (Y:
+Rn
[B11.2.3]
La extrapolación es el proceso de calcular un valor de f(x)que cae fuera del rango de los puntos base conocidos, xo, x1 ,. . . , x, (Fig. 11.11). En una sección anterior, se dijo que la interpolación más exacta usualmente se obtiene cuando las incógnitas caen cerca de los puntos base. Obviamente, esto no sucede cuando las incógnitas caen fuera del rango, y por lo tanto, elerrorenla extrapolación puede ser muy grande. Como se
370
INGENIEROS
FIGURA 1 1 . 1 1
PARA
MÉTODOS NUMÉRICOS
Ilustración de las posiblesdivergenciasdeunapredicciónextrapolada. La extrapalación se basa en el ajuste de una parabola a través de los primeros tres puntos.
muestra en la figura 11.11,la naturaleza abierta-en-los-extremos de la extrapolación representa u n paso en la incógnita porque el proceso extiende la curva más a116 de la región conocida. Como tal, la curva verdadedra diverge fácilmente de la predicción. Por lo tanto, se debe tener cuidado extremo en casos donde se deba extrapolar. El caso de estudio 12.1 e n el capítulo siguiente muestra un ejemplo del riesgo que se corre al proyectarse más allá de los límites de los datos.
11.4 INTERPOLACIÓN SEGMENTARIA (SPLINE) En la sección anterior se usaron polinomios de n-ésimo orden para interpolar entre n + 1 puntos. Por ejemplo, en ocho puntos, se deriva un polinomio perfecto de séptimo orden. Esta curva captura todos los serpenteos (al menos considera hasta derivadas de séptimo orden) sugeridos por los puntos. Sin embargo, existen casos en donde estas funciones pueden llevar a resultados erróneos. Una alternativa es la de aplicar polinomios de orden inferior a subconjuntos de datos. Estos polinomios conectados se llaman funciones de interpolación segmentaria (en inglés, spline functions).
371
INTERPOlAC16N
Por ejemplo, las curvas de tercer orden empleadas para conectar cada par de datos se llaman funciones de interpolación cúbica segmentaria (del inglés cubic splines). Estas funciones tienen la propiedad adicional de que las conexiones entre ecuaciones cúbicas adyacentes son visualmente suaves. Superficialmente parece que la aproximación segmentaria de tercer orden es inferior a la expresión de séptimo orden. El lector puede preguntarse por qué la interpolación segmentaria siempre es preferible.
FIGURA 1 l. 12
Representación visual de una situaciónen donde la interpolación segmentaria (spline) es meior a la interpolación polinomial de orden superior. La función muestra unsalto abrupto en x = O. En losincisos a) al c) se muestra que el cambio abrupto indica oscilaciones con la interpolación polinomial. En contraste y debido a que se limita a curvas de tercer orden con transiciones suaves, la interpolación segmentaria d) proporciona una aproximación mucho más aceptable.
METODOS NUMERICOS PARA INGENIEROS
372
Enlafigura 11.12 se ilustra un caso en donde la interpolación segmentaria se lleva a cabo mejor que con polinomios de orden superior. Este es el caso donde una función es generalmente suave pero muestra un cambio abrupto en algún lugar de la región de interés.La figura 11.12 es un caso extremo de este cambio y sirveparailustrarel punto. En las figuras 1 1 . 1 2 ~ hasta la 1 1 . 1 2 se ~ ilustra cómo los polinomios de orden superior tienden a balancearse a través de oscilaciones bruscas en la vecindad de un cambio abrupto. En contraste la interpolación segmentaria también conecta a los puntos, pero como está limitada a cambios de tercer orden, las oscilaciones se mantienen mínimas. De ahí que la interpolación segmentaria proporcione una aproximación superior del comportamiento de las funciones que tienen cambios locales abruptos. El concepto de interpolación segmentaria se originó de la técnica de uso de una lámina de plástico delgada (llamadacuruigrufo, en inglés spline) en el trazo de curvas suaves a través de un conjunto de puntos. El proceso se muestra enla figura 11.13 sobre un conjunto de cinco tachuelas (datos). En esta técnica, el dibujante coloca papel sobre un tablero de madera y clava tachuelas en el papel (y en el tablero) en la posición de los datos. Al pasar un hilo entre las tachuelas resulta una curva cúbica suave. De ahí que se haya adoptado el nombre de “interpolación segmentaria” (en inglés“cubicspline”)parapolinomiosdeestetipo. En esta sección se utilizan primero funciones lineales simples para introducir algunos conceptos y problemas básicosasociados con la interpolación segmentaria. Despuésse deriva un algoritmo para ajustar polinomios
FIGURA 1 l. 13
Técnica de dibujo para trazar curvas suaves utilizando un curvígrafo, dados una serie de puntos. Nótese como la unión de un punto a otro se realiza mediante diferentes tipos de curvas. A este tipo de interpolación de punto Q punto (segmentaria) se conoce como interpolación segmentaria natural (natural spline).
373
INTERPOLACldN
de segundo orden a los datos. AI final, se presenta material sobre interpolación cúbica segmentaria, la cuál es laversiónmáscomún y útil en la práctica de la ingeniería:
1 1.4.1 Interpolación segmentaria lineal La conexión más simple entre un par de puntos es una línea recta. Se pueden definir los polinomios interpolantes de primer orden medianteun conjunto de puntos ordenados y definirse como un conjunto de funcioneslinealesqueunen a los puntos:
en donde mi es la pendiente de la línea recta que une los puntos: r11.231
Estas ecuaciones se usan en la evaluación de funciones de cualquier punto entre x. y x,, localizando primeroel intervalo dentro del que se encuentra el punto. Después se usa la ecuación apropiada y se determina el valor funcional dentro del intervalo. Obviamente, el método es idéntico a la interpolación lineal.
EJEMPLO 11-8 lnterpolación segmentaria de primer orden
Enunciado del problema: ajústense los datos del cuadro 11.1 con interpolaciónsegmentariadeprimer orden. Evalúese lafunciónen x = 5. CUADRO 1 1.1
Datospor aiustar con funciones segmentarias X
3.0
4.5 7.0 9.0
{(x)
2.5 1.o 2.5 0.5
374
METODOS NUMERICOS PARA INGENIEROS
Solución: los datos se pueden usar para determinar las pendientes entre x = 4.5 a x = 7 la pendiente puntos. Por ejemplo, enelintervalode se puede calcular usando la ecuación (112 3 ):
I
2.5 - 1.0 = 0.60 7.0 - 4.5 m= Los pendientes sobre los otros intervalos se pueden calcular, y los pol l .4a. El valor para linomios de primer orden se graficanenlafigura x = 5 es 1.3.
Una inspección visual sobre la figura 11.14~1 indica que laprincipal desventaja de los polinomios de primer orden es que no son uniformes. En esencia, en los puntos donde coinciden los polinomios (llamados nodos), la pendiente cambia abruptamente. En términos formales, la primera derivada de la función es discontinua en estos puntos. Esta deficiencia se supera con el uso de polinomios de orden superior, que aseguranuniformidad en los nodos igualando derivadas en esos puntos, como se muestraenlasiguiente sección.
11.4.2 lnterpolación cuadratica segmentaria Para asegurar que las m-ésimas derivadas sean continuas en los nodos, se debe usar un polinomio de al menos ( m + 1)-ésimo orden. Los polinomios de tercer ordeno cúbicos se usan más frecuentemente en la práctica asegurando continuidad en la primera y segunda derivada. Aunque las derivadas de orden superior sean discontinuas al usarse polinomios de tercer orden,en general, no se detectan visualmente y por ende, se ignoran. La interpolación cúbica segmentaria se estudia en una secciónsubsecuente. Antes de ésta se ilustra el concepto de interpolación cuadrática segmentaria usando polinomiosde segundo orden. Estos “polinomiosmadráticos” tienen la primera derivada continua en los nodos. Aunque los polinomios cuadráticos no garantizan segundas derivadas iguales en los nodos, sirven muy bien para demostrar el procedimiento general en el desarrollodepolinomiosinterpolantessegmentariosdeordensuperior.
El objetivo de los polinomios cuadráticoses el de obtener un polinomio de segundo orden para cada uno de los intervalos entre los puntos. El polinomio para cada uno de los intervalos se representa generalmente como: fi(x)= aix2-t bix + ci
[11.24j
375
INTERPOLAC16N
FIGURA 1 l. 14
Ajustecon interpolación segmentaria sobre un conjunto de cuatro puntos. a) interpolación segmentaria lineal;b) interpolación segmentaria cuadrática y c) interpolación cúbica segmentaria, con un polinomio cúbico interpolante que también aparece en la gráfica.
Se haincluidolafigura 11.15para ayudar a clarificar la notación. Para los n 1puntos (i = O, 1, 2 , . . . , n ) , existen n intervalos, y por lo tanto, 3 n incógnitas constantes por evaluar (lasp, las b y las c). Por lo tanto, se requieren 3 n ecuaciones o condiciones para evaluar las incógnitas.Estas son:
+
1. Los valores de las funciones deben ser iguales en los nodos interiores. Esta condiciónserepresentamediante: [11.25] [11.26]
376
NUMERICOS
FIGURA 11.15
METODOS
PARA INGENIEROS
Notación usadaen la derivación de interpolación segmentaria cuadrática. Nótese que hay n intervalos y n 1 puntos. El ejemplo que se muestraes para n = 3.
+
para i = 2 hasta n . Como se usan sólo los nodos interiores, las ecuaciones (11.25) y (11.26) proporcionancadauna n - 1 condiciones, con un total de 2n - 2.
2. L a primera y la última función deben pasar a través de los puntos f i nales. Esto agregados ecuaciones adicionales: [11.27] [11.28]
+
2 = 2n condiciones. 3. Las primeras deriuadas e n los nodos interiores deben ser iguales. La primeraderivada enla ecuación (11.22) es: con un total de 2n - 2
f '(x) = 2ax
+b
Por lo tanto, la condición se representa generalmente cómo:
íkblxi + bi-l = 2aixi+ bi
E11.291
para i = 2 hasta n . Esto proporcionaotras n - 1 condicionescon un total de 2n + n - 1 = 3 n - 1. Debido a que hay 3n incógnitas, se tiene una condición menos. A menos que exista una información adicional en relación a las funciones o sus derivadas, se debe escoger
377
INTERPOLACI~N
arbitrariamente una condición para calcular eficientemente las constantes. Aunque existen algunas alternativas diferentesque se pueden hacer, aquí se escoge la siguiente: 4. Se supone que la segunda derivada es cero en el primer punto. Ya que la segunda derivada de la ecuación (11.24) es 2a, esta condición se expresa matemáticamente cómo:
al
=
O
[11.30]
La interpretación visual de esta condición es que los primeros dospuntos se conectarán mediante una línea recta.
EJEMPLO 11.9
Interpolacion cuadrática segmentaria Enunciado del problema: ajústense polinomios cuadráticos-por segmentos a los datos usados en el ejemplo 11.8 (Cuadro 11.1). Usense los resultadosparacalcularelvalorpara x = 5. Solución: en este problema, se tienencuatrodatos y n = 3 intervalos. Por lo tanto, se deben determinar 3(3) = 9 incógnitas. Las ecuaciones (11.25) y (11.26) llevana 2(3) - 2 = 4 condiciones.
2 0 . 2 5 ~+1 ~4.5bl
+ c1 = 1.0 + 4.5b2 + c2 = 1.0 20.25~ 49a2 + 7b2 + c2 = 2.5 + 7b3 + c3 = 2.5 49a3 Pasando la primera y la última función por los valores iniciales y finales agrega dos más: [Ec. (11.27)]
gal y [Ec.
+ 3bl + c1 = 2.5
(11.28)]
81a3
+ 9b3 + c3 = 0.5
Lacontinuidad de lasderivadas crea adicionalmente 3 - 1 = 2 [Ec. (11.29)]:
378
MÉTODOS
NUMÉRICOS
PARA INGENIEROS
Finalmente, la ecuación (11.30)especifica que al = O . Ya queesta ecuación especifica al exactamente, el problema se reduce aresolver ocho ecuaciones simultáneas. Estas condiciones se pueden expresar en forma matricial como
1.0 o.o 0.0 0.0 20.25 4.5 7.0 0.0 49.00 0.0 o.O 0.0 1.0 o.o 0.0 0.0 0.0 0.0 0.0 -9.00 -1.0 0.0 0.0 14.00 1.0
4.5 0.0 0.0 0.0 3.0 0.0 1.0
0.0 1.0 1.0 0.0 0.0 0.0
0.0 0.0
0.0 0.0 0.0 7.00 0.0 9.00
0.0 0.0
o.o o.o 81.00 o.o 49.00
- 14.00
0.0 0.0
0.0 1.00 0.0 1.00 0.0
0.0 -1.00 0.0
1.0 1.0 2.5 2.5 2.5 0.5
o.o o.o
Estas ecuaciones se resuelven usando las técnicas de la parte 111 con los resultados: al = O a2 = 0.64 a3 = -1.6
bl b2 b3
= = =
"1 -6.76 24.6
c1
=
c2 = ~3 =
5.5 18.46 -91.3
los cuales se sustituyen en las ecuaciones cuadráticas originales desarrollando la relación siguiente para cada intervalo: fI(X) = "x
f2(x) =
+ 5.5
0.64~ -~ 6 . 7 6 ~+ 18.46
f3(~)= -1.6~'
+ 2 4 . 6 ~- 91.3
la predicción para x
f2(5) = 0.64(5)'
-
=
3.0 5 x 4.5 5 X 7.0 5 X
4.5 5 7.0 5 9.0 5
5 es, por lo tanto
6.76(5) + 18.46 = 0.66
El ajuste polinominal segmentario totalse muestra en la figura 11.14b. Nótese que hay dos inconvenientes enel ajuste: 1)la línea recta que une los primeros dos puntosy 2) el polinomio del último intervalo parece serpentear demasiado alto. Los polinomios segmentarios cúbicos de la siguiente sección no muestran estos incovenientes y como consecuencia, en general son mejores métodos de interpolación segmentaria. 11.4.3 lnterpolación segmentaria
El objetivo d e la interpolación cúbica segmentaria es obtener polinomios los intervalos entre nodos, dela forma de tercer orden para cada uno de fi(x) = aix3
+ bix2 + cix + di
[11.31]
379
INTERPOLACldN
Por lo tanto, para los n + 1 puntos (i = O , 1 , 2 , . . . , n ) , existen n intervalos y. por lo tanto, 4 n incógnitas constantes por evaluar. Como se hizo para polinomios cuadrájicos, ahora se requiere de 4 n condiciones para evaluarlasincógnitas.Estas son: 1. Los valores d e la función deben ser iguales e n los nodos interiores ( 2 n - 2 condiciones). 2. La primera y la última funciones deben pasar a través de los puntos finales (2 condiciones). 3. Las primeras derivadas e n los nodos interiores deben ser iguales ( n - 1 condiciones).
4. Las segundas derivadas en los nodos interiores deben ser iguales ( n - 1 condiciones). 5. Las segundas derivadas en los nodos finales son cero (2 condiciones).
La interpretación visual de la condición 5 es que la función sea una línea recta en los nodos finales. Debido a la especificación de esta condición es que se le llama interpolación segmentaria “natural”.Se le da este nombre ya que el polinomio interpolante se comporta de manera natural en este esquema (Fig. 11.13). Si elvalordela segunda derivada en los nodos finales fuese diferente de cero (es decir, existe alguna curvatura), entonces esta información se usaría alternativamente para proporcionar lasdos condiciones necesarias. Los cinco tipos anteriores de condiciones proporcionan un total de 4 n ecuaciones necesarias para encontrarlos 4 n coeficientes. Mientras que es posible desarrollar interpolación cúbica segmentaria con este esquema, aquí se presenta una técnica diferente que requiere únicamente de la solución de n - 1 ecuaciones. Aunque la derivación de este método (recuadro 11.3) es algo menos directo que el de interpolación cuadrática segmentaria, la ganancia en eficiencia bienvaleel esfuerzo. RECUADRO 11.3 Obtención de
la
interpolación cúbica segmentaria
El primer paso en la obtención (Chene y Kincaid, 1980) x - xi x - xi-1 fl’(x) = f”(Xi-1) f“(Xi) se basa en la observación de que debido a que cada parexi-1 - xi xi - xi-1 ja de nodos está conectada por un polinomio cúbico, la dentro derivada segunda intervalo una es línea [B11.3.1] recta. La ecuación (11.31)se puede derivar dos veces para verificar esta observación. Con base a lo anterior, las segundas derivadas se representan mediante los polinomios en donde f,” (x) es el valor d e la segunda derivada en el de interpolación d e primer ordendeLagrange[Ec. primer nodo x dentrodel i-ésimointervalo. Por lo tanto, (11.21)l: una es ecuación esta conecta línea que recta la segunda ~
+
___c
INGENIEROS 380
PARA
NUMERICOS
derivada en el primer nodo f”(xiPl)con la segunda derivada en el segundo nodo f” (x,). En seguida, la ecuación (B11.3.1) se integra dos veces y se obtiene una expresión para ft(x). Sin embargo, esta expresión contendrá dos incógnitas constantes de integración. Estas constantes se evalúan invocando las condiciones de equiespaciamiento, f(x) debe ser igual f ( x , - J en y f(x) debe ser igual a !(x,) en x,. Llevando a cabo estas evaluaciones, resulta la siguiente ecuacióncúbica:
METODOS
Las segundas derivadas se evalúan usando la condición de que lasprimerasderivadasen los nodos deben ser continuas:
[B11.3.3]
f I-1(Xi) = f I(Xi)
La ecuación (B11.3.2)se deriva y se obtiene una expresión de la primera derivada. Si esto se hace para los intervalos (¡ - l)-ésimos e ¡-ésimos y los dos resultados se igualan, de acuerdo a la ecuación (B11.3.3),resulta la siguiente relación: (Xi
-
xi-1)
f“(Xi-1)
+ 2(Xi+l - X , - d
f’W
+ (Xi+l - Xi) f“(Xi+l)
Ahora, esta expresión es mucho más complicada para los polinomios de interpolación segmentaria en el i-ésimo intervalo, digamos, la ecuación (11.31). Sin embargo, nótese que esta contiene sólo dos “coeficientes” incógnitas, las segundas derivadas al principio y al final del intervalo, f’ ’ h - 1 ) y f ’ ’(xi).Por lo tanto, si se determina propiamente la segunda derivada en cada nodo, la ecuación (B11.3.2)es un polinomio de tercer orden que se usa parainterpolar dentro de un intervalo.
Si la ecuación (B11.3.4)se escribe para todos los nodos interiores, resultan n - 1 ecuaciones simultáneas con n + 1 segundas derivadas incógnitas.Sin embargo, ya que este es un polinomio interpolante “natural”, las segundas derivadas en los nodos finales son cero y el problema se reduce a n - 1 ecuaciones con n - 1 incógnitas. Además, nótese que el sistema de ecuaciones será tridiagonal. Por lo tanto, no sólo se tiene que reducir el número de ecuaciones sino que también se calculan de forma que sean muy fáciles de resolver (recuérdese el recuadro 7.2).
La derivación del recuadro 11.3genera las siguientes ecuaciones cúbicas para cada intervalo:
[11.32]
38 1
INTERPOLACldN
Esta ecuación contiene únicamente dos incógnitas , las segundas derivadas al final de cada intervalo. Estas incógnitasse evalúan usando la ecuación siguiente:
Si esta ecuación se escribe para todos los nodos interiores, se generan n - 1 incógnitas. (Recuérdese que las segundas derivadas en los nodos finales son cero). La aplicación de estas ecuaciones se ilustra en el ejemplo siguiente:
EJEMPLO 11.10
Interpolación cúbica segmentaria
Enunciado del problema: ajústese un polinomio cúbico por segmentos a los datos usados en los ejemplos 11.8 y 11.9 (Cuadro 11.1). Utilicense losresultadosparacalcularelvaloren x = 5. Solución: el primer paso es emplear la ecuación (11.33) para generar un conjunto de ecuaciones simultáneas que se usarán en la determinación de las segundas derivadas en los nodos. Por ejemplo, en el primer nodo interior, se usan los siguientes datos:
xo=3
f(xo) = 2.5
x1 = 4.5
f(xJ = 1
x2
=
7
f ( ~ 2= ) 2.5
Estosvalores se sustituyenenla
ecuación (11.33) y se obtiene
(4.5 - 3)fff(3)+ 2(7 - 3)frr(4.5)+ (7 - 4.5)f”(7) -
7 -4.5 4.5
(2.5 - 1)
+
6 (2.5 - 1) -3
Debido a la condición natural de los polinomios,f ” (3) = O , y la ecuación se reduce a
8f”(4.5)+ 2.5ff’(7)= 9.6 De manera similar, la ecuación (11.33) se aplica a los segundos puntos interiores para obtener
382
INGENIEROS METODOS NUMÉRICOS
I
PARA
3.5f"(4.5) + 9f"(7) = -9.6 Estas dos ecuaciones se resuelven simultáneamente cómo
f"(4.5) f " (7)
=
1.745 45
-1.745 45
=
Estos valores se sustituyen en la ecuación (11.32),junto con los valores de las x y de las !(x), obteniendo:
2.5
45
fib)
1.745 (x 6(4.5 - 3)
=
+
[4.5f
3
+
3)3
4.5
-
(4.5 - x)
3
1.745 45 (4.5 - 3) 6
1
(x - 3)
O
fI(x) = 0.193 9 3 9 ( ~ 3)3+ 1.666 667(4.5- X)
+ 0.230 3 0 3 ( ~ 3)
Esta ecuación es el polinomio cúbico interpolante para el primer intervalo. Se pueden llevar a cabo sustituciones similares y desarrollar las ecuaciones para el segundo y tercer intervalo:
fi(x) = 0.116 364(7 -
- x)3 -
O. 327 273 (7
0.116 364(x
+
- X)
-
4.5)3
1.727 2 7 3 ( ~- 4.5)
Y
f3(~= )
-
0.145455(9
-
+
1.831818(9 - X)
+
0 . 2 5 (~ 7)
Las tres ecuaciones se emplean para calcular los valores dentro de cada uno de los intervalos. Por ejemplo, el valor en x = 5, que cae dentro del segundo intervalo, se calcula cómo
fZ(5) = 0.116 364(7 -
-
0.327 273(7
5)3 - 0.116 364(5 -
5)
+
-
1.727 273(5
4.5)3
-
4.5)
=
1.125 5
Se calculan otros valores y los resultados obtenidos se muestran en la figura 1 1 . 1 4 ~ . Los resultados del ejemplo11.8al 11.10se resumen en la figura 11.14. Nótese cómo se obtienen mejoras progresivas conforme se pasade interpolación lineal a cuadrática y a cúbica. También se ha sobrepuesto un
383
lNTERPOLACl6N
polinomio de interpolación cúbica enlafigura 1 1 . 1 4 ~Aunque . la interpolación cúbica consiste de una serie de curvas de tercer orden, el ajuste resultante difiere del que se obtiene usando polinomios de tercer orden. Esto se debe a que la interpolación natural requiere de segundas derivadas en los nodos finales, mientras que el polinomio cúbico no tiene esta restricción.
11.4.4 Algoritmo para la interpolación cúbica segmentaria El método para calcular los polinomios cúbicos de la interpolación segmentaria vista en las secciones anteriores es ideal para su implementación en microcomputadoras. Recuérdese que por algunas manipulaciones inteligentes, el método se reduce a resolver n - 1 ecuaciones simultáneas. Un beneficio adicional obtenido de la derivación es que, como lo especifica la ecuación (11.33), elsistema de ecuaciones es tridiagonal. Como se describe en el recuadro 7.2, se dispone de los algoritmos para resolver tales sistemas de una manera extremadamente eficiente. Enla figura 11.16 se presenta el algoritmo de interpolación cúbica segmentaria elcualincluyelos aspectos antes mencionados.
FIGURA 1 1 . 1 6 Algoritmo de interpoiación cúbicasegmentaria.
PROBLEMAS Cálculos a mano 11.1
Calcúlese el logaritmo de 4 en base 10 (log 4) usando interpolaciónlineal. a) Interpolar entre log 3 = 0.477 121 3 y log 5 = 0.698 970 O. b) Interpolar entre log 3 y log 4 . 5 = 0.653 212 5. Para cada una de las interpolaciones calcúlese el error relativo porcentual basado en el error verdaderode log 4 = 0.602 060 O.
11.2
Ajústese un polinornio de interpolación de Newton de segundo orden para aproximar log 4 usando los datos del problema 1 1 . 1 , Calcúlese el error relativo porcentual.
384
INGENIEROS
PARA
METODOS
NUMERICOS
11.3
Ajústese un polinomio de interpolación de Newton de tercer orden para calcular log 4 usando los datos del problema 11.1además del punto adicional, log 3.5 = 0.544 068 O . Calcúlese el error relativo porcentual.
11.4
Dados los datos
I
x
I
f(x)
O
0.5
1.0
1.5
2.0
2.5
1 2.119 2.910 3.945 5.720 8.695
a) Calcúlese f (1.6) usando polinomios de interpolación de Newton de orden 1 hasta el 3. Escójase la secuencia de puntos de las aproximaciones para lograr exactitud. b) Úsese la ecuación (11.18)para calcular el error en cada predicción. 11.5
Dados los datos 2 3
5
6
x
1
1
f(x)
I
4.75 4 5.25 19.75 36
Calcúlese f (3.5)usando polinomios de interpolación de Newton de orden 1hasta el 4. Escójanse los puntos base para obtener una buena aproximación. ¿Qué indican los resultados respecto al orden del polinomio que seusa para generar los datos en la tabla? 11.6
Repítanse los problemas 11.1al 11.3 usando polinomios deLagrange.
11.7
Repítase el problema 11.40 usando interpolación deLagrange.
11.8
Repítase el problema 11.5 usando polinomios de Lagrane de orden 1 hasta el 3
11.9
Desarróllese la interpolación cuadrática segmentaria para los datos del problema 11.5 y calcúlese f (3.5).
11.10 Desarróllese la interpolación cúbica segmentaria para los datos del problema 11.5 y cálculese f (3.5).
Problemas relacionados con la computadora 11.11 Vuélvase a programar la figura 11.7 de tal manera que sea legible al usuario. Entre otras cosas: a) Insértese documentación a lo largo del programa para identificar lo que cada una de las secciones debe hacer. b ) Etiquétense las entradas y las salidas. c ) Inclúyase la ecuación (11.18)para calcular el error de cada orden del polinomio (excepto el último). 11.12 Pruébese el programa que el lector haya desarrollado en el problema 11.11duplicando los cálculos del ejemplo 11.5. 11.13 úsese el programa desarrollado por el lector en el problema 11.11y resuélvanse los problemas 11.1al 11.3. 11.14 Úsese el programa desarrollado en el problema 11.11y resuélvanse los problemas 11.4 y 11.5.En el problema 11.4, utilícense todos los datos par desarrollar
385
INTERPOLAC16N
los polinomios del orden primario hasta el quinto. En ambos problemas, grafíquese el error calculado contra el orden. 11.15 Repítanse los problemas 11.12 y 11.13, usando el paquete NUMERICOMP asociado con este texto. 11.16 Úsese el paquete NUMERICOMP con los ejemplos 11.6 y 11.7 11.17 Desarróllese un programa legible al usuario para la interpolación Pruébese con el ejemplo 11.7.
de Lagrange.
11.18 Desarróllese un programa legible al usuario para la interpolación cúbica segmentaria basado en la figura 11.16 y en la sección 11.4.4. Pruébese el progama con el ejemplo 11.10. 11-19 Úsese el programa desarrollado en el problema 11.18 para ajustar polinomios cúbicos con los datos de los problemas 11.4 y 11.5. En ambos casos, calcular f (2.25).
CAPíTULO DOCE CASOS DE LAPARTE IV: AJUSTEDECURVAS
El propósito de este capítulo es el de hacer uso de los métodos de ajuste de curvas en la solución de problemas de ingeniería. Al igual que en los otros casos de estudio de los otros capítulos, el primer ejemplo se toma del área general de la ingeniería económica y de administración. A este caso lo siguen las cuatro áreas principales de la ingenieria: química, civil, eléctrica y mecánica. En el caso 12.1 se hace un análisis sobre los datos de venta de computadoras. El ejemplo ilustra dos puntos importantes relacionados con el ajuste de curvas: 1) los polinomios de interpolación están bien condicionados para el ajuste de datos imprecisos y 2) la extrapolación es un procedimiento, poco confiable cuando la relación de causa-efecto subyacente a la tendencia se desconoce. El caso 12.2, tomado de la ingeniería química, demuestra cómo se puede linealizar un modelo no lineal y ajustarse a datos que usan regresión lineal. El caso 12.3 usa un esquema similar pero emplea también interpolación polinomial para determinar la relación esfuerzo-deformación enproblemasdeestructuraseningenieríacivil. El caso 12.4 ilustra cómo se usa un simple polinomio de interpolación para aproximar una función más complicada en ingeniería eléctrica. Finalmente, el caso 12.5 demuestra cómo se usa la regresión lineal múltiple en el análisis experimental de datos en un problema de fluidos tomadodelaingeniería mecánica.
CASO 12.1
MODELO DE INGENIERíA DE VENTA DEPRODUCTOS (INGENIERíA EN GENERAL) Antecedentes: los ingenieros encargados del diseñoy fabricación de productos tales como automóviles, televisoresy computadoras pueden verse implicadosen otros aspectos de los negocios. Estasimplicaciones incluyenlas ventas, mercadeo y distribucióndelproducto.
METODOS
388
NUMERICOS PARA INGENIEROS
Supóngase que un ingenierotrabajaparalacompañía que fabrica las Computadoras de tipo Micro 1 (véase el caso 6.1). Las consideraciones sobre planificación y localización de recursos (caso 9.1) requieren que este ingeniero sea capaz de predecir hasta cuándo permanecerán en el mercado las computadoras de su compañía enfuncióndel tiempo. En este caso de estudio, se proporcionan datos que describen el número de computadoras de la compañía que se encuentran en el mercado en diferentestiemposhasta 60 días (Fig. 12.1). Al ingeniero se lepide que examine estos datos y, usando método de extrapolación, calcular cuántas computadorasse tendrán disponiblesa los 90 días. Los datos se mues12.1. tranenelcuadro
FIGURA 12.1
Número de computadoras en el mercadocontra el tiempo.
CUADRO 12.1
Número de computadorasen el mercado en función del tiempo Número de computadoras Tiempo, días
en el mercado ~~
~~
O
~
10 20 30
50 O00 35 O00 31 O00 20 O00
40 50 60
1 9 O00 1 2 O00 1 1 O00
389
CASOS DE LA PARTE IV: NUSTE DE CURVAS
Este análisis de tendenciay extrapolación se resuelve usando polinoel sexto grado así como con polimios de interpolación del primero hasta nomios de regresión del primero hasta el sexto grado. Las curvas resultantes se usan para predicciones en los días 55,65 y 90 que ilustran el contraste entre interpolación y extrapolación. Solución: analizando la figura 12.1 se observa que los datos no son uniformes. Aunque el número de computadoras decrezca con el tiempo, la tasa de decrecimiento varía de intervalo a intervalo comportiíndose aleatoriamente. Por lo tanto, aún antes de que empiece el análisis, se puede esperar que la extrapolación de estos datos traerá dificultades. Los resultados del cuadro 12.2 confirman esta conjetura. Nótese que hay una gran discrepancia entre las predicciones con cada uno de los métodos. Para cuantificar la discrepancia se calcula la media, la desviación estándar y un coeficiente de variación de las predicciones. El coeficiente de variación, que es la media dividida por la desviación estándar (multiplicada por el loo%, proporciona una medida relativa de la variabilidad de cada conjunto de predicciones [ € c(IV.5)J. . Nótese cómo el coeficienCUADRO 12.2 Resultados del ajuste de varios polinomios de interpolacibn y polia datos del cuadro 12.1. Se muesnomios ¿e minimos cuadrados los tra una interpolacibn en t 55 y una extraplacibn de t 65 y 90. Nbtese que, debido aque las ecuaciones notmales estbn mal condicionadas, el polinomio con minimos cuadrados de sexto orden difiere del polinomio de interpolacibn mbs preciso (recuerdese la sección 10.2.1 )
=
~~
I N T E R P O lEAXCTl dRNA P O l A C l d N t
Polinomios de interpolación Primer orden
961
8
9% variaci6n
788 Segundo 10 orden Tercer 10 orden ordenCuarto Quinto 7 orden Sexto 4 orden Media Desviación 2 estándar de Coeficiente Polinomios con mínimos cuadrados Primer 9 orden
71
orden Segundo Tercer orden orden Cuarto Quinto orden 261 Sexto 4 orden Media Desviación estándar 2 Coeficiente de variación245%
55
1 1 525
047 300 660 8 880 542 820 1 1 829 12 040 12 104 1 1 101 83 1 1 768 10 203 834 128% 28%
t
= 65
10 475 12 688 16 391 992 38 942 67 975 28 41 1 21 951 128
3 573 10 939 8 872 733 9 366 266 18 910 24 233
t
90
7 850 43 230 161 750 578 750 1 854 500 5 458 100 1 350 700 2 226 -1 2 045
16 529 -3 046 -78 906
5 768 460 910 623 408 2 228
390
INGENIEROS MGTODOS NUMERICOS PARA
te de variación es el menor para el valor interpolado en el día 55. También, nótese cómo la mayor discrepanciase daen el día 90, que representa la extrapolación más lejana. Además, los resultados de los polinomios de extrapolación disminuyen a medida que crece el orden, hasta el punto en queel caso de sexto orden lleva a la ridícula predicción de que en el día 90 se tendrán disponibles 5 458 100 computadoras. La razón de este resultado sin sentido se ilustra en la figura 12.2, que muestra el polinomio de sexto grado. Ya que la tendencia sugerida por los datos no es uniforme, los polinomios de grado superior oscilan para intersectar cada punto. Estas oscilaciones llevan a interpolaciones falsas y extrapolaciones del tipo manifestado en la figura 12.2. Ya que la regresión no se restringe para pasar por cada uno de los puntos, algunas veces resulta útil para remediar esta situación. La figura 12.3 que muestra los resultados de la regresión cuadrática y cúbica sugiere que es real para regresión de nivel bajo. Dentro del rango de los datos ( t = O hasta 60 días), los resultados de las dos regresiones llevan a resultados poco consistentes. Sin embargo, cuando se extrapolan más allá de este rango, la predicción diverge. En t = 90, la regresión de se-
PARTE CASOS
LA DE
FIGURA 12.3
IV: AJUSTE
CURVAS
Gráfica de las curvas de regresión de segundo y tercer orden usadas para interpolar y extrapolar los datos de venta de computadoras.
gundo orden lleva al resultado absurdo de que el número de computadorasha crecido, mientrasque laversiónde tercerordenlleva a la proyección ridícula de que habráun número negativo de computadoras. La razón principal de que la interpolación y la regresión estén mal condicionadas para este ejemplo es que ni siquiera se basan en un modelo de la realidad física. En ambos casos, el comportamiento de las predicciones es puramente un artificio del comportamientode los números. Por ejemplo, ni los modelos tomanen consideración que más allá det = 60. elnúmerodecomputadorasdebeestarentre O y 11 000. Por lo tanto, si se estuviera interesadoen una aproximación rdpida del número decomputadoras en el mercado, en un tiempo futuro, un ajuste y una extrapolación “visula” arrojaría resultados más realistas. Esto se debe a que se está conciente de las restricciones físicas del problema y se puede, por lo tanto, incorporar estas restricciones en la solución gráfica simple. En el caso de estudio 18.1, se usa una ecuación diferencial para desarrollar un modelo que tenga una base teórica y , por consiguiente, lleve a resultados más satisfactorios. Por el lado positivo se debe notar que este ejemplo ilustra cómo la regresión tiene alguna utilidad para la interpolación entre puntos un tanto erróneos o inexactos. Sin embargo, la primera conclusión de este caso es que la extrapolación siempre se debe llevar a cabo con cuidadoy precaución.
CASO 12.2
REGRESIóNLINEAL Y MODELOS DEMOGRÁFICOS (INGENIERíA QUíMICA) Antecedentes: los modelos de crecimiento poblacional son importantes en muchos campos de la ingeniería. La suposición de que la tasa de cre-
391
392
NUMERICOS
METODOS
PARA INGENIEROS
cimiento de la población ( d p / d t ) es proporcional a la población actual (p) en el tiempo (f) es de fundamental importancia en muchos de los modelos, enforma de ecuación -dP= / q
dt
[12.11
en donde k es un factor de proporcionalidad conocido como la tasa de crecimiento específico y tiene unidades de tiempo-l. Si k es una constante, entonces se puede obtener lasolucióndela ecuación (12.1) de lateoría de ecuaciones diferenciales:
en donde po es la población enel tiempo t = O. Se observa que p(t) en la ecuación (12.2) tiende a infinito a medida que t crece. Este comportamiento es claramente imposible en los sistemas reales. Por lo tanto, se debe modificar el modelo y hacerlo más realista. Solución: primero, se debe reconocer que la tasa de crecimiento específico k no puede ser constante a medida que la población crece. Esto es porque, cuando p tiende a infinito, el organismo que se modela se ve limitado por factores talescomo el almacenamiento de comida y producción de desperdicios tóxicos. Una manera de expresar esto matemáticamente es la de usar el modelo de tasa-de-crecimiento-y-saturacióntal como:
[12.3] en donde kmdxes la máxima tasa de crecimiento posible para valores de comida v) abundante y K es la constante de semi-saturación. La gráfica de la ecuación (12.3) de lafigura 12.4 muestraquecuando f = K, k = kmex/2. Por lo tanto, K es la cantidad de comida disponible que sostiene una tasa de crecimiento poblacionaligual a la mitad de la tasa máxima. Las constantes K y kmáxson valores empíricos basados en medidas experimentales de k para varios valores de f. Como ejemplo, supóngase que la población p representa una levadura empleada en la producción comercial de cerveza y f es la concentración de la fuente de carbono a fermentarse. Las medidas de k contra f de lalevadura se muestranen el cuadro 12.3. Se necesita calcular kmáx y K de estos datos empíricos. Esto se lleva a cabo invirtiendo la ecuación (12.3) de manera similar a la ecuación (10.16),obteniendo
[12.4]
CASOS
DE
IV: AJUSTE
FIGURA 12.4
CUADRO 12.3
393
CURVAS
Gráfica del promedio de crecimiento específico contra la comida disponible con el modelode promedio-de-crecimiento-de-saturaciónusado en la caracterización de la cinética microbial. El valor de K es llamado constante de saturación media ya que representa la concentración endonde el promedio de crecimiento específico es la mitad del valor máximo.
Datos usadosen la evaluación de las constantes en un modelo de promedio-de-crecimiento-desaturación que caracteriza a la cinética microbial
f, mglL
7 9 15 25 40 75 1O0 150
k, dias" 0.29 0.37 0.48 0.65 0.80 0.97 0.99 1 .O7
llf, Llmg
O. 142 86 0.111 1 1
0.066
66
0.040 O0
0.025 O0 0.013 33 0.010 O0
0.006
66
Ilk, día 3.448 2.703 2.083 1.538 1.250 1 .O31 1 .o1o
0.935
De esta manera, se ha transformado la ecuación (12.3) a la forma lineal; esto es, l / k es una función lineal de l/f, con pendiente K/kmdX.Estos valores se grafican en lafigura 12.5. Debido a la transformación, se puede usar el procedimiento de mínimos cuadrados lineales descrito en el capítulo 10 para determinar kmdx = 1.23 días" y K = 22.18 mg/L.Combinando estos resultadoscon la ecuación (12.3) y comparándolos con los datos sin transformar de la figura 12.6, y cuando se sustituyen en el modelo de la ecuación (12.1) se obtiene:
[12.5]
394
FIGURA 12.5
NUMERICOS
METODOS
PARA INGENIEROS
Versión linealizada del modelo de promedio-de-crecimiento-desaturación. La línea es un ajuste con mínimos cuadrados que seusa en la evaluación de los coeficientes del modelo kmbx= 1.23 días” y k = 22.18 mg/L para levadura usada en la fabricación de cerveza.
Esta ecuación se puede resolver usando la teoría de las ecuaciones diferenciales o usando los métodos numéricos analizados en los capítulos 16 y 17 cuando se conoce f ( t ). Si f se aproxima a cero a medida que p crece, entonces d p / d t tiende a cero y la población se estabiliza. La linealización de la ecuación (12.3) es una manera de evaluar las constantes kmdxy K . Otra manera de hacerlo, y que ajusta la relación a
FIGURA 12.6
Ajuste del modelo de promedio-de-crecimiento-de-saturación de la levadura empleada en la fabricación comercial de cerveza.
CURVAS CASOS
DE
395
IV: AJUSTE
su forma original, se le conoce con el nombre de regresión no lineal (Draper y Smith, 1981).En cualquier caso, se puede usar análisis de regresión para calcular los coeficientes del modelo usando los datos medidos. Este es un ejemplo del uso de la regresión para la prueba de hipótesis, como se estudió en la sección IV.1.2.
CASO 12.3
AJUSTEDECURVAS EN EL DISEÑODE U N MÁSTIL PARA BARCO (INGENIERíA CIVIL) Antecedentes: elmástil de un barco (véase el caso 15.3para mayores detalles)tiene un área transversal de 0.876 pulg2 y se construyede una aleación de aluminio experimental. Se llevan a cabo pruebas para definir la relación entre esfuerzo (fuerza por área) aplicada al material y deformación (deflexión por unidad de longitud). Los resultados de estas pruebas se muestranenlafigura 12.7y se resumen en el cuadro 12.4. Es necesario calcular el cambio de longitud del mástil debido a la deformación causada por la fuerza del viento. La compresión causada por el aire se puede calcular usando la relación: Esfuerzo =
FIGURA 12.7
fuerzaenelmástil área de la sección transversal del mástil
Curva de esfuerzo-deformación en una aleación de aluminio. En el caso 12.3 se debe obtener una deformación aproximada a partir de estos datos que conforman un esfuerzo de 7 350 libras/pulgada2.
396
MhODOS NUMERICOS PARA INGENIEROS
CUADRO 12.4
Datos de esfuerzo-deformación ordenados de tal manera que los puntos usados en la interpolación estén siempre más cercanos al esfuerzo de 7 350 Iblpulg' Número de Esfuerzo, puntos lblpu1g2
1
2 3 4
5 6
Deformación pieslpie
0.002 o 0.004 5 0.006 O 0.001 3 0.008 5 0.000 5
7 200 7 500 8 O00 5 200 10 O00 1 800
En este caso, se tiene una fuerza del vientode 6 440.6 libras (nótese que al igual que en el caso 15.3 se usan métodos numéricos para determinar este valor directamente de los datos del viento), y el esfuerzo se calcula mediante: Esfuerzo =
440'6
0.876
=
7 350 Ib/pulg2
Este esfuerzo puede ser usado para calcular la deformación de la figura 12.7, el cual, a su vez, se puede sustituir en la ley de Hooke y calcularelcambioenlalongituddelmástil:
AL = (deformación) (longitud)
[12.6]
en donde la longitud se refiere a la altura del mástil. Por lo tanto, el problema se reduce a la determinación de valores de la deformación de los datos en la figura 12.7. Ya que no se dispone de ningún punto para un valor de esfuerzo dado de 7 350, el problema necesitará algún ajuste de curvas. En este caso se usarán dos planteamientos: el de interpolación polinomial y elderegresiónconmínimoscuadrados. Solución: elprimer planteamientousará la interpolaciónpolinomialde orden O al 5 paracalcular la deformación a un esfuerzo de 7 350 lb/pulg2. Para hacerlo, los datos se ordenan de tal manera que la interpolación siempre use información quese encuentre más cercana a los puntos incógnitas (cuadro 12.4). Sepuede aplicar la interpolación polinomial de Newton, con los resultadosdadosen el cuadro 12.5. Todos los polinomios excepto el de orden cero llevan a resultados que casi coinciden. En base al análisis, se concluiría que una deformación de aproximadapies/pie es una aproximación razonable. mente 3 . 4 X Sin embargo, hayuna aclaración importante. Es realmente fortuito que la aproximación de la deformación tienda a un mismovalor.Esto se puede ver examinando la figura 12.8, en donde se muestra el polino-
PARTE CASOS DE LA
397
IV: AJUSTE DE CURVAS
CUADRO 12.5 Resultados del polinomio deinterpolacih de Newton para predecirunadeformacióncorrespondiente a unesfuerzode 7 350 lblpu1g2 en basea la información del cuadro 12.4 Orden del polinomio (n)
Coeficiente de n-ésimo orden
2 X 10-3 8.33 x -6.67 X 10-9 -3.62 X 10”’ 1.198 x 2.292 x
FIGURA 12.8
Deformación (con esfuerzo
2 X 10-3 3.27 X 1 0 - ~ 3.42 X 10-3 3.36 X 10-3 3.401 x 3.38 X 10-3
Gráfica de un polinomio interpolante de quinto orden que ajusta perfectamente los datos del cuadro 12.4. Nótese que aunque la curva pasa muy bien a través de los trespuntosen la vecindad del esfuerzo de 7 350, la curva oscila ampliamente en otras partes del rango de datos.
7 350)
398
METODOS NUMERICOS
PARA INGENIEROS
mio de quinto orden junto con los datos. Nótese que debido a que los tres datos se encuentran muy cercanos del valor de 7 350, la interpolación no debe variar significativamente en este punto, como era de esperarse. Sin embargo, si se requieren aproximaciones de otras fuerzas, las oscilaciones de los polinomios pueden llevar a resultados inexactos. Los resultados anterioresilustran que la interpolación con polinomios de grado superior está mal condicionada para datos inciertos o con “ruido” del tipo de este problema. La regresión proporciona una alternativa que, en general, es más apropiado para estas situaciones. Por ejemplo, se puede usar la regresión lineal para ajustar una línea recta a través de los datos. La línea de mejor ajuste es Deformación = -0.002 527
+
9.562 x
esfuerzo
[12.7]
la línea y los datos se muestran en la figura 12.9. Sustituyendo el esfuer350 libras/pulg2en la ecuación (12.7) se obtiene una predicción pulgs/pulg. de 4.5 X Un problema con regresión lineal llevaa resultados fuera de la realidad con deformaciones negativas en un esfuerzo igual a cero. Una manera diferente de regresión que evita este resultado no realista es la de ajustar una línea recta al logaritmo (base 10) de la tensión contra el logaritmo del esfuerzo (recuérdese la sección 10.1.5). El resultado en este caso es:
zo = 7
log (deformación)= -8.565
+ 1.586 log(esfuerzo)
Esta ecuación se puede transformar a la forma inicial que predice la deformación, sacando antilogaritmos se obtiene: deformación = 2.723
X
(esfuerzo)
[12.8]
Esta curva también se superpone a la figura 12.9 en donde se puede ver que esta versión muestra los resultados físicos más realistasya que la deformación es cero cuando el esfuerzo es cero. La curva también es un poco más realista ya que captura algunas de las curvaturas sugeridas por los datos. Sustituyendo el esfuerzo = 7 350 en la ecuación (12.8)se obtieneunapredicciónde la deformación = 3.7 x l o p 3pulgs/pulg. De esta manera, la interpolación polinomial y los dos tipos de regresión llevan a resultados diferentes de deformación. Debido al realismo físico y al comportamiento más satisfactorio a través del rango completo de los datos, se optará por la ecuación (12.8) ya que proporciona mejores predicciones. Usandoun valor de longitud = 30 pies y con la ecuación (12.6) se obtiene el siguiente resultado del cambio en la longitud del mástil:
AL
=
(3.7 x
pies/pie)(30 pies)
=
0.11 pies
PARTE CURVAS CASOS DE LA DE
399
IV: AJUSTE
FIGURA 12.9
Gráfica de una línea usando regresión lineal y una línea de regresión usando la transformación logarítmica con los datos de esfuerzodeformación del mástil de un barco.
CASO 12.4
AJUSTEDE CURVAS EN LA ESTIMACIóN DELA CORRIENTE RMS (INGENIERíA ELÉCTRICA) Antecedentes: el valor promedio de una corriente eléctrica oscilante durante un periodopuedeser cero. Por ejemplo, supóngaseque la corriente se describe mediante una senoidal simple: i(t) = sen (2at/T) en donde T es el periodo. El valor promedio de esta función se puede determinar mediante la siguiente ecuación:
- -cos 27T
T
=o
+ cos o
400
METODOSNUMERICOSPARAINGENIEROS
La misma aproximaciónse muestra gráficamente enla figura 12. loa. Como se puede ver, resulta una corriente neta igual a cero ya que las áreas positiva y negativa bajo la curva se cancelan. A pesar de que el resultado neto es cero, esta corriente es capaz de realizar un trabajo y generar calor. Por lo tanto, los ingenieros eléctricos, a menudo, caracterizan esta corriente mediante
[12.9] en donde I,,, se conoce como corriente RMS (raíz cuadrada media, en inglés “root-mean-square”). El problema de cancelación de signos positivos y negativos se evita elevando la corriente al cuadrado antes de calcular el promedio.
FIGURA 12.1 O
a) Gráfica de una corriente eléctrica oscilante. Sobre un periodo T (esto es, un cic!o completo), la integral de la función es cero ya que las áreos positivas y negativas son iguales, y por lo tanto, se cancelan. Para evitar este resultado, la corriente se eleva al cuadrado, como en b). La raíz cuadrada del promedio del cuadrado, a lacual se le llama corriente RMS, proporciona una medida de la magnitud de la corriente.
””
CURVAS CASOS
DE
401
IV: AJUSTE
En este caso, supóngase que la corriente en un circuito es de
(
i ( t ) = 10e-t’Tsen-
para O
i(t) = O
para T / 2 < t
2;t)
It IT
5
/2
[12.10]
T
Determínese la corriente RMS ajustandoun polinomio de segundo grado que coincida con i2(t) exactamente en t = O , T/4 y 1/2. En seguida, intégrese este polinomio analíticamente y calcúlese la corriente RMS en el intervalo de O a T usando la ecuación (12.9).Supóngase que T = 1 s. Este resultado se puede comparar al caso 15.4 en donde se emplear6n otras técnicas para calcular la corriente RMS. Solución: usando la ecuación (12.lo), se generan los siguientes puntos. t
O 114 1/2
i(t)
0.000 O00 O00 7.788 007 831 0.000 O00 O00
i*(t)
0.000 O00 O0 60.653 065 98 0.000 O00 O0
Ajustando un polinomio de Newton de segundoorden(Fig. 12.11),se obtiene elpolinomio i2(t) = 242.612 264t - 970.449 056t(t
FIGURA 12.1 1
- 1/4)
Gráfica de la corriente verdadera [Ec. ( 1 2.10)], junto con la parábola que se usa como aproximación.
402
METODOS
que se puedeintegrardesde t
:i
=
O hasta t
=
NUMERICOS PARA INGENIEROS
T/2 (T = 1 S) y obtener:
i2(t) dt-= 121.306132t2 -.323.483 0187t3 + 121.306132$
:I
obteniendo el resultado 20.217 688 66, el cual, a suvez se sustituye en la ecuación (12.9) y se obtiene lRMs = 4.496 408 418. Enel caso 15.4 se usan varias técnicas de integración numérica para llevar a cabo estos mismos cálculos.
CASO 12.5
REGRESIóNLINEALMQLTIPLEEN EL ANALISIS DE DATOSEXPERIMENTALES (INGENIERíA MECANICA) Antecedentes: las variables de diseño en la ingeniería,a menudo, dependen de muchas variables independientes. Con frecuencia esta dependencia funcional se caracteriza mejor con ecuaciones de potencia multivariable. Como se analiza en la seccidn 10.3, una regresión lineal múltiple de datos transformados mediante logaritmos porporciona un medio para evaluar tales relaciones. elflujo Por ejemplo, un estudio de ingeniería mecánica indica que de fluido a través de un tubo es función del diámetro del tubo y de su pendiente (cuadro 12.6). Para analizar estos datos se usa una regresión lineal múltiple. En seguida, se usa el modelo resultante para predecir el flujo en un tubo con un diámetro de 2.5 pies y con una inclinación de O .O25 piedpie. Solución: la ecuación de potencias se evalúa como Q = u,D"~S"*
c12.111
2 3 1
2 3 1
2 3
0.001 0.001 0.01 0.01 0.01 0.05 0.05 0.05
8.3 24.2 4.7 28.9 84.0 11.1
69.0 200.0
CASOS DE
403
IV: AJUSTE DE CURVAS
en donde Q es el flujo (en pies cúbicos por segundo), S es la pendiente (en pies por pie), D es el diámetro del tubo (en pies) y ao, a l y a2 son coeficientes. Extrayendo logaritmos a esta ecuación se obtiene log
Q
=
log a.
+ al log D + a2 log S
De esta forma, la ecuación se adapta a la regresión lineal múltiple ya que log Q es función lineal de log S y de log D. Usando los logaritmos (base 10) de los datos en el cuadro 12.6, se generan las siguientes ecuaciones normales expresadas en forma matricial [recuérdese la Ec. (10.21)]: 2.334 2.334 0.954 -4.903 -18.903
-18.903
:t] [
log a.
-4.903][ -22.207 44.079
=
11.691 3.9451
Este sistema se puede resolver usando eliminación gaussiana para obtener: log a. = 1.747
5%
al = 2.62
a2 = 0.54
Si log a. = 1.747 5, entonces vierte en: Q =
a. =
55.9 y la ecuación (12.11) se con-
55.902.62SO.54
[12.12]
La ecuación (12.12) se puede usar para predecir el flujo en el caso en que D = 2.5 pies y S = 0.025 piedpie, dando
Q
=
55.9(2.5)2.62(0.025)o.54 = 84.1 pies3/s
Se debe notar que la ecuación (12.12) puedeusarse para otros propósitos además de calcular flujos.”Por ejemplo, la pendiente está dada en función de la pérdida de calor hL y la longitud del tubo L por S = h , / L . Si esta relación se sustituye en la ecuación (12.12) y la fórmula resultante se resuelve para hL. se obtiene la siguiente ecuación:
Esta relación se conoce con el nombre de ecuación de Hazen-Williams.
404
INGENIEROS
PARA
METODOS NUMERICOS
PROBLEMAS Ingeniería en general 12.1
Efectúense los cálculos llevados a cabo en el caso 12.1 usando los programas propios.
12.2
Ejecútense los mismos cálculos del caso 12.1, pero con el número de computadoras en el mercado en los días 50 y 60 modificados un poco a 12 O00 y 1 1 050.
12.3
Si se deposita una cantidad de dinero con cierta tasa de interés, se pueden usar las tablas económicas para determinar la suma acumulada en un tiempo posterior. Por ejemplo, la siguiente información se encuentra en una tabla económica sobre elvalorfuturo de un depósito después de 20 años:
190
Tara de inter& O h 15 20 337 25 736 30
F/P
= 20 años)
(n
16 366 38 86 05
en donde FIP es el promedio delvalorfuturoalvalor actual. Por lo tanto. si se depositaron P = $10 000, después de 20 años al 20% de interés se debe tener: F = (F/P)P = 38.337(10 000) = $383 370 Utilícese interpolación lineal, cuadrática y cúbica y determínese el valor futuro de $25 O00 depositados al 23.6% de interés. Interprétense los resultados desde la perspectiva de lainstitución prestamista. 12.4
Utilícese la información dada en el problema 12.3. pero suponiendo que se han invertido $40 O00 y le dicen que después de 20 aiios el prestamista regresará $2 800 000. Úsese interpolación lineal, cuadrática y cúbica para determinar la tasa de interés que se está dando.
12.5
Supóngase que al ganador de un premio se le da la oportunidad de escoger entre $2 millones ahora o $700 O00 por atio durante 5 años. La relación entre el valor actual P y una serie de pagos anuales A está dada por la siguiente información de unatabla de economía:
Tasa de inter& 016
15 38 0.334 20 25 30
A/P (n = 5 años)
32 0.298 85 0.371 0.41058
PARTE CASOS DE LA
405
IV: AJUSTE DE CURVAS
en donde A/P es el promedio de pagos anuales alvalor actual. Por lo tanto, la tasa de interés del 15%, los cinco pagos anuales A que son equivalentes a un solo pago actual (P = $2 millones) se calculan como A = (A/P)P = 0.298 32(2 O00 000) = $596640 Utilicese interpolación para determinarla tasa de interés a la cual los $2 millones es la mejor decisión. 12.6
Se est5 llevando a cabo un estudiopara determinar la relación entre la fuerza de fricción que actúa hacia arriba y la velocidad de caída del paracaidista. Se llevan a cabo algunos experimentos para obtener la siguiente información sobre la velocidad (u medida en centímetros por segundo) y la fuerza de rozamiento (F, medidaen lo6 dinas): u
F,
I
1
1 O00 5
2 O00 15.3
3 O00 29.3
4 O00 46.4
5 O00 66.3
Graffquese F contra u y úsese regresión para determinar la relación entre la fuerza de rozamiento y la velocidad.
Ingeniería química 12.7
Repítanse los cálculos del caso 12.2 usando los programas propios.
12.8
Efectúense los mismos cálculos del caso 12.2, pero usando regresión polinomial paraajustarunaparábola a los datos. Analícense los resultados.
12.9
Efectúense los mismos cálculos del caso 12.2, pero usando regresiónlineal con transformaciones para ajustar los datos a una ecuación de potencias. Ignórese el primer punto cuando se ajuste la ecuación.
12.10 Se llevan a cabo los siguientes experimentos y se determinan los siguientes valores de capacidad calorífica ( c ) a varias temperaturas ( T ) para un metal:
r C
-50 0.125
"20 0.128
10
70
0.134
0.144
100 0.150
Utilicese regresión y determínese.un modelo para predecir
120 0.155 c
en función de T.
12.11 La concentración de saturacióndel oxígeno disuelto en el agua enfunción de la temperatura y del cloruro se muestra en el cuadro P12.11.Utilicese interpolación para calcular el nivel de oxígeno disuelto para T = 22.4OC con cloruro = 10 oon mg/L. 12.12 osese interpolación polinomial con los datos del cuadro P12.11para derivar una ecuación sobre la concentración de oxígeno disuelto en función de la temperatura para el caso en que la concentración de cloruro es igual a 2 0 O00 my/L.
406
CUADRO P12.11
MÉTODOS
NUMÉRICOS
PARA INGENIEROS
Dependencia de la concentración de oxígeno en función de la temperatura y de la Concentración de cloruro OXiGENO DISUELTO (mglL) PARA CONCENTRACIONES DE CLORURO Temperatura OC
Cloruro Cloruro O m g l l = 10 O00 m g l l
Cloruro 20 O00 mglL
5 10 15 20 25 30
12.8 11.3
1 1.6 10.3
10.0
9.1
10.5 9.2
=
9.0 8.2 7.4
8.2
8.2 7.4 6.8
7.4
6.7 6.1
12.13 Utilicese regresiónpolinomial para llevar a cabo el mismo problema 12 12 12.14 Úsese regresión lineal múltiple y trsnsformaciones logaritmicas para derivar una ecuación que prediga la concentración del oxígeno disuelto en función de la temperatura y de la concentración de cloruro. Evalúense los resultados
Ingenieria civil 12.15 Repítanse los cálculos del caso 12.3 usando los programas propios. 12.16 Efectúense los mismos cálculos del caso 12.3. pero usandoregresión polinomial de segundo orden para relacionar deformación y esfuerzo. 12.17 Efectúense los mismos cálculos del caso 12.3pero usando una formulación exponencia1 para relacionar deformación y esfuerzo 12.18 Efectúense los mismos cálculos del caso 12.3 pero usando interpolacljnpolinomial para evaluar AL si el esfuerzo es de .7 700 libras/pulgada'.
Ingenieriaeléctrica 12.19 Repítanse los cálculos del caso 1 2 . 4 usando los programas proplo5 12.20 Efectúense los mismos cálculos del caso 12.4 ajustando e integrando un polinomi0 de tercer orden que coincida con i 2 ( t ) exactamente en t = O. TíG. T1'3. y T/2. 12.21 Se mide la caída de voltaje II a través de una resistencia para cierto número de valores de la corriente i . Los resultados obtenidos son i u
1 I
0.75 0.25
-0.23
-0.33
1.25
1.5
2.0
0.70
1.88
6.00
407
CURVAS CASOS DE LA DE PARTE IV: AJUSTE
Úsese interpolaciónpolinomialparacalcular Interprétense los resultados.
la caída de voltajepara i = 0.9.
12.22 Duplíquense los cálculos del problema 12.21 usando regresión polinomial para obtener una ecuación cúbica que ajuste los datos. Grafíquense y evalúense 10s resultados.
Ingeniería mecánica 12.23 Efectúense los cálculos del caso 12.5 usando los programaspropios 12.24 Basándose enel cuadro 12.6 utilícese interpolaciones lineal y cuadrática para calcular Q con D = 1.23 pies y S = 0.01 piedpie. Compárense los resultados con elmismovalor calculado con la fórmuladerivadaen el caso 12.5. 12.25 Utilícese el caso 12.5 para desarrollar una ecuación que prediga el diámetro en función de la pendiente y del flujo. Compárense los resultados con los de la fórmuladel caso 12.5 y analícense los resultados. 12.26 La viscosidad cinemática del agua. u , está relacionada con ia temperatura de !a siguiente manera:
T(OF) u
i
40
pies2/s) I
50
1.66
1.41
60 1.22
70 1.06
80 0.93
Grafíquense estos datos y utilícese interpolación para predecir u en
T = 62'F.
12.27 Repítase el problema 12.26 usandoregresión 12.28 Léanse todos los casos del capítulo 12. C o n base a la lectura y a la experiencia, elabórense los propios casos de cualquiwa de fos campos de la ingeniería. Esto puede involucrar la modificación o la reexpresión de los casos. Sin embargo, también pueden ser totalmente originales. Como los ejemplos del capítulo, se deben y debe demostrarse el elaborar con u n enfoque a losproblemasdeingeniería uso de los métodos numéricos para ajustar curvas. Escríbanse los resultados usando los casos delcapítulo como modelos.
EPíLOGO: PARTE IV
IV.4 ELEMENTOS DE JUICIO En el cuadro IV.4 se proporciona un resumen de los elementos de juicio relacionados con el ajuste de curvas. Los métodos se dividen en dos amplias categorías dependiendode la incertidumbre delos datos. Para las mediciones imprecisas, se usa la regresión para desarrollar la "mejor" curva que ajuste todas las tendencias de los datos sin pasar necesariamente a través de algún punto. Para mediciones precisas, se usa la interpolación para desarrollar una curva que pase directamente a través de cada uno de los puntos. Todos los métodos de regresión se diseñan de manera que ajusten funciones que minimicen la suma de los cuadrados de los residuos entrelos datos y la función. A estos métodos se les conoce como regresión con mínimos cuadrados. La regresión con mínimos cuadrados lineal se usa en aquellos casos en donde una variable dependiente y otra independiente se relacionan de manera lineal. Para situaciones en que las variables dependiente e independiente muestren una relación curvilínea, se dispone de varias alternativas. En algunos casos, se pueden usar transformacionespara linealizar la relación. En estos casos se puede aplicar la regresión lineal a variables transformadas para determinar la mejor línearecta. Alternativamente, se puede emplear la regresión polinomial y ajustar una curva directamente a los datos. La regresión linealmúltiple se usa cuando una variable dependiente es una función de dos o más variables independientes. Se pueden aplicar también transformaciones logaritmicasa este tipo de regresión en algunos casos donde la dependencia múltiple es curvilínea. La interpolación polinomial esta diseñada para ajustar un polinomio Único de n-ésimo orden que 1 puntos exactos. pase exactamente por los n Este polinomio se presenta en dos formatos diferentes. El polinomio de interpolación de diferencias divididas de Newton se adapta idealmente a
+
410
MÉTODOS
+
O
Q
7
P
O
0
a
,
7
P
a 0
C
NUMÉRICOS
PARA INGENIEROS
41 1
EPíLOGO PARTE IV
aquellos casos en que el orden propio del polinomio se desconoce. El polinomio de Newton es apropiado para tales situaciones ya que se programa fácilmente enun formato que compara los resultados con órdenes diferentes. Además, se puede incorporar con facilidad una aproximación del error en el método. De esta forma, se puede comparar y escoger a partir de los resultados usando varios polinomios de órdenes diferentes. La otra formulación alternativa esel polinomio de interpolación de Lagrange el cual es apropiado cuando el orden se conoce a priori. En estos casos, la versión de Lagrange es algo más simple de programar y no requiere de los cálculos y almacenamiento de diferencias divididas finitas.
El método final deajuste de curvas es mediante interpolación segmentaria. Este método ajusta un polinomio de orden bajo a cada uno de los intervalos entre los puntos. El ajuste se hace uniforme obligando a que las derivadas de dos polinomios adyacentes en el mismo valor de su punto de conexión sean iguales. La interpolación cúbica segmentaria es la versión más común. Los segmentos son muy útiles cuando se ajustan datos que en general son uniformes pero exhiben áreas locales de saltos de los datos. Tales datos tienden a inducir oscilaciones en los polinomios de interpolación de orden superior. La interpolación cúbica segmentaria está menos propensa a estas oscilaciones ya que se limita a variaciones de tercer orden.
IV. 5 RELACIONES Y FóRMULAS IMPORTANTES En el cuadro IV.5 se resume la información de mayor importancia que se presenta en la parte IV. El cuadro se puede consultar para tener una referencia rápida de las relaciones y fórmulas de importancia.
IV.6 MÉTODOS AVANZADOS Y ALGUNAS REFERENCIAS ADICIONALES Aunque se han repasado una gran cantidad de métodos de ajuste de curvas, aún existen otros métodos que tienen mucha utilidad en la práctica de la ingeniería. Por ejemplo, los polinomios ortogonales se pueden emplear enel desarrollo de un método alternativo para la regresión polinomial. Esta técnica tiene mucha utilidad ya que no es susceptible al mal condicionamiento cuando se deben ajustar polinomios de orden superior. La información sobre polinomios ortogonales se encuentra en Shampine y Allen ( 1 973) y en Guest ( 1 961). Existe una gran variedad de métodos que desarrollan directamente el Gjuste con mínimos cuadrados de una ecuación no lineal. Estas téc-
METODOS
41 2
rl i , L v)
@
x"
F
4
I v *
I
x
v
h
h
j¿
F
I
I
*
-x
It
11
v
h
x"
II
NUMERICOS PARA INGENIEROS
h
x"
oc" boc"
N
L.
x
v
h
x" I
/I
413
EPlLOGO PARTE IV
nicas de regresión no lineal incluyen al método de Gauss-Newton, método de Marquardt’s y mcitodos de pasos descendentes. La información sobre estos métodos y de regresión en general se encuentran en Draper y Smith (1981). Todos los métodos de la parte IV se han expresado en términos del ajuste de una curva a un conjunto de puntos. Pero se puede ajustar una curva a otra curva. La motivación principal de tal aproximación funcional es la de representar una funcióncomplicada a una más simple que sea más fácil de manejar. Una manera de hacerlo es la de usar función complicada para enerar una tabla de valores. Después se pueden usar cualquiera de as técnicas analizadas en este libro para ajustar polinomios a esos valores discretos.
B
Más allá de este planteamiento, existe una variedad de métodos alternativos, y en general, preferibles en la aproximación funcional. Por ejemplo, si la función es continua y diferenciable, se puede ajustar a una serie de Taylor truncada. Sin embargo, esta estrategia se desecha ya que el error aumenta a medida que se ale’a del punto base Por lo tanto, se puede tener una buena predicción del intervalo y una mala aproximación para un Un enfoque alterno se basa en el principio de minimax (recuérdese 1 0 . 2 ~ )Este . principio especifica que los coeficientes del polinomio de aproximación se escogen de tal forma que la discrepancia máxima sea tan pequeña como sea posible. Por lo tanto, aun ue la aproximación no puede ser tan buena como la obtenida con a expansión de la serie de Taylor en el punto base, generalmente, es mejor a travésde todo el dominio delajuste. l a economización de Chebyshev es un ejemplo del acercamiento de una aproximación funcional basada en esta estrategia (Ralstony Rabinowitz, 1978; Gerald y Wheatley, 1984 y Carnahan, Luther y Wilkes, 1969). la Fig.
4
Un método final de aproximación funcional es la de usar funciones trigonométricas. La transformada ru ida de Fourier es un ejemplo de este enfoque y es ampliamente usa o en la ingeniería práctica (Bri ham, 1974; Davis y Rabinowitz, 1975 y Gerald y Wheatley, 19847.
B
En resumen, lo antes mencionado tiene la finalidad de proporcionar al lector senderos de exploración más profundos sobre la materia. Además, todas las referencias anteriores proporcionan descripciones de las técnicas básicas cubiertas en la parte IV. Se sugiere al lector que consulte estas fuentes alternativaspara profundizar en el conocimiento de los métodos numéricos sobre elajuste de curvas.* * Aquí se hace referencia a los libros únicamente por autor; se encuentra una bibliografía cornpleta al final del libro.
416
MÉTODOS
FIGURA V.l
NUM&lCOS PARA INGENIEROS
Representación gráfica de la integral de {(x) entre los límites x 3 a y Lo integral es equivalente al área baio la curva.
b.
2.
Una función complicada y continua que es difícil o imposible de integrar directamente.
3.
Una función tabulada en donde los valores de x y f (x) se dan en un conjunto de puntos discretos, como esel caso, a menudo, de los datos experimentales.
En el primer caso, la integral simplemente es una función que se puede evaluar fácilmente usando métodos analiticos aprendidos en el cálculo. En los dos últimos casos, sin embargo, se deben emplear métodos aproximados. Un planteamiento lógico es el de graficar la función sobre una malla (Fig. V.2) y contar el número de cuadros que aproximan el área. Este número multiplicado por el área de cada uno de ellos da una estimación aproximada del área total baio la curva. Esta estimación puede meiorar a costa de un mayor esfuerzo, usando una malla más fina. Otro planteamiento con sentido común es el de dividir el área en segmentos verticales, o bandas, con una altura igual al valor de la función enel punto medio de cada banda (Fig. V.3). El área de los rectángulos se puede entonces calcular y sumar para estimar el área total. En este planteamiento, se supone que el valor de los puntos medios proporciona una aproximación válida de la altura promedio de
41 7
lNTEGRACl6N
FIGURA V.2
FIGURA V.3
"X
..
--
Uso de una malla para aproximar una integral.
Uso de rectángulos,
O
bandas para aproximar la integral.
41 8
MÉTODOSNUMÉRICOS
P A R A INGENIEROS
la función de cada banda. Comocon el método de mallas, es posible obtener una estimación, mejor usando más (y más delgadas) bandas para aproximar la integral. Aunque estos esquemas simples tienen utilidad para estimaciones rápidas, se dispone de métodos alternativos llamados integración numérica o cuadratura gaussiana para los mismos propósitos. Estos métodos, que son más fáciles de implementar que la técnica de ma-
FIGURA v.4
Aplicaciónde un método numérico de integración a) función continua complicada; bJ tabla de valores discretos de f(x) generados de la función, y c) USO de un método numérico (el método de bandas) para aproximar la integral en base a los puntos discretos. Para una función tabular, 10s datos se encuentran en forma tabular en b); por lo tanto el paso 0 ) es innecesario.
419
lNTEGRACl6N
las, son similares en esencia al método de bandas. Esto es, las alturas de la función se multiplican por el ancho de las bandas y se suman para calcular la integral. Sin embargo, con el uso de la alternativa más inteligente de factores de peso, la estimación resultante puede ser más exacta que la obtenida con el "método de bandas" simple. Como en el método simple de bandas, los métodos de integración numérica utilizan datos en puntos discretos. Ya que la información tabulada ya se encuentra en esta forma, es naturalmente compatible con muchos métodos de integración numérica. Aunque las funciones continuas no están originalmente en forma discreta, en general una proposición simplees la de usar la ecuación dada para generar una tabla de valores. Como se muestra en la figura V.4, esta tabla se emplea en el cálculo de la integración numérica.
V.1.2 Integración numérica e ingeniería práctica La integración de unafunción tiene tantasaplicaciones en la ingeniería que probablemente al lector se le enseñe el cálculo integral en el primer año de la facultad. Pueden darse muchos ejemplos específicos de sus aplicaciones en todos los campos de la ingeniería. Uno de ellos es el uso de la integración para determinar la media de una función continua. En la parte IV se introdujo el concepto de media de npuntosdiscretos [recuérdese la Ec. (lV.1)J:
.iy;
Media = L n
N21
en donde y son medidas individuales. La determinación de la media de puntos discretos se muestra en la figura V S a . En contraste, supóngase que y es una función continua de una variable independiente x, como se muestra en la figura VSb. En este caso, existe un número infinito de valores entre a y b. Así como se puede aplicar la ecuación (V.2) para determinar la media de una lecturadiscreta, también se puede estar interesado en calcular la media o promedio de una función continua y = f (x) en el intervalo de a a b. Se usa la integración para este propósito, tal como se especifica en la fórmula:
420
MÉTODOS
FIGURA V.5
Ilustración de la mediaa) caso discreto,
b) caso
NUM6RICOS PARA INGENIEROS
continuo.
Esta fórmula tiene cientos de aplicaciones en la ingeniería. Por ejemplo, se usa para calcular el centro de gravedad de objetos irregulares en ingeniería mecánica y civil y para determinar la corriente RMS en ingeniería eléctrica. Las integrales las emplean los ingenieros también para evaluar la cantidad total o para cuantificar una variable física dada. La integral se o un volumen. Por ejemplo, puede evaluar sobre una línea, una área la cantidad total de masa de sustancias químicas que contiene un reactor está dada como el producto de la concentración de sustancias químicas y el volumen del reactor, o sea M a s a = concentración X volumen en donde la concentración tiene unidades de masa por volumen. Sin embargo, supóngase que la concentración varia de posición a posición dentro del reactor. En este caso, es necesario sumar los productos de concentración local c y sus volúmenes elementales correspondientes (AVi):
INTEGRAC16N
42 1 n
c;AV,
Masa = i= 1
en donde n es el número de volúmenes discretos. En este caso continuo, en donde c (x,y,z,) es una función conocida y x, y y z son variala posición, en coordenadas bles independientes quedenotan cartesianas, la integración se puede usar para el mismo propósito: Masa =
Masa =
111 111
c(x, y, z)
dx dy dz
c ( V ) dV
V
a la cual se le conoce como integral de volumen. Nótese la fuerte analogía entre la sumatoria y la integración.
Se pueden dar ejemplos similares para los otros campos de la ingeniería. Por ejemplo, el promedio total de transferencia de energía a través de un plano en donde el fluio (en calorías por centímetro cuadrado por segundo) es una función de la posición dada por Transferencia de calor =
JJ
fluio dA
A
A la cual se le conoce como integral de superficie endonde A = área. De manera similar, para el caso unidimensional, el peso total de una varilla con densidad variable está dada por w =
A
lo’
p(x) dx
en donde w es el peso total (en libras), I es la longitud de la varilla (en pies), p ( x ) es la densidad conocida (en libras por pie cúbico) en función de la longitud x (en pies) y A es el área transversal de la varilla (en pies cuadrados). Finalmente, las integrales se usan para la evaluación de ecuaciones promedio. Supóngase que la velocidad de una partícula es una función cococida continua del tiempo v (t). La distancia total d recorrida por esta partícula en un tiempo dado t está dada por
d=
v(t) dt
rv.41
Estos son sólo algunos ejemplos de las aplicaciones de las integrales que se pueden encontrar regularmente en el desarrollo de la profe-
422
MÉTODOS
NUMERICOS PARA INGENIEROS
sión. Cuando las funciones a integrar sonsimples, normalmente se integran analíticamente. Por ejemplo, en el problema del paracaidista, se determinó la velocidad en función del tiempo (Ec. (1.8)]. Esta relación se puede sustituir en la ecuación (V.4), la cuál se integra fácilmente y de esta manera se determina que tan rápido cae el paracaidista enun periodo detiempo t. En este caso, simplemente se evalúa la integral. Sin embargo, es dificil o imposible cuando la función se complica, como es el caso para ejemplos más comunes. Además, la función en cuestión a menudo se desconoce y se define únicamente con medidas en puntos discretos. En ambos casos,se debe tener la suficiente habilidad como para obtener valores aproximados a las integrales usando métodos numéricos. Algunosde estos métodos se analizan en esta parte del libro.
v.2 FUNDAMENTOS MATEMÁTICOS En la preparatoriao en los primeros años de la facultad, se ven introducciones al c6lculo integral. Se aprenden técnicas que obtienen soluciones analíticas o soluciones exactasde integrales definidas e indefinidas. En la parte VI se analiza la integración indefinida, que involucra en primer lugar la determinación de una función cuya derivada está dada. En esta parte del libro se desarrolla la integraci6n definida, que se ocupa de determinar una integral entre un par de límites específicos, como en
I=
1."
f ( xd) x
~ 5 1
De acuerdo al teorema fundamental del cálculo integral, la ecuación (V.5) se evalúa como
lab
f ( x ) ¿x = F(x)
1:
en donde F (x) es la integral de f (x), esto es, cualquier función tal que F' ( x ) = f (x). La nomenclatura sobre el lado derecho queda
1
b
F(x)
= F(6) - F(a)
[W
O
r8
Un ejemplo de una integral definida es
I=
(0.2+ 25x - 200x2 + 675x3 - 900x4 + 400x5) dx
[V.7]
En este caso, la función es un simple polinomio quese puede integrar analíticamente evaluando cada uno delos términos de acuerdo a la regla
423
INTEGRACldN xnt~
Jab
b
x" dx = n + l a
en donde n no puede ser igual a - 1 . Aplicando esta regla a cada uno de los términos en la ecuación (V.7) se obtiene
200
+ 1 6 8 . 7 5 ~-~1 8 0 +~ 400 -X' ~
I = 0 . 2 ~+ 1 2 . 5 ~- ~-x3 3
1
O'*
Io
que se puede evaluar de acuerdo a la ecuación (V.6) como I = 1.640 533 34. Este valor es igual al área bajo el polinomio original [Ec. (V.7)] entre x = O y x =0.8. La integración anterior depende del conocimiento de la regla expresada por la ecuación (V.8). Otras funciones permiten reglas diferentes. Todas estas "reglas" son meros ejemplos de antidiferenciación, esto CUADRO V. 1
Algunas integrales simples usadas enla parte V. La a y la b en este cuadro son constantes y no se deben confundir con los límites de integracibn discutidoselen texto. judv=uv-jvdu ""+l
lu"du=-n + 1 ubxdx =
j$=
+c
nf-1
bx
U +c b In a
In 1x1+
j e o x d x = -eU+
Ox
j x e a x d x = 7e( u x Ox
U
U > O , U f l
c
C 1)
+C
424
MÉTODOS NUMÉRICOS PARA INGENIEROS
es, encontrando f (x) de tal manera que F’ ( x ) = f (x). Por consiguiente, la integración analítica depende del conocimiento previo de la respuesta. Este conocimiento se adquiere por experiencia. Muchas de estas reglas se resumen en manuales y en tablas de integrales. En el cuadro V.l se listan algunas de las integrales más comúnmente usadas. Sin embargo, muchas funciones de importancia prácticason demasiado complicadas para incluirlas en tales tablas. Una razón por la que las técnicas de esta parte del libro son tan valiosas, es porque proporcionan un medio de evaluarrelaciones tales como la ecuación (V.7) sin conocimiento de las reglas.
v.3 Antes de continuar con los métodos numéricos de integración, puede ser de utilidad información adicional. Las siguientes secciones están enfocadas a dar un bosquejo del material analizado en la parte V. Además, se han formulado algunos objetivos que ayudarán al aprendizaje cuando se estudie este material.
V.3.1
Alcances y avances
La figura V.6 proporciona un panorama de la parteV. En el capitulo 73 se desarrolla el planteamiento más común de la integración numérica: las fórmulas de Newton-Cotes. Estas relaciones se basan en el reemplazo de una función complicada o de un conjunto de datos en forma tabular a polinomios simples que son fáciles de integrar. Se analizan en detalle tres de las fórmulas más ampliamente usadas de Newton-Cotes: la regla trapezoidal,la regla 713 de Simpson y la regla 318 de Sirnpson. Todas estas fórmulas están proyectadas para casos en donde los datos a integrarse están igualmente espaciados. Además, se incluye un análisis de la integración numérica de datos que no están igualmenté espaciados. Este es un tema muy importante ya que muchas aplicaciones del mundorealmaneian datos de esta manera. Todo el material siguiente trata sobre la integración cerrada, en donde se conocen los puntos finales de los límites de integración. AI final del capítulo 13, se presentan las fórmulas de integración abiertas, en donde los límites de integración se extienden más allá del rango de los datos conocidos. Aunque no se usan comúnmente en la integración definida, se presentan aquí las fórmulas de integración abierta porque se usan extensamente en la solución de ecuaciones diferenciales ordinarias de la parte VI.
INTEGRACldN
FIGURA V.6
425
Esquema de la organización del material de la parte
V: Integración numérica.
Las formulaciones estudiadas en el capítulo 13 se pueden emplear en el análisis de funciones tabulares y continuas. En el capitulo 14 se analizan dos métodos diseñados expresamente para integrar funciones continuas: integraciónde Romberg y cuadratura gaussiana. También se proporcionan algoritmos para estos dos métodos.
El capitulo 75 demuestra como los métodos se pueden aplicar a lasolución deproblemas. Como con el resto de las partes del libro, se mencionan casos de todos los campos de la ingeniería.
426
METODOS NUMÉRICOS
PARA INGENIEROS
Se incluye una sección de repaso o epilog0 al final de la parte V. Este repaso incluye un análisis de los elementos de juicio incluidos en la implementación de los métodos en la ingeniería práctica. Además, se resumen las fórmulas y conceptos más importantes relacionados con los métodos numéricos de integración. Finalmente, se hace un repaso breve de los metodos avanzados y algunas referencias adicionales que facilitarán estudios posteriores sobre integración numérica. Se proporcionan varias opciones para efectuar el cálculo por computadora de cálculo. En primer lugar, el paquete de programas NUMERICOMP contiene la regla trapezoidal a usarse sobre una base opcional en las microcomputadoras APPLE II e IBM-PC. Alternativamente, semuestran directamenteen eltexto programas en los lenguajes FORTRAN y BASIC de la reglatrapezoidal. Esto le da oportunidad al lector de copiar estos programas e implementarlo sobre una microcomputadora o en una supercomputadora. Se suministran diagramas de fluio para la mayor parte de los otros métodos descritos enel texto. Estos diagramas de flujo, combinados con los programasescritos por ellectoren cualquierlenguaje, proporcionan programas que pueden aplicarsea un conjunto de problemas de ingeniería.
V.3.2
Metas y objetivos
Objetivos de estudio. Después de terminar la parte V, el lector debe ser capaz de resolver muchos problemas de integración numérica y apreciar su aplicación en la solución de problemas de ingeniería. Se debe hacer lo posible por dominar varias técnicas y valorar su confiabilidad. Debe entender los elementos de juicio involucrados en la selección del "mejor" método (o métodos) para cualquier problema en particular. Además de estos objetivos generales, se deben asimilar y dominar los conceptos específicos listados en el cuadro V.2 Objetivos de cómputo. El lector debe tener un paquete de programas, programas simples para la computadora, algoritmos y diagramas de flujo que implementen las técnicas analizadas en la parte V. Todas ellas tienen utilidad como herramientas de aprendizaje.
El paquete personal de programas NUMERICOMPes legible al usuario. Emplea la regla trapezoidal para evaluar la integral de funciones tabulares o continuas. Las gráficas asociadas con estos programas habilitarán al lector a visualizar fácilmente los problemas y las operaciones matemáticas asociadas como el área entre la curva y eleje x. Este paquete de programas es muy fácil de aplicar en la solución de problemas prácticos y se puede usar en la prueba de resultados de cualquier programa de computadora que el lector pueda desarrollar por sí mismo.
427
INTEGRACldN
CUADRO V.2
Objetivos de estudios especificos de la parte V
l.
Entender la derivación de las fórmulas de Newton-Cotes; saber cómo derivar la regla trapezoidal y cómo derivar los dos casos de la regla deSimpson; reconocer que la regla trapezoidal, la regla 1/3 y la regla 3/8 de Simpson representan las areas baio polinomios de primero, segundo y tercer orden, respectivamente.
2. Conocer las fórmulas y las ecuaciones de error para a) La regla trapezoidal
b) La regla trapezoidal de segmentos múltiples. c) La regla 1/3 de Simpson d) La regla 3/8 de Simpson
e) La regla de Simpson de segmentosmúltiples. Ser capaz de escoger la "meior" de estas fórmulas para cualquier problema en particular.
3. Reconocer que la regla 1/3 de Simpson es exacta hasta cuarto orden aun cuando está basada en sólo tres puntos; darse cuenta que todas las fórmulas de NewtonCotes de segmentos par y punto impar tienen exactitud similar.
4. Saber cómo evaluar la integral de datos desigualmente espaciados.
5. Reconocer la diferencia entre fórmulas de integración abiertas y cerradas. 6. Entender las bases teóricas de la extrapoloción de Richardson y cómo se aplica al algoritmo de integración de Romberg.
7. Entender la diferencia fundamental entre las fórmulas de Newton-Cotes y la cuadratura gaussiana.
8. Reconocer por qué la integración de Romberg y la cuadratura gaussiana tienen
utilidad en la integración de funciones continuas (opuesta a la forma tabular).
Alternativamente, se proporcionan directamente en el texto los programas de la regla trapezoidal en los lenguajes FORTRAN y BASIC. Además, se proporcionan los algoritmos generales y diagramas de fluio de la mayor parte de los métodos de la parte V. Esta información le permite al lector aumentar la biblioteca de programas de tal manera que incluya métodos más a116 de la re la trapezoidal. Por ejemplo, sería útil, desde un punto de vista pro esional, desarrollar programas que manejen datos que no estén igualmente espaciados. Se pueden desarrollar también programas sobre la regla de Simpson, la integración de Romberg y la cuadratura gaussiana, que, en general, son más eficientes y exactos que la regla trapezoidal.
3
CAPíTULO T R E C E FóRMULAS DE INTEGRACIóN DE NEWTON-COTES
Las fórmulas de integración de Newton-Cotesson los esquemas más comunesdentrodelaintegraciónnumérica. Se basanenlaestrategiade reemplazar una función complicada o un conjunto de datos tabulares con algunafunciónaproximadaqueseamásfácildeintegrar: [13.1]
endonde j,(x) es un polinomio de la forma: fn(x)= aa + al
FIGURA 13.1
+ . . . + a,-l xn-l + a,
x"
Estimación de una integral mediante el área baio a) una línea recta, y parábola.
b) una
430
MÉTODOS
FIGURA 13.2
NUMERICOS PARA INGENIEROS
Aproximación de la integral mediante el área baio tressegmentos de línea recta.
en donde n es el orden del polinomio. Por ejemplo, en la figura 13.la,se usaunpolinomio de primer orden (una línea recta) como aproximación. En la figura 13.lb se emplea una parábola para el mismo propósito. Laintegral se puede aproximar usando una serie de polinomios aplicados por partes a la función o a los datos sobre intervalos de longitud constante. Por ejemplo, en la figura 13.2,se usan tres segmentos de línea recta para aproximar la integral. Se pueden usar polinomiosde mayor grado para este mismo propósito. Con estos fundamentos ahora
FIGURA 13.3
Diferencia entre fórmulas de integración a) cerradas y b) abiertas.
~.~ ..__I___ .
FORMULACldN DE INTEGRACldN DE NEWTON-COTES
43 1
se reconoce que el “método de bandas” de la figuraV.3 empleó una serie de polinomios de orden cero (esto es, constantes) para aproximar la integral. Se dispone de las formas abiertay cerrada de las fórmulas de NewtonCotes. Lasformas cerradas son aquéllas en donde los puntos al principio y al final de los límites de integración se conocen (Fig. 13.3~1). Las fórmulas abiertas tienen los límites de integración extendidos más allá del rango de los datos (Fig. 13.3b). En este sentido, se parecen a la extrapolación analizadaalfinaldelcapítulo 11. Las fórmulasabiertasdeNewtonCotes, engeneral,noseusanen la integración definida. Sin embargo, se usan extensamente en la solución de ecuaciones diferenciales ordinarias. En este capítulo se hace hincapié en las fórmulas cerradas. Sin embargo, el material de las fórmulas abiertas de Newton-Cotes se introduce brevemente alfinaldelcapítulo.
13.1 REGLADEL TRAPECIO La regla del trapecio o regla trapezoidal es la primera de las fórmulas cerradas de Newton-Cotes. Corresponde al caso en donde el polinomio de laecuación (13.1) es deprimerorden.
Recuérdese del capítulo 11 que una línea recta se puede representar como (Ec. (11.2)]
[13.2] El área bajo la línea rectaes una aproximación de la integral def (x) entre loslímites a y b:
El resultado de la integración (véase el recuadro 13.1 para mayores detalles) es
[13.3]
alque se lellamareglatrapezoidal. Geométricamente, la regla trapezoidal es equivalente a aproximar el área del trapecio bajo la línea recta que une a f (a) y f (b) enlafigura 13.4. Recuérdesede la geometría de lafórmulaparacalcularelárea
432
INGENIEROS
RECUADRO 13.1
PARA
MÉTODOS
NUMERICOS
Derivación de la regla trapezoidal
Antes de integrar, la ecuación (13.2) se puede expresar como
Este resultado se puede evaluar, obteniendo
Agrupando los dos últimos términos se obtiene f(x) =
f (b). - f(a) X
Ahora,considerando
b-a
que b2
-
a2 =
(b - a) (b
+
a)
Multiplicando y agrupando términos se obtiene
que es la fGrmula de la regla trapezoidal que se puede integrar entre x = a y x = b y obtener
r = f (b)b --af (a)x* -2+
b f b ) - af (b)x b-a
1
a
de un trapecio es la altura por el promedio de las bases (Fig. 13.5~). En este caso, el concepto es el mismo pero el trapecio se encuentra sobre uno de sus lados (Fig. 13.56). Por lo tanto, la aproximación a la integral se puede representar como I =ancho promedio X altura
FIGURA 13.4
[13.4]
Esquema gráfico de la regla trapezoidal.
~
~~~
_ l _ l
433
FoRMlJLACl6N DE lNTEGKACl6N DE NEWTON-COTES
FIGURA 13.5
a) Fórmula para calcular el area de un trapecio: altura por el promedio de las bases. b) En la regla trapezoidal, el concepto es el mismo sólo que el trapecio está sobre uno de sus lados.
I = (b - a) x altura promedio
[13.5]
v
en donde, para la regla trapezoidal, la altura media es el promedio de los valores de la función en 10s puntos de los extremos, es decir (a) +f (W2. Todas las fórmulas cerradas de Newton-Cotes se pueden expresar en el formato general de la ecuación (13.5).De hecho, solo difieren con respecto a la formulación de la altura media.
13. l. 1
Error en laregla trapezoidal
Cuando se emplea la integral bajo un segmento delínea recta para aproximar la integral bajo una curva, obviamente que sejncurre en un error que puede ser sustancial (Fig. 13.6)Una estimación del error de truncamiento de una sola aplicación de la regla trapezoidal es (recuadro 13.2)
[13.6]
en donde E es un punto cualquiera dentro del intervalo de a a b. La ecuación (13.6) indica que si la función que se está integrando es lineal, la
434
METODOS NUMERICOS PARA INGENIEROS
FIGURA 13.6
Esquema gráfico al usar sólo una aplicación de la regla trapezoidal a r a aproximar la iqtegral de f(x) = 0.2 25 x - 200 x2 675 x 900 x4 400 x’ desde x = O hasta 08.
+
+
+
Y-
regla trapezoidal ser%exacta. De otra manera, ocurrir6 un error para funciones con derivadas de segundoy tercer orden (estoes, con curvatura).
RECUADRO 13.2 Obtención y estimacion de error de lareglatrapezoidalbasada polinomio de interpolación hacia adelante de Newton-Gregory. Una forma para obtener la regla trapezoidal es integrando elpolinomiodeinterpolaciónhaciaadelantedeNewtonGregory. Recuérdese que para laversióndeprimer ordencontérminode error, laintegralsería(recuadro 11.2)
para simplificar
el analisis, tomandoen
a = (x - a ) /
h,
en la integración del
a O y 1, respectivamente. Por lo tanto, la ecuación (813.2.1) se puede expresar como
1= b
lo1[f
(a) + Af (a) a
[,B13.2.11 Se suponequepara h pequeña, eltérmino f’ ’([) es que aproximadamente constante, la ecuación se puede integrar:
dx = h da Debido a que h = b - a (para la regla trapezoidal de un segmento), los límitesdeintegración. a y b. corresponden
y evaluarse como
435
FORMULAC16N DE lNTEGRACl6N DE NEWTON-COTES
*Y)]
1 = h f(a) + - - , , f ” ( 8 h 3
[
Debido a que A f (u) = f (b)-f (u),el resultado se puede escribir como
ReglatrapezoidalErrordetruncamiento Por lo tanto, el primer término es el de la regla trapezoidal y el segundo es unaestimacióndel error.
EJEMPLO 13.1 Aplicación de la regla trapezoidal
simple
Enunciado del problema: utilícese la ecuación (13.3) para integrar numéricamente f(x) = 0.2
+2
5~ 2 0 0 ~ ‘+ 6 7 5 ~~ 9 0 0+ ~4 ~00~~
desde a = O hasta b = 0.8. Recuérdese de la sección V.2 que el valor exacto de laintegral se puededeterminaranalíticamente como 1.640 533 34. Soluci6n: los valores de lafunción
f ( 0 ) = 0.2 f(0.8) = 0.232 se pueden sustituirenla I = 0.8
0.2
ecuación (13.3) y obtener
+ 0.232 = 0.1 728 2
que representa un error de
E, = 1.640 533 34
-
0.1 728
=
1.467 733 34
que corresponde a un error relativo porcentual de E , = 89.5 % . La razón para este error tan grande es evidente en la gráfica de la figura 13.6. Nótese que el área bajo la línea recta descuida una porción significativa de la integral sobre la línea. En la situación actual, no se tendría conocimiento previo del valor verdadero. Por lo tanto, se requiere una aproximación al error. Para obtener esta aproximación, se calcula la segunda derivada dela función sobre el intervalo, derivando lafunciónoriginaldos veces para dar
f’ ’(X)
=
-400
+
4 0 5 0 ~- 10 8 0 0 ~ ’ + 8 OOOx3
elvalor promedio de la segunda derivada puede ser calculada usando la ecuación V . 3
436
MÉTODOS
NUMÉRICOS
PARA INGENIEROS
4050~ - 10 8002 + 8 OOOx9dx - -60 0.8 - O que se puede sustituirenla ecuación (13.6) y obtener
(-400
f,=
E,
+
1 -= (-60)(0.8)3 = 2.56 1L
que es del mismo orden de magnitud y signo que tiene el error verdadero. Existe una discrepancia debido a que en un intervalo de este tamaño, el promedio de la segunda derivada no es necesariamente una aproximación exacta de f ’ ’ (E). Por lo tanto, se denota que elerroresaproximado usando la notación E,, envez deusar E,.
13.1.2
La regla deltrapecio
usando segmentos multiples
Una manera de mejorarla exactitud de la regla trapezoidales la de dividir el intervalo de integración de a a b en un conjunto de segmentos y aplicar el método a cada unode los segmentos (Fig. 13.7). En seguida se suman las áreas de los segmentos individuales y se obtiene la integral sobre el intervalo completo. A las ecuaciones resultantes se les conoce como fórmulas de integración de segmento múltiple o fórmulas de integración compuestas. En la figura 13.8 se muestra el formato generaly la nomenclatura que se usará en la caracterización de integrales de segmentos múltiples. Hay n + 1 puntos base igualmente espaciados (xo,xl, x2,. . . , x,), Por consiguiente, hay n segmentos de igual anchura: h = -b - a n
[13.7]
Si a y b se igualan a x. y a x,, respectivamente, la integral total se representa como
I
= l:f(x)dx
+ [f(x)dx +
Sustituyendo la regla trapezoidal para cada una de las integrales, se obtiene
[13.8] o, agrupandotérminos [13.9]
437
FORMULACIóN DE INTEGRACIóN DE NEWTON-COTES
FIGURA 13.7
~~~
~
-.
Ilustración de la regla trapezoidal múltiple o) dos segmentos; mentos: c) cuatro segmentos y d) cinco segmentos.
-
b) tres seg-
438
METODOS NUM~RICOS PARA INGENIEROS -
FIGURA 13.8
Formato general de la nomenclatura para integralesde
segmentos múltiples.
o, usando la ecuación (13.7)para expresar la ecuación (13.9)en la forma generaí de la ecuación (13.5),se obtiene
I
[13.10]
+<
Ancho
Altura promedio
Ya que la sumatoria de los coeficientes de f (x) en el numerador dividido por 2 n es igual a 1, la altura promedio representa un promedio pesado de los valores de la función. De acuerdo a la ecuación (13.lo),las alturas de los puntos interiores aparecen doblemente respecto a los puntos finales f (xg) y f (x,,).
439
FORMULAC16N DE INTEGRAC16N DE NEWTON-COTES
El error en la regla trapezoidal múltiple se obtiene sumando los erroresindividualesde cada uno de los segmentos, dando [13.11]
en donde f’ ’ (ti) es la segunda derivada de la función evaluada en el punto tilocalizado dentro del segmento ¡. Este resultado se simplifica calculando la media o el valor promedio de la segunda derivada sobre el intervalo completo [Ec. (V.2)]: n
J
[13.12]
n
Por lo tanto, C f’ ’
(ti)=
n f’ ’ y la ecuación (13.11) se reescribe como
[13.13]
De manera que, si el número de segmentos se duplica, el error de truncamientodisminuyea un cuarto de suvalor.Nótesequelaecuación (13.13) es un error aproximado debido a la naturaleza aproximada de la ecuación (13.12).
EJEMPLO 13.2 Regla trapezoidal de segmentos múltiples
Enunciado del problema: utilícese la regla trapezoidal de dos segmentos para calcular laintegralde
+ 25x - 200x2 + 675x3 - 900x4 + 400x5
!(x) = 0.2
desde a = O hasta b = 0.8. Empléese la ecuación (13.13) para calcular el error. Recuérdese de la sección V.2 que el valor correcto de la integral es 1.640 533 34. Solución: n
=
2 (h = 0.4):
f(0) = 0.2 f(0.4) = 2.456
f(0.8) = 0.232 I = 0.8
0.2
+ Z(2.456) + 0.232 4
=
1.068 8
METODOS
440
E,
~
=
E, = I
1.640 533 34 -
12(2)2
(-60)
-
=
1.068 8
=
NUMERICOS PARA INGENIEROS
0.571 73
E, =
34.9%
0.64
en donde -60 es el promedio de la segunda derivada determinada previamente enel ejemplo 13.1. ~
~
~
~~~
~~
~~
.~ ~~
En el cuadro 13.1 se resumen los resultados delejemplo anterior junto con la aplicación de la regla trapezoidal usando desde tres hasta diez segmentos. Nóteseque elerrordisminuye a medidaqueelnúmero de segmentos crece. Sin embargo, también se nota que el promedio de disminución es gradual. Esto se debe que el error es inversamente proporcional al cuadrado de n [Ec. (13.13)]Por lo tanto, si se duplica el número de segmentos el error disminuyea un cuarto de su valor. En secciones posteriores se desarrollan fórmulas de orden superior que son más exactas y que convergen más rápidamente a la integral real a medida que el númerode segmentos crece. Sin embargo, antesdeinvestigarestas fórmulas, primero se analiza un programadecomputadoraqueimplemente lareglatrapezoidal.
13.1.3 Programa de computadora sobre lareglatrapezoidal segmentosmúltiples
de
Enlafigura 13.9 se muestra un pequeño programa que implementa la regla trapezoidal. Este programa tiene algunos inconvenientes. Primero, está limitado a que los datos estén en forma tabular. Un programa general debe tener la capacidad de evaluar también funciones conocidas. Además, el programa no es legibleal usuario, está diseñado estrictamente para CUA,DRO 13.1
Resultadode la regla trapezoidalde segmentos múltiples para calcular la integral de
-
-
f(x) 0.2 + 2 5 ~2 0 0 + ~ 6~7 5 ~9~0 0 ~ ~ + 400x5de x O hasta 0.8. el valor exacto es 1.640 533 34 n
h
I
t, 9 0
2 3 4 5 6 7 8 9 10
0.4 0.266 7 0.2 0.16 0.133 3 0.1 14 3 o. 1 0.088 9 0.08
1.O68 51.369 1.484 8 1.539 9 1.570 3 1.588 7 1.600 8 1.609 1 1.615 O
34.9 16.5 9.5 6.1 4.3 3.2 2.4 1.9 1.6
FORMULACldN DE INTEGRACldN DE NEWTON-COTES
BASIC
FORTRAN
1
2
3 170
4
44 1
DIMENSION F ( 2 0 ) , Y < 2 0 5 WEAL I N COMMON N, A , B READ< 5 , 1 >N FORMUT/HI DO 170 I = l , N READ( 5,3 ) Y ( I j FURMAT CONTINUE CALL TRAPIW FORMAT<' ',F10,3> STOP END
DIM F (.2lS.l,Y(21)) I NPIJT N N I r N - 1 INPUT A , B H = (B - A ) / NIFOR I = 1 T O N L'NPIJT Y ( I j NEXT I
GOSUB 1 O00 PRINT IN END
N
= númerodepuntos NI = númerodesegmentos A , Bintegracibn = límites de H = anchodelsegmento
Y = valor de la variable dependiente
SUBROUTINE TRAP DO 1 0 3 0 I r 2 , N I SlI=SU+2*YC I > 1030 CONTINUE HT= / ( 2*NI Z I N = < B-A M H T RETURN END
FIGURA 13.9
(Subrutina para calcular la regla trapezoidal)
Programa de la regla trapezoidal con segmentos múltiples para datos tabulados.
imprimir Gnicamentela respuesta. En el problema 13.21 se enfrenta la tarea de facilitar el uso y la comprensión de este programa. También se tiene la oportunidad de modificar el programa de tal manera que sea capaz de evaluar la integral de funciones conocidas. El paquete suplementario de programas NUMERICOMP que acompaña a este texto incluye un ejemplo de un programa legible al usuario implementando la regla trapezoidal. Este paquete evalúa las integrales de datos tabulares o de funciones definidas por el usuario. En el siguiente ejemplo se demuestra su utilidad en la evaluación de integrales. También proporciona una buena referencia'para valorar y probar los programas del usuario.
EJEMPLO 13.3 Evaluación de integrales con la computadora
Enunciado del problema: el paquete de programas NUMERICOMP asociado con este texto contiene un programa para computadora implemen-
442
METODOS NUMERICOS PARA INGENIEROS
tando lareglatrapezoidaldesegmentosmúltiples. Estos programas se pueden usar para resolverun problema asociado con el problema delparacaidista. Como se recordar6 del ejemplo l.l , la velocidad del paracaidista est6 dada como la siguiente función del tiempo:
[E13.3.1] en donde u es la velocidad en centímetros porsegundo, g es la constante de aceleración gravitacional igual a 980 cm/s2, m es la masa del paracaidista igual a 68 100 g, y e es el coeficiente de fricción igual a 12 500 g / s . El modelo predice la velocidad del paracaidista en función deltiempo como se describe en el ejemplo 1.1. Una gráfica de la variación de la velocidad se desarrollaenel ejemplo 2.1. Supóngase que se desea conocer la distancia que ha recorrido el paracaidista después de cierto tiempoT.La distancia está dada por[ € c(V.4)] . d=
endonde
v ( t ) dt
d es la distancia en centímetros.Sustituyendo la ecuación
(E.13.3.1) y haciendo T
FIGURA 13.1O
=
10
S,
Pantallas de la computadora que muestran a) entrada de los parámetros de integración y los resultados de la integración y b) gráfica de la integral como el área baio la función y el eje x .
443
COTES FORMULAC16N DE DE INTEGRAC16N
Realizando la integración y sustituyendo los valores conocidos resulta
d = 28 943.5147 cm Este resultado exacto se puede usar en el análisis de eficiencia de la regla trapezoidal de segmentos múltiples. En la figura 10.130se muestra la pantalla de la computadora que pide los límites superior e inferior de integración y el tamaño de paso. Después de que los cálculos se terminan, se imprime la integral como 28 874.91. La integral es equivalente al área bajo u (t) y el eje t , como se muestra en la figura 13.10b. Una observación confirma que la integral es el ancho del intervalo (10,) por la altura promedio (alrededor de 2 900 cm/s). Se pueden probar fácilmente otros conjuntos de segmentos repitiendo los cálculos. Los resultados indicancomo la distancia de caída del paracaidista se aproxima al valor exacto a medida que el tamaño del segmento decrece: d, cm
Segmentos Tamaño Estimado del segmento
0.05
10 20 50 1 O0 200 500 1 O00 2 O00 5 O00 10 O00
1 .o 0.5 0.2 o.1
0.02 943.507 280.01 0.005 0.002 0.001
28 28 28 28 28 28
874.914 6 926.357 4 940.769 2 942.828 2 943.343 1 943.487 1 6 943.513 28 3 943.515 28 7 213 943.5159
E"% 0.237 0.059 3 9.49 x 10-3 2.37 x 10-3 5.93 x 10-4 9.52 x 10-5 2.44 x 4.65 x -3.63 x -4.32 x
Por lo tanto, con la reglatrapezoidalmúltiple se obtiene una exactitud excelente. Sin embargo, nótese cómo el error cambia el signo y empieza a crecer envalorabsolutomásalládel caso de 5 O00 segmentos. Esto se debe a la intrusión de errores de redondeo debido al gran número de cálculos para esta cantidadde segmentos. Por lo tanto, el nivel de precisión está limitado,y jamás se alcanza el resultadoexacto de 28 943.514 7 obtenido analíticamente. Esta limitación se analiza de manera detallada enel capitulo 14.
13.2 REGLA DE SIMPSON Además de aplicar la regla trapezoidal con segmentos cada vezmás finos, otra manera de obtener una estimación más exacta de una integral, es la de usar polinomios de orden superior para conectar los puntos. Por ejemplo, si hay un punto medio extra entref (a) y f (b), entonces se pue-
AA4
INGENIEROS MÉTODOS
NUMÉRICOS
PARA
den conectar los tres puntos con una parábola (Fig. 13.1 l a ) . Si hay dos puntos igualmente espaciados entref (a) y f (b), entonces los cuatro puntos se pueden conectar con un polinomio de tercer orden (Fig. 13. l l b ) . A las fórmulas resultantes de calcular la integral bajo estos polinomios se lesllama reglasde Simpson.
13.2.1
Regla de Simpson de 113
LaregladeSimpson de 1/3 resultacuandosesustituye de segundo orden enla ecuación (13.1): f(x) dx =
b
un polinomio
f&) dx
Si a y b se denomina como x. y x2,y f2 (x)se representa mediante un polinomio de Lagrange de segundo orden [Ec. (11.22)1,entonces la integral es: (x - x&. - x2) (x - XONX - x2) foco) + f (x11 (x1 - xo)(x1 - x2) (x0 - XI) (x0 - X d
Después de integrary de reordenar términos, resulta la siguiente ecuación:
FIGURA 13.1 1
a) representacióngráficadelareglade Sirnpson de 1/3: consiste en tornar el área baio una parabola que una los puntos. b) representación gráfica de la regla de Sirnpson de 3/8:consiste en tomar el área baio una 4 puntos. ecuación cúbica que conecta
445
iORMULACl6N DE lNTEGRACl6N DE NEWTON-COTES
[ 13.141
donde, en este caso, h = (b - a ) / 2 . Esta ecuación se conoce como regla de Simpson de 113. Esta es la segunda fórmula de integración de Newton-Cotes. La etiqueta “1/3” viene de que h se divide por 3 en la ecuación (13.14).En el recuadro 13.3 se muestra una derivación alternativa en donde seintegra el polinomio de Newton-Gregory y se obtiene la misma fórmula. La regla de Simpson de 1/3 se puede expresar usando el formato de la ecuación (13.5):
I
I
+\ Ancho
Altura promedio
[13.15]
en donde a = xo, b = xp, y x 1 es el punto medio entre a y b , dado por (b + a ) / 2 . Nótese que de acuerdo ala ecuación (13.15),el punto medio se pesa con dos tercios y los dos puntos extremos con 1 sexto. Se puede demostrar que una simple aplicación de la regla de Simpson de 1/3 tiene un error de truncamiento de (recuadro 13.3):
RECUADRO 13.3 Obtención y estimación del errorde interpolación hacia adelante de Newton-Gregory.
la reglade
Simpson basado en el polinomio de
Como se hizo en el recuadro 13.2 para la regla trapezoi- mo se esperaría que fuese. La razón de esto es que apadal, la regla de Simpson de 1/3 se puede derivar integran- rentemente será corto. Nótese también que 10s límites de do el polinomio de interpolación hacia adelante de integración van desde x, hasta xp. Por lotanto, cuando se hacen las simplificaciones y la sustitución (recuérdese Newton-Gregory. el recuadro 13.2), la integral va desde a= O hasta 2: I = [ ~ ( x o+ ) Af(x0) a + A2f(xo) (a - 1)
I”
2
X0
+-A3f6(xo)a (a - l ) ( a
-
I=h
loz[f ( x o ) +
Af(x0) a
AZf (x01 +a (a - 1) 2
2)
+-A3f(x0) a (a - l ) ( a - 2) 6 Nótesequeseha escrito el polinomiohastatérminos de cuarto orden en vez de hasta términos de tercer orden co-
+-f‘4’(na (a - l ) ( a - 2)(a - 3 ) h 4 24
l
da
446
INGENIEROS MÉTODOS
que se puede integrar para obtener
NUMÉRICOS PARA
Nótese el resultado significativo de que el coeficiente de la tercera diferencia dividida es cero. Debido a que A (xo) = f (x1) - f (x01 Y de que A 2 f (x,) = (XP)- 2 f (x1 + f (xo), la ecuación (B13.3.1) se puede reescribir como
1 90
--f'4'(i3
+
;;
-- - +
11a3 - - j [ 4 ) ( # -
h4
8
72
Regla de Simmon de 1/3
1' 0
y evaluarse en los límites para dar
A2f(xo) 2 j ( ~ 0+) 2Aj (a)+ 3
+ ( 0 ) A 3 j ( ~-)
1
90f'4)(#
h4
1
h5
"
Error de truncamiento
Por IO tanto, el primer término es la regla de Simpson de 1/3 y el segundo es el error de truncamiento. Debido a que la tercera diferencia dividida se anula, se obtiene el resultado significativode que la fórmula tiene exactitud de tercer orden.
[B13.3.1]
o, ya que h = (b - a)/2:
[13.16]
en donde cae en algún lugar dentro del intervalo de a a b. Por lo tanto, la regla de Simpson de 1/3 es más exacta que la regla trapezoidal. Sin embargo, la comparación con la ecuación (13.6) indica que es mucho más exacta de lo que se esperaba.En vez de ser proporcional a la tercera derivada, el error es proporcional a la cuartaderivada. Esto se debe a que, como se mostró en el recuadro 13.3, los coeficientes del término de tercer orden se anulan durante la integración del polinomio de interpolación. En consecuencia, la regla de Simpson de 1/3 es exacta hasta tercer orden aunque esté basada únicamente en tres puntos.
EJEMPLO 13.4 Aplicación de la regia Simpson de 1/3 simple. Enunciado del problema: utilícesela ecuación (13.15)para integrar f(x) = 0.2
+2
5 -~ 2 0 0 + ~ 6~ 7 5 ~ 9~ 0 0 + ~ 4~ 0 0 ~ ~
desde a = O hasta b 1.640 533 34.
=
0.8. Recuérdeseque
la integral exacta es
6
447
FORMULAC16N DE lNTEGRACl6N DE NEWTON-COTES
Solución:
f(0) = 0.2
f(0.4)
=
2.456
f(0.8) = 0.232
Por lo tanto, la ecuación (13.15) se puede usar para calcular
1 = 0.8
0.2
+ 4(2.456) + 0.232 =
466 67
6
que representa un error exacto de E,
=
1.640 533 34
-
1.367 466 67
=
0.273 066 66
tu
=
16.6%
que es aproximadamente cinco veces más exacto que el de una aplicación de la regla trapezoidal (Ej. 13.1). El error estimado es [Ec. (13.16)]
E, =
- (03)5(-2
400) = 0.273 066 67 2 880 en donde -2 400 es el promedio de la cuarta derivada en el intervalo obtenido usando la ecuación (V.3).Como fue el caso del ejemplo 13.1, el error es aproximado (E,)porque el promedio de la cuarta derivada no es una estimación exacta de f4 ( E ) . No obstante, ya que en este caso se trata con polinomios de quinto orden, la discrepancia no es mayor y los errores exacto y aproximado son casi idénticos.
13.2.2
Regla de Simpson de 1/3 de segmentos múltiples
Así como con la regla trapezoidal, la regla de Simpson se puede mejorar dividiendo el intervalo de integración en segmentosde igual anchura (Fig.
13.12) :
h = -b - a n
[13.17]
La integral total se representa como
Sustituyendo la regla de Simpson en cada una de las integrales individuales se obtiene 1 = 2h f k o ) + 4fkd + f(x2)
6
+ * . . + 2h f(X,-z)
+
2h
f 4f(Xn-1)
€
f(X2)
f(X,)
+ 4f(x3) + f(X4)
448
MÉTODOS
FIGURA 13.1 2
NUMÉRICOS
PARA INGENIEROS
Representación gráfica del uso de segmentos múltiples sobre la regla de Simpson de 3/8.Nótese que el método sólo se puede emplear si el número de segmentos es par.
o , reordenandolostérminos
I
+\
Ancho
y usando la ecuación (13.17), se obtiene
Altura promedio
Nótese que, como se ilustra en la figura 13.12, se debe usar un número par de segmentos para implementar este método. Un error estimado por la regla de Simpson de segmentos múltiples se obtiene de la misma manera que lo hace la regla trapezoidal, sumando los errores individuales de cada uno de los segmentos y promediando la derivada para obtener [ 13.191
en donde
f(4J es el promedio de la cuartaderivada
EJEMPLO 13.5
Aplicación de la regla de
Simpson de
enel intervalo
1/3 de segmentos múltiples
Enunciado del problema:utilícese la ecuación (13.18) con n calcular laintegral de:
=
4 para
FORMULACldN DE INTEGRACION DE NEWTON-COTES
f ( x ) = 0.2
+2
449
5 -~ 2 0 0 + ~ 6~ 7 5 ~ 9~ 0 0 + ~ 4~ 0 0 ~ ~
desde a = O hasta b 1.640 533 34. Solución: n = 4 (h
f ( 0 ) = 0.2
=
=
0.8. Recuérdese que laintegral
exacta es
0.2): fi(0.2) = 1.288
fi(0.4) =-2.456t(0.6)
=
3.464
f,(0.8) = 0.232 de la ecuación (13.18) 1 = 0.8 =
E,
=
0.2
+ 4(1.288 + 3.464) + 2(2.456) + 0.232 12
1.623 466 67
1.64053334
-
1.623466 67
=
0.017 066 67 e,
=
1.04%
El errorestimado [Ec. (13.19)J es
E, =
(O 8)5 A (-2400) = 0.017 066 67
180(4)4
El ejemplo previo muestra que la versión de segmentos múltiples de la regla de Simpson de 1/3 proporciona resultadosmuy exactos. Por esta razón, se considera superior a la regla trapezoidal en la mayor parte de las aplicaciones. Sin embargo, como se dijo previamente, est& limitada a los casos en que se cuenta con un número par de segmentos y un número impar de puntos. Por consiguiente, como se examina en la siguiente sección, se usa la regla de segmentos impares puntos pares, conocida como regla de Simpson de 3/8, en conjunción con lareglade 1/3 para permitir la evaluación de cualquier número de segmentos, pares o impares.
13.2.3
Regla de Simpson de
3/8
De manera similar a la derivación de la regla trapezoidal y a la regla de Simpson de 1/3, se pueden ajustar polinomios de Lagrangede tercer orden a cuatro puntos e integrar;
para obtener
450
MÉTODOS
NUMÉRICOS PARA INGENIEROS
en donde h = (b - a ) / 3 . A esta ecuacipn se le llama regla de Simpson de 318 porque h es un múltiplo de 3/8. Esta es la tercera regla cerrada de integración de Newton-Cotes. La regla de Simpson de 3/8 se puede expresar en la forma de la ecuación (13.5):
" Ancho
U
,
[13.20]
Altura promedio
Por lo tanto, a los dos puntos interiores se les dan pesos de tres octavos, mientras que a los puntos extremos se les da un peso de un octavo. La regla de Simpson de 3/8 tiene un error de
E,, =
FIGURA 13.13
3 h5j'"'(d 80
"
Ilustración de cómo las reglas de Simpson de 1/3 y de 3 / 8 se pueden aplicar a la vez para manejar segmentos múltiples con números pares de intervalos.
45 1
FORMULACldN DE INTEGRAC16N DE NEWTON-COTES
o , ya que h = (b - a)/3: [13.21]
Por lo tanto, la regla 3/8 es algo más exacta que la regla de 1/3 [ecuación (13.16)]. La regla de Simpsonde 1/3 es, en general, el método de preferencia ya que alcanza exactitud de tercer orden con tres puntos en vez de los cuatro puntos necesarios para laversiónde 3/8. No obstante, laregla de 3/8 tiene utilidad en las aplicaciones de segmentos múltiples cuando el número de segmentos es impar. Obsérvese que en el ejemplo 13.5 se usala regla de Simpson para integrar la función de cuatro segmentos. Supóngase que se desea unaestimaciónparacinco segmentos. Una opción sería usar una aplicación de segmentos múltiples de la regla trapezoidal como se hizoenel ejemplo 13.3. Sin embargo esto noes aconsejable, debido al error grande de truncamiento asociado con este método. Una alternativa sería la de aplicar la regla de Simpson de 1/3 a los primeros dos segmentos y la regla de Simpson de 3/8 a los últimos tres (Fig. 13.13). De esta manera, se obtendría una estimación con exactitud de tercer orden a través del intervalo completo.
EJEMPLO 13.6
Regla de Simpson de
3/8
Enunciado del problema: a)
de Simpson de 3/8 paraintegrar
Utilíceselaregla f(x') = 0.2
+ 25x - 200x2 + 675x3 - 900x4 + WOx5
desde a = O hasta b = 0.8. b) Utilícese en conjunción con la regla de Simpson de 1/3 para integrar la misma función usando cinco segmentos. Solución: aplicación simple de la regla de Simoson de 3/8 requiere de cuatro puntos igualmente espaciados: f(0) = 0.2
a) Una
f(0.266 7)
=
1.432 724 28
f(0.533 3)
=
3.487 176 96
f(0.8) = 0.232
452
MÉTODOS
NUMÉRICOS
PARA INGENIEROS
Usando la ecuación (13.20),
1
2
=
E,
0.2
0.8
+
3(1.432 724 28
E, =
0.232
1.519 170 37
1.640 533 34
=
+ 3.487 176 96) +
8 -
1.519170 37
-(0'8)5 (-2 400)
6 480
=
=
0.121 362 97
7.4%
E,
=
=
O.16) son
0.121 362 96
b) Los datos necesarios para la aplicación de cinco segmentos (h
f ( 0 ) = 0.2
f(0.16) = 1.296 919 04
f(0.32) = 1.743 393 28
f(0.48) = 3.186 014 72
f(0.64) = 3.181 928 96
f(0.80) = 0.232
La integral de los primeros dos segmentos se obtiene usando la regla de Simpsonde 1/3:
I
=
0.32
0.2 + 4(1.296 919 04)+1.743 393 28 = o.38o 323 7o 6
Para los últimos tres segmentos, se usa la regla de Simpson de 3/8 para obtener
1 = 0.48 =
1.743 393 28
+ 3(3.186 014 72 + 3.181 928 96) + 0.232 8
1.264 753 46
La integral total se calcula sumando los dos resultados:
0.380 323 70 + 1.264 753 46 = 1.645 077 16 1.640 533 34 - 1.645 077 16 = -0.004 543 83 E, = -0.28%
I E,
=
13.2.4
=
Algoritmo para computadora de la regla de Simpson
En la figura 13.14 se esboza un diagrama de flujo para la regla de Simpson. Nótese que el programa está elaborado de tal forma que se pueda usar un número par e impar de segmentos. En el primer caso se aplica la regla de Simpson de 1/3 a cada par de segmentos y los resultados se sumanpara obtener elvalorfinal de la integral. Enel segundo caso, se aplica la regla de Simpson de 3/8 a los últimostres segmentos y la regla de 1/3 se aplica a todos los segmentos previos.
FIGURA 13.14
Diagrama de fluio de una versión de segmentos múltiples de la regla de Simpson.
METODOS NUMERICOS
454
PARA INGENIEROS
4
x
h
+
6 ' 6 - 3 I
I
I
S
S
S
.
FORMULACION DE INTEGRACldN DE NEWTON-COTES
455
13.2.5 Fórmulas cerradas de Newton-Cotes de orden superior Como se dijo previamente, la regla trapezoidaly la regla de Simpson son miembros de una familia de ecuaciones de integración conocidas como fórmulas cerradas de integración de Newton-Cotes. En el cuadro 13.2 se encuentran resumidas algunas deestas fórmulas, junto con las estimaciones de su error de truncamiento. Nótese que, aligualenel caso de las reglas de Simpson de 1/3 y 3/8, las fórmulas de cinco y seis puntos tienen el mismo orden de error. Esta característica general se cumple para las fórmulas con m6s puntos y trae como consecuencia de que las fórmulasde segmentos pares punto impares (por ejemplo la regla de 1/3 y la regla de Boole) sean, en general, los métodos de preferencia. Sin embargo, se debe tomar en cuenta que en la ingeniería prsctica, las fórmulas de orden superior (esto es, mayores de cuatro puntos) rara vez se usan. Las reglas de Simpson son suficientes en la mayor parte de lasaplicaciones. Se puedemejorar la exactitudusandounaversión de segmentos múltiples en vez de optar por las fórmulas de mds puhtos. Adem&, cuando la función se conoce y se requiere de exactitud muy alta, los métodos de integración de Rombergo cuadratura gaussiana,analizadosenelcapítulo 14, ofrecen alternativasviables y atractivas.
13.3 INTEGRACIóNUSANDOINTERVALOSDESIGUALES Hasta el momento, las fórmulas de integración numérica se han basado en puntos igualmente espaciados. En la pr6ctica, existen muchos casos en donde esta suposiciónno se cumple y se debe tratar con diferentestamaños de segmentos. Por ejemplo, los datos derivadosexperimentalmente, a menudo, son de este tipo. En estos casos, un método es aplicarla regla trapezoidal a cada uno de los segmentos y sumar los resultados:
[13.22]
en donde hies el ancho del segmento i . Nótese que este fue el mismo planteamiento usado en la regla trapezoidal de segmentos múltiples. La únicadiferenciaentrelasecuaCiones (13.8) y (13.22) es quelas h de la primera son constantes. Por consiguiente, la ecuación (13.8) se puede simplificar y llevarala ecuación (13.9). Aunque esta simplificación no se puede aplicar a la ecuación (13.22), se puede desarrollar con facilidad un programa de computadora que acomode los segmentos de tamaño desigual. Antes de describir tal programa, se ilustra en el siguiente ejemplo como se aplica la ecuación (13.22) en la evaluación de una integral.
456
MÉTODOS
NUMÉRICOS
PARA INGENIEROS
EJEMPLO 13.7 Regla trapezoidal con puntos que noestán igualmente espaciados
Enunciado del problema: la información del cuadro 13.3 se generó usando el mismo polinomio empleado en el ejemplo 13. l . Utilícese la ecuación (13.22) para determinarla integral de estos datos.Recuérdese que la respuesta correcta es 1.640 533 34. Solución: aplicando la ecuación (13.22) a los datos del cuadro 13.3 se obtiene
I = 0.12
1.309 729 28
+ 0.2
+
o,1o 1.305 241 28 + 1.309729 28 2
2
0.232 +*.-+0.1 =
0.090 583 76
=
1.564 800 98
+
+ 2.363 2 0.130 748 53
+
. . .
+
querepresenta un errorrelativoporcentualabsolutode
0.129 75
E, =
4.6 % .
-
CUADRO 13.3 Datos de f(x) 0.2 + 25x-200x2 + 675x3-900x4 + 400x5con valores dex desigualmente espaciados
0.0 0.200000 O0 0.442.842894 96 0.121.309729280.543.50729696 0.221.30524128 0.64 3.18192896 0.321.743393280.702.363 O00 O0 0.36 2.07490304 0.80 0.232O00 O0 0.40 2.456 O00 O0
Los datos del ejemplo 13.7 se muestranenlafigura 13.15. Nótese que algunos segmentos adyacentes son de igual ancho y, por consiguiente, podrían haber sido evaluados usando reglas de Simpson. En general, esto lleva a resultados m6s exactos, como se ilustra en el ejemplo siguiente. Programa de computadora para datos que no están igualmente espaciados. Es muy simple programar la ecuación (13.22). Sin embargo, como se demuestra en el ejemplo 13.8, la aproximación se acrecenta si se implementan las reglas de Simpson hasta donde sea posible. Por esta razón, se ha desarrollado un algoritmoqueincorpora esta opción.
457
FORMULACldN DE lNTEGRACl6N DE NEWTON-COTES
FIGURA 13.15
Uso de la regla trapezoidal para determinar la integral de datos espaciados irregularmente. Nótese cómo se pueden evaluar los segmentos sombreados con las reglas de Simpson para obtener mayor exactitud.
EJEMPLO 13.8 Inclusión de la regla de Simpson en la evaluación de datos impares
Enunciado del problema: calcúlese nuevamente la integral de los datos del cuadro 13.3,pero usando las reglas de Simpson en aquellos segmentos donde sean apropiadas. Solución: el primer segmento se puede evaluar con la regla trapezoidal:
I
=
0.12
1.309 729 28 2
+
0.2
=
o.o9o 583 76
Debido a que los siguientes dos segmentos desde x = 0.22 a 0.36 son de igual longitud, su integral se pJede calcular usando la regla de Simpson de 1/3. 1 = 0.2 =
1.743 393 28
0.275 802 92
+
4(1.305 24128) 6
+
1.309 729 28
458
METODOS NUMERICOS PARA INGENIEROS
Los siguientes tres segmentos sontambién iguales, y por lo tanto, se pueden evaluar con la regla de 3/8 para dar I = 0.272 686 31. De manera similar, se puede aplicar la regla de 1/3 a los dos segmentos desde x = 0.44 a x = 0.64 para obtener I = 0.668 470 06. Finalmente, los últimos dos segmentos, que tienen longitud desigual, se pueden evaluar con la regla trapezoidaly obtener los resultados de O. 166 347 87 y O. 129 750 00, respectivamente. El área de estos segmentos individuales se puede sumar para obtener una integral total de 1.603 640 92. Esto representa un error de q, = 2.2%, que es superior al resultado obtenido con la regla trapezoidal del ejemplo 13.7. __-
" " "
." "
Como se muestra en la figura 13.16, el diagrama de flujo verifica la longitud de intervalos adyacentes. Si dos segmentosconsecutivos tienen igual longitud, entonces se aplica la regla de Simpson de 1/3. Si tres de ellos son iguales, entonces se aplica la de 3/8. Cuando los segmentos adyacentes son desiguales se implementa la regla trapezoidal. Se sugiere al lector que implemente su propio programa a partir de este diagrama de flujo. Esto no sólo le permite la evaluación de segmentos desiguales, sino que si se usa también la información de segmentos iguales, reduce las reglas de Simpson. Como tal, representa un algoritmo básico de propósitos generales, en la determinación de la integral de datos tabulares.
13.4 FóRMULAS DE INTEGRACIóN ABIERTA Recuérdese de la figura 13.3b que las fórmulas de integración abierta tienen límites que se extiendenmás allá del rango de los datos. En el cuadro 13.4 se resumen las fórmulas de integración abierta de NewtonCotes. Las fórmulas se expresan en la forma de la ecuación (13.5)de tal manera que resultan evidentes los factores de peso: Como con las versiones cerradas, los pares sucesivos de las fórmulas tienen el mismo orden de error. Las fórmulas de segmentos pares-puntos impares son, en general, los métodos de preferencia ya que requieren algunos puntos menos para alcanzar la misma exactitudde las fórmulasde segmentos impares: puntos pares. Nótese que el método de bandas mostrado enla figura V.3 es, en realidad, una versión de segmentos múltiples del método de punto medio del cuadro 13.4. Como se menciona previamente, las fórmulas abiertas rara vez se usan en la integración. Sin embargo, tienen aplicación directa con los métodos de paso múltiple en la solución de ecuaciones diferenciales ordinarias analizadas en el capítulo 17.
FIGURA 13.1 6
Diagrama de fluio para la integración con datos desigualmente espaciados. 459
460
MÉTODOS
h
0 I
S
-CY
-4-
LD
NUMÉRICOS
PARA INGENIEROS
46 1
FORMULACldN DE INTEGRACldN DE NEWTON-COTES
PROBLEMAS Cálculos a mano 13.1
Utilícense medios analíticos para evaluar (a)
I" (10 + 2x 15 (1
- 6x2
+ 5x4) dx
O
(b) (c)
-3
Jv
O
- x - 4x3
+ 3x5) dx
(8 + 5 sen X) dx
13.2
Utilícese una aplicación simple de la regla trapezoidal y evalúense las integrales delproblema 13.1.
13.3
Evalúense las integrales delproblema 13.1 con la regla trepezoidalde segmentos múltiples, con n = 2, 4 y 6.
13.4
Evalúense las integrales del problema 13.1 con una aplicación simple de la regla Simpson de 1/3.
13.5
Evalúense las integrales del problema 13.1 con una regla de Simpson de 1/3 de segmentos múltiples, con n = 4 y 6.
13.6
Evalúense las integrales del problema 13.1 con una aplicación simple de la regla de Simpson de 3/8.
13.7
Evalúense las integrales del problema 13.1 usando la regla de Simpson de 3/8 con segmentos múltiples, con n = 5.
13.8
Intégrese la siguiente función analíticamente y usando la regla trepezoidal, con n = 1, 2, 3 y 4:
Calcúlese el error relativo porcentual y evalúese la exactitud de la aproximación trapezoidal. 13.9
Intégrese la siguiente función analíticamentey usando las reglas de Simpson, con n = 4y5:
Estúdiense los resultados 13.10 Intégrese la siguiente función analítica y numéricamente. Úsese la regla trapezoidal y la regla de Simpson de 1/3 para integrar la función. En ambos casos, úsese
462
METODOS NUMERICOS PARA INGENIEROS
laversión
de segmentos múltiples, con n = 4:
Compárese el error relativo porcentual de los resultados numéricos. 13.11 Intégrese la siguiente función analítica y numéricamente. Utilícese la regla trapezoidal y la regla de Simpson de 1/3 y 3/8 además de la regla de Boole (véase el cuadro 13.2).
lo*
15.32.5xdx
Calcúlese el error relativo porcentual de los resultados numéricos 13.12 Evalúese laintegral
I,” (4 + 2 sen x) dx a)
Analíticamente.
b) Mediante la aplicaciónsimple de la reglatrapezoidal.
c) Mediante la aplicaciónmúltiple de la reglatrapezoidal (n = 5). dj Mediantelaaplicaciónsimple de la regla de Simpson de 1/3. e ) Mediante la aplicaciónsimple de la regla de Simbson de 3/8. f) Mediante la aplicaciónmúltiple de lasreglas de Simpson (n = 5). En los casos b ) a f ) , calcúlese elerrorrelativoporcentual (c,) basadoen
a).
13.13 Evalúese la integral de los siguientes datos tabulares mediante la regla trapezoidal:
I
O 0.1 0.2 0.3 0.4 0.5 4 5 9 3 f(x)Il 7 X
13.14 Efectúense lasmismas evaluaciones delproblema 13.13 usando lasreglas de Simpson. 13.15 Evalúese la integral de los siguientes datos tabulares usando la regla trapezoidal.
x 1-3-1 f(x) I 1 -4
1 3 5 7 9 -5 2 4 8 6
11 -3
13.16 Efectúese la misma evaluación del problema 13.15 usando las reglas de Simpson. 13.17 Determínese elvalormediode !(x)
=
-46
la función
+ 4 5 . 4 ~- 1 3 . 8 ~ ’+
1 . 7 1 ~ -~0 . 0 7 2 9 ~ ~
entre x = 2 y x = 10: a) Graficando la función y calculando visualmente el valor. bj Usando la ecuación (V.3) y la evaluación analítica d e l a integral. cj Usando la ecuación (V.3)y una versión de cuatro segmentos de la regla trapezoidal enla estimaciónde la integral.
463
FORMULAC16N DE INTEGRAC16N DE NEWTON-COTES
d) Usando la ecuación (V.3) y una versión de cuatro segmentos de la regla de Simpson de 1/3. 13.18 La función !(X)
10 - 3 8 . 6 ~+ 7 4 . 0 7 ~ ' - 4 0 . 1 ~ '
=
se usa en el cálculo de la siguiente tabla de datos que no están igualmente espaciados: X
!(x)
I
I
O 0.1 0.3 0.95 0.7 0.5 10 6.84 4 4.20 5.51 5.77
1.2 1
Evalúese la integral desde a = O y b = 1.2 usando Mediosanalíticos b) La reglatrapezoidal c) Una combinación de las reglas de Simpson y la regla trapezoidal; utilícense las reglasde Simpson en donde sea posible para obtener la m6s alta exactitud posible. En b) y c) calcúlese el errorrelativo porcentual (E,,) a)
13.19 Evalúese la siguienteintegral doble:
a)
Analíticamente
b) Usando la reglatrapezoidal con segmentos múltiples (n
=
2).
c) Usando unaaplicaciónsimple de la regla de Simpson de 1/3. En b) y c) calcúlese el errorrelativo porcentual (e"). 13.20 Evalúese la integraltriple
I,"l:I
(x4 - 2Y4 dx
dY dz
Analíticamente b) Usando unaaplicaciónsimple de la regla de Simpson de 1/3 En b) calcúlese elerrorrelativo porcentual (E,,). a)
Problemas relacionados con la computadora 13.21 Desarróllese un programa para computadora que sea amable con el usuario de la regla trepezoidal de segmento múltiple basado en la figura 13.9. Entre otras cosas, a) Agréguense declaraciones de documentación al programa. b) Hágase la entrada y la salida más descriptiva y orientada al usuario. c) Inclúyanse diagnósticos que alerten al usuario cuando se accesen datos que no estén igualmente espaciados o enorden ascendente. d) (Opcional) Modifíquese el programa de tal manera que sea capaz de evaluar funciones predefinidas y en forma tabular. Pruébese este programa repitiendo los cálculos del ejemplo 13.2.
464
M h O D O S NUMÉRICOS PARA INGENIEROS "
13.22 Desarróllese un programa para computadora amable con el usuario para la versión de la regla de Simpson de segmentos múltiples basado en la figura 13.14. Pruébese reproduciendo los cálculos de los ejemplos 13.5 y 13.6. 13.23 Desarróllese un programa para computadora que sea amable con el usuario para integrar datos desigualmente espaciados basados en lafigura 13.16. Pruébese repitiendo los cálculos del ejemplo 13.7 13.24 Utilícese el programa TRAPEZOIDAL RULE del paquete de programas NUMERICOMP (o el programa propio del problema 13.21) y repítase a) el problema 13.2, b) el problema 13.3, c) el problema 13.8, a') el problema 13.10 y e) el problema 13.13. Utilícesela opción de graficaciónpara que le ayude a visualizar
el concepto de que 1 =
S1
f (x) dx es el área entre la curva f (x) y el eje. Prué-
bense varios tipos de pasos para cada uno de los problemas. 13.25 Desarróllense cinco funciones. Úsese el paquete de programas NUMERICOMP (o los programas propios) para calcular la integral de cada una de las funciones sobre algunos límites basados en los datos de entrada. Pruébense los tamaiios de paso h = (b - a)/ n para = n 1 , . . ,n = 10. Grafíquese I en funciónde n . 13.26 Utilícese el paquete de programas NUMERICOMP (o los programas propios) para calcular la integral de datos tabulares. Invéntense datos para x y f (x),Úsense valores negativos y cero para x y f (x). Obsérvese la función, graficándola; el lector puede convencerse de que el paquete NUMERICOMP trabaja perfectamente.
C A P í T U L OC A T O R C E INTEGRACIóN DE ROMBERG Y CUADRATURA GAUSSIANA
En la introducción a la parte V se menciona que las funciones a integrarse numéricamente tienen, en general, dos formas: una tabla de valores o una ecuación. La forma de los datos tiene una influencia importante en el esquema que se va a usar para evaluar la integral. Para el caso de información tabular, se está limitado al número de puntos datos. En contraste, si se dispone de la función analíticamente, entonces se pueden generar tantos valores de f(x)como sean necesarios para alcanzar una exactitud aceptable (recuérdese la Fig. V.4). Este capítulo se dedica al estudio de dos métodos que estánexpresamente diseñados para analizar casos en que se conoce la función. Ambos métodos aprovechan la facilidad de generar valores de la función en el desarrollo de esquemas eficientes de la integración numérica. El primero de ellos se basa enla extrapolación de Richardson, método que combina dos aproximaciones de integración numérica en la obtención de un tercer valor que es más exacto. El algoritmo que implementala extrapolación de Richardson en su forma más eficiente se llama integración de Romberg. Este métodoes recursivo y se usa para generar una aproximación a laintegral dentro de una tolerancia de error especificada. El segundo método es el llamado cuadratura gaussiana. Recuérdese que enelúltimocapítulo los valores de f(x) enlasfórmulasdeNewton Cotes se determinanenvaloresespecíficos de x. Por ejemplo, si se usa la regla trapezoidal para determinar una integralse está restringiendoa tomar el promedio pesado def(x) en los intervalos de los extremos.Las fórmulas de cuadratura gaussiana emplean valores dex contenidos dentrode a y de b de tal forma que resulta una integral mucho más exacta.
14.1 INTEGRACIóN DE ROMBERG En el capítulo 13 se presenta una versión de la regla trapezoidal con segmentos múltiples y lasreglasde Simpson. Paraunafunciónanalítica (opuesta a la forma tabular), las ecuaciones de error [Ec. (13.13)y (13.19)]
466
MÉTODOS
NUMERICOS PARA INGENIEROS
indican que aumentandoel número n de segmentosse genera una aproximación más exacta a la integral. Esta observación la comprueba la figura 14.1, que es una gráfica del error real contra n para la integral de f(x) = 0.2 + 25x - 200x2 = 675x3 - 900x4 + 400x5. Nótese cómo el error decrece a medida que n crece. Sin embargo nótese también que para valores muy grandesd e n , el error empieza a crecer ya que los errores de redondeo empiezana dominar. También obsérveseque se necesita un número muy grande de segmentos (y por lo tanto, esfuerzo de
FIGURA 14.1
Valor absoluto del error relativo porcentual verdadero contra el núme25x ro de segmentos en la determinación de la integral {(x) = 0.2 200x2 675x3 - 900x4 400x5, evaluada de a = O a b = 0.8 usando la regla trapezoidal desegmentos múltiples y la regla de Simpson de 1/3 de segmentos múltiples. Nótese que ambos resultados indican que para un número considerable de segmentos, los errores de redondeo limitan la precisión.
+
+
+
INTEGRACldN DE ROMBERG Y CUADRATURA GAUSSIANA
467
cálculo) para alcanzar niveles altos de exactitud. Como una consecuencia de estos inconvenientes, la regla trapezoidal de segmentos múltiples y las reglas de Simpson algunas veces son inadecuadas en problemas donde se necesita gran eficiencia y pocos errores. La integración de Romberg es un método diseñado para evitar estos inconvenientes. Es muy similar a los métodos analizados enel capítulo 13, en el sentido de que está'basado en la aplicación sucesiva de la regla trapezoidal. Sin embargo, mediante manipulacionesmatemáticas, se obtienen mejores resultados con menos esfuerzo.
14.1.1 Extrapolación de Richardson Recuérdese que en la sección 7.4.4 se usan ecuaciones de error paramejorar la solución de un conjunto de ecuaciones lineales. En el mismo sentido, existen métodos que corrigen errores y mejoran los resultados de la integración numérica en base a la estimación de la integral misma. Conocidos generalmentecomo extrapolación de Richardson, estos métodos usan dos cálculos de la integral para efectuarun tercer cálculo másexacto. El cálculo y el error asociado con la regla trapezoidal de segmentos múltiples se representa generalmente como: I = I(h)
+ €(h)
en donde I es el valor exacto de la integral, I(h) es la aproximación de la integral usando la regla trapezoidal con n segmentos y con tamaño de paso h = (b - a ) / n y E(h) es el error de truncamiento. Si se obtienen dos aproximaciones por separado usando tamaños de paso h l y hz y se tiene elvalor exacto del error, entonces
Ahora recuérdese que el error de la regla trapezoidal de segmentos múltiplesserepresentapor la ecuación (13.13) [con n = (b - a ) / h ] : [14.2]
Si se supone que f ' ' es una constante que depende del tamaño delpaso, entonces la ecuación (14.2) se usaenla determinación del promedio de losdos errores,que es: [14.3]
Este cálculo tiene el importante efecto de quitar el término f ' ' de los cálculos. AI hacerlo, se ha hecho posibleutilizarlainformaciónrelacionada
468
MÉTODOS
NUMÉRICOS
PARA INGENIEROS
c
con la ecuación (14.2) sin conocimiento previo de la segunda derivada de la función. Para hacerlo, se reordena la ecuación (14.3) para obtener:
lacual se puede sustituirenla
ecuación (14.1):
la cual, puede resolverse
Por lo tanto, se ha desarrollado una expresión que calcula el error detruncamiento en teiminos del valor de la integral y el tamaño de paso. Esta estimación se sustituyeen
I
= I(h2)
+ E(h2)
obteniendounaestimaciónmejoradade r
1
la integral:
1
[14.4]
S e demuestra (Ralston y Rabinowitz, 1978) que el error de esta estimación es O(h4). Por lo tanto, se han combinado dos estimaciones de la regla trapezoidal de O(h2) enla obtención de una nueva estimación de O(h4).En el caso especial en que el intervalo se divide en dos partes (h2 = h l / 2 ) , la ecuación se transforma a:
c
o, reordenando términos, [14.5]
EJEMPLO 14.1
Correction de errores en la regla trapezoidal Er,unciado del problema: en el capítulo anterior (ejemplo 13.1 y el madro 13.1) la aplicación de la regla trapezoidal de segmentos múltiples lie-
INTEGRACldN DE ROMBERG Y CUADRATURA GAUSSIANA
469
va a los siguientes resultados: -~
~
~~~
~
~~~~
~
Segmentos
h
Integral
ev,%
1 2 4
0.8
0.172 8 1.068 8 1.484 8
89.5 34.9
0.4 0.2
9.5
Utilícese esta información junto con la ecuación (14.5) para calcular mejores estimaciones de la integral. Solución: los cálculos con uno y dos segmentosse combinan y se obtiene
4 (1.068 8)
I =
3
1 - - (O. 172 8) = 1.367 466 67
3
El errorenlaintegral
mejorada es
E, = 1.640 533 34 - 1.367 466 67
= 0.273 066 67
E,
= 16.6%
que es superior a la aproximación en que se basó. De la misma manera, los cákulos de dos y cuatro segmentosse com binan y se obtiene
4 I = "1.484 3
3
8)
-
1 -(1.068
8)
=
1.623 466 67
que representa un error de
E,
=
1.640 533 34 - 1.623 466 67
=
0.017 066 67
E,
=
1.0%
La ecuación 14.4 proporciona una formade combinar dos aplicaciones de la regla trapezoidal con error O(h2) y calcular una estimación de O(b4).Este planteamiento es un subconjunto de un método más general que combina integrales paraobtener mejores estimaciones. Porejemplo, enel ejemplo 14.1, se calcularon dos integrales mejoradas de O(h4) en base a tres estimaciones de reglas trapezoidales. Estas dos estimaciones mejoradas, pueden a la vez, combinarse paraobtener todavía una mejor estimación de O(h6). Para el caso especial en que las estimaciones mediante regla trapezoidal original se basen en divisiones sucesivas a la mitaddel intervalo, la ecuaciónusadacon O(h6) deexactitud es:
15
16 15
I =" I ,-
1
"4
[14.6]
470
MÉTODOS
NUMÉRICOS
PARA INGENIEROS
en donde I, y I, son las estimaciones más y menos exactas, respectivamente. De manera similar, dos resultados de O(h6) se combinan para calcular una integral que es O(h8) usando 64 I = -I,
63
- -1,1 63
[14.71
EJEMPLO 14.2 Corrección del error de órdenes mayores de dos en la estimación de integrales
Enunciado del problema: en el ejemplo 14.1 se usa la extrapolación de Richardson para calcular dos estimaciones de la integral de O(h4). Utilícense la ecuación (14.6) y combínense estas estimaciones para calcular una integral con O(h6). Solución: las dos aproximaciones de O(h4) obtenidas en el ejemplo 14.1 fueron 1.367 466 67 y 1.623 466 67. Estos valores se sustituyen en la ecuación (14.6) y se obtiene
la cual es la respuesta correcta a nueve cifras significativas que son las obtenidas en este ejemplo.
14.1.2 Algoritmo de la integración de Romberg Nótese que los coeficientesen cada una de las ecuaciones de extrapolación [Ec. (14.5),(14.6) y (14.7)]suman 1. Por lo tanto, representan factores de peso que, a medida que la exactitud aumenta, coloca progresivamente pesos mayores en la estimación de la integral. Estos planteamientos pueden expresarse en una forma general, que se adapta muy bien a las implementaciones mediante computadora:
[14.8]
INTEGRACldN DE ROMBERG Y CUADRATURA GAUSSIANA
471
en donde [,+I,+" y lj,k-lson las integrales más y menos exactas, respectivamente, 1j.k es la integral mejorada. El índice k indica el nivel de integración, k = 1 corresponde a la estimación de la regla trapezoidal original, k = 2 corresponde a O(h4), k = 3 a O(h6),etcétera. El índice j se usa paradistinguir entre las estimaciones mejores (j + 1) y menores (j). Por ejemplo, si k = 2 y j = 1 , entonces la ecuación (14.8) se transforma en
lacual esequivalente a la ecuación (14.5). La forma general representada mediantela ecuación (14.8) se le atribuye a Romberg, y a la aplicación sistemática en la evaluación de integrales se le conoce como integración de Romberg. La figura 14.2 muestra un esquema gráfico de la secuencia de estimaciones generadas usando este método. Cada una de las matrices corresponde a una iteración. La primera columna contiene las evaluaciones de la regla trapezoidal quese denotan por J,l, en donde j = 1 es la aplicación sobre un solo segmento (el tamaño del paso es b - a);j = 2 es la aplicación sobre los segmentos [tamaño del paso (b - a)/4]; etcétera. Las otras columnas de lamatriz se generan sistem6ticamente aplicando la ecuación (14.8) para obtener sucesivamente mejores estimaciones para la integral. Por ejemplo, la primera interación (Fig. 14.2a) implica calcular la regla trapezoidal de uno y dos segmentos (11,1y 12,1).En seguida se usa la ecuación (14.8) para calcular el elemento 11,2= 1.367 466 67, que tiene un errorde O(h4).
FIGURA 14.2
Esquema gráfico de la secuencia de aproximaciones a la integral generadas usando la integración de Romberg.
472
INGENIEROS
PARA
MÉTODOS
NUMERICOS
Ahora, se debe verificar que este resultado sea adecuado a las necesidades. Como se hizo con los otros métodos de aproximación de este libro, se requiere un criterio de terminación o de paro para valorar la exactitud de los resultados. Un método que se puedeemplear para los propósitos actuales es (Ec. (3.5)] [14.9]
en donde E, es una estimación del error relativo porcentual. Por lo tanto, de la manera como sehizo anteriormente en los otros procesos iterati-
se compara la nueva estimación con el valor anterior. Cuando el cambio entre los valores anterior y actual representados mediante E*, está bajo un criterio de error preespecificado E,, los cálculos se terminan. En la figura 1 4 . 2 esta ~ evaluación indica un cambio del 87.4% decambio sobre el curso de la primera interación. El objeto de la segunda iteración (Fig. 14.2b) esel de obtener la estimación O(h6):11,s. Para hacerlo, se determina una nueva estimación trapezoidal, 13.1 = 1.484 8. En seguida ésta se combina con 12,1usando la ecuación (14.8)para obtener 12,* = 1.623 466 67.Este resultado, a la vez, se combina con 11,2para obtener 11,3 = 1.640 533 34. La ecuación (14.9)se aplica para determinar que este resultado representa un cambio del 16.6% cuando se compara con el anterior 11,2. La tercera iteración (Fig. 14.2%)continúa el proceso de la misma manera. En este caso, se agrega una estimación trapezoidal a la primera columna y luego se aplica la fórmula (14.8)al cálculo sucesivo de integrales más exactasbajo la diagonal inferior. Después de tres iteraciones, se sabe que el resultado, 11,5= 1.640 533 34, es exacto al menos hasta nueva cifras significativas. La integración de Romberg es más eficiente que la regla trapezoidal y que las reglas de Simpson analizadas en el capítulo 13. Por ejemplo. en la determinación de la integral mostrada en la figura 14.1, la regla de Simpson de 1/3 requeriría una aplicación de 256 segmentos para encontrar un valor de 1.640 533 32. No serían posibles mejores aproximaciones debido al error de redondeo. En contraste, la integración de Romberg obtiene un resultado exacto (hasta nueve cifras significativas) basado en la combinación de la regla trapezoidal de dos, cuatro y ocho segmentos. Enla figura 14.3 se muestra un diagrama de flujo de la integración de Romberg. Usando ciclos, el algoritmo implementa el método de manera eficiente. Recuérdese que la integración de Romberg está diseñada para casos en que la función por integrar se conoce. Esto se debe a que el conocimiento de la función permite las evaluaciones necesarias para las implementaciones iniciales de la regla trapezoidal. Los datos en forma tabular rara vez se encuentran en forma necesaria para llevar a cabo evaluaciones sucesivas. VOS,
NU R A 14.3 Diagrade fluio de la inteciór7 de Ron1 ber g .
473
MÉTODOS
474
NUMÉRICOS
PARA INGENIEROS
14.2 CUADRATURA GAUSSIANA En el capítulo 13 se analiza un conjunto de fórmulas de integración n u mérica o de cuadratura conocidas como las ecuaciones de Newton-Cotes. Una característica de estas fórmulas (con la excepción del caso especial de la sección 13.3)es que la estimación de la integral se basa en puntos igualmente espaciados. Por consiguiente,la posición de los puntos base usados en estas ecuaciones estaba predeterminado o fijo. la base de la rePor ejemplo, como se puede ver en la figura 14.4~1, gla trapezoidal es tomar el área bajo la línea recta que une los valores de la función evaluada en los extremos del intervalo. La fórmula usada para calcular esta área es
1
FIGURA 14.4
(b -
U)
f (a>+ f tb) 2
a) Esquema gráfico de la regla trapezoidal dada por el área baio la línea recta que une los puntos extremos. b) Se obtiene una aproximación meiorada a la integral tomando el área baio la línea recta que pasa a través de dospuntos intermedios. Colocandoadecuadamente estos puntos, los errores, positivo y negativo se equilibran y resulta una aproximación a la integral meiorada.
[14.10]
475
INTEGRACldN DE ROMBERG Y CUADRATURA GAUSSIANA
en donde a y b son los límites de integración y b - a es el ancho del intervalo de integración. Debidoa que la regla trapezoidal debe pasara través de los puntos límites, existen casos como el de la figura 14.4a en donde la fórmula genera un error muy grande. Ahora, supóngase que la restricción de fijar los puntos base se elimina y se va a evaluar libremente el área bajo la línea recta que une dos puntos cualesquiera de la curva. Colocando estos puntos de manera inteligente, se puede definir una línea recta que balancee los errores negativos y positivos. De ahí que, como enlafigura 14.4b, se llegara a un valormás exacto de laintegral. La cuadratura gaussiana es el nombre de uno de estos métodos que implementa esta estrategia. Las fórmulas particulares de cuadratura gaussiana descritas en esta sección se llaman fórmulas de Gauss-Legendre. Antes de describir el método, se demuestra cómo las fórmulas de integración numérica talescomo la regla trapezoidalse derivan usando elmétodode coeficientes indeterminados.Estemétodo se emplea enel desarrollodelasfórmulasde Gauss-Legendre.
14.2.1 Método de coeficientes indeterminados En el capítulo 13 se deriva la regla trapezoidal integrando un polinomio lineal mediante un razonamiento geométrico. El método de coeficientes indeterminados ofrece una tercera alternativa que tiene también utilidad enla derivación de otros métodos tales como la cuadratura gaussiana. Para ilustrarel método, la ecuación (14.10) se expresa como
en donde las c son constantes. Ahora, considerando que la regla trapezoidal debe llevar a resultados exactos cuando la función a integrarse sea una constante o una línea recta. Dos ecuaciones simples que representan este caso son y = 1 y y = x. Ambas se ilustranenlafigura 14.5. Por lo tanto, se debencumplirlassiguientesigualdades:
Y
o , evaluandolasintegrales:
.
476
MÉTODOS
FIGURA 14.5
Dos integrales que lareglatrapezoidalevaluará constante y b) una línea recta.
NUMÉRICOS
PARA INGENIEROS
exactamente: a) una
Estas son dos ecuaciones con dos incógnitas que pueden resolverse por
c1
= c2 =
b-a -
2
las cuales, cuando se sustituyendenuevo
enla
lacual es equivalente a la regla trapezoidal.
ecuación ( 1 4 . 1 1 ) dan
477
INTEGRACldN DE ROMBERG Y CUADRATURA GAUSSIANA
14.2.2 Derivación de la fórmula de Gauss-Legendre basada en dos puntos Como en el caso de la derivación anterior de la regla trapezoidal, la cuadratura gaussiana determina los coeficientes de una ecuación de la forma
en donde las c son los coeficientes incógnitas. Sin embargo,en contraste a la regla trapezoidal que usa puntos extremos a y b, los argumentos de la función x1 y x2 ahora no están fijos a los puntos extremos, sino que son incógnitas (Fig. 14.6). Por lo tanto, ahora se tiene un total de cuatroincógnitas que se deben evaluar, y por consiguiente, se requieren de cuatro condiciones para determinarlos exactamente. Al igual que con la regla trapezoidal, se pueden obtener dos de estas condiciones suponiendo que la ecuación (14.12) ajusta exactamente la integral de una corstante y de una función lineal. Entonces, para llegar a las otras dos condiciones, se extiende este razonamientoal suponer que también se ajusta laintegral a unafunciónparabólica (y = x2) y a una función cúbica (y = x3).Haciendo esto, se determinan las cuatro incógnitas conviniendo en derivar una fórmula de integración de doble punto que sea exacta para cúbicas. Las cuatro ecuaciones por resolver son
+ C2f(X2)
Clf(X1)
=
1 dx
=
2
[14.13]
[14.14]
[14.15]
[14.16] Las ecuaciones (14.13) hasta la (14.16) se resuelven simultáneamente, c1 =
c2
= 1
-1
xl=-=
d3
x2="
d3
-0.577 350
269. . .
- 0.577 350 269. . .
478
MÉTODOS
FIGURA 14.6
Esquema gráfico de las variables incógnitas -x1 y x2usando cuadratura gaussiana.
NUMERICOS PARA INGENIEROS
para integración
las cuatro se pueden sustituir en la ecuación (14.12)y obtener la fórmula de Gauss-Legendre de dos puntos [14.17]
Por lo tanto, se llega al resultado interesante de que la suma simple de los valores de la función en x = 1/& y - l/& lleva a una estimación de la integral con una exactitud de tercer orden. Nótese que los límites d e integración de las ecuaciones (14.13)a la (14.16)van desde - 1 a 1.Esto se hizo para simplificar la aritmética y hacer la formulación tan general como seaposible. Un simple cambio de la variable se puedeusar para trasladar otroslímites de integración en esta forma. Esto se lleva a cabo suponiendo que la nueva variable xd está dada en función de la variable original x en una forma lineal como en: x
= a.
+ alxd
[14.18]
si el limite inferior, x = a , corresponde a x d = sustituyen en la ecuación (14.18)y se obtiene: a = a0
= a0
1, estosvalores
+ al(-l)
De manera similar el límite superior, x obtener
b
-
+ al(1)
Se
[14.19] =
b , corresponde a xd
=
1, y
[14.20]
479
INTEGRACI~N DE ROMBERG Y CUADRATURA GAUSSlANA
Las ecuaciones (14.19) y la (14.20) se resuelven simultáneamente, generando:
b+a 2
[14.21]
=
-
at =
2
a0
Y
b-a
quesesustituyeenlaecuación X =
[14.22] (14.18) para obtener:
(b + a) + (b - a)xd 2
[14.23]
Esta ecuación se diferencia dando: & = -b - a
2
dx;
[14.24]
Las ecuaciones (14.23) y (14.24) se pueden sustituir para x y dx, respectivamente, enla ecuación por integrar. Estas sustituciones transforman efectivamente el intervalo de integración sin cambiar los valores de la integral. El ejemplosiguienteilustra cómo se hace esto enla práctica.
EJEMPLO 14.3 Fórmulas de Gauss-Legendre de dos puntos
Enunciado del problema: utilícese la ecuación (14.14) para evaluar la integral !(x) =
0.2
+ 25x - 200x2 + 675x3 - 900x4 + @Ox5
entre los límitesx = O y x = 0.8. Recuérdese que éste fue el mismo problema resuelto en el capítulo 13 usando una variedad de formulaciones de Newton-Cotes. El valor exacto de laintegral es 1.640 533 34. Solución: antes de integrar la función, se debe realizar un cambio de variable de tal forma que los límites sean desde - l hasta l. Para hacerlo, se sustituye a = O y b = 0.8 enla ecuación (14.23) y se obtiene X
=
0.4
+ 0.4xd
al calcular su derivada se tiene [Ec. (14.24)] I
& = 0.4 dxd
480
INGENIEROS MÉTODOS
Estosdosvalores se sustituyenenla (0.2
NUMÉRICOS PARA
ecuación originalpara obtener
+ 2 5 -~ 2 0 0 ~+ ~6 7 5 ~- 9~ 0 0 +~ 4~ 0 0 ~ dx ~) {[0.2 + 25(0.4 + 0.4~d)- 200(0.4 + 0.4xd)' - I:! + 675(0.4 + O.4xJ3 - gOO(0.4 + O.4xJ4
Por lo tanto, el lado derecho está enla forma que es adaptable para la evaluación mediante la cuadratura gaussiana. La función transformada se puede evaluar en - l/& siendo igual a 0.516 740 55y en 1 4siendo igual a 1.305 83723. Por lo tanto, de acuerdo a la ecuación (14.171, laintegral es: 1 = 0.516 74055
+
1.305 837 23 = 1.822 577 78
que representa un error' relativo porcentualdel - 11.1% . Este resultado es comparable en magnitud a la aplicación de la regla trapezoidal de cuatro segmentos (cuadro 13.1) o a una aplicación de la regla de Simpson de 1/3 y la de 3/8 (ejemplos 13.4 y 13.6). Este último resultado ya se esperaba porque las reglas de Simpson tienen también exactitud de tercer orden. Sin embargo, debido a la forma hábil de escoger los puntos, la cuadratura gaussiana obtiene esta exactitud en basea sólo dos evaluaciones de la función.
14.2.3 Fórmulas de más de dos puntos Además de la fórmula de dos puntos, analizada en la sección previa, se pueden desarrollar también versiones de más de dos puntos, las cuales se presentan enla forma general:
En el cuadro 14.1 se resumen los valores de las c y de las x de las fórmulas de hasta seis puntos, incluyendo a éstas. EJEMPLO 14.4 Fórmula de Gauss-Legendre de tres puntos Enunciado del problema: utilícese la fórmula de tres puntos del cuadro 14.1 paracalcular laintegral de lamismafuncióndel ejemplo 14.3.
48 1
INTEGRACldN DE ROMBERG Y CUADRATURA GAUSSIANA
CUADRO 14.1
Factores de peso c y argumentos x de la funci6n usados en las f6rmulas de Gauss-legendre
Puntos
Factores de peso
Argumentos de la funelen
2
c1 = 1.000 O00 O00
x1 = -0.577
c:, =
1 .O00 O00 O00
x1 =0.555 555 556 0.888 888 889 x2 x3 0.555 555 556
3
c1
4
c1 = 0.347854845
c:, = ~3 =
c:, = ~3 = ~4 =
5
~1 = C?
= ~3 = ~4 = ~5
6
=
= c:, = ~3 = ~4 = ~5 = c6 = ~1
X:, =
= = =
Error de truncamiento
350 269 = f(41([) 0.577 350 269
-0.774 596 669 = f(6)([) 0.0 0.774 596 669
X] = -0.861136312 = f(*)([) 0.652 145 155 X:, = -0.339 981 044 0.652 145 155 x3 = 0.339 981 044 0.347 854 845 x4 0.861136312
0.236926885 0.478 628 0.568 888 0.478 628 0.236 926
x1 = -0.906179846 = f(”](t) 670 X:, = -0.538 469 310 889 x3 = 0.0 670 x4 = 0.538 469 310 885 x5 = 0.906 179 846
0.171324492 X, = -0.932469514 = 0.360 761 573 X:, = -0.661 209 386 0.467 913 935 x3 = -0.238 619 186 0.467 913 935 x4 = 0.238 619 186 0.360 761 573 x5 = 0.661 209 386 0.171 324 492 X6 = 0.932 469 514
Cl2’([)
Solución: de acuerdo al cuadro 14.1, lafórmuladetrespuntoses 1 = 0.555 555 556 f(”0.774 596 669)
+
1
0.555 555 556 f(0.774 596 669)
1 = 0.281 301 290
lacuales
+ 0.888 888 889 f(0)
+ 0.873 244 444 + 0.485 987 599 = 1.640 533 34
exacta.
Debido a que la cuadratura gaussiana requiere de evaluaciones de la función en puntos que no están uniformemente espaciados dentro del intervalo de integración, no es aplicable a los casos en que la función se desconoce. Por lo tanto, no se adapta a muchos problemas de la inge-
482
INGENIEROS MÉTODOS NUMÉRICOS
PARA
niería en donde se manejan datos tabulares. Sin embargo, en donde se conoce la función, su eficiencia tiene grandesventajas. Esto es particularmente cierto cuando se deben realizar numerosas evaluaciones funcionales. 14.2.4 Programa para la computadora de la cuadratura gaussiana
Enlafigura 14.7 se muestran programas en FORTRAN y BASIC sobre el método de cuadratura gaussiana. Nótese que los programas están diseñados de tal manera que se aprovecha lasimetríade los factores de peso y los argumentos de lafunciónenel cuadro 14.1. Los programas mostrados en la figura 14.7 están listos para resolver las mismas ecuaciones analizadas en los ejemplos 14.3 y 14.4. Se calculan aproximaciones hasta e incluyendo la fórmula de seis puntos. Por lo tanto, si se desea aplicar estos programas a otro caso, se debe cambiar la función que especifica la ecuación a integrarse. Haciendo esto, el programa se puede emplear enel análisis de una gran variedad de problemasdeingeniería.
EJEMPLO 14.5 Aplicación de la cuadratura gaussiana al problema del paracaidista
Enunciado del problema: enel ejemplo 13.3 se usala regla trapezoidal de segmentos múltiplesparaevaluar
gm
d=-b C
10
[l-
en donde g = 980, c = 12 500 y m = 6 8 100.Elvalor exacto de la integral se determina medianteel cálculo y fue de 28 943.514 7. Recuérdese que la mejor estimación, calculada usando la regla trapezoidal con 5 O00 segmentos fue de 28 943.517 7 con un I c v l = 4 x lo-%%. Repítase este cálculo usando el programa de la figura 14.7 sobre la cuadratura gaussiana. Solución: después de modificar la función, se obtienen los siguientes resultados: estimacióncon dos puntos = 29 001.447 8 estimacióncontrespuntos = 28 943.929 7 estimaciónconcuatropuntos = 28 943.516 2 estimaciónconcincopuntos = 28 943.514 7 estimaciónconseispuntos = 28 943.514 7 Por lo tanto, las estimaciones con cinco y seis puntos obtienen resultados exactos hasta nueve cifras significativas.
483
INTEGRACldN DE ROMBERG Y CUADRATURA GAUSSIANA
BASIC
FORTRAN
UIM XQ(ll),C(lIi,J0(5),Jl(5)
DIMENSION C ( l l > , X Q < l l > , J 0 < 5 > , J l ~ 5 > FCIXDI=AU+Al*:(D F( Xj=O.2+25*:(-%UO*X**2+675*%**3 C-900*X**4+400*X**5 DATA C/l.,.888888,.555555,.652145,
L>EF F N C ( X D )
O . , ,774597, , 3 3 9 9 8 1 ,
c.a61136,0.,.~38469,.90618~,.238~~9,
1 4
C661209, ,932470,' D A TJI 0 / 1 , 3 , 4 , 7 . 9 / D A T AJ 1 / 1 , 3 , 5 , 8 , 1 1 c WRITE(6,l > FORMIT( ' 0 ' , 5 X , 'CUIDRAIURA R E A D < 5 , 4 ) I ,B FORMFIT< 2 F 1 0 , O > A O=( B+I)/2 A 1=( 8 - A >/2 DO 4 1 01 - 1 , s
sn=o.
JA= JOC I ) JB=Jl(I)
FIp( 1/2>-1/2 I F (FX.NE.0.) K=( 1 - 1 >*2
350 380
COTO 3 5 0
SM=SM+C( K )*F( FCC X Q < K ) > > DO 3 8 0J = J A J, B SM=SM*C< J >*F(-FCC XQ< J > j > SM=SM+C( J )*FI F C < X Q ( J > j > CONTINUE sn=srm1
FIGURA 14.7
*
XD-
LIEF- F N F ( X ) = . 2 + 25 % X +x 1 3 200 * x A 2 + a75 '300 a X A 4 + 400 *: X A 5 PRINT : P R I N T " CUADRATLIRA GALISSIANA": PRINT F U R I = 1 TO 1 1
FcCAU C i I i
GAUSSIANA'
Al
*
C.347855,.568889,.478629,.236927, C.467914,.360762,.171324/ [)ATA X Q / . 5 7 7 3 5 0 ,
+
= A0
NEXT I 1 11 FOR I i TO READ XI2 t. I ) NEXT I FOR I = 1 TO 5 READ JO(. I ) NEXT I FOR I = 1 TO 5 READ 541 ( I ) NEXT I 2 d 1 INF'IJT " L I M I T E 5 DE INTEGRACIO N iA.B)=":A,B 270 A 0 = ( H A) / 2 1:3O A l = I B - A ) / 2 290 P R l N T _. .::cid FUR I = 1 TO 5 3 1 0 5M = O 321) I F I N(T, I / 2) - I / 2 < i O THEN ,350
(Funcidn que implementa el cambio de variable) (Funci6n que especifica la ecuaci6n a integrarse)
C l l l = vector que contlene
los factores
de peso (Cuadro 14.11
X(Il = vector que contlene los argumentos de la
-
Programas para la computadora en FORTRAN y BASIC que implementan la cuadratura gaussiana usando fórmulas de Gauss-Legendre.
funci6n (Cuadro 14.1)
484
MÉTODOS
14.2.5 Análisis de error
NUMÉRICOS
PARA INGENIEROS
en la cuadratura gaussiana
El error en las fórmulas de Gauss-Legendre se especifica generalmente mediante (Carnahan et al., 1969): [14.26]
en donde n es el número de puntos menos uno y f""+*J(~) es la (2n + 2)-ésima derivada de la función después del cambio de variable y 4 se localiza en algún lugar dentro del intervalo de - 1 a 1. La comparación de la ecuación (14.26) con el cuadro 13.2 indica la superioridad de la cuadratura guassiana sobre las fórmulas de Newton-Cotes, dado quelas derivadas de orden superior no crecen sustancialmente a medida que crece n. En el problema 14.8,al final de este capítulo se ilustra un caso en donde las fórmulas de Gauss-Legendre trabajan deficientemente. En estos casos, será preferible la regla de Simpson de segmentos múltiples o la integración de Romberg. Sin embargo, la cuadratura de Gauss proporciona un medio eficiente para evaluar las integrales en muchas funciones usadas en ingeniería.
PROBLEMAS Cálculos a mano 14.1
Utilícese la integración deRombergpara [sen (5x
+
evaluar
l)] dx
con una exactitud d e E, = 0.5%. Los resultados se deben presentar en la forma dada en la figura 14.1. Calcúlese la solución analítica y úsese para determila integracion deRomberg. nar el errorreal E, delresultadoobtenidocon Verifíquese que E , sea menor que el criterio de paro E,. 14.2
Efectúense los mismos cálculos del problema 14.1 con la integral xeZx dx
14.3
Utilicese la integración deRombergpara
evaluax
dx
con una exactitud del O . 1 % . Los resultados se deben presentar en la forma dada en la figura 1 4 . 2 .
lNTEGRACl6N DE ROMBERG Y CUADRATURA GAUSSIANA
485
14.4
ObtQngaseuna estimación de la integral del problema 14.1 usando fórmulas de Gauss-Legendre de dos, tres y cuatro puntos. Calcúlese E , para cada caso en base a la solución analítica.
14.5
Obténgase una estimación de la integral del problema 14.2, usando fórmulas de Gauss-Legendre de dos, tres y cuatro puntos. Calcúlese para cada caso con base a la solución analítica.
14.6
Usando fórmulas de Gauss-Legendre desde dos hasta cinco puntos, obténgase una aproximación de la integral del problema 14.3.
14.7
Usando integración de Romberg (E, = O.Ol%), repítanse los cálculos de los ejemplos 13.3 y 14.5 para el problema del paracaidista.
14.8
Utilícense métodos analíticos (recuérdese el cuadro V. 1)y las fórmulas de GaussLegendre de dos a seis puntos para resolver
14.9
Desarróllese un programa legible al usuario sobre la integración de Romberg basado en la figura 14.3. Pruébese repitiendolos cálculos mostrados enla figura 14.2.
14.10 Desarróllese un programa legible al usuario sobre la cuadratura gaussiana basado en la figura 14.7. Pruébese repitiendo los cálculos de los ejemplos 14.3 y 14.4. 14.11 Utilícese el programa desarrollado en el problema 14.9 para resolver los proble-
mas 14.1 y 14.2 y 14.3. 14.12 Utilícese el programa desarrollado en el problema 14.10 para resolver 10s pro-
blemas 14.4, 14.5 y 14.6.
"
.
..
C A P í T U L OQ U I N C E
V: CASOSDELAPARTE INTEGRACI~N
El propósito de este capítulo es el de aplicar los métodos de integración numérica analizados en la parte V, a problemas prácticos de ingeniería. Frecuentemente se encuentran dos situaciones;la primera de ellas es cuando la función en estudio se puede expresar de forma analítica pero es demasiado complicada para integrarse usando los métodos del cálculo. La integración numérica se aplica a casos de este tipo usando la expresión analítica para generar una tabla de argumentos y valores de la función. En el segundo caso, la función a integrarse es, por naturaleza, de forma tabular. Este tipo de funciones, en general, representan una serie de medidas, observaciones o alguna otra información empírica.Los datos en cualquier caso son compatibles directamente con varios esquemas de integración numéricaanalizadaenloscapítulos 13 y 14. El caso 15.1, que analiza los flujos de efectivos en una compañía de computadoras, es un ejemplo de la integración en su forma tabular. Se usa la regla trapezoidal y la regla de Simpson de 1/3 para determinar el flujo de efectivos. El caso 15.2, que trata de cálculos de calor de la ingeniería química, comprende datos analíticos. En este caso de estudio, se integra numéricamente una función analítica para determinar el calor necesario que eleve la temperatura de un material. Los casos 15.3 y 15.4 se relacionan con funciones dadas en forma analítica. El caso 15.3, tomado de la ingenieríacivil,usalaintegración numérica para determinar la fuerza del viento total que actúa sobre el mástil de un velero de carreras. El caso 15.4 determina laraíz de la corriente media al cuadrado (RMS) de un circuito eléctrico. Este ejemplo se usa en la demostración de la utilidad de la integración de Romberg y la cuadratura gaussiana. Finalmente, el caso 15.5 regresa al análisis de la información tabular para determinar el trabajonecesario para mover un bloque. Aunque este ejemplo tiene conexión directa con la ingeniería mecánica, tiene aplicación en todas las otras áreas de la ingeniería. Entre otras cosas, este caso ilustrala integración de datos desigualmente espaciados.
488
INGENIEROS MÉTODOS
CASO 15.1
NUMÉRICOS
PARA
ANALISIS DE MOVIMIENTO DE EFECTIVOS (INGENIERíAENGENERAL) Antecedentes: el análisis de movimiento de efectivos es una parte importante dentro de cualquier proyectode ingeniería o de cualquier proyecto de negocios. El efectivo disponible puede afectar muchos aspectos del problema, por ejemplo, la localización de recursos (véase el caso 9. I ) . La posición de un ingeniero enla Compañía de Computadoras Micro-1 es lade calcular el efectivo total generado de una venta de computadoras en los primeros 60 días que siguen a la introducción de una computadora al mercado (véase el cuadro 15.1 sobre los datos de venta de computadoras). Su problema es complicado ya que el costo de la computadora esmuy sensitivo a la demanda abastecimiento o a la disponibilidad. Los equipos de ventas e investigación de mercados han obtenido la información de que el precio de venta base considerando una demanda óptima es de $1 250 por computadora. A medida que la demanda disminuye, el precio aumenta a un máximo de $3 O00 por computadora. Más aún, la variación continua del costo con un suministro N se define por la ecuación derivada empíricamente:
Costo por computadora ($) que se grafica enlafigura
=
3 O00
-
1 750
N 10 O00
+N
[15.13
15.1.
CUADRO 15.1 Datos de venta de computadoras y de fluio deefectivos. La columna c) se calcula usando derivación num6rica de la información enla columna b). El primero y último valor de la columna e) se determinan usando diferencias hacia adelante y hacia atrásde orden h2, los valores medios mediante diferencias centrales de ordenh2 Efectivo Costo por computadora, generado ($) [basado diariaPromedio de Cantidad de computadoras Número de computadoras en la columna meme $ vendidas 4 Y la computadodisponibles en el mercado ras vendidas diariamente ecuación (1 5.1 )] [(c) X ( d ) ] a) b) 4 4 e)
50 O00 35 O00 31 O00 20 O00 19 O00 12 050 11 O00
O 15 O00 19 O00 30 O00 31 O00 37 950 39 O00
2 050.0 950.0 1 500.0 600.0 397.5 400.0 -1 90.0
1 542 1 639 1 677 1 833 1 853 2 040 2 083
3 161 100 1 557 050 2 515 500 1800 099 736 568 816 O00 -395 770
Tiempo en días f)
O 10 20 30 40 50 60
CASOS DE LA PARTE V: l N T E G R A C l 6 N
FIGURA 15.1
489
Costo de las computadoras contra el número de computadoras enelrnercado. La curva se basa en la ecuación (15.1).
Solución: el efectivo total generado estádadopor Efectivo total
=
(u" (efectivo generado diariamente) dt
Efectivo total
=
r
(promedio de ventas
X
costo unitario) dt
En este caso, el promedio de ventas de los días O al 60 está dado por la columna c ) del cuadro 15.1. El promedio se determina usando diferencias divididas finitas (recuérdese la sección 3.5.4) para apoximarla primera derivada de la columna b). Nótese cómo, debido a la variación de los datos, la aproximación a la derivada en la columna c) varía mucho. En efecto, aunque la venta total de computadoras siempre crece, la variación en los datos proporciona un promedio de ventas negativo en el día 60. Este inconveniente se debe a que las aproximaciones numéricas de las derivadas son altamente sensitivas al cambio en los datos. El costo por computadora diariose calcula en base a la ecuación (15.1) y el número de computadoras disponibles se muestra en la columna a) del cuadro 15.1. El costo por computadora diario desde el día O hasta el 60 está dato en la columna d ) . En la columna e ) se muestra el efectivo generado diariamente. Este dato se puede usar en conjunto con los procedimientos de integración numérica analizados enelcapítulo 13. En el cuadro 15.2 se muestran los resultados de aplicarla regla trapezoidal y la regla de Simpson de 1/3 a este problema. Nótese como va-
490
INGENIEROS METODOS
CUADRO 15.2
NUMÉRICOS PARA
Resultados al aplicar la regla trapezoidal y la regla de Simpson de 113 para calcular el flulo de efectivos generado dela venta de computadoras Mdtodo
Segmentos Efectivo generado
Regla trapezoidal
Regla de
Simpson de
1/3
$
1 2 3 6
82 959 900 950 74 473 96 294 660 81 075 830
2 6
71 645 300 77 202 887
rían los resultados ampliamente, dependiendo de cuántos segmentos se empleen en el análisis. En particular, la estimación de la versión de tres segmentos de la regla trapezoidal es mucho mayor que las otras estimaciones debido a la inclusión selectiva de las altas estimaciones de flujo de efectivos eneldía 20. En base a este análisis se puede concluir que el flujo de efectivos es de aproximadamente $77 millones. Sin embargo, los resultados indican que se debe tener cuidado cuando se aplican los métodos de integración numérica y que las aproximacionesde datos tabulares pueden, en general, mejorarse si se obtiene información adicional. Esta conclusiónla comprueba el caso de estudio 15.5 en donde se demuestra que el número de datos puede tenerun efecto significativo en el resultado final de laaproximación a una integral.
CASO 15.2
EL USO DEINTEGRALESPARADETERMINARLA CANTIDAD TOTAL DE CALOR EN LOS MATERIALES (INGENIERíA QUíMICA) Antecedentes: los cálculos de calor se emplean rutinariamente en la ingeniería química, asícomo también en otros campos de la ingeniería. Este caso proporciona un ejemplo simple pero muy útil de estos cálculos. Un problema que se encuentra a menudo es determinar la cantidad de calor necesaria para elevarla temperatura de un material. La característica necesaria para realizareste cálculo es la capacidad calorífica c. Este parámetro representa la cantidad de calor necesaria para elevar una unidad de masa a una unidad de temperatura. Si c es la constante sobre el rango de temperaturas quese van a examinar, el calor necesario AH (en calorías) se calcula como
AH
=
me AT
[15.2]
49 1
CASOS DE LA PARTE V: INTEGRACldN
en donde c tiene unidades de calorías por gramo por grado centígrado, m es la masa (en gramos) y AT es el cambio de temperatura (en grados centígrados). Por ejemplo, la cantidad de calor necesaria para elevar 20 g deaguade 5 a 10°C es igual a
AH
=
(20)1(10 - 5) = 100 cal
en donde la capacidad calorífica del aguaes aproximadamente 1 cal/g/"C. Tal valor es adecuado cuando AT es pequeño. Sin embargo, en rangos mayores de temperatura,la capacidad caloríficano es constante, y de hecho, varía en función de la temperatura. Por ejemplo, la capacidad calorífica de un material aumenta con la temperatura de acuerdoa relaciones tales como
c(T) = 0.132
+ 1.56 X
10-4T + 2.64
En este caso se pide calcular el calor deestematerialde -100 a 200°C.
X
10-7T2
[15.3]
necesario para elevar 1 O00 g
Solución: la ecuación (V.3) proporciona una manera de calcular el valor promedio de c ( T ) :
quepuedesersustituidoen
AH
=m
ITT:c(T)dT
la ecuación (15.2) y obtenerse
[15.4]
en donde AT = T2- T1.Ahora, ya que en este caso c(T) es una cuadrática simple, AH se determina analíticamente. La ecuación (15.3) se sustituyeenla ecuación (15.4) y el resultado se integra para obtener el valor exacto de AH = 42 732 calorías. Es útil y además instructivo comparar este resultado con los métodos numéricos desarrollados en el capítulo 13. Para llevar a cabo esto, es necesario generar una tabla de valores de c paravariosvaloresde T: T, OC
-100 -50 O 50 100 150 200
c callglOC
0.119 0.124 0.132 0.140 0.150 0.161 0.173
04 86 O0 46 24 34 76
092
MÉTODOS
NUMÉRICOS PARA INGENIEROS
Estos puntos se usan junto con la regla de Simpson de 1/3 usando seis segmentos y se calcula una integral aproximada de 42.732. Este resultado se sustituyeenla ecuación (15.4) quelleva alvalor AH = 42 732 calorías, resultado que coincide exactamente con la solución analítica. Esta coincidencia se esperaba ya que c es una función cuadrática y laregla de Simpson es exacta para polinomios de tercer orden o menos (véase la sección 13.2). Los resultados obtenidos con la regla trapezoidal se muestranenel cuadro 15.3. S e ve que la regla trapezoidal también es capaz de estimar el calor total de manera exacta. Sin embargo, se necesita un paso pequeño ( < 10°C) para una exactitud de cinco cifras significativas. Este ejemplo ilustra bien el por qué la regla de Simpson es muy popular. Es fácil llevarla a cabo, ya sea usando cálculos a mano o , mejor aún, conuna computadora personal. Además porlo comGn, es lo suficientemente exacta con tamaños de paso relativamente grandesy exacta para polinomios de tercer orden o menos.
CUADRO 15.3
Resultados obtenidos usando la regla trapezoidal con varios tamaños de paso Tamaño paso, de 300 150 1O0 50 25 10 5 1 0.05
CASO 15.3
OC
AH
96 43 42 42 42 42 42 42 42
€+
048 029 864 765 740 733.3 732.3 732.01 732.000 3
Yo
125 0.7 0.3 0.07 0.018 < 0.01 < 0.01 < 0.01 < 0.01
FUERZAEFECTIVA SOBRE EL MÁSTIL DE UN VELERODECARRERAS (INGENIERíA CIVIL) Antecedentes: enlafigura 15.2a se muestra un corte transversal de un velero de carreras. Las fuerzas del viento (fl ejercidas por pie de mástil desde las velasvarían en función de la distancia sobre la cubierta del bote (z) como lo muestra lafigura 15.2b. Calcúlese la fuerza de tensión T en el cable de soporte del lado izquierdo del mástil, suponiendo que el soporte del cable derecho está flojo y el mástil se une al casco de manera que transmita fuerzas verticales y horizontales pero no momentos. Supóngase que elmástil permanece vertical.
CASOS DE LA
V: INTEGRACldN
FIGURA 15.2
493
a) Sección transversal de un velero de carreras. b) Fuerzas del viento f eiercidas por pie de mástil en función de la distancia z sobre el casco del bote.
= tan= 0.099
0
Solución: para proceder con elproblema, se requiere que la fuerza distribuida f se convierta en una fuerza total equivalente F y que se calcule su posición efectiva d sobre el casco (Fig. 15.3). Este cálculo se complica por el hecho de que la fuerza ejercida por pie de mástil varía con la distancia sobre el puente. La fuerza total ejercida sobreel mástil expresa comounaintegraldelasiguientefuncióncontinua:
(3/30),’ 668 7 ,
I-
“N
FIGURA 15.3 Diagrama de cuerpo libre de las fuerzas ejercidas en el mástil de un velero.
Estaintegralnolineal es difícil de evaluar analíticamente. Por lo tanto, es conveniente emplear un método numérico tal como la regla de Simpson y la regla trapezoidal para este problema. Esto se lleva a cabo calculando f(z) paravariosvalores de z y, después, usandolas ecuaciones (13.10) y (13.18). Por ejemplo, el cuadro 15.4 tiene valores def(z) para un tamaño de paso de 3 pies que proporciona datosde la regla de Simpson de 1/3 y de la regla trapezoidal. En el cuadro 15.5 se muestran resultados de varios valores del tamaño de paso. Se observa que ambos métodos proporcionan un valor de F = 1 480.6 libras a medida que el tamaño de paso decrece. En este caso, el tamaño de paso de 0.05 pies en la regla trapezoidal y de 0.5 en la regla de Simpson proporciona buenos resultados.
INGENIEROS METODOS
494
NUMÉRICOS
PARA
CUADRO 15.4Valoresde f(z) con un tamaño de paso de 3 piesqueproporcionan datos de la regla trapezoidal y la regla de Simpson de 113
f(z),lblpies
z, pies
O 6 1.40 73.13 70.56 63.43 55.18 47.14 39.83 33.42 27.89 23.20
O 3 6 9 12 15 18 21 24 27 30
La línea de acción F (Fig. 15.3) se calculaevaluando la integral.
CUADRO 15.5 Valores de F calculados en basea varias versiones de la regla trapezoidal y la regla de Simpson de 113 _____
_____________
Método pies
~~
Tamaño de paso,
Segmentos
F, libras
15 10 6 3 1 0.5 0.25 o. 1 0.5
2 3 5 10 30 60 120 300 600
1 001.7 1222.3 1 372.3 1450.8 1 477.1 1 479.7 1 480.3 1 480.5 1 480.6
2 6 10 30 60
1 219.6 1 462.9 1 476.9 1 480.5 1 450.6
Regla trapezoidal
de Regla Simpson de 113
15 5 3 1
0.5
CASOS DE
495
V: INTEGRACldN O
lo3'
200z[z/(5
d=
+ ~ ) ] e - ~dz/ ~ '
1480.6
Esta integral se evalúa usando métodos similaresa los anteriores. Porejemplo, la regla de Simpson de 1/3 con un tamaño de paso de0.5 proporciona
19 326.9 1 480.6
d =
=
13.05 pies
Con F y d conocidos de los métodos numéricos, se usa un diagrama de cuerpo libre para desarrollar ecuaciones de equilibrio de fuerzas y momentos. Este diagrama de cuerpo libre se muestra en la figura 15.3. Sumando fuerzas en la dirección vertical y horizontal y tomando momentos alrededor delpunto O , se obtiene EFH = O = F
CF"= O EM0
=
O
-
Tsen 8
-
H
[15.9]
=
v - reos o
[15.10]
=
3V - Fd
E15.111
en donde T es la tensión en el cable. H y V son las reacciones que se desconocen sobre el mástil transmitidas al casco. La dirección y magnitud de H y V se desconocen. La ecuación (15.11) se resuelve directamente para V ya que se conocen F y d .
Por lo tanto, de la ecuacion (15.l o ) ,
y de la ecuación (15.9),
H = F
-
T sen 8
=
1 480.6
-
(4 473)(0.099 5)
=
836.54 lb
Estas fuerzas le ayudan al diseñador para continuar con otros aspectos del diseño estructural delvelero, tales como los cables y el sistema de soporte del mástil sobre el puente. Este problema ilustra muy bien dos usos dela integración numérica que se pueden encontrar durante el diseño
496
METODOS NUMÉRICOS
PARA INGENIEROS
de estructuras.Se ha visto que la regla trapezoidal y la regla de Simpson de 1/3 sonfáciles de aplicar y sonherramientasprácticas enla solución de problemas. La regla de Simpson de 1/3 es más exacta que laregla trapezoidal para el mismo tamaño de paso y por lo tanto, se prefiere a menudo.
CASO 15.4
DETERMINACIóN DE LA CORRIENTERMS MEDIANTEINTEGRACIóN NUMÉRICA (INGENIERíA ELÉCTRICA) Antecedentes: el valor efectivo de una corriente eléctrica cuyo valor varía periódicamente está dado porla fórmula de raíz cuadrada de la corriente al cuadrado (véase el caso 12.4):
IWS =
1
i2(t)dt
[15.12]
endonde T es el periodo, esto es, eltiempode un ciclo e i(t) es la corriente instantánea.Calcúlese la corriente RMS de la forma de onda mostrada en la figura 15.4 usando la regla trapezoidal, la regla de Simpson de 1/3, la integración de Romberg y la cuadratura gaussiana para T = 1 s. Recuérdese que enel caso 12.4, se resolvió este problema por integra-
FIGURA 15.4
Corriente eléctrica que varíaperiódicamente.
CASOS DE
497
V: INTEGRACldN
CUADRO 15.6
Valores dela integral calculada usando varios métodos num6ricos. El error relativo porcentual E, se basa en el valor verdadero de
15.412 608 1 Método
Segmentos Integral
Regla trapezoidal
de
Regla Simpson de
1/3
E,
%
1 2 4 8 16 32 64 128
0.0 15.163 266 5 15.401 429 1 15.411 958 4 15.412 568 2 15.412 605 6 15.412 607 9 15.412 608 1
1 O0 1.62 0.0725 4.21 x 10-3 2.59 x 10-~ 1.62X 10-5 1.30x low6 O
2 4 8 16 32
20.217 688 7 15.480 816 6 15.415 468 1 15.412 771 4 15.412 608 1
-31.2 -0.443 -018 6 -1.06 x 103 O
ción analítica dela parábola que se había ajustado a la función cuya aproximación a laintegralfuede 20.217 688 7. Solución: en el cuadro 15.6 se muestra la aproximación a la integral con varias aplicaciones de la regla trapezoidal y la regla de 1/3 de Simpson. Una aplicación de la regla de Simpson de 1/3 obtiene el mismo resultado del caso de estudio 12.4. Esto ya se esperaba porquela regla de Simpson de 1/3 corresponde al área bajo la parábola ajustada a los tres puntos. Nótese que la regla de Simpson es más exacta que la regla trapezoidal. El valor exacto de la integral es 15.412 608 1. Este resultado se obtiene usando la regla trapezoidal con 128 segmentos o la regla de Simpson con 32 segmentos. Usando la integración de Romberg se determina la mismaaproximación (Fig. 15.5).
"
FIGURA 15.5
Resultados obtenidosusando la corriente RMS.
la integracióndeRomberg
para calcular
498
MÉTODOS
NUMÉRICOS
PARA INGENIEROS
Además, se puede usar la cuadratura gaussiana para obtener la misma aproximación. Recuérdese que la determinación de la corriente RMS del caso 12.4 se incluye la evaluación de la integral (T = 1)
I
(b” (lOe-t sen 2at)* dt
=
[15.13]
Primero se hace un cambio de variable aplicando la ecuación (14.23) y (14.24) para obtener
1 4
1 4
t = - + - t d
Y
1 4
dt = - dtd
Estas relaciones se sustituyen en la ecuación (15.13) y se obtiene
Con la fórmula de Gauss-Legendre de dos puntos,la función se evalúa en t d = 1/43 y - 1/43, con los resultados de 7.684 096 2 y 4.313 728 O , respectivamente. Estos valores se sustituyen en la ecuación (14.17) y se obtiene una aproximación a la integral de 11.997 824 2, que representa un error del = 22%. La fórmula de tres puntos es (cuadro 14.1):
I
=
0.555 555 556 (1.237 449 345) + 0.888 888 889 (15.163266 49)
+ =
0.555 555 556 (2.684 914 679)
15.657 550 21
=
1.6%
En el cuadro 15.7 se resumen los resultados del uso de fórmulas de más puntos. CUADRO 15.7
Resultadosobtenidosusandovarios puntos y la cuadratura gaussiana para aproximar la integral ~~
Puntos
Aproximacih
2
824 11.997 3 15.657 550 2
5
15.412 639 1 610 9
3 802 15.4054
15.4126
3
!%
22.1 -1.59 4.42 x -2.01 X 1 0 - ~ -1.82 x 10-5
499
CASOS DE LA PARTE V: INTEGRACldN
Laaproximación a laintegralde 15.412 608 1 se sustituyeenla ecuación (15.12) y se calcula IRMscomo 3.925 889 5 A. Esteresultado se emplea en la guía de otros aspectos del diseño y operación del circuito.
CASO 15.5
INTEGRACIóN NUMÉRICA EN EL CALCULO DE TRABAJO (INGENIERíA MECANICA) Antecedentes: muchos problemas de ingeniería incluyen el cálculo del trabajo. Lafórmulageneral es: Trabajo = fuerza
X
distancia
Cuando se estudia este concepto en la materia de físicaa nivel preuniversitario, se presentan aplicaciones simples usando fuerzas que permanecen constantes a través del desplazamiento. Por ejemplo, si se usauna fuerza de 10 libras para jalar un bloque una distancias de 15 pies, el trabajo se calcula como 150 pies X libra. Aunque este cálculo simple es útil enla introducción del concepto, los problemas realistas, en general, son más complejos. Por ejemplo, supóngase que la fuerza varía durante el curso del cálculo. En estos casos, la ecuación del trabajo puede expresarse como
w=
F(x) cix
[15.14]
donde W es el trabajo en pie X libra, x. y x, son las posiciones inicial y final, respectivamente y F(x) es la fuerza que varía en función de la posición. Si F(x) es fácil de integrar, entonces la ecuación (15.14) se integra analíticamente. Sin embargo, en problemas reales, la fuerza no se puede expresar de esta manera. De hecho cuando se analizan los datos medios, la fuerza puede estar disponible en forma tabular. En estos casos, la integración numérica es laúnicaopciónviablepara la evaluación. Cuando el ángulo de la fuerza y la dirección del movimiento también varíanconla posición, se introducemayorcomplejidad(Fig. 15.6). La ecuación del trabajo se puede modificar aún más tomando en cuenta este efecto,
w=
F(x) cos [O(x)] dx
[15.15]
Otra vez, si F(x) y O(x) son funciones simples, la ecuación (15.15) se resuelve analíticamente. Sin embargo, como en la figura 15.6, es más fácil
500
MÉTODOS
FIGURA 15.6
NUMERICOS
PARA INGENIEROS
Caso de una fuerza variable que actúa sobre un bloque. Eneste caso, el ángulo, así como la magnitud de la fuerza varían.
que la relación funcional sea complicada. En este caso, los m6todos numéricos proporcionan la única alternativa para determinar la integral. Supóngase que seva a calcular la situación mostrada en la figura 15.6. Aunque la figura muestra los valores continuos deF(x) y B(x),se supone que debido a restricciones experimentales, dnicamente se proporcionan las medidas discretas en intervalos de x = 5 pies (cuadro 15.8). Utilicense las versiones de un segmento y de segmentos múltiples de la regla trapezoidal y las reglas de Simpson de 1/3 y 3 / 8 para calcular el trabajo con estos datos. Solución: en el cuadro 15.9 se muestran los resultados resumidos delanálisis. Se calculó un error relativo porcentual E ~ ,en referencia al valor real
E
CASOS DE LA
50 1
V: INTEGRACldN
CUADRO 15.8 Datos de la fuerza F ( x ) y del ánglo @(x) en funcidn de la posicidn x F(x),libras O, radianes F(x)cos 0
x , pies
O 13.0 14.0 10.5 12.0
0.0 9.0
5 10 15 20 25 30
5.0
0.000 o 1 S29 7 9.512 O 8.702 5 2.808 7 1.088 1 0.353 7
030 1.40 0.75 0.90 1.30 1.48 1S O
de la integral cuyo valor es 129.52, calculando en base a los valores tomados de lafigura 15.6 con intervalos de un pie. Estos resultados son importantes porque el resultado másexacto ocurre cuando se usala regla trapezoidal de dos segmentos. Las estimaciones más refinadas usando mássegmentos, así como la regla de.Simpson, llevan a resultados menos exactos. La razón de este resultado aparentemente ilógico es que el espaciamiento grueso de los puntos no es adecuado para capturar las variaciones de las fuerzas y los ángulos. Esto es evidente enlafigura 15.7, en donde se ha graficado la curva continua de los productos de F(x) y cos [e(x)].Nótese cómo el uso de siete puntos para caracterizar la continuidad de la función falla en los dos picos x = 2.5 y x = 12.5 pies. La omisión de estos dos puntos limita efectivamente la exactitud de la integración numérica en el cuadro 15.9. El hecho de que la regla trapezoidal de dos segmentos obtenga la mayor precisión en estos resultados se debe a la forma en que se posicionan los puntos en este problema en particular (Fig. 15.8). CUA,DRO 15.9
P
A roximaciones del trabalo calculado usando la reg a trapezoidaly la regla de Simpson. El error relativo oreentual (e,) se calculd en referencia al valor rea de la integral (129.52 pies libra)calculado en base a los valores en intervalos de1 pie
P
M6todo Regla trapezoidal
Regla de Simpson de
1 2 3 6
1/3 2 6
Regiade
Simpson de
3/8 3
95.9
5.31 -2.84 133.19 3.51 124.98 1 1 9.09
8.05
175.82 -35.75 9.57117.13 139.93
-8.04
502
METODOS NUMÉRICOS
PARA INGENIEROS
FlGlJRA 15.7 Gráfica
continua de f(x) cos [O(x)]contra la posición, junto con los siete puntos discretos usados para desarrollar la aproximación a la integral numérica del cuadro 15.9. Nótese cómo el uso de siete puntos para caracterizar esta función que varía continuamente omite dos picos en x = 2.5 y 12.5 pies.
FIGURA 15.8
Esquema gráfico del por qu6 la regla trapezoidal de dos segmentos genera una buena aproximación de la integral para este caso en particular. Por casualidad el uso de los dos trapecios genera un balance entre los errores positivos y negativos.
503
CASOS DE LA PARTE V: INTEGRACION
FIGURA 15.9
Esquemas de segmentación desigual que resulta al incluir dos puntos iniciales en x = 2.5 y 12.5 en los datos delcuadro 15.8. Se muestran las fórmulas de integración aplicadas a cada conjunto de segmentos.
La conclusión derivada de la figura 15.7 es que se debe hacer un número adecuado de medidas para calcular exactamente las integrales. En este caso, si se conociera F (2.5) cos [0(2.5)]= 4.350 O y F(12.5) cos [6(12.5)] = 11.360 O se podría determinar un cálculo de la integral usando el algoritmo de datos desigualmente espaciados descrito previamente enla sección 13.3. En la figura 15.9 se ilustra la segmentación desigualen este caso. Incluyendo los dos puntos adicionales, llevaa un mejor cálculo dela integral de 126.9 (E,, = 2.02%). Por lo tanto, lainclusiónde los datos adicionales podría incorporarlos picos que se habían ignorado previamente y, en consecuencia, !levar a un resultado mejor.
PROBLEMAS Ingeniería en general 15.1
Repítanse los cálculos del caso 15.1 usando los programas propios
504
NUMERICOS
15.2
METODOS
Efectúense los mismos cálculos del caso 15.1, pero envez de usarla ecuación (15.1) utilícese la siguientefórmulaalternativa: Costo por computadora ($) = 1250
15.3
PARA INGENIEROS
+
1750e-5”10-5N
AI efectuar un estudio de la linea de ensamble de unaplanta de automóviles, en un periodo de 24 horas, se visitan dos puntos sobre la línea y en instantes diferentes durante el día se verifica el ntímero de autos que pasa por ahí en un minuto. Los datos son
~~
~~
~
~
~~
~~
~~
_ _ ~
Punto A
~~~
~~~
~
Punto B
Tiempo
Carrodminuto
Tiempo
Carrodminuto
Medianoche 2 A.M. 3 A.M. 6 A.M. 9 A.M. 11 A.M. 2 P.M. 5 P.M. 6 P.M. 7 P.M. P.M. Media noche
3
Medianoche 1 A.M. 4 A.M. 5 A.M. 7 A.M. 10 A.M. 1 P.M. 3 P.M. 9 P.M. 10 P.M. 11 P.M. Medianoche
3
3 5 4 5
6 2 1 1 3 4 6
a
3 5 2 1 4 3 4 6 1 3 6
Utilícese integración numéricay la ecuación V.3para determinar el número total de carros que pasa por día en cada punto. 15.4
Los datos del cuadro P15.4 proporcionan medidasdelflujo de calor q sobre la superficie de un colector solar en intervalos de una hora. Calcúlese el calor total absorbido por un panel colector de 150 O00 cm2 durante un periodo de 14 horas. El panel tiene una eficiencia de absorción eobdel 45%. El calor total absorbido está dado por
H
=
eab
S1
q A dt
en donde A es el área y q es el flujo de calor
Ingeniería Química 15.5
Repítanse los cálculos del caso 15.2 usando los programas propios.
15.6
Efectúense los mismos cálculos del caso 15.2calculando la cantidad de calor necesario para elevar la temperatura de 2 O00 g de material desde ”2 000 hasta
505
CASOS DE LA PARTE V: INTEGRACldN
TABLA P15.4
Medidas del flujo de calor solar
Tiempo, h
Flujo de calor q, colorks/cm2/h
o. 1
6 7 8 9 10 11 12 13 14
1.62 5.32 6.29 7.8 8.81 8.00 8.57 8.03 7.O4 6.27 5.56 3.54 1 .o 0.2
100°C. Utilicese la regla de Simpson en los cálculos, con valores de T a intervalos de 5OOC. 15.7
Repítase el problema 15.6 usando integraci6n de Romberg con
15.8
Repítase el problema 15.6 usando la fórmula de Gauss-Legendre de dos y tres puntos. Interprétense los resultados.
15.9
Utilicese la regla de Simpson para calcular el calor total de la placa mostrada en el caso 9.2 sila capacidad calorífica está definida por la ecuación (15.3).
E"
= 0.01%.
Ingeniería civil 15.10 Repítanse los cálculos del caso 15.3 usando sus propiosprogramas 15.11 Repítanse los cálculos del caso 15.3 usando la integración de Romberg para evaluarla integral. Usese un criterio de paro de e, = 0.25%. 15.12 Ejecútense los mismos c6lculos del caso 15.3 usando la cuadratura de Gauss para evaluar la integral. 15.13 Ejecútense losmismos cálculos del caso 15.3 cambiando la integral a
506
NUMERICOS
METODOS
PARA INGENIEROS
15.14 Para ciertos trabajos sobre ingeniería de recursos de agua, que incluye la prevención de inundaciones y el diseño de reservas, se requieren canales de área transversal ( A ) . A menos que se disponga de dispositivos de sondeo electrónico en la obtención de perfiles continuos del fondo del canal. el ingeniero debe confiar en las medidas discretas de la profundidad a calcular. En la figura P15.14 se ilustra una sección transversal de un canal común. Los puntos representan posiciones en donde se ancló el bote y se tomaron lecturas de la profundidad. Utilícense dos ecuaciones dela regla trapezoidal ( h = 4 y 2 m) y la regla de Simpson de 1/3 para calcular el área transversal a partirde estos datos 15.15 Durante una investigación de campo es necesario calcular el área del campo mostrado en la figura P15.15. Utilícense las reglas de Simpson para determinar elárea.
15.16 Un estudio de ingeniería de tránsito'sequiere el cálculo del número total de carros que pasa a través de una intersección en un periodo de 24 horas. Un individuo visita laintersección varias veces durante el díay cuenta el número de carros que pasa a través de la intersección en un minuto. Utilícense estos datos, que se encuentran resumidos en el cuadro P15.16, para calcular el número total de carros que pasa por la interseccióndurante el día. (Téngase cuidado con las unidades.)
Ingeniería eléctrica 15.17 Repítanse los cálculosdel caso 15.4 usandolosprogramaspropios
TABLA P15.16
Promedio de flujo de tráfico en una intersección medido envorios tiempos en un periodo de24 horas Tiempo
Promedio, carroslmin
12:OO Medianoche 2:00 A.M. 6:OO A.M. 7:OO A.M. 8:OO A.M. 9:OO A.M. 11:o0 A.M. 1:OOP.M. 3:OO P.M. 4:OO P.M. 5:OO P.M. 6:OO P.M. 7:OOP.M. 8:OOP.M. 1O:OOP.M. 12:OO Medianoche
10
4 .6 40 60 80
25 18 17 28
35 77 40
30 31 15
507
V: INTEGRACION
CASOS
FIGURA P15.14
Sección transversal de un canal.
FIGURA P15.15
Campo limitado por dos caminosy
""".""".
..
un arroyo.
508
INGENIEROS
PARA
MÉTODOS
NUMERICOS
15.18 Efectúense los mismos cálculos del caso 15.4 usando una función de corriente dada por: i(t) =
sen 2?rt
i(t) = O
por O
It S
por T / 2
r/2
It I
T
e n donde T = 1 s. Utilícese la regla de Simpson de 1/3 con 16 segmentos para calcular la integral. 15.19 Repítase el problema 15.18 usando cuadratura gaussiana 15.20 Repítase el problema 15.18 usando integración de Romberg a
E,
=
0.1%.
Ingeniería mecánica 15.21 Repítanse los cálculos del caso 15.5 usando los programas propios 15.22 Ejecútense los mismos cálculos del caso 15.5 usando la siguiente ecuación para calcular:
F(x) = 1 . 1 7 ~- 0 . 0 3 5 ~ ~ Empléense los valores de 6 del cuadro 15.8 15.23 Ejecútense los mismos cálculos del caso 15.5pero con la siguiente ecuación para calcular:
Empléese la ecuación del problema 15.22 para F(x). Utilícese la regla trapezoidal con cuatro, ocho y dieciséis segmentos para calcular la integral. 15.24 Repítase el problema 15.23 con la regla de Simpson de 1/3 15.25 Repítase el problema 15.23 usando integración de Romberg hasta
E$
=
O. 1% .
15.26 Repítase el problema 15.23 usando cuadratura gaussiana 15.27 Leánse todos los casos del capítulo 15. En base a las lecturas y a la experiencia invéntese un caso propio en cualquiera de los campos de la ingeniería. Esto puede implicar la modificación o la reexpresión de alguno de los casos. Sin cmbargo, también puede ser totalmente original.Como sucede en los ejemplos del texto, se debe elaborar enfocando los problemas de ingeniería y debe demostrar el uso de los métodos numéricos para la integración. Escrlbanse los resultados usando los casos propios como modelos.
EPíLOGO: PARTE V
V.4
ELEMENTOS DE JUICIO El cuadro V.3 muestra un resumende los elementos de juicio relacionados con la integración numérica o cuadratura. La mayor parte de estos métodos se basa en la interpretación física simple de que una integral es el área baio la curva. Estos métodos están diseñados para evaluar la in1 ) una función tegral endoscasosdiferentes: matemática continua y 2) datos discretos en forma tabular. Las fórmulas de Newton-Cotes son los primeros métodos analizados en el capítulo 13. Son aplicables a funciones continuasy a funciones discretas. Se dispone de estas fórmulas en sus versiones cerradas y abiertas. las formas abiertas, que tienen límites de integración extendidos más allá del rango de los datos, rara vez se usan en la evaluación de integrales definidas. Sin embargo, tienen gran utilidad en la solución de ecuaciones diferenciales ordinarias, analizada enel capítulo 17.
Las fórmulas de Newton-Cotes cerradas se basan en el reemplazo de una función matemática o de datos enforma tabular enun polinomio quees fácil de integrar. La versión más simple es la regla trapezoidal, que se basa en tomar el área baio una línea recta que une los valores adyacentes de la función. Una manera de meiorar la exactitud de la regla trapezoidal es la de dividir el intervalo de integración de a a b en un conjunto de segmentos y aplicar el método a cada uno de los segmentos. Además de aplicar la regla trapezoidal con segmentación más fina, otra manera de obtener una aproximación más exacta a la integral es eluso de polinomios¿e orden superior para conectar los puntos. Si se emplea una ecuación cuadrática, el resultado es la regla de Simpson de 1/3. Si se usa una cúbica el resultado es la regla deSimpson de 3/8. Estas reglas se prefieren a la de la regla trapezoidal debido a que son mucho más exactas. Existen versiones de segmentos múltiples.En situa-
METODOS
510
?
>
O L
P
a
a
W
NUMÉRICOS
PARA INGENIEROS
EPILOG0 PARTE V
51 1
ciones con un número par de segmentos, se recomienda la aplicación múltiple de la regla de 1/3.Para el caso de un número impar de segmentos, se puede aplicar la regla 3/8 a los últimos tres segmentos y la regla de 1/3 a los restantes. También existen fórmulas de Newton-Cotes de orden superior. Sin embargo, rara vez se usan en la práctica. Cuando se requiere de alta exactitud se dispone de la integración de Romberg y de la cuadratura gaussiana. Debe hacerse notar que las fórmulas de integración de Romberg y la cuadratura gaussiana tiene valor práctico sólo en casos donde se conoce la función en forma continua. Estos métodos no funcionan para datos tabulares.
V.5 RELACIONES Y FóRMULAS IMPORTANTES En el cuadro V.4 se resume la información más importante analizada en la parte V. Este cuadro se puede consultar para tener un rápido acceso a las relaciones y fórmulas de mayor importancia.
V.6 MÉTODOS AVANZADOS Y ALGUNAS REFERENCIAS ADICIONALES Aunque se han analizado varios métodos numéricos, existen otros más que tienen utilidad en la práctica de la ingeniería. Por ejemplo, la integración adaptiva de Sirnpson se basa en la división del intervalo de integración en una serie de subintervalos de ancho h. En seguida se usa la regla de Simpson de 1/3 para evaluar la integral en cada subintervalo, partiendo el tamaño de paso de manera iterativa, es decir, con un tamaño de paso h, h/2, h/4, h/8, etc. Las iteraciones se continúan para cada uno de los subintervalos hasta que una aproximación con error calculado E, [Ec. (3.5)]cae dentro de un criterio de paro antes especificado E,. La integral total se calcula como la sumatoria de las aproximaciones a la integral evaluadas en cada subintervalo. Este método se usa, especialmente, en funciones complicadas que tienen regiones con variaciqnes de baio y alto orden. El análisis de la integración adaptiva se encuentra en Gerald y Wheatley (1 984) y Rice (1983). Otro método para la obtención de integrales es el de ajustar polinornios cúbicos segrnentarios a los datos. La ecuación cúbica resultante se puede integrar fácilmente (Forshyte et al., 1977).Finalmente, aparte de las fórmulas de Gauss-Legendre analizadas en la sección 14.2,existe una variedad de fórmulas de cuadratura. En Carnahan, Luther y
METODOS NUMERICOS PARA INGENIEROS
512
-2 N
t
N
x
l!
I
x
x
- x
x
Y
y
U
x'
h
x'
x
v
x
i;
+
h
t
C 9
x'
v
x
C
m
S
3 I
e,
U
EPíLOGO PARTE V
513
Wilkes ( 1 969) y Ralston y Rabinowitz ( 1 978) se resumen algunas de estas formulaciones. En resumen, lo anterior tiene la finalidad de proporcionar caminos para exploraciones más a fondo sobre el tema. Además, todas las referencias anterioresproporcionan descripciones de los métodos básicos cubiertos en la parte V. Sele sugiere al lector consultar estas fuentes alternativas de información para profundizar en los métodos numéricos de integración.
516
MÉTODOS
m-
d2x dt
+ C"
dX
dt
NUMÉRICOS
PARA INGENIEROS
+kx=O
[VI. 21
en donde c es un coeficiente de amortiguamiento y k es la constante delresorte. De manera similar, una ecuación de n-ésimo orden incluiría una n-ésima derivada. Las ecuaciones de orden superior se pueden reducir a un sistema de ecuaciones de primer orden. Para la ecuación (V1.2)) esto se lleva a cabo definiendo una nueva variable y donde
dx Y=%
[V1.3]
que se puede derivar y obtener
dy - d2x -"
[V1.4]
Las ecuaciones
(V1.3) y (V1.4) se pueden sustituir en la ecuación(V1.2)
df
dt2
y obtener m-dY
dt
+ cy + &x = o
[VIS]
O
dy "dt
cy
+ kx
[V1.6]
m
Por lo tanto, las ecuaciones (V1.3) y (V1.6) son un par de ecuaciones de primer orden que son equivalentes a la ecuación original de segundo orden. Debido a que otras ecuaciones diferenciales de n-ésimo orden se pueden reducir de lamisma manera, esta parte del libro se enfoca a la solución de ecuaciones de primer orden. Algunos de los casos de estudio del capítulo 18 tratan con la solución de E D 0 de segundo orden reduciéndolas a un par de ecuaciones de primer orden.
VI. 1.1.
M é t o d o s anteriores al en la solución d e E D 0
uso
de computadoras
Antes de la era de la computación, las E D 0 se resolvían por lo común, con métodos de integración analítica. Por eiemolo, la ecuacion (VI.l) se puede multiplicar por dt e integrarse para obtener
[V1.7]
517
ECUACIONES DIFERENCIALES ORDINARIAS
AI lado derecho de esta ecuación se le llama integral indefinida debido a que los límites de integración no están definidos. Esto contrasta con las integrales definidasanalizadas previamente enla parte V [compárese la Ec. (V1.7) con la Ec. (VS)]. Se obtiene una solución analítica de la ecuación (V1.7)si la integral indefinida se puede evaluar exactamente en forma de una ecuación. Por ejemplo, recuérdese que para el problema del paracaidista la ecuación (VI.7) se resuelve analíticamente mediantela ecuación (1.9) (suponiendo que v = O en t = O):
[V1.8] La mecánica de derivación de tales soluciones analíticas se analiza en la sección V1.2. En este momento, lo importante es que, como en el caso de la integral definida, la evaluación analítica de las integrales indefinidas, en general depende del conocimientoprevio de la respuesta. Desafortunadamente,las soluciones exactas de muchas EDOs de importancia práctica no existen. Como sucedeen la mayor parte de las Gtuaciones analizadas en otras partes de este libro, los métodos numéricos ofrecen la única alternativa viable enestos casos. Debido a que estos métodos numéricos, por lo común, requieren de computadora, los ingenieros de la era anterior al uso de las mismas se veían limitados enel alcance de sus investigaciones. Un método muy importante que los ingenieros y matemáticos desarrollaron para evitar este dilema fueel de linealización. Una ecuación diferencial ordinaria es aquella que se ajusta a la forma
a,(x)y'"'
+ . . . + a1 (x)y' + uo(x)y = +(x)
[V1.9]
en donde y(") es la n-ésima derivada de y con respecto a x y las a y las f son funciones específicas de x. A esta ecuación se le llama lineal ya que no hay productos o funciones no lineales de la variable dependiente y de sus derivadas. La importancia práctica de las E D 0 lineales es que se pueden resolver analíticamente.En contraste, la mayor parte de las ecuaciones no lineales no se pueden resolver exactamente. Por lo tanto en la épocaanterior al uso de computadoras, una táctica para resolver las ecuaciones no lineales fue la de linealizarlas. Un ejemplo simple de la aplicación de E D 0 es el predecir el movimientodel péndulo oscilante (Fig. VI.1). De manera similar ala derivación del problema del paracaidista, se puede usar la segunda ley de Newton para desarrollar la siguiente ecuación diferencial (véase el caso 18.5 para la derivación completa: FIGURA VI.l Péndulo oscilador.
d28
g
dt2
I
-+-sen0
=
O
CVl.1O]
518
METODOS NUMÉRICOS
PARA INGENIEROS
donde e es el ángulo de desplazamiento del péndulo, g es la aceleración gravitacional y I es la longitud del péndulo. Esta ecuación no es lineal ya que contiene el término sen 8 . Una manera deobtener una solución analítica es la de considerar pequeños desplazamientos del péndulo a partir del equilibrio (esto es, para valores pequeños de6 ), sen 8 = 8
[VI.11]
Por lo tanto, si se supone que sólo estamos interesados en los casos donde O sea pequeña, entonces la ecuación (VI.11) se puede sustituir en la ecuación (VI.1O) para obtener
[V1.12] De esta manera se ha transformado la ecuación ma lineal fácil de resolver analíticamente.
(VI.1 O) en una for-
Aunque la linealización sigue siendo una herramienta muy útil en la solución de problemas de ingeniería, existen casos donde no se puede usar. Por ejemplo, supóngase queestamos interesados en estudiar el comportamiento del péndulo para grandes desplazamientos a partir del punto de equilibrio. En estos casos, los métodos numéricos ofrecen una opción viable en la obtención de soluciones. Actualmente, la amplia disponibilidad de computadoras coloca esta opción al alcance de todos los ingenieros.
Vi. 1.2
Las
E D 0 en la práctica de la ingeniería
Las leyes fundamentales de la física, la mecánica, la electricidad y la termodinámica se basan en general en observaciones empíricas que explican la variación delas propiedades físicas y estados de los sistemas. En lugar de describir el estadode los sistemas físicos directamente, las leyes se expresan en cambios del tiempo y del espacio. En el cuadro VI.l se muestran varios ejemplos. Estas leyes definen mecanismos de cambio. Cuandoéstas se combinan con las leyes de continuidad ¿e la energía, de mesa o de momento, se generan ecuaciones diferenciales. La integraciónsubsecuente de estas ecuaciones diferenciales genera funciones matemáticas que describen el estado espacial y temporal de un sistema en términos variacionales de la energía, de la masa y de la velocidad.
El problema del paracaidista introducido en el capítulo 1 es un ejemplo de la derivación de una ecuación diferencial ordinaria a partir de una ley fundamental. Recuérdese que la segunda ley de Newton se usa en el desarrollo de una E D 0 que describe el cumbic propor-
519
ECUACIONES DIFERENCIALES ORDINARIAS
CUADRO VI. 1
Ejemplos de lasleyes fundamentales escritas en terminos del promedio de cambiode las variables ( t tiempo y x posición)
=
Variables y parámetros
Expresión matemática
Ley Segunda ley de Newton del movimiento
dv
f
dt
m
- = -
Flujo de calor = k-
Ley del calor de Fourier
Velocidad (v ), fuerza ( F ) y masa ( m )
aT
Conductividad térmica y temperatura ( T )
ax
ac Flujo de masa = 4 ax
Ley de difusión de Fick Ley de Farafay (describe la caída del voltaje a través de un conductor)
Caída de voltaje =
L-
di
(k)
Coeficiente de difusión (D) y concentración (c) lnductancia (I y) corriente ( i )
dt dc Acumulación = V--
Conservación de la masa
=
dt
Volumen (V) y concentración (c)
cional de la velocidad de caída del paracaidista. Integrando esta relación se obtiene una ecuación que predice la velocidad de caída en función del tiempo. Esta ecuación puede usarse de diferentes maneras, incluyendo propósitos de diseño. De hecho, estas relaciones matemáticas son la base de la solución de un gran número de problemas de ingeniería. Sin embargo, como se describe en la sección anterior, muchas de las ecuaciones diferenciales de significancia práctica no se pueden resolver usando métodos analíticos del cálculo. Por lo tanto, los métodos analizados en los capítulos siguientes son sumamente importantes entodos los campos de la ingeniería.
v1.2 FUNDAMENTOS MATEMÁTICOS Una solución de una ecuación diferencial ordinaria es una función específica de la variable independiente y de sus parametros que satisfacen la ecuación diferencial original. Para ilustrar este concepto, se tiene la siguiente función
+
y = - 0 . 5 ~ ~4x3 - lox2
+ 8 . 5 ~+ 1
[V1.13]
la cual es un polinomio de cuarto orden (Fig. V1.20). Ahora, si se deriva la ecuación (VI.13), se obtiene la EDO:
" I * _
.c.
~
...
520
MÉTODOS
FIGURA V1.2
NUMÉRICOS PARA INGENIEROS
Gráfica de a ) y contra x y b) d y / d x contra x de la función y = - 0 . 5 ~ ~ 4x3 - l o x 2 8 . 5 ~+ l.
+
d~-
-2x3
”
dx
+
+ 12x2
-
2oX + 8.5
[VI.141
Esta ecuación también describe el comportamiento del polinomio pero de manera diferente que la ecuación (Vl.13). En vez de representar explícitamente los valores de y para cada uno de los valores de x, la ecuación (VI.14) proporciona la relación de! cambio de y respecto a x(esto es, la pendiente) para cada valor de x . En la figura V1.2 se muestran la función y su derivada graficadas contra x . Nótese que los valores cero de la derivada corresponden aun punto donde la función original es plana, estoes, tiene una pendiente cero. También, los valores absolutos máximos alcanzados de las derivadas son los extremos del intervalo en donde las pendientes de una función son mayores. Aunque, como yase ha demostrado, se puede determinar una ecuación diferencial dada la función original, el objetivo
521
ECUACIONES DIFERENCIALES ORDINARIAS
aquí es el de determinar la función original dada la ecuación diferencial. La función original representa entonces la solución. En este caso se puede determinar la solución en forma analítica, integrando la ecuación (VI. 14):
y=
I [-2x3 + 1 2x2
-
2Ox
+ 8.51 dx
Aplicando las reglas de integración (recuérdese el cuadro
V.l)
AI resolver cada término de la ecuación se obtiene la solución:
+
+
y = - 0 . 5 ~ ~ 4x3 - lox2 + 8 . 5 ~ C
[VI.15]
que es idéntica a la función original con una notable excepción. En el acto de derivación e integración, se pierde el valor de la constante 1 en la ecuación original y se gana el valor C. Esta C es conocida con el nombre de constante de integración. El hecho de que aparezca una constante indica que la solución no es única. De hecho, ésta es sólo una de un número infinito de funciones posibles (correspondientes a un número infinito de valores posibles para C)que satisfacen a la ecuación diferencial. Por ejemplo, en la figura V1.3 se muestran seis posibles funciones que satisfacen la ecuación (V1.14).
FIGURA V1.3
. . I""
+
Seis soluciones posibles de la integral de -2x3 12x2 - 2Ox + 8.5. Cada uno tiene un valor diferente de la constante de integración c.
.-
.
..
." . ..~
522
INGENIEROS MÉTODOS
NUMÉRICOS
PARA
Por lo tanto, para especificar la solución completamente, una ecuación diferencial se acompaña de condiciones auxiliares. Para EDOs de primer orden, a un tipo de condición auxiliar se le llama valor inicial y es necesaria para determinar la constante y obtener una solución única. Por ejemplo, la ecuación (VI. 14) puede ir acompañada de una condición inicial en que x = O, y = l . Estos valores se sustituyen en la ecuación (VI. 15):
1
=
-0.5(0)4 + 4(0)3- 10(0)2 + 8.5(0) + C
[VI. 161
para determinar C = l . Por lo tanto, la solución única que satisface a la ecuación diferencial y a la condicióninicial especificada se obtiene sustituyendo C = 1 en la ecuación ('41.15 ) para obtener
y
=
- 0 . 5 ~+~ 4x3 - lox2 + 8 . 5 ~+ 1
[VI.17]
De esta manera, se ha considerado en la ecuación (VI.15) que pasa a través de la condición inicial, al hacerlo, se ha obtenido una solución única para laE D 0 y se ha completado el círculo hasta la función inicial [ecuación (VI.13)]. Las condiciones iniciales por lo común tienen interpretacicpes muy tangibles en ecuaciones diferenciales de problemas físicos. Por ejemplo, en el problema del paracaidista la condicióninicial fue reflectiva del hecho físico de que en un tiempo cero la velocidad vertical fue cero. Si el paracaidista hubiera estado en movimiento vertical en el momento cero, la solución se habría modificado para tomar en consideración esta velocidad inicial. Cuando se trata con ecuaciones diferenciales de n-ésimo orden se requieren de n condiciones para obtener una solución única. Si todas las condiciones se especifican en el mismo valor de la variable independiente (por ejemplo, en x o t = O), entonces al problema se le conoce como problema¿e valor inicial. Esto contrasta con los problemas de valor en la frontera en donde las especificaciones de las condiciones ocurren en valores diferentes de la variable independiente. Los capítulos 16 y 17 se enfocan a problemas con valores iniciales. Los problemas con valores en la frontera se mencionan al final del capítulo 16.
VI .3 Antes de continuar con los métodos numéricos en la solución de ecuaciones diferenciales ordinarios, puederesultar otil una orientación. El material siguiente tiene lafinalidaddeproporcionaruna visión general de los temas analizados en la parte VI. Además, se han for-
523
ECUACIONES DIFERENCIALES
mulado objetivos para orientar al lector en el estudio de de esta área.
V1.3.1
los temas
Alcances y avances
En la figura V1.4 se muestra una visi6n general de la parte VI. Dos categorías importantes de los métodos numéricosse analizan en esta
FIGURA V1.4
_I,..
Representación esquemática de la organización del material de la parte VI: ecuaciones diferenciales ordinarias.
..
524
MÉTODOS
NUMÉRICOS
PARA INGENIEROS
parte del libro. Los métodos de un paso, cubiertos en el capítulo 16, permiten al cálculo de y;lh 1, dada la ecuación diferencial y y;. Los métodos de pasos múltiples, cubiertos en el capítulo 17, requieren valores adicionales de y además de los dados para i. En todo, con algunas excepciones menores, los métodos de un paso del capitulo 76 pertenecen a los métodos de Runge-Kutta. Aunque el capítulo esté organizado alrededor de este concepto teórico, se ha optado por abordar el tema de manera más gráfica. Por lo tanto, el capítulo empieza con el método de Euler que tiene una interpretación gráfica muy clara. Después, se usan argumentos orientados hacia lo visual para desarrollar dos versiones meioradas del método de Euler: el método de Heun y el método del polígono mejorado.En seguida de esta introducción, se desarrolla formalmente el concepto de los métodos de Runge-Kutta (o RK) y se demuestra como los métodos anteriores son métodos RK de primer y segundo grado. A esto le sigue un análisis de la formulación RK de orden superior que se usa frecuentemente en la solución de problemas de ingeniería. El capítulo termina con secciones sobre dos aplicaciones de los métodos de un paso: sistemas de € D yOla solución de problemas con valores en la frontera usando métodos de disparo.
€1 capitulo 7 7 se dedica a los métodos de pasos múltiples que algunas veces son mas difíciles de programar en una computadora pero que alcanzan exactitudes comparables a los métodos de un paso y con menor esfuerzo. Otra vez, al comienzo se enfoca el tema en forma visual usando un método simple; el método de Heun sin principio, para introducir todos los rasgos esenciales de los métodos de pasos múltiples. En seguida se entra en un análisis de las fórmulas de integración numérica que sonel corazón de los métodos de pasos múltiples. A esto le sigue una sección sobre las versiones de orden superior, incluyendo dos esquemas comunes, el método de Milne y el método de cuarto orden de Adams. En el capítulo 78 se desarrollan casos para todos los campos de la ingeniería. Finalmente, se incluye una sección de repaso al término de la parteVI. Este epilog0 resume y compara las fórmulas importantes y los conceptos relacionados con las EDO. Esta comparación incluye un análisis de los elementos de juicio importantes para su implementación en la práctica de la ingeniería. El epílogo resume también las fbrmulas importantes e incluye referencias adicionales sobre temas avanzados. Se suministra información de cómputo automático de diferentes maneras. Primero, está disponible el paquete NUMERICOMP para el métodode Euler conlaopciónbasede usarse en l a s computadoras
525
ECUACIONES DIFERENCIALES ORDINARIAS
IBM-PC y Apple I I . En forma alterna se d a directamente en el texto el programa para el método de Euler en ambos lenguajes FORTRAN y BASIC. Esto posibilita copiar el programa e implementarlo en la computadora o en una supercomputadora. Se proporcionan también los diagramas de flujo y algoritmos de los programas para computadora de la mayor parte de los métodos descritos en el texto. Esta información, combinada con los programas propios bien escritos y documentados en cualquier lenguaje, proporcionan herramientas aplicables a un gran número de problemas de ingeniería.
V1.3.2
Metas y objetivos
Objetivos de estudio. Después de terminar la parte VI, el lector debe de aumentar sus habilidades para confrontar y resolver ecuaciones diferenciales ordinarias. Las metas de estudio generales deben incluir confiabiel dominio de los métodos, tener la capacidad de valorar la lidad de las respuestas, y ser capaz de escoger "el mejor" método (o métodos) de cualquier problema en particular. Además de estos objetivos generales, se deben dominar los objetivos específicos de estudio del cuadro V1.2. Objefivos de cómputo. Se debe estar bien equipado con un paquete que incluya programas simples para la computadora, algoritmos, y diagramas de flujo que implementen los métodos analizados en la parte VI. Todos éstos tienen utilidad como herramientas de apredizaje.
El paquete de programas para computadoras personales NUMERICOMP, que utiliza el método de Euler, es legible al usuario. La solución se puede mostrar ya sea en forma gráfica o en forma tabular. La salida gráfica posibilita visualizar fácilmente el problema y su solución. Se puede estudiar la eficiencia del método probando varios tamaños de paso. El paquete es muy fácil de implementar y puede ser usado para verificar los resultados de cualquier programa de computadora desarrollado por el lector. Alternativamente, los programas del método de Euler escritos en los lenguajes FORTRAN y BASIC se suministran directamente en el texto. Además, se proporcionan los algoritmos y los diagramas de flujo para la mayor parte delos otros métodos anulizados en la parte VI. Esta informaciónpermitirá expander la biblioteca de programas del lector, incluyendo métodos que vayan más allá del método de Euler. Por ejemplo, puede ser de mucha utilidad desde un punto de vista profesional, el tener un paquete de programas queemplee los métodos de cuarto orden de Runge-Kutta o el método de Adams. También se puede desarrollar un paquete de programas que solucione sistemas de ecuaciones diferenciales ordinarias.
526
METODOS
CUADRO V1.2
NUMÉRICOS
PARA INGENIEROS
Bbietivos de estudios específicos de la parte VI
1. Ehtender la representación visual de los métodos de Euler, Heun y el polígono meiorado.
2. Conocer la relación del método de Euler con la expansión en serie de Taylor y que su conocimiento está relacionado con el error del método. 3. Entender la diferencia entre los errores de truncamiento locales y globules y
4.
5. 6.
7. 8. 9.
1o. 11. 12.
13. 14.
cómo se relacionan con la selección de un método numérico en particular para la solución de un problema. Conocer el orden y la dependencia de los tamaños de paso de los errores de truncamiento para todos los métodos descritos en la parte VI; comprender cómo estos errores influyen en la exactitud de los métodos. Entender la base de los métodos predictor-corrector. Comprender en particular que la eficiencia del corrector es altamente dependiente de la exactitud del predictor. Conocer la forma general de los métodos de Runge-Kutta. Entender la derivación del método de RK de segundo orden y cbmo estese relaciona con la expansión en serie de Taylor; reconocer que existe un número infinito de posibles versiones para los métodos RK de orden superior. Saber aplicar cualquiera de los métodos RK a sistemas de ecuaciones; ser capaz de reducir una ED0 de n-ésimo orden a un sistema de n E D 0 de primer orden. Entender la diferencia entre problemas de valor inicial y con valores a la frontera; ser capaz de implementar el método de disparo en problemas con valores a la frontera. Conocer la diferencia entre los métodos de pasos múltiples y de un solo paso; reconocer que todos los métodos de pasos múltiples son predictorcorrector pero que no todos los métodos predictor-corrector son de pasos múltiples. Entender la importancia de los modificadores en los algoritmos de pasos multiples. Entender la conexión entre las fórmulas de integración y los métodos predictor-corrector. Conocer la diferencia fundamental entre los métodos de integración de Newton-Cotes y de Adams. Entender la conexión entre los modificadores y el ajuste en el tamaño de paso; reconocer el tipo de contexto de un problema donde el ajuste de tamaño de paso es importante. Comprender el hecho de que el método de Milne es inestable y reconocer por qué posee dificultades en ciertos tipos de problemas.
CAPíTULO DIECISÉIS MÉTODOS DE U N PASO
Este capítulo está dedicado a la solución de ecuaciones diferenciales ordinariasdelaforma
Enel capítulo 1 se usa un método numérico para resolver el problema del paracaidista. Recuérdese que la ecuación usada en la solución de esteproblemafuede laforma general [Ec. (1.13)] Valoractual
=
valoranterior
+
pendiente
X
o , en términosmatemáticos
FIGURA 16.1
Esquema
gráfico del método de un paso.
tamaño delpaso
528
MÉTODOS
Yitl
=
Y¡ + 4 h
NUMÉRICOS PARA INGENIEROS
[16.1]
De acuerdo a esta ecuación, se usa la aproximación a la pendiente 4 para extrapolar a partir de un valor anterior y, a un valor actual y,, l en una distancia h (Fig. 16.1).Esta fórmula se aplica paso a paso para calcular una solución futura y , de aquí, trazar la trayectoria de la solución. Todos los métodos de un paso se pueden expresar en esta forma general, con la única diferencia en el cálculo de la pendiente. Como en el problema del paracaidista, el esquema simple como la primera derivada de xi. Este esquema, llamado método de Euler, se analiza en la primera parte de este capítulo. A este le siguen otros métodos de un paso que emplean aproximaciones alternativas ala pendiente que dan como resultado mejores aproximaciones.
16.1 MÉTODO
DE EULER
La primera derivada proporciona una aproximación directaa la pendiente en xi (Fig. 16.2):
4
=
f h ,Y¡)
donde f (xt,y,) es la ecuación diferencial evaluada en x,y y , . Esta aproximación se sustituye en la ecuación (16.1): [16.2]
A esta fórmula se le conoce como método de Euler ( o método de Euler-Cauchy o de pendiente puntual). S e predice un nuevo valor de y usando la pendiente (igual a la primera derivada en el valor original x) para extrapolar linealmente sobre el tamaño de paso h (Fig. 1 6 . 2 ) .
FIGURA 16.2
Método de Euler.
~
-
MÉTODOS
529
DE PASO
EJEMPLO 16.1 Método de Euler
Enunciado del problema: utilícese el método de Euler para integrar numéricamente la ecuación (VI. 14). y ) = -2x3
+uX2
-
20x
+ 8.5
de x = O hasta x = 4 con un tamaño de paso de 0.5. La condición inicialen x = O es y = 1. Recuérdese que la solución exacta está dada 17) : porla ecuación (VI.
+
y = - 0 . 5 ~ ~4x3 - lox2
+ 8 . 5 ~+ 1
Solución: se puede usar la ecuación (16.2) para implementar el método de Euler:
~ ( 0 . 5=) y(0) en donde y(0)
f ( 0 ,1)
=
+ f(0, 1) 0.5
1 y la aproximación a la pendienteen x
+ 12(0)'
=
-
=
O es:
20(0) + 8.5 = 8.5
Por lo tanto:
y(0.5) = 1.0
+ 8.5 (0.5) = 5.25
La soluciónverdaderaen K = 0 . 5 es:
~ ( 0 . 5 ) -0.5(0.5)4 + 4(0.5)3 - lO(O.5)'
+ 8.5(0.5) + 1
3.218 75
=
Por lo tanto, elerror es:
E,
=
verdadero - aproximadQ = 3.218 75 - 5.25 = -2.031 25
O , expresado como errorrelativo porcentual, E, = -63.1 % . enel segundo paso:
y(1.0) = y ( O . 5 ) + f(0.5,5.25) 0.5
.I
_"
=
5.25 + [ ~ - 2 ( 0 . 5+) ~ lZ(O.5)'
=
5.875
-..
-
20(0.5) + 8.530.5
530
INGENIEROS MÉTODOS
CUADRO 16.1
NUMÉRICOS
PARA
Comparación delos valores verdaderos y aproximados de la integral de y' = 2x3 + 12x2 -2Ox + 8.5, con la condición inicial de que y 1 en x O. Los valores presentadosse calcularon usandoel método de Euler con un tamaño de paso de 0.5. E l error local se refiere al error obtenido en un paso. E l error global es IQdiferencia total debido a los pasos anteriores así como al actual e,, error relativo Doreentual X
Yverdadero
__
0.0 0.5 1 .o 1.5 2.0 2.718 2.5 3.0 3.5 4.0 ~
FIGURA 16.3
1 .O00O0 3.218 75 3.000 OG 2.218 75 2.000 O0 75 4.000 O0 4.718 75
3.000O0
YEuler
Global
local
1 .O00O0
5.250 O0
5.875 O0 5.125 O0 4.500 O0 4.750 O0
5.875 O0 7.125 O0 7.000 O0
-63.1 -95.8 "131 .O -1 25.0 -75.7 -46.9 -5 1 .O -1 33.0
-63.1 -28.0 -1.41 20.5
17.3 4.0 -1 1.3 -53.0
Comparación de la solución verdadera con una solución numérica usando el método de Euler para la integral de y ' = -í!x3 12x2 -2Ox 8.5 de x = O a x = 4 con un tamaño de paso de 0.5. La condición inicial en x = O es y = l .
+
+
La solución verdadera en x = 4.0 es 3.0, y por lo tanto el error relativo porcentual es -95.8%. Los cálculos se repiten, los resultados se resumenenel cuadro 16.1 y enlafigura 16.3. Obsérvese que, aunque los
MÉTODOS
53 1
DE UN PASO
cálculos capturan la tendencia general de la solución verdadera, el error es considerable. Como se analizaenlasiguiente sección, este error se puede reducir usando un tamaño de paso menor.
16.1.1
Análisis de error enel método de Euler
La solución numérica de E D 0 incluye dos tipos de error sección 3.6):
(recuérdese la
1. Errores de truncamiento causados por la naturaleza de empleados enla aproximación a los valoresde y , y
los métodos
2. Errores de redondeo causadosporelnúmerolimitado decifrassignificativasquepuederetenerlacomputadora.
de dígitos o
Los errores de truncamiento se componen de dos partes. La primera es un error de truncamiento local que resulta al aplicar el método en cuestión en un paso. El segundo es un error de programación que resulta de las aproximaciónesproducidasdurante los pasosanteriores.Lasuma delosdoseselerrordetruncamientoglobal. El conocimientode lamagnitud y propiedadesdelerror de truncamiento se puede obtener derivando el método de Euler directamente de la expansión de la serie de Taylor. Con el fin de hacer esto recuérdese que la ecuacióndiferencialque se estáintegrandoserá de la forma general.
Y'
=f
k
Y)
[16.3]
donde y' = dy/dx y x e y son las variables independiente y dependiente, respectivamente. Sila solución, estoes, la función que describe el comportamiento de y tiene derivadas continuas, ésta se puede representar mediante una expansión de la serie de Taylor alrededor del punto inicial (xl,yi),como en [recuérdese la Ec. (3.14)]: [16.4]
donde h = x , ,
-
x, y
R, es eltérminoresidualdefinido
como r16.51
INGENIEROS 532
PARA
NUMERICOS
MÉTODOS
donde <;.estádentro delintervalode x; a xi+ Se puede desarrollar una forma alternativa sustituyendo la ecuación (16.3) en las ecuaciones (16.4) y (16.5) y obtener.
[16.6]
en donde O (h"+')especifica que el error de truncamiento local es proporcional al tamaño de paso elevado a la (n + 1)-ésima potencia. Comparando las ecuaciones (16.2) y (16.6),puede verse que el método de Euler corresponde a la serie de Taylor truncada hastael término f (xi, yi) h. Adicionalmente, la comparación indica que el error de truncamiento se debe a que se aproxima la solución verdadera usando una cantidad finita de términos de la serie de Taylor. Por lo tanto, se trunca o se deja fuera una parte de la solución verdadera. Por ejemplo, el error de truncamiento en el método de Euler es atribuible a los términos restantes de la expansión que no se incluyen en la ecuación (16.2). Restandola ecuación (16.2) de la ecuación (16.6) se obtiene [16.71
donde € , e els error de truncamiento local. Para una h lo suficientemente pequeña, los errores en los términos de la ecuación (16.7) decrecen por lo común a medidaqueelorden crece (recuérdese el ejemplo 3.7 y el análisis que lo acompaña), y el resultado, a menudo, se representa como [16.8] O
E,
=
[16.9]
O(h2)
donde E, es el error de.truncamiento local aproximado.
EJEMPLO 16.2 Aproximación del error en la serie de Taylor.
el método de Euler
usando
Enunciadodelproblema:utilíceselaecuación (16.7) paraaproximarel error del primer paso del ejemplo 16.1. Úsese también la ecuación para
533
METODOS DE UN PASO
determinar el error ocasionado por cada uno de los términos de orden superior de la expansión de la serie de Taylor. Solución: debido a que se trata de un polinomio, se puede usar la expansión de la serie de Taylor para obtener una aproximación exacta del error usando el método de Euler. La ecuación (16.7) se puede escribir como:
rE16.2.11 en donde !’(x,, y,) es laprimeraderivadadela ecuación diferencial (es decir, la segundaderivada de lafunción original).Paraeste caso, es:
f‘(xi, yi) y
=
-6~’+ 2 4 ~ 20
[E16.2.2]
f “ (xi, y) es la segunda derivada de la E D 0 ff’(xi,yi) = - 1 2 ~+ 24
[E16.2.3]
y f”’ (xi, yi) es la tercera derivada de la E D 0 f”’(Xi,
y¡) = -12
rE16.2.41
Se pueden omitir los términos adicionales (esto es, las derivadas cuarta y deordensuperior) de la ecuación (E16.2.1) ya que en este caso en particular son cero. Se debe notar que en otras funciones (por ejemplo), las funciones trascendentes tales como seno, coseno o exponenciales) esto no es necesariamente cierto, y los términos de orden superior no valen cero. Sin embargo, en este caso, las ecuaciones (E16.2.1) hasta la (E16.2.4)definen completamente el error de truncamiento de una aplicacióndelmétododeEuler. Por ejemplo, el error debido al truncamiento del segundo término se puede calcular como: Eu2 =
-6(0.0)’
+ 24(0.0) - 20 2
(0.5)2 = -2.5
Para el término de tercer orden Eu3
=
-12(0.0) 6
+ 24 (0.5)3= 0.5
y para el término de cuarto Eu4
- 12 24
orden:
= -(0.5)4= -0.031 25
534
MÉTODOS NUMÉRICOS PARA INGENIEROS
Estos tres valores se pueden sumar para obtenerel error total de truncamiento:
E,
E,,z
+
Eu,3 + Eu,4 = -2.5
+
0.5
-
0.031 25
=
-2.031 25
que esexactamente el error incurrido en el paso inicial del ejemplo 16.1. Obsérvese cómo .E,,* > E,,3 > E,,4,que apoya la aproximación representada por la ecuación (16.8). I
Como se puede ver en el ejemplo 16.2, la serie de Taylor es u n medio para cuantificar el error en el método de Euler. Sin embargo, existen muchas limitaciones asociadas con su uso para este propósito: 1. La serie de Taylor sólo proporciona una aproximación local del error de truncamiento, es decir, el error generado durante el primer paso del método. No proporciona una medida de la propagación y , por ello, el error global de truncamiento. En el cuadro 16.1se han incluido los errores de truncamiento locales y globales del ejemplo 16.1. El error local se calcula para cada unode los valores de x con la ecuación (16.2), pero usando el valor verdadero de y, (la segunda columna del cuadropara calcular cada una de las en lugar del valor aproximado (la tercera columna), como se hizo con el método de Euler. Como era de esperarse,el promedio local del error de truncamiento (25%) esmenor al error global promedio (90%).La única razón por la que se podrían calcular estos errores exactamentesería la de conocer a priori el valor verdadero. Este no es el caso en un problema como el actual. Por consiguiente, como se analiza anteriormente, por lo común se deben aplicar los métodos tales como el Euler utilizando un tamaño de paso diferente hasta obtener una aproximación indirecta de los errores considerados. 2. Como se menciona anteriormente, en problemas verdaderos, usualmente se trata con funciones más complicadas que un simple polinomio. Por consiguiente, las derivadas necesarias para evaluar la serie de Taylor no siempre son fáciles de obtener.
Aunque estas limitaciones no ayudan en el análisis exacto de errores en la mayor parte de los problemas prácticos, la serie de Taylor proporciona una idea valiosa del comportamiento del método de Euler. De acuerdo a la ecuación (16.8),se ve que el error locales proporcional al cuadrado del tamatio de paso y la primera derivada de la ecuación diferencial. También se puede demostrar que el error global de truncamiento es O ( h ) ; esto significa que es proporcional al tamaño del paso (Carnahan et al., 1969). Estas observaciones llevan a las siguientes conclusiones:
535
MhODOS DE UN PASO
1. Elerrorsepuedereducirdisminuyendoeltamañodel
paso.
2. El método proporciona predicciones libres de error si la función fundamental (esto es, la solución a la ecuación diferencial) es lineal, ya que la segunda derivada de una línea recta es cero. Estaúltimaconclusióntienesentidointuitivodebido a queelmétodo de Euler usa segmentos de línea recta para aproximar la solución. De aquí que, elmétododeEulerseconozcacomo método de primer orden.
EJEMPLO 16.3 Efecto de la reducción del tamaño de paso en el método
de Euler
Enunciado del problema: repítanselos cálculos del ejemplo 16.1 usando un tamañodepasoigual a 0.25. Solución: se repiten los cálculos, y los resultados se muestran en la figura . 16.4a. AI utilizar el tamaño de paso más pequeño, se reduce el valor absoluto del error global promedio en un 40% y el valor absoluto del error local en un 6.4%. Esto es comparable con los errores globales y locales del ejemplo 16.1 del 90% y.del24.8%. Por lo tanto, como era deesperarse, el error local se reduce a la cuarta parte y el error global se reduce a lamitad. Obsérvese también que el error local cambia de signo en valores intermedios a lo largo del rango de valores. Esto se debe, en primer lugar, a que la primer derivada de la ecuación diferencial es una par6bola que cambia de signo [recuérdese la Ec. (E16.2.2) y véase la Fig. 16.4bl. Debido a que el error local es proporcional a esta función, el efecto neto de la oscilación en el signo es el de mantener el error global en crecimiento continuo a medida que aumentan los cálculos. Por lo tanto, de x = O a x = 1.25, los errores locales son todos negativos y por consiguiente, el error globalcrece en este intervalo. En la sección intermedia delrango, los errores locales positivos empiezan a disminuir el error global. Cerca del extremo, el proceso se invierte y el error global nuevamente crece. Si el error local cambiara continuamente de signo sobre el intervalo de interés, entonces el efecto neto, por lo general, minimizaría el error global. No obstante, endonde los errores locales son del mismo signo, la solución numérica puede diverger cada vez más rápido dela solución verdadera a medida que los cálculos aumentan. Estos resultados se dice que son inestables.
536
M~TODOS NUMERICOS PARA INGENIEROS
FIGURA 16.4
a) Comparación de dos soluciones numéricas con el método de Euler usando tamaños de paso de0.5 y 0.25 b) Comparación de los errores de truncamiento locales verdaderos y aproximados.
En la figura 16.5 se ilustra el efecto de reducir más y más el tamaño del paso sobre el error de truncamiento global con el método de Euler. Esta gráfica muestra el error relativo porcentual en x = 5 en función del tamaño del paso sobre los problemas que se han analizado en los ejemplos 16.1 al 16.3. Nótese que aun cuando h se ha reducido a 0.001, el error aún excede al O. 1 W . Debido a que este tamaño de pasocorresponde a 5 O00 iteraciones que van desde x = O hasta x = 5 , la gráfica muestra que los métodos de primer orden tales como el de Euler demandan un gran esfuerzo de cálculo para obtener niveles de error aceptabies. En las siguientes secciones se muestran métodos de órdenes superiores que alcanzan mucha más exactitud con el mismo esfuerzo de cálculo. Sin embargo, se debe notar que a pesar de su ineficiencia, la simplicidad del mé-
537
METODOS DE UN PASO
FIGURA 16.5
Efecto del tamaño de paso sobre el error global de truncamiento enel método de Euler para la integral de y' = 2x3 1 2 2 - 20x 8.5. La gráfica muestra el error relativo porcentual en x = 5 en función del tamaño de paso.
+
+
todo deEuler hace muy atractivo suuso dn muchosproblemasde la ingeniería. Debido a que es muy fácil de programar, el método es particularmente útil en cálculos iniciales rápidos, previosa un análisis de escala completa. Enla siguiente sección,se desarrolla un programapara computadora sobre el método de Euler.
16.1.2 Programa para computadora delmétodo de Euler Los algoritmos de métodos de un paso tales como el de Euler son fáciles de programar en una computadora personal.Como se menciona previamente al principio del capítulo, los métodos de un paso tienen la forma: Valoractual
=
valoranterior
+
pendiente
X
tamaño del paso [ 16.101
En lo Único que se diferencian los métodos es en la forma en que calculanla pendiente. Aunque el programa de la figura 16.6 está disenado específicamente para implementar el método de Euler, va dirigido a la forma general de
538
MÉTODOS
COMMOH x . Y F( X , Y )-4*EXP< 8bX )R E A D ( 5 , l )XO.X1 FORUaT( 2F1 O . O ) READ/PI NC-PI/H ~
1
2
x-x0
3
250 270
Y-YO YRITE(6,3)X,Y FORMfIT < ’ ’ . 2 F 2 0 . 3 ) DO 270 I - l . N P DO 250 J - 1 , N C C A L L E U L ~ S )L Y-wsLw
x-x+n
CONTINUE URITE<6,3)X,Y CONTINU€ STOP €NO
-
*
X I .S Y INPUT K O . X 1 INPUT YO INPUTH INPUT P i NP = ( X I XO) / NC = P I / H x = x c:, Y = Y0 PRINT X , Y NP FhR I = 1 TU FUR J = 1 ro NC FDSIJU l0OC:l f = I + S L * H X = X + H NEXT J PRINl X.V NEXT I ENIl
-
NUMÉRICOS
PARA INGENIEROS
X 0 . X l = valor lnclal y flnal de la vanablemdependlente
YO
PI
= valor lniclal dela varlable dependlente
H = tamaño del paso
PI
= Intervalo de mpreslán
NP = numero de p a s o s de Irnpreslón
NC = numero de Dasosdecalculo
ISubrutlnaparacalcular
la pendlentel
RETURN EN0
FIGURA 16.6
Programaparalacomputadora
del método de Euler en
FORTRAN y BASIC.
la ecuación (16.10).Todo lo que se requiere para aplicar este programa a otro método de un paso es modificar el cálculo de la pendiente en la subrutina (línea 1 000). El progama de la figura 16.6 no es legible al usuario, está diseñado estrictamente para arrojar la respuesta. En el problema 16.12 se deja de tarea el hacer este programa más fácil de usar y de entender. En el paquete suplementario de programas NUMERICOMP asociado con este libro se incluye un ejemplo de un programa legible al usuario sobre el método de Euler. El siguiente ejemplo demuestra el uso de este programa en la solución de EDO. También proporciona una referencia para la validación y la prueba de sus programas.
METODOS
539
DE UN PASO
la parte I que el modelo matemático de la velocidad se basa en la segunda ley de Newton de la forma:
dv dt
C
-g-mU
"
Se resuelve la ecuación diferencial analíticamente (ejemplo l .1)y numéricamente usando el método de Euler (ejemplo 1.2). El objetivo de este ejemplo es el de repetir estos cálculos numéricos empleando un modelo sobre la velocidad más complicado basado en una descripción matemática más completa acerca del coeficiente de fricción causado por la resistencia del viento. Este modelo está dado por:
[E16.4.1] en donde a, b y umáXson constantes empíricas. Obsérvese que este modelo es capaz de ajustar más exactamente medidas empíricas de coeficientes de fricción contra la velocidad que el modelo lineal simple del ejemplo l. l. Sin embargo, esto incrementa la flexibilidad a expensas de evaluar tres coeficientes en vez de uno. Además, el modelo matemático resultante es más difícil de resolver analíticamente. En este caso, el método de Euler proporciona una alternativa conveniente para obtener una solución numérica aproximada.
FIGURA 16.7
a) Resultados tabulares de los cálculos y b) resultados gráficos de la solución de la E D 0 [Ec. (E16.4.11. Nótese que b) también muestra la solución del modelo lineal con propósitos de comparación. De hecho, el programa no está diseñado para superponer gráficas de esta manera.
540
MÉTODOS
NUMERICOS PARA INGENIEROS
Solución: se usará el paquete NUMERICOMP para abordar la ecuación (E16.4.1). Enlafigura 16.7a se muestra la solución del modelo con un tamaño de paso de O. 1 s. Para propósitosde comparación en la gráfica de la figura 16.7bse muestra la solución no linealy el modelo lineal superpuestos. Nótese que la computadora puede graficarsólo una solución a la vez. Los resultados de los dos cálculos indican el crecimiento de la complejidad enla formulación de los efectos que la fuerza de fricción ejerce sobre la velocidaddelparacaidista. En este caso, la velocidadterminal disminuye debido a la resistencia causada por los términos de orden superiorenla ecuación (E16.4.1). Se pueden probar modelos alternos de manera similar. La combinación del paquete NUMERICOMP y la computadora hacen que esto sea una tarea fácil y eficiente. Esta conveniencia permite al usuario dedicar más de su tiempo en considerar alternativas creativas y aspectos globales delproblemaenlugarde los tediosos cálculos manuales.
16.1.3
Métodos con serie de Taylor de orden superior
Una manera de reducir el error en el método de Euler sería incluir términosdeordensuperiorenlaexpansión de la serie de Taylor alrededor de la solución. Por ejemplo, incluyendo el término de segundo orden de la ecuación (16.6) se obtiene [16.11]
con un errorlocaldetruncamiento
de:
Aunque la incorporación de términos de orden superiores lo suficientemente simple como para implementarse en polinomios,su inclusión no es tan trivial cuando la E D 0 es complicada. En particular, las E D 0 que son una función de la variable dependiente y de la variable independiente requieren derivación con la regla de la cadena. Por ejemplo, la primera derivada de f (x, y) es
La segunda derivada es
54 1
MhODOS DE UN PASO
Y las derivadas de orden superior vienen a ser crecientemente más complicadas. Por consiguiente, como sedijo en las secciones previas, se han desarrollado métodos alternativos de un paso. Estos esquemas son comparables en ejecución a1 de la serie de Taylor de órdenes superiores pero requieren únicamente el cálculo de la primera derivada.
16.2 MODIFICACIONES Y MEJORAS AL MÉTODO DE EULER Una fuente fundamental de error en el método deEuler es quela derivada al principio del intervalo se supone que se aplica a través del intervalo entero. Existen dos modificaciones simples para ayudar a evitar este inconveniente. Como se demuestra en la sección 16.3, las dos modificaciones en realidad pertenecen a unaclase mayor de métodos desolución llamados métodos de Runge-Kutta. Sin embargo, ya que tienen una interpretación gráfica sencilla, se presentan antes de la derivación formal de los ,métodos de Runge-Kutta.
16.2.1 Método de Heun Un método para mejorar la aproximación a la pendiente implica el cálculo de dos derivadas del intervalo, una en el punto inicial y la otra en el punto final. En seguida se promedian las dos derivadas y se obtiene una aproximación mejorada de la pendiente en el intervalo completo. Este esquema, llamado método de Heun, se muestra gráficamente en la figura 16.8. Recuérdese que en el método de Euler, la pendiente al principio de un intervalo
Y:
= !(X¡,
Y¡>
r16.121
Se usa para extrapolar linealmente a
En el método estándar de Euler se pararía en este punto. Sin embargo, e n el método deHeun, la calculada con la ecuación (16.3)noes la respuesta final sino una predicción intermedia. Esto se debe a que se ha distinguido a ésta con el superíndice O. La ecuación (16.13) se llama ecuación.predictora. Proporciona una aproximación de y ¡ + que permite el cálculo de una pendiente aproximada al final del intervalo: y:+1 = f ( X i + l ,
"_
" P
I....
.
.. ".".,
Y?*d
[16.14]
542
MÉTODOS NUMÉRICOS
FIGURA 16.8
PARA INGENIEROS
Esquema gráfico del método de Heun. o) Predictor y b) corrector.
Por 10 tanto, se pueden combinar las dos pendientes [ecuaciones(16.12) y (16.14)] y obtener una pendiente promedio sobre el intervalo:
Esta pendiente promedio se usa para extrapolar linealmente de y, a y,, usando el método de Euler:
que se llama una ecuación correctora. El método de Heun es un esquema predictor-corrector. Todos los métodos de pasos múltiples por discutirse en el capítulo 17 son de este tipo. El Único método corrector-predictor de un paso descrito en este libro es el método de Heun. Como se dijo antes, se puedeexpresar concisamente como:
MÉTODOS
543
DE UN PASO
I Predictor (Fig
16.8a):
= yi
Corrector(Fig. 16.8b): yi+l = yi
I
+ f ( x i ,yi) h +fki,
Y¡> + f(Xi+lr Y ? + J
2
[16.15] [16.161
Nótese que debido a que la ecuación (16.16) tiene y¡+ 1 en ambos lados del signo igual, ésta puede aplicarse para “corregir” en un esquema iterativo. Esto es, se puede usar una aproximación anterior varias veces para proporcionar una aproximación mejorada de El proceso muestra en la figura 16.9. Se debe entender que este proceso no necesariamente converge a la respuesta correcta sino que converge a una aproximación con un error de truncamiento finito, como se demuestra en el siguiente ejemplo. Como con los métodos iterativos similares analizados en las secciones previas del libro, un criterio de paro en la convergencia del corrector lo proporciona[recuérde la ecuación (3.5)]
[16.17]
en donde y!;: y y j + l son el resultado de la iteración anterior y actual del corrector, respectivamente.
FIGURA 16.9
Representación gráfica de la iteración del corrector del método de Heun para obtener una rrleior aproximación.
544
MÉTODOS
NUMERICOS PARA INGENIEROS
EJEMPLO 16.5 Método de Heun Enunciado del problema: empléese el método de Heun para integrar y ' = 4e0 8x - 0 . 5 desde ~ x = O a x = 4 con tamaño de paso 1.La conx = O es y = 2. dicióninicialen Solución: antes de resolver el problema numéricamente, se puede efectuarel cálculo mediante la siguiente solución analítica:
y = 4
-
[E16.5.1]
e-0.5~) + & - 0 . 5 ~
1.3
Esta fórmula se puede usar para generar los valores verdaderos los cuales se presentan enel cuadro 16.2. La solución numérica se obtiene usando la fórmula predictora [Ec. 16.15)] paraobtener un valorde y para 0.5:
y':
=
2
+ [4e0 - 0.5(2)] 1 = 5
Obsérvese que este es el resultado que se debería obtener con el método deEulerestándar.Usando elvalorverdaderodelcuadro 16.2, a este corresponde un errorrelativoporcentualdel 19.3%. Lapendiente en (xo, yo) es
yó = 4 e o
-
0.5(2) = 3
Este resultado es muy diferente de la pendiente promedio verdadero en intervalo de O a 1.0, que es igual a 4.194 6, calculada de la ecuación Por lo tanto, para mejorar la diferencial original usando la ecuación (V.3). aproximación de la pendiente, se usaelvalor y: para predecir la pendiente alfinaldel intervalo:
que se puede combinar con
la pendiente inicial y obtener:
que es más cercana a la pendiente promedio de 4.194 6.Este resultado se puede sustituirenla ecuación correctora [Ec. (16.16)]para obtener la predicción en x = 1:
y1
=
2 + (4.701 081 86)l
=
6.701 081 86
MCTODOS DE UN PASO
CUADRO 16.1
545
Comparacidn delos valores verdaderosy aproximados dela integral de y' 4eo*8x- 0 . 5 ~ con la condicidn incial de que y 2 en x O. Los valores aproximadosse calcularon usandoel metodo de Heun con un tamaño de paso de 1. Se muestran dos casos, correspondientes a números diferentes de iteraciones del corrector, junto con el error relativoporcentual absoluto
=
lteraciones con el metodo de Heun
1 x
O 1 2
3 4
Yverdmdero
Yheun
2.000 O00 O0 6.19463138 14.843921 9 33.677171 8 75.338 962 6
15 lEvl '10
Yheun
0.00 2.000 O00 O0 6.701 081 86 8.18 9.94 16.319 7819 10.46 37.199 248 9 10.62 83.337 767 4
kv1
2.000 O00 o 6.360 865 15.302 236 7 34.743 2761 77.735 096 2
0.00 2.68 49 3.09 3.17 3.18
que representa un error relativo porcentual del -8.18%. Por lo tanto, el método de Heun reduce el valor absoluto del error en un factor de 2.4 comparado con el método de Euler. Ahora esta aproximaciónse puede usar para refinaro corregir la predicción de y l sustituyendo el nuevo resultado de nuevo en el lado derecho de la ecuación (16.16): y]=2+
[3
+ 4eo.8"'
- 0.5(6.701 081
2
86)]
1
=
6.275 81139
que representa un error relativo porcentual del 1.31%. Este resultado, a su vez se puede sustituir en la ecuación (16.16) para una mejor aproximación yl: y1=2+
[3
+ 4eo.8(1)
-
0.5(6.275 811 39)] = 6.382 129 O 1 2
que representa un error 1 ~ de ~ 3.03%. 1 Nótese cómo los errores algunas veces crecen a medida que las iteraciones avanzan. Por ejemplo, en las tres iteraciones el error crece en un 3.03%, estos incrementos pueden ocurrir,especialmente en tamaños depaso muy grandes. Elusuario debe evitar la conclusión general de que una iteración adicional siempre mejora el resultado. No obstante, para un tamaño de paso lo suficientemente pequeño, la iteración debe eventualmente converger a un solo valor. En este caso, se obtiene el resultado 6.360 865 49, que representa un error relativo del 2.68% después de 15 iteraciones. En el cuadro 16.2 se muestran los resultados de los calculos restantes usandoel método con 1 y 15 iteracionespor paso.
546
INGENIEROS MÉTODOS
NUMÉRICOS
PARA
En el ejemplo anterior, la derivada es una función de la variable dependiente y y de la variable independiente x. Para casos polinomiales, en donde las E D 0 son sólo función de la variable independiente, el tamaño predictor [Ec. (16.15)Jn o se necesita y se aplica únicamente el corrector a cada una de las iteraciones. En estos casos el método se expresa abreviadamente como [16.18]
Nótese la similitud entre el lado derecho de la ecuación (16.18)y la La conexión entre los dos métodos se pueregla trapezoidal [Ec. (13.3)]. de demostrar formalmente empezando con la ecuación diferencial ordinaria
Esta ecuación se resuelve para y integrando:
r+' R" dy
!(x)dx
=
[16.19]
que lleva a [16.20] O
Yitl
=
yi
+
[+I
f(x) dx
[16.21]
Ahora, recuérdese de la sección 13.1que la regla trapezoidal [Ec. (13.3)] se define como
o, en este caso L16.221
donde h = xi+l- xi. Sustituyendo la ecuación (16.22) en la ecuación (16.21) se obtiene
"""
METODOS
DE U N PASO
547
[16.23]
queesequivalente a la ecuación correctora [Ec. (16.16)]. Debido a que la ecuación (16.23) es una expresión directa dela regla trapezoidal, el error local de truncamiento está dado por [recuérdese la Ec. (13.6)] [16.24]
donde está entre xi y xi+l.Por lo tanto, el método es de segundo orden debido a que la derivada de segundo orden de E D 0 es cero cuando la solución es cuadrática. Además, los errores local y global son de O(h3) y O(h2), respectivamente. Por lo tanto, disminuyendo el tamaño de paso se disminuye también el error más rápidamente que usando el método de Euler. La figura 16.10, que muestra el resultado de usar el método de Heun para resolver el polinomio del ejemplo16.1, demuestra estecomportamiento.
16.2.2
Método meiorado del polígono (Euler modificado)
La figura 16.11 ilustra otra modificación simple del método de Euler. Este método, llamado poligono mejorado (o € d emodificado), r usa el mé-
Figura 16.1 O
Comparación de la solución verdadera con un método numérico usan12x2 do los métodos de Euler y Heun de la integral de y' = -2x3
- 2oX ..
+
+ 8.5
-
.- ' ...
.
548
MÉTODOS NUMERICOS PARA INGENIEROS
FIGURA 16.11
Esquema gráfico del método del polígono mejorado. a) Ecuación ( 1 6.25) y b) ecuación ( 1 6.27).
todo de Euler para predecir un valor de y en el punto medio del intervalo (Fig. 16.l l a ) : 116.251
Entonces este valor predecid0 se usa en la aproximación de la pendiente e n el punto medio:
I
y:+1/2
= f(Xi+l/2,Yi+l/2)
I
[16.26]
lo cual, se supone, representa una aproximación válida de la pendiente promedio en el intervalo completo. Esta pendiente se usa para extrapolar linealmente de x,a x,, usando el método de Euler (Fig. 16.l l b ) :
METODOS
549
DE UN PASO
1
Yi+l
= Y¡
+ f(X,+1,2,
Yi+l/2)h
1
[16.27]
Nótesequedebido a quenoestáenambos lados, la correctora [Ec. (16.27)] no se puede aplicar iterativamente para mejorar la solución. El método del polígono mejorado es superior al método de Euler ya que éste utiliza una aproximación de la pendiente en el punto medio del intervalo de prediccfón. Recuérdese del análisis de derivación numérica de la sección 3.5.4 que las diferencias divididas centrales fueron mejores aproximaciones a la derivada que las versiones hacia adelante y atrás. Enelmismo sentido, unaaproximación centrada, como la ecuación (16.26) tiene un error de truncamiento local de O(h2) en comparación con la aproximación hacia adelante del método de Euler que tiene un error de O(h). Por consiguiente, los errores local y global del método del poligono mejorado son O(h3) y O(h2), respectivamente.
16.2.3 Algoritmo para lacomputadora de los métodosde Euler meiorado y modificado El método de Heun con un corrector simple y el método mejorado del polígono se pueden programar con facilidad usandola estructura general mostrada en la figura 16.6. Es una tarea relativamente simple la de modificar lasubrutinadelprogramageneralparacalcularlapendientede acuerdo con estos métodos. Sin embargo, cuando se implementa la versión iterativa del método de Heun, las modificaciones son un poco más complicadas. En la figura 16.12 se ha desarrollado una subrutina para este propósito. Esta subruti-
SUBROUTINE HEUN( X , Y > COMMON H. I M , E S F( X , Y )-4*EXP( , 8 o X )- , 5-Y Sl=F
S1 = pendiente al prmclplo del intervalo Y1 = prediccldn al h i l l del 1nterva10 IM = ttsracl6n rnAxma del COrleCtOr S2 = pendente al fm.9 del
!"tervalo SL = pendmnte promedlo
SL-~s1*S2,,'2
YP-Y+SL.M E A = A B S ( ( V 2 - Y I )/Y2 M 1 0 8 I F < E A . L E , E S ) G O TO I 1 2 0 Y I -Y2 I 1 O9 CONTINUE YRITE(6.4)EA 4 FORMAT( ' ' I ' L A I T E R A r l O N M A X I M A E X C E D I D CF10.5) I 1 2 0 X-X-H RETURN EN0
FIGURA 16.12
fCorrector1 E A = error calculado % fPrueba del error donde ES = error aceptable1
EA=
Versionesen FORTRAN y todo iterativo d e Hewn.
" " " "
..
.
._, .
"
.
BASIC d e la subrutina que implementa el mé-
...,. .-
.
550
NUMÉRICOS
MÉTODOS
PARA INGENIEROS
na se puede combinar con la figura 16.6 para desarrollar programas del método iterativo de Heun.
16.2.4
Resumen
Manipulando el método de Euler se han derivado dos nuevos métodos de segundo orden. Aun cuando estas versiones requieren mayor esfuerzo de cálculo para determinar la pendiente, la reducción que acompaña al errorpermitiráconcluirenunasecciónsubsiguiente (sección 16.3.4) que la exactitud mejoradaes, en general, merecedora del esfuerzo. Aunque existenciertos casos en dondelosmétodosfácilmenteprogramables tales como el método de Eulerse pueden aplicar ventajosamente, los métodos del polígono mejorado son generalmente superioresy se deben implementar si son consistentes con los objetivos del problema. Como se menciona al principio de la sección, el método de Heun (sin iteraciones), el método del polígono mejorado y , de hecho, el método mismo de Euler son versiones de una clase más amplia de esquemas de un paso llamado métodos de Runge-Kutta. Ahora se desarrolla la derivación formal de estos métodos.
16.3 MÉTODOS
DE RUNGE-KUTTA
Los métodos de Runge-Kutta tienen la exactitud del esquema de la serie de Taylor sin necesitar del cálculo de derivadas superiores. Existen muchas variaciones pero todas ellasse pueden ajustar a la forma general de la ecuación (16.1): Yi+l
=
Y,
+
+(Xi,
r16.281
Yi, h) h
donde a 4 (xi,yi, h ) se le llama función de incremento y puede interpretarse como elpromedio de la pendiente sobre el intervalo. La función de incremento se puede escribir enla forma general como
#
=
alkl
en donde las
+ a2k2 +
*
*
+ ankn
[16.29]
a son constantes y las k son [16.29a] [16.29b]
SS 1
METODOS DE UN PASO
Obsérvese que las k son relaciones recurrentes. Esto es, kl aparece en la ecuación de kZ, que aparece en la ecuación de k3, etc. Esta recurrencia hace a los métodos RK eficientes para su cálculo en computadora. Se pueden desarrollar varios métodos de Runge-Kutta empleando una cantidad diferente de términos enla función de incremento especificados por n. Nótese que el método RK de primer orden con n = 1 es, de hecho, el método de Euler. Una vez que se ha escogido n, los valores de las a, de las p y de las q se evalúan igualando la ecuación (16.28) a los términos en una expansión de la serie de taylor (recuadro 16.1). Por lo tanto, al menos para versiones menores de la orden, en general, el número de términos n representa el orden del método. Por ejemplo, enla siguente sección, los métodos RK de segundo orden usanunafunción de incremento con dos términos (n = 2). Estos métodos de segundo orden son exactos si la solución a la ecuación diferenciales cuadrática. Además, debido a que se desprecian los términos con h 3 y de orden superior durante la derivación, el error local de truncamiento es O(h3) y el error global es O(h2). En secciones posteriores se desarrollan los métodos RK de tercer y cuarto orden (n = 3 y 4). En estos casos, los errores globales detruncamientoson O(h3) y O(h4), respectivamente.
RECUADRO 16.1 Obtención de los coeficientes de los métodos de segundo orden de Runge-Kutta La versión de segundo orden de la ecuación
(16.28) es:
Sustituyendo la obtiene:
donde
donde f' (xi, y,) debe determinarse derivando con la gladela cadena(sección 16.1.3):
[B16.1.5]
re-
ecuaci6n (B16.1.5)en (B16.1.4) se
g(x+r, y + ~ )= g(x, y)
+ r-as + s- as + - . ax
ay
*
552
METODOS NUMÉRICOS
Aplicando este método enlaexpansióndelaecuación (B16.1.3) obtiene nes se
f(xt + plh, Y I + q11klh)
Ahora, comparando términos semejantes enlas ecuacio(B16.1.6) y (B16.1.7), selas determina que para que dos ecuaciones sean equivalentes, se debe cumplir lo siguiente:
al
+ a2 = 1 azpl
Este resultado puede se sustituir ecuación junto la con (B16.1.2)enlaecuación
PARA INGENIEROS
=
$ 1
(B16.1.1) paraobtener
a2q11 = 5
Estastres ecuaciones simultáneascontienenlascuatro yi+l = y, + alhf(x1, y11 + a2hf(xi,yi) constantes incógnitas. Debido que a existe una incógnita másqueelnúmerode ecuaciones, nohay un conjunto af + azqllh2f(xi,y3- af Único de valores que satisfagan las ecuaciones. Sin em+ azph2-ax ay bargo, adjudicándole un valor lasade una constantes, se 3) Por tres.otras determinar pueden las consiguiente, existe una familia de métodos de segundo orden en vez de una
+o@
sola o, términos, reordenando
+ o(h3)
[B16.1.7]
16.3.1
Métodos de Runge-Kutta de segundo orden
La versión de segundoordende la ecuación (16.28) es [16.30] [16.30a] [16.30b]
Como se describe en el recuadro 16.1, los valores de a l , a2,P1y q1 se evalúan igualando la ecuación (16.30) a la expansión de la serie de Taylor hasta el segundo término. Haciendo esto, se obtienen tresecuaciones para evaluar las cuatro incógnitas constantes. Estas tres ecuaciones son
al
+ a2 = 1
[16.31] [16.32] [16.33]
553
METODOS DE UN PASO
Debido a que se tienen tres ecuaciones con cuatro incógnitas se debe suponer el valor de una de las incógnitas para determinar las otras tres. Supóngase que se especificaelvalor de a2. Entonces las ecuaciones (16.31) a la (16.33) se resuelven simultáneamente para: a1 =
1-
[16.34]
a2 1
P1
1
= 911 = -
2a2
[16.35]
Ya que se puede escoger una cantidad infinita de valores de a2, existe un número infinito de métodos de RK de segundo orden. Cada versión llevaría exactamente a los mismos resultados si la solución de la E D 0 es cuadrática, lineal o constante. Sin embargo, llevan a resultados diferentes cuando la solución es más complicada(como es el caso típico). A continuación se muestran tres de las versiones más comúnmente usadas y preferidas: Método de Heun con un corrector simple (a2 = 1/2). Si se considera que a2 es igual a un medio (1/2), entonces 1% ecuaciones (16.34) y (16.35)se pueden resolver para al = 1/2 y p 1 = qll = 1. Estos pará-
metros, cuando se sustituyen en la ecuación (16.30) generan [16.36]
donde [16.364
l16.3661
Obsérvese que kl es la pendiente al principio del intervalo y k2 es la pendiente al final del intervalo. Por consiguiente, este segundo método de Runge-Kutta es realmente el método de Heun con una sola iteración del corrector.
El método meiorado del polígono (a2 = 1). Si se supone que a2 sea 1, entonces al = C, p 1 = q l l = 1/2, y la ecuación (16.30) viene a ser: [16.37]
donde [16.37a] [16.376]
554
MÉTODOS
NUMÉRICOS PARA INGENIEROS
Este es el método mejorado delpolígono
2/3).Ralston (1962) y Ralston y Rabinowitz (1978) determinaron que escoger a2 = 2/3 proporciona un límite mínimo en el error de truncamiento de los algoritmos RK de segundo orden. Paraesta versión, a , = 1/3 y p 1 = q I 1 = 3/4: Método de Ralston (a2 =
[16.38]
donde
EJEMPLO 16.6 Comparación de varios métodos RK de segundo orden Enunciado del problema: utilícese el polígono mejorado [Ec. (16.3711 y el método de Ralston [Ec. (16.38)]para integrar numéricamente la ecua14): ción (VI. f(x, y ) =
-zX3
+ 12x* - zox + 8.5
desde x = O hasta x = 4 usando un tamaño de paso de 0.5. La condición inicial en x = O es y = 1. Compárense estos resultados con los valores obtenidos usando otro algoritmoRK de segundc orden: el método deHeunconiteracionesde un corrector (Fig. 16.10 y cuadro 16.3). Solución: elprimer paso enel método del polígono mejorado usarla ecuación (16.37a) paracalcular:
kl = -2(0)3
es elde
+ 12(0)' - 2O(O) + 8.5 = 8.5
No obstante, debido a que la E D 0 es una función sólo de x, este resultado se requiereparacalcular k,; alusarla ecuación (16.37b) se tiene k2
1
=
-2(0.25)3 + 12(0.25)2- 20(0.25) + 8.5 = 4.218 75
Nótese que esta aproximación de la pendiente es mucho más cercana al valor promedio sobre el intervalo (4.437 5) que la pendiente al principio delmismo (8.5) que debió usarse en el método de Euler. La pendiente en el punto medio se puede sustituir en la ecuación (16.37)para predecir
555
METODOS DE UN PASO
CUADRO 16.3
Comparación delos valores verdaderosy aproximados dela integral de y ' -2x3 1 2x2 -2Ox 8.5, con la condicidn inicial de 1 en x O. Los valores aproximadosse calcularon usando que y tres versiones RK de segundo orden con un tamaño de paso 0.5 de
+
+
Heun RKRalston Polígono corrector simple mejorado segundo de orden
x
Y
0.0 0.5 1 .o 1.5 2.0 2.5 3.0 3.5 4.0
1 .o00 O0 1.000 O0 o 3.218 75 3.43750 6.8 3.000O0 3.375O0 12.5 2.218 75 2.68750 21.1 2.000 O0 2.500 O0 25.0 12.5 2.718 75 3.18750 17.2 4.000 O0 4.375O0 9.4 4.718 75 4.93750 4.6 3.000O0 3.000O0 O
veradera
~(0.5')' = 1
y
El cálculo se repite,
16.13
Y
1%
%
1.000 O0 o 3.1093753.4 6.3 2.812 50 1.984 375 10.6 1.75 2.484375 8.6 3.81250 4.7 4.6093752.3 O 3
+ 4.21875(0.5) = 3.109375
el cuadro 16.3.
FIGURA
I 4
E"
y losresultadosseresumenen
=
y
lk"l
1 .o00 O0 O 3.277 343 75 1.8 3.101 5625 3.4 2.347 656 25 5.8 2.140 625 7.0 2.855 468 75 5.0 4.117 1875 2.9 4.800 781 25 1.7 1 .o 3.031 25
3.4% la figura 16.13 y en
Comparación de la solución verdadera con los métodosnuméricos,tres RK de segundo orden y método de Euler.
556
M~TODOS NUMÉRICOS PARA INGENIEROS
En el método de Ralston, kl en el primer intervalo también es igual a 8.5 y [Ec. (16.38b)l: k2 =
-2(0.375)3 + 12(0.375)2- ZO(0.375) + 8.5 = 2.582 031 25
La pendiente promedio se calcula mediante
4
=
i(8.5) + $ (2.582 031 25)
=
4.554 687 5
que se puede usar para predecir
~ ( 0 . 5= ) 1 + 4.5546875(0.5)
=
3.27734375
=
-1.82%
Los cálculos se repiten, y los resultados se resumen en la figura 16.13 y el cuadro 16.3. Obsérvese cómo todos los métodos RK de segundo orden son superiores al método de Euler.
16.3.2
Métodos de Runge-Kutta de tercer orden
Se puede llevar a cabo unaderivación análoga a la del método de segundo orden, para n = 3. El resultado de esta derivación es de seis ecuaciones con ocho incógnitas. Por lo tanto, se deben especificar a priori los valores de dos de las incógnitas para determinar los parámetros restantes. Una versión común que resulta es r16.391
donde [16.39a] [16.39b] [16.39c]
Obsérvese que si la derivada es una función sólo de x , este rnétodo de tercer orden se reduce a la regla de Simpson de 1/3. Ralston (1962) y Ralston y Rabinowitz (1978) han desarrollado una versión alternativa que proporciona un límite mínimo en el error de truncamiento. En cualquier caso, los métodos RK de tercer orden tienen errores globales de O(h4) y O(h3), respectivamente, y llevan a resultados exactos cuando la solución es de ordencúbico. Como semuestra en el siguiente ejemplo, cuando se trata de polinomios, la ecuación (16.39) será exacta cuando la ecuación diferencial sea de orden cúbico y la solución de orden cuarto.
MÉTODOS
557
DE UN PASO
Esto es porque la regla de Simpson de 1/3 proporciona aproximaciones exactas a laintegraldeordencúbico (recuérdese el recuadro 13.3).
EJEMPLO 16.7 Método RK de tercer orden Enunciado del problema:utilícese la ecuación (16.39) paraintegrar a) Una E D 0 queesexclusivamenteunafunciónde
d~ - -2x3 dx
"
con y(0)
=
x [Ec. (VI.14)]:
+ 12x2 - 20x + 8.5
1 y detamañodepaso
igual a 0.5.
b) Una ED0 que es unafunciónde x y
y:
dY = 4e0,&- 0 . 5 ~
dx
con y(0)
=
2 desde x
=
O a 1 con un tamañodepaso
1.
Solución: a) Se puedenusarlas ecuaciones (16.39~1) a la ( 1 6 . 3 9 ~para ) calcular:
+ 12(0)2- 20(0) + 8.5 = 8.5 k2 = -2(0.25)3 + 12(0.25)2- 20(0.25) + 8.5 = 4.218 75 k3 = -2(0.5)3 + 12(0.5)2 - 20(0.5) + 8.5 = 1.25 kl = -2(0)3
que se puedesustituirenla
y(0.5) = 1
ecuación (16.39) para obtener:
+ {i[8.5 +4(4.218 75)+
1.25]}0.5
=
3.218 75
la cual es exacta. Porlo tanto, ya que la solución verdadera es un polinomio de cuarto orden [Ec. (VI.13)]. La regla de Simpson de 1/3 proporciona un resultado exacto.
INGENIEROS 558
PARA
NUMERICOS
que se puede sustituirenla
METODOS
ecuación (16.39) y obtener:
+ 4(4.217 298 79) + 5.184 864 9241 1 1 = 6.175 676 681 que representa un E , = 0.31 % (valorverdadero = 6.194 631 38), que ~ ( 1 . 0= ) 2+
es superior en mucho a los resultados obtenidos previamente con los métodos RK de segundo orden (esto es, el Heun sin iteraciones) del ejemplo 16.5.
16.3.3
Métodos de Runge-Kutta de cuartoorden
Los métodos RK más populares son los de cuarto orden. Como sucede con los métodos de segundo orden, existe un número infinito de versiones. El siguiente algunas veces se llamamétodo clásico RK de cuarto orden:
donde [16.40~11
[16.40b] [16.40~1
[16.40d] Obsérvese que para las E D 0 que sólo son función de x , el método clási1/3. co deRKtambién es equivalente a laregladeSimpsonde
EJEMPLO 16.8 Método clásico RK de cuarto orden
Enunciado del problema: utilícese el método clásico RK de cuarto orden [Ec. (16.4O)Jparaintegrar: f(x,y) =
-2x3
+ 1zx2
-
2oX + 8.5
usando un tamaño de paso de 0.5 y unacondicióninicialde en x = 0.
y =
1
Solución: las ecuaciones (16.40~) a la (16.40d) se usan paracalcular:
559
METODOS DE UN PASO
kl = -2(0)3 k2
-
20(0) + 8.5
+
=
8.5
= ~ 2 ( 0 . 2 5 ) ~12(0.25)' - 20(0.25)
k3 =
k4
+ 12(0)'
+ 8.5 =
4.218 75
4.218 75
= -2(0.5)3
+ 12(0.5)* - 20(0.5) + 8.5 = 1.25 ecuación (16.40) para obtener:
que se puedensustituirenla
y(O.5) = 1
+
+ {i[8.5 + 2(4.21875) + 2(4.218 75) + 2(4.218 75)
1.25110.5
=
3.21875
el cual es exacto. Por lo tanto, debido a que la solución verdadera es de cuartoorden [Ec. (VI.131, el método de cuartoordenproporciona un resultado exacto.
16.3.4
Métodode Runge-Kutta de orden superior
Donde se requiera mayor exactitud, se recomienda método el RK de quinto orden, Butcher (1964):
donde kl = f
k5
k i ,
= f(xi
ks =/(xi
[16.41a]
Y¡)
+
h, yi
+ &hkl + & h b )
+ h, yi - Qhkl +'$hk2 + y h k 3 - Y h k 4 + $hk5)
[16.41e] [16.41f]
Obsérvese la similitud entre el método de Butcher y la fórmula NewtonCotes de quinto orden del cuadro 13.3. Se puede disponer de fórmulas RK de orden superior, tales como el método de Butcher, pero, en general, la ganancia obtenida en exactitud por los métodos de orden superior al cuarto se contrapone con la complejidad y esfuerzo de cálculo.
560
MÉTODOS
NUMÉRICOS
PARA INGENIEROS
EJEMPLO 16.9 Comparación de los métodos de Runge-Kutta
Enunciado del problema: emplirenselos métodos RK desde primero hasta quinto orden para resolver
con y(0) = 2 de x = O hasta x = 4 con varios tamaños de paso. Compárese la exactitud de los varios métodos en el resultado x = 4 basado en la respuesta exacta de y(4) = 75.338 962 61. Solución: efectúense los cálculos usando los métodos de Euler, Heun sin corregir, RK de tercer orden [Ec. (16.39)],RK clásico de cuarto orden y el método RK de Butcher de quinto orden. Los resultados se muestran en la figura 16.14, en donde se ha graficado el valor absoluto del error relativo porcentua! contra el esfuerzo computacional.Esta última can-
FIGURA 16.1 4
Comparación del error relativo porcentual contra el esfuerzo de cálculo de los métodos del primero ai cuarto de Runge-Kutta.
561
METODOS DE UN PASO
tidad es equivalente al número de evaluaciones de la función necesarias para alcanzar un resultado, Esfuerzo
=
nf
b - a ~
h
[16.42]
en donde nf es el número de cálculos de la función relacionados con el cálculo particular RK. Para órdenes 5 4, nf es igualalordendel método. Sin embargo, obsérveseque el método RK de Butcher de quinto orden requiere de seis cálculosde la función [Ec. (16.41a) a la (16.41fl1. Lacantidad ( b - a ) / h es el intervalototaldeintegracióndivididopor el tamaño del paso, es decir, es el número de aplicaciones del método RK necesarias para obtener el resultado. Por lo tanto, ya que las evaluaciones de la función son, en general, los pasos que consumen más tiempo, la ecuación (16.42) proporciona una medida aproximada del tiempo de corrida necesarios para alcanzar la respuesta. Analizandolafigura 16.14 se llega a algunas conclusiones: primemejores exactitudes ro, que los métodos de ordensuperiorobtienen con el mismo esfuerzo de cálculo y segundo, que la ganancia en exactitud por el esfuerzo adicional tiefide a disminuir después de un punto. (NÓtese que las curvas caen rápidamente alprincipio y después tienden a nivelarse.)
El ejemplo 16.9 y lafigura 16.14 llevan a la conclusión de que los métodos RK de orden superior son siempre los métodos de preferencia. Sin embargo, se deben considerar también otros factores tales como los costos de programación y los requisitos de exactitud del problema cuando se escoja un método de solución. Estos elementos de juicio se analizan detalladamenteen los casos delcapítulo 18 y enelepílogo de laparte VI.
16.3.5
Error local de truncamiento de los métodos de Runge-Kutta
Debido a que un método de Runge-Kutta de n-ésimo orden se determinaigualando los términosde la ecuación (16.28) y la expansiónde la seriedeTaylorhasta los términosquecontienen h", elerrorlocalde truncamiento se puede expresar como
E, = O(,"+')
[16.43]
en donde el valor exacto de E, depende de f ( x , y) y sus derivadas superiores. En general, no es posible calcular E, en base a la ecuación (16.43) ya que los cálculossondemasiadocomplicados. Enel mejor de los casos, si h es pequeña, y por consiguiente si a la ecuación la domina el primer término de la serie de Taylor, los coeficientes del método de RK [esto es, las a , p y q de la ecuación (16.29)) sepuedenescogerdetal
562
INGENIEROS
PARA
M~TODOS NUMERICOS
manera que minimicen el límite superior E,. Más allá de eso, un análisis del error del método RK viene a sermás complicado. Por ejemplo, el método deRunge-Kutta-Fehlberg se basaenel cálculo de dos aproximaciones RK de orden diferente, restando los resultados para obtener una aproximación del error.El método consisteen la fórmula de cuarto orden:
Yi+l
=
25
+ ( E k 1 +
~
1 408 k3 2 565
junto con lafórmuladequinto yi+l = yi
+(gkl
~
2 197 k4 4 104
-
1 -ks)
5
h
1
r16.441
orden:
6 656
+ 12 825
+
k3
+
28 561 56 430 [16.45]
donde
12
k4 = f(xi + Gh,
yi
1 932
hkl +2 197 439
+ h, yi + -hkl 216 1
8
ki = f(xi + Zh, yi - -hk, 27
+- 1859
4 104
-
-
8hk2
~
Oo' hkp 2 197
+
680 +"- 3513
7 296 -hk3 2 197
3
410
3 544 + 2hk2 - ___ 2 565 hk3
40
la aproximacih al error se obtiene restando la ecuación (16.44) de la (16.45) paraobtener
I
I
MÉTODO
563
DE UN PASO
Por lo tanto, la E D 0 se puede resolver con la ecuación (16.44) y la aproximación del error de la ecuación (16.46). Sin embargo, la aproximación al error se alcanza a costa de una complejidad extra y de un esfuerzo de cálculo. Nóteseque, después de cada uno delos pasos, la ecuación (16.46) se puede sumara la ecuación (16.44) y llegar a resultados de quinto orden. Aunqueelmétodo de Runge-Kutta-Fehlberges algomás pesado para manejarse que el método Runge-Kutta de cuarto orden, existen situaciones en donde el error aproximado lo convierte en un método preferible. El cálculo del error es de particular importancia cuando se trata de funciones que requieren pasospequeños en algunas regionesy pasos grandes en otras. En tales funciones, un error aproximado proporciona una base para cambiar el tamaño de paso durante los cálculos. De otra forma, el tamaño del pasose debe escoger conservadoramente, es decir, debe ser más pequeño que lo necesario para alcanzar la exactitud deseada, ademásde acomodar laregiónquerequieradelostamañosmás pequeños. Esta limitación se considerará con más detalle cuando se analicen métodos de pasos múltiples en el capítulo 17 para los cuales las aproximaciones delerror se obtienen con mayor facilidad.
16.3.6 Algoritmos para computadora de los métodos de Runge-Kutta Como en todos los métodos cubiertos en el capítulo, el método de RK se ajusta muy bien en el algoritmo general de la figura 16.6. En la figura 16.15 se presentan subrutinas en los lenguajes FORTRAN y BASIC que determinan la pendiente del método RKde segundo orden de Ralston [Ec. (16.38)].Las subrutinas para calcular pendientes de todas las otras versiones se pueden programar fácilmente de manera similar. Enel método de RK-Fehlberg, el tamaño variable de paso se puede incorporar de diferentes maneras. Una forma de hacerlo (Maron, 1982) es la de especificar un límite inferior y otro superior en el error. El objetivo es el de emplear un tamaño de paso que genere una aproximación
FIGURA 16.15
Subrutinas en FORTRAN y BASIC para determinarlapendienteusando RK el método de Ralston de segundo orden de
INGENIEROS 564
PARA
NUMfRICOS
METODOS
del error dentro del rango aceptable. Si el error aproximado es mayor que el límite superior, el tamaño de paso se parte a la mitad hasta que el error se encuentre dentrodel rango aceptable. Si el error aproximado es menor que el límite inferior, el tamaño de paso se duplica hasta que el error se eleva de un rango aceptable.
16.4 SISTEMAS DE ECUACIONES Muchos problemas prácticos de ciencia e ingeniería requieren de la solución de un sistema de ecuaciones diferenciales ordinarias en lugar de una sola ecuación. Tales sistemas se pueden representar generalmente como
[16.47]
La solución de este sistema requiere que las n condiciones iniciales se conozcan en un valor inicial de x. Todos los métodos analizados en este capítulo para ecuaciones simples se pueden extender para el sistema mostrado anteriormente. Las aplicaciones de la ingeniería pueden implicar la solución de varios cientos de ecuaciones simultáneas. En este caso, el procedimiento de solución del sistema de ecuaciones simplemente significa aplicar el método de un paso a cada una de las ecuaciones antes de continuar con el siguiente paso. Esto se ilustra mejor en el siguiente ejemplo.
EJEMPLO 16.1 O Solución de sistemas de E D 0 usando el método de Euler
Enunciado del problema: resuélvase el siguiente conjunto de ecuaciones diferenciales usando el mGtodo de Euler, suponiendo que en x = O, y1 = 4, y y 2 = 6. Intégrese a x = 2 con un tamaño de paso de 0.5.
565
METODOS DE UN PASO
Solución: el método de Euler se implementa como en la ecuación (16.2)
yZ(0.5) = 6
+ [4 - 0.3(6)- 0.1(4)]0.5 = 6.9
Obdervese que yl(0) = 4 se usa en la segunda ecuación en vez de y l(0.5) = 3 , calculado con la primera ecuación. Procediendo de una manera semejante se obtiene X
O 0.5 1.0 1.5 2.0
Y1
4 3 2.25 1.687 5 1.265 6215
Y2
6 6.9 7.715 8.445 25 9.094 087 5
16.4.1 Algoritmo para la computadora para la solución de sistemas ED0
de
El programa para resolver una sola E D 0 con el método de Euler (Fig. 16.6) se puedeextender fácilmente a un sistema de ecuaciones. Las modificaciones incluyen: 1. Introducir el núrrero de ecuaciones, n. 2. Introducir los valc'res iniciales para cada unade las n variables dependientes. 3. Modificar la subrutina de tal manera que calcule las pendientes de cada una de las variables dependientes. 4. Incluir funciones adicionales para calcular las derivadas de cada una de las EDO. 5. Incluir las ecuacicnes restantes (del tipo en la linea 230 de la versión BASIC) para calc.darun nuevo valor de cada una delas variablesdependientes.
Obsérvese que cualquiera de los métodos de un paso de este capitulo se pueden usar para este algoritmo. La única diferencia seria la formulación de la subrutina que calcula las pendientes. El método clásico RK de cuarto orden es una buena alternativa para este propósito ya que proporciona una exactitud excelente y es relativamente fácil de programar. Una característica importante de un programa de computadora para resolver sistemas de E D 0 con un método RK es la secuencia del cálculo de las k como se demuestra en el ejemplo siguiente.
566
METODOS
NUMERICOS PARA INGENIEROS
EJEMPLO 16.1 1 Solución de sistemas de
ED0 empleando el método RK de cuarto
orden
Enunciado del problema: utilícese el método RK de cuarto orden para resolver las E D 0 del ejemplo 16.10. Solución: primero, se deben resolver para todas las k l : kl,l = f(0, 4, k1.2 =
6) = -0.5(4)
f(0, 4, 6) = 4
-
==
-2
0.3(6) - 0.1(4) = 1.8
en donde k,,,es el i-ésimo valor de k para la j-ésima variable dependiente. En seguida, se calculan los valores de y l y y 2 que se necesitan para determinar las k2:
y1
+ $hkl,l = 4 + $(0.5)(-2) = 3.5
y2
+ i h k l , 2 = 6 + $(0.5)(1.8)= 6.45
que se usan para calcular: k2,1 = f(0.25, 3.5, 6.45) =
k2,2 =
-1.75
f(0.25, 3.5, 6.45) = 1.715
El proceso continúa hasta calcular las k restantes: k3,1 =
f(0.25, 3.562 5, 6.428 75)
k3,2
=f(0.25, 3.562 5, 6.428 75)
k4.1
= f(0.5,
k4.2 =
=
=
-1.781 25 1.715 125
3.109 375, 6.857 562 5)
f(0.5, 3,109 375, 6.857 562 5)
=
-11.554 687 5 1.631 793 75
=
Los valores de k se pueden usar para calcular [Ec. (16.40)l:
yl(0.5) = 4 =
-
1.781 25)
-
1.554 687 510.5
3.115 234 38
y2(0.5) = 6 =
+ iL-2 + 2(-1.75
+ 2[1.8 + 2(1.715+ 1.715 125)+ 1.431793 7510.5
6.857 670 32 ~
~~
~
567
METODOS DE UN PASO
Procediendo de manera semejante en los pasos restantes, se obtiene X
Y1
O
4 3.1 15 234 4 2.426 171 3 1.889523 1 1.471576 8
0.5 1 .O 1.5 2.0
16.4.2
Y2
6 6.857 670 3 7.632 105 7 8.326 886 O 1 8.946 865
Problemas con valores en la frontera: métodosde disparo
La solución de ecuaciones con valores en la frontera usando el método de disparo es un ejemplo de un problema que en el contexto de los sistemasde E D 0 se puederesolver. Recuérdese delanálisis alprincipio de la parte VI, que una ecuación diferencial ordinaria va acompañada de condiciones auxiliares. Estas condiciones se usan para evaluar las constantes de integración que resultan durante la solución de una EDO. Para unaecuación de n-ésimo orden, se debenevaluar n constantes, y por lo tanto, se requieren n condiciones. Si se especifican todas las condiciones en un mismovalor de lavariable independiente, entonces se trata de un problema con valores iniciales. En su mayoría la parte VI trata este tipo de problemas. En contraste hay otra clase de E D 0 para la que las condiciones no se dan en un solo punto pero sí en varios valores de la variable dependiente. Debido a que estas condiciones se expresan en los puntos extremos o límites, éstosse les conocen conel nombre deproblemas con valores en la frontera. Una variedad de problemas significativosde ingeniería caen dentro de esta clase. En este capítulo, se analiza un esquema general para resolverestosproblemas: el método de disparo. El método de disparo está basado en la conversión de problemas de valores en la frontera en problemas de valor inicial equivalente. Se implementa un esquema de prueba y error que resuelve la versión de valores iniciales. El esquema se puede ilustrarcon un ejemplo.
EJEMPLO 16.1 2
El
método de disparo
Enunciado del problema: empléese el método de disparo para resolver
I
d2Y + 0.2y = 2 dx2
568
MÉTODOS
con las condiciones en la frontera y(0)
=
NUMÉRICOS
O y y ( 10)
=
PARA INGENIEROS
O.
Solución: usando el mismo esquema empleado en la transformación de la ecuación (VI.2)en las ecuaciones (VI.3)y (VI.6), la ecuación de segundo orden se puede expresar como dos EDO:
dY
[E16.12.1]
- 2
"
dx Y
dz dx
-
2
"
-
FIGURA 1616
0.2y
[E16.12.2]
Método de disparo: a) el primer "disparo"; b) segundo "disparo"; y c) el "tiro" exacto final.
569
METODOS DE UN PASO
A fin de resolver estas ecuaciones, se requiere un valorinicialpara
z. Para el método de disparo, se elige un valor, que puede ser
40)
=
1.
Entonces la solución se obtieneintegrandolas ecuaciones (E.16.12.1) y (E16.12.2) simultáneamente.Por ejemplo, usando un método RK decuartoordenparasistemas de ODES, se obtiene un valorfinaldel intervalo de y(10) = 10.208 (Fig. 1 6 . 1 6 4 , que define el valor verdadero y (10) = O por lo tanto, se hace otra elección, z(0) = 2 , y se llevan a cabo nuevamente los cálculos. Esta vez, elresultado y (10) = 8.035 está un poco más cercano alvalorverdaderode y(10) = O , peroaún persisteelerror (Fig. 16.166). Ahora, debido a que la E D 0 es lineal, los valores z(0) = 1
y(10) = 10.208
z(0) = 2
y(10) = 8.035
Y
están relacionados linealmente. Como tales, se pueden usar para calcularelvalorde z(0) queconforma a y(10) = O. Se puedeemplear una fórmula de interpolación para este propósito [recuérdese la Ec. (ll.í!)]: z(0) = 1 +
2 - 1 (O - 10.208) = 5.7 8.035 - 10.208
Este valor se pQede usar para determinar la solución 16.16~. se muestraenlafigura
correcta como
L
Para problemas con valor a la frontera no lineales, la interpolación lineal o extrapolación a través de la solución de dos puntos no resultanecesariamente una aproximación segura de la condición en la frontera requerida para obtener una solución exacta. Un esquema alterno es el de realizar tres simulacionesy usar un polinomio de interpolación cuadrático para calcular la condición en la frontera. Sin embargo, no es muy probable que tal esquema lleve a la respuesta exacta, y con iteraciones adicionales sería necesario obtener la solución. Debido a que éste es un proceso ineficiente, existen métodos alternativosentales casos. Los máscomunes son los métodos de diferencias a la finitas. Estos métodos son apropiados para problemas con valores frontera lineales y no lineales. En estos esquemas, las diferencias divididas finitas se sustituyen por las derivadas en la ecuación original. De esta
570
METODOS NUM~RICOS PARA INGENIEROS
manera, la ecuación diferencial se transforma en un conjunto de ecuaciones algebraicas simultáneas que se puede resolver usando un método de la parte 111. Este es el esquema que se usa en el caso 9.2 para resolver ladistribucióndela temperatura de una placa caliente. Los problemas 9.8, 16.9 y 18.10 se relacionan con la solución de problemas con valores a la frontera.
PROBLEMAS Cálculos a mano 16.1
Resuélvase el siguienteproblema con valorinicial sobre el intervalo de x x = 2: dY -= dx
=
Oa
yx2 -y
donde y(0) = 1. Grafiquese la solución 16.2
Utilicese el método de Euler con h = 0.5 y 0 . 2 5 para resolver el problema 16.1. Grafíquense los resultados en la misma gráfica y compárese visualmente la exactitudde los dos tamaños de paso.
16.3 Utilicese el método de Heun con h = 0 . 5 y 0.25 para resolver el problema 16.1. Itérese el corrector a E, = 1%. Grafíquense los resultados sobre lamisma gráfica y compárese visualmente la exactitud de los dos tamaños con la solución analítica. Interprétense los resultados. 16.4
Utiliceseel método del polígono mejorado con h problema 16. l.
16.5
Utilicese el método RK de Ralston de segundo orden con h elproblema 16.1
16.6
Utilicese el método clásico RK de cuarto orden con h = 0 . 5 para resolver el problema 16.1.
16.7
Utilicese el método de RK-Fehlberg de cuarto orden con h = 0 . 5 para resolver el problema 6.1. Calcúlese el error aproximado en cada paso.
=
0 . 5 y 0 . 2 5 para resolver el
=
0 . 5 para resolver
16.8 Repítanse los problemas 16.1 al 16.7 pero con el siguiente problema con valores iniciales sobre el intervalo x = O a x = 1. dy
-
4
"
dx
y(0) = 1
MÉTODOS
DE UN PASO
571
16.9 Utilíceseel método de disparo para resolver
d$ +
16-
dy dx
-
4y = 20
con la condicióna la frontera, y ( 0 ) = 5 y y(20) = 2 . 16.10 Utilícese el método de Euler con un tamaño de paso de 1 para resolver el siguiente sistemade ecuaciones de x = O a x = 10:
dy1
- y1
"
-
0.1Y1Y2
dx
en donde y , = 2 5 y y2 = 7 enx = O. 16.1 1Utilícese el método RK de cuarto orden para resolver el problema 6 . 1 0 usando h = 1 . 0 d e x = O a x = 1.
Problemas relacionados con la computadora 16.12 Progrimese nuevamente la figura 16.6 de tal forma que sea legible al usuario. Entre otras cosas, a) Colóquense declaraciones de comentarios, a lo largo del programapara identificar lo que cada una de las secciones va a realizar. b) Etiquétese la entrada y la salida.
16.13 Pruébese el programa del problema 16.12 duplicando los cSlculos de los ejemplos 16.1, 16.3 y 16.4. 16.14 Utilicese el programa del problema 16.12 repitiendo los problemas 6.1 y 6.2. 16.15 Repítanse los problemas 16.13 y 16.14, pero usando el paquete NUMERICOMP, disponible con el texto. 16.16 Desarróllese un programa legible al usuario del metodo de Heun con un corrector iterativo. Tómese como base del programa lasfiguras 16.6 y 16.12. Pruébese el programa duplicando los resultados del cuadro 16.3. 16.17 Desarróllese un programa legible al usuario del método RK de Ralston de segundo orden basado en las figuras 16.6 y 16.15. Pruébese el programa duplicando el ejemplo 16.16. 16.18 Desarróllese un programa legible al usuario del método cldsico RK de cuarto orden. Pruébese el programa duplicandoel ejemplo 16.8 y elproblema 16.6. 16.19 Desarróllese un programa para la computadora que sea legible al usuario para sistemas de ecuaciones usando el método de Euler. Tómese como base del programa el andlisis de la sección 16.4.1. Utilícese este programa para duplicar los cSlculos del ejemplo 16.12. 16.20 Repítase el problema 16.19. pero usando el método RK de cuarto orden.
C A P í T U L OD I E C I S I E T E MÉTODOS
DE PASOS MÚ LTIPLES
Los métodos de u n paso analizados en el capítulo anterior utilizan la información de un solo punto xi para predecir un valor de la variable dependiente en un punto posterior x , + ~(&. 17.1~1):Las técnicas alternas, llamados métodos de pasos múltiples, (Fig. 17.lb),se basan en el conocimiento de que una vez que los cálculos han empezado, la información evaluada en puntos previos sirve de guía. La curvatura de las líneasque conectan estos puntosanterioresproporcionainformación refermte a la trayectoria de la solución. Los métodos de pasos múltiples ED0 explorados en este capítulo consideran esta información para resolver y evaluar su error. Antes de describir las versiones de orden superior, se presenta un método simple de segundo orden que sirve para demostrar las características generales de los esquemas de pasos múltiples.
FIGURA 17.1
Esquemagráficode las diferenciasfundamentalesentre o) métodos de un paso y b) métodos de pasos múltiples en la solución de EDO.
574
NUMERICOS
MtTODOS
PARA INGENIEROS
17.1 UNENFOQUESIMPLE DE PASOSMúLTIPLES: MÉTODO DE HEUNSINPRINCIPIO Recuérdese que el método de Heunusael predictor:
método de Euler como un
y la regla trapezoidd como corrector:
[17.2] Por lo tanto, el predictor y el corrector tienen errores locales de truncamiento de O(h2) y O(h3),respectivamente. Esto sugiere que el predictor sea el punto débil en el método ya que tiene el mayor error. Este punto débil es significativo debido a que la eficiencia delpaso corrector iterativo depende de la exactitud de la prediccióninicial.Por consiguiente, una manera de mejorar el método de Heun es desarrollar un predictor que tenga un error local de O(h3).Esto se puede llevar a cabo usando el método de Euler y la pendiente en y , , pero haciendo la corrección desde un punto previo yi.l, como en:
La ecuación (17.3) no es auto-principianteya que implica un valor anterior de lavariable dependienteEstevalornodeberíaestardisponibleen un problematípico de valorinicial.Debido a este hecho, a las ecuaciones (17.3) y (17.2) se les conoce como método de Heun sin principio. Obsérvese que, como se muestra en la figura 17.2, la aproximación a la derivada en la ecuación (17.3) se localiza ahora en el punto medio envez de alprincipiodelintervalosobreelcual se hace la predicción. Como se demuestra subsecuentemente, este centrado mejorael error del predictor a O(h3).Sin embargo, antes de continuar a una derivación formal del método de Heun sin principio, se resume el método y se expresa usando una nomenclatura un poco modificada: Predictor: y k l = yP1 Corrector: y(+l = y 7
+ f(xi,y?) 2h
+ f h i , Y 3 +2f(Xi+l,
(para j
=
[17.4] YG)
1 , 2, . . . , m )
C17.51
MÉTODOS
575
D E PASOS M ú L T I P L E S
FIGURA 17.2
Esquema gráfico del método de Heun sin principio. al método de P’Jnto medio usado como predictor; b) regla trapezoidal empleada como COrrector.
donde los Subindices se han agregado para denotar que el corrector se aplica iterativamente desde j = 1 a m para obtener soluciones refinadas. Nótese que y ? y y,ml son los resultados finales de las iteraciones del corrector en los pasos de cálculo anteriores. Las iteraciones se terminan en cualquier paso del cálculo en base alcriteriode paro
[17.6] Cuando E, es menor que una tolerancia preespecificada en el error, E, se terminan las iteraciones. En este punto, j = m. El uso de las ecuaciones (17.4) a la (17.6) en la solución de una E D 0 se demuestra en el ejemplo siguiente.
576
MÉTODOS
NUMÉRICOS
PARA INGENIEROS
EJEMPLO 17.1 Método de Heun sin principio Enunciado del problema: utilicese el método de Heun sin principio para realizar los cálculos del ejemplo 16.5 usando el método de Heun. Es decir, intégrese y ' = 4e0.8X - 0.5 y desde x = O hasta x = 4 usando un tamaño de paso de 1.0. Como con el ejemplo 16.5, la condición inicial en x = O es y = 2. Sin embargo, debido a que se está utilizando un método de pasos múltiples, se requiere la información adicional de que y es iqual a -0.392 995 325 en x = - 1. Solución: se usa el predictor [Ec. (17.4)]para extrapolar linealmente de x = -1 a x " 1 :
+ [4e0.8io)- 0.5(2)]2 =
y': = -0.392 995 325
5.607 004 675
Entonces se usa el corrector [Ec. (17.5)] para calcular el valor -
y:=2+ =
0.5(2) +
4eo.8(')
-
0.5(5.607 004 675)]
2
1
6.549 330 688
que representa un error relativo porcentual de - 5.73% (Valor verdadero = 6.194 631 377). Este error es algo más pequeño que elvalor de -8.18% contraído con el método de Heun auto-principiante. Ahora se puede aplicar iterativamente la ecuación (17.5)para mejorar la solución:
yT=2+
3 + &o.8i')
-
0.5(6.549 330 688) 2
=
6.313 749 185
que representa un E, del - 1.92%. También se puede determinar una aproximación del error usando la ecuación (17.6):
141=
6.313 749 185 - 6.549 330 688 6.313 749 185
=
3,7%
La ecuación (17.5) se puede aplicar iterativamente hasta que t o se encuentre dentro de un valor E, preespecificado. Como en el caso del método de Heun (recuérdese el ejemplo 16.5),las iteraciones convergen al valor 6.360 865 49 (E, = - 2.68%).Sin embargo, debido a que el valor del predictor inicial es más exacto, el método de pasos múltiples converge en proporci6n un poco más rápida:
577
METODOS DE PASOS MúLTIPLES
1
En el
segundopaso,
+
y; = 2 = 13.443 461
el predictor es 0.5(6.360 865 49)] 2 2 €, = 9.43%
-
que es superior a la predicción de 12.082 569 46 (E, = 18% calculada con el método de Heun original. El primercorrector lleva a 15.955395 53 E, = - 6.8%) y las iteraciones siguientes convergen al mismo resultado que se obtiene con el método de Heun sin principio: 15.302 236 7 (E, = - 3.1%). Como en el paso anterior, la proporción de convergencia del corrector se perfecciona un poco debido ala mejor preducción inicial.
17.1.1 Obtención y análisis de error de las fórmulas predictor-corrector Se han empleado conceptos gráficos para derivar el método sin principio de Heun. Hasta ahora se ha demostrado como las mismas ecuaciones se pueden derivar matemáticamente. La obtención de estas fórmulas particularmente interesante debido a sus vínculos con las ideas de ajuste de curvas, integración numérica y EDO. La obtención de estas fórmulas también es útil ya que proporciona un medio de avancesimple en el desarrollo de métodos de pasos múltiples de orden superior y la aproximación a sus errores. La obtención se basa en la solución de la E D 0 general
Esta ecuación se puede resolver multiplicando ambos ladospor d x e integrando entre los límites i e i + 1:
El lado izquierdo se puede integrar y evaluar usando el teorema fundamental [recuérdese la ecuación (16.21)]: Yi+l
=
Y¡ +
h,
Kit1
f(x, y) dx
[17.7]
Si se puedeevaluar la integral, entonces la ecuación (17.7) representa la solución a la EDO. Es decir, esta fórmula proporciona una manera de calcular un nuevo valor de la variable dependiente y;, I en base al valor anterior y ; y la ecuación diferencial. Las fórmulas de integración numérica tales como las desarrolladas en el capítulo 13 proporcionan una manera de realizar esta evaluación. Por ejemplo, la regla trapezoidal [ecuación (13.3)Jse puede usar en la eva-
578
MÉTODOS
NUMÉRICOS
PARA INGENIEROS
luación de la integral, como en [17.8]
donde h = x , + ~ - x , es el tamaño de paso. Sustituyendo (17.8) en la ecuación (17.7)se obtiene Yiil
=
Yi
+
f k i l
la ecuación
Y¡> + f(Xi+l, Y-hi + d 2
que es la ecuación corrector del método de Heun.Debido a que esta ecuación se basa en la regla trapezoidal, el error de truncamiento se puede tomar directamente del cuadro 13.2:
E,
= -1 h3Y"'((c) = 12
-
1 h 3 f"((J 12
[17.9]
donde el subíndice c denota que éste es el error del corrector. Se puede usar un esquema similar para derivar el predictor. En este caso, los límites de integraciónvan desde i - 1 a i + 1:
y" dy = r"f (x, y) dx J x ~ -1
]Y¡-1
que se puede integrar y reordenar para obtener [17.10]
Ahora, en vez de usar una f6rmula cerrada del cuadro 13.2, se puede usar la primera fórmula de integración abierta de Newton-Cotes (véase el cuadro 13.4) para evaluar la integral [17.11]
a la cual se le llama el método del punto medio. Sustituyendo la ecuación (17.11) en la ecuación (17.10) se obtiene yi+l
=
yi-1
f
f(xi, yJ2h
que representa al predictor del método de Heun sin principio. Como sucede con el corrector, el error local de truncamiento se puede tomar di-rectamente del cuadro 13.4 E, = h 3 y"'((,) = h3 f"(&,) [17.12] donde el subíndice p denota que éste es el error del predictor. Por lo tanto, el predictor y el corrector del método de Heunsin principio tienen los mismos errores de truncamiento. Además de aumentar la exactitud del predictor, este hecho tienelos beneficios adicionales relacionados con el análisis del error. como semuestra en la siguiente sección.
5
5
579
METODOS DE PASOS
17.1.2 Aproximación del error Si el predictor y el corrector de un método de pasos múltiplessondel mismo orden, entonces el error local de truncamiento se puede obtener a lo largo del cálculo. Esta es una ventaja tremenda debidoa que establece un criteriodeajusteen el tamaño del paso. El error local de truncamiento del predictor se calcula mediante la ecuación (17.12).Esta aproximación del error se puede combinar con la aproximación de y;, del paso predictor para obtener [recuérdese la definición básica de la ecuación ( 3 .l)]:
,
verdadero Valor
=
yp+l
+ $ h 3 y”’(&,)
C17.131
Usando un esquema similar, la aproximación del error para el predictor [Ecuación (17.9)]se puede combinar con el valor verdadero y el resultadel do corrector genera: verdadero Valor
=
y21 - ff h3 y”’(&)
C17.141
La ecuación (17.13) se puede restar de la ecuación (17.14) para obtener
o = y21 - y?+1 - & h 3 y”’([)
r17.151
donde 4 está entre xiPly xi+l.Ahora dividiendo la ecuación (17.15) entre 5 y reordenando términos el resultado es
C17.161 Obsérvese que los lados derechos de las ecuaciones (17.9) y (17.16) son idénticos, conla excepción del argumento de la tercera derivada. Si la tercera derivada no varía apreciablemente sobre el intervalo en cuestión, se supone que los lados derechos son iguales, y , por lo tanto, también los lados izquierdos deben ser iguales, como en
[17.17] Por lo tanto, hemos llegado a una relación que se puede usar para aproximar el error de truncamiento por pasoen base a dos cantidades, el predictor (y:+l) y el corrector ( y z J , que son rutinas por productos de los cálculos.
580
INGENIEROS MÉTODOS
NUMÉRICOS
PARA
EJEMPLO 17.2 Aproximación del error de truncamiento por paso para el método de Heun sin principio
Enunciado del problema: utilícese la ecuación (17.17) para aproximar el error de truncamiento por paso del ejemplo 17.l . Obsérvese que los valores verdaderos en x = l y 2 son 6.194 63138 y 14.843 921 9, respectivamente. Solución: en x,, = 1, el predictor genera 5.607 004 675 y el corrector genera 6.360 865 49. Estos valores se pueden sustituir en la ecuación (17.17) y obtener
E = - 6.360 865 49
-
5.607 004 675
=
-o,150 772 163
5
que es comparable con el error exacto, .E,=
6.194 631 38
-
6.360 865 49
=
-0.166 234 110
En x , , ~= 2, el predictor genera 13.443461 9 y el corrector 15.302 236 7, que se usan para calcular
E
=
-"
15.302 236 7
-
13.443 461 9
=
"o,371 754 960
5 que también secompara
14.843 921 9
-
favorablemente con el error exacto, E,
15.302 236 7
= -
=
0.458 314 8.
La facilidad con que se puede calcular el error usando la ecuación
(17.7)representa una ventaja importante de los métodos de pasosmúltiples sobre los mgtodos de un solo paso. Entre otras cosas, esto proporciona una base racional e n el ajuste de tamaño de pasodurante el curso de los cálculgs. Por ejemplo, sila ecuación (17.17) indica que el error es mayor al nivel aceptable, el tamaño de paso debe disminuir. En una sección subsiguiente (sección 17.4),delinearemos como estos ajustes en los tamaiios de paso se pueden incorporar en un algoritmo para la computadora.
17.1.3 Modificadores Antes de desarrollar algoritmospara la computadora, se deben notar otras dos formas enque se puede hacer más exacto y más eficiente al método de Heunsin principio. Primero, se debe tomar en cuenta que la ecuación (17.17),además de proporcionar un criterio en el ajuste del tamaño del
MÉTODOS
581
PASOS MÜLTIPLES
paso, representa una aproximación numéricade la diferencia entre el valorcorregidofinalen cada uno de los pasos y,+] y el error verdadero. Por lo tanto, éstepuedesumarsedirectamente y,,] paramejorar aún másla aproximación:
YZl
+
YE1 -
YZ1 -
O
Yi+l
L17.181
5
A la ecuación (17.18) se lellama corrector modificador. (El símbolo
-
se lee “se reemplaza por”.) El lado izquierdo es el valor modificado de Y%]. Una segunda mejora, relacionada más con la eficiencia de programación, es el predictor modificador, elcual estádiseñadoparaajustar el resultado del predictor de tal manera que esté más cercano al valor convergente final del corrector. Esto es ventajoso debido a que, como se menciona al principio de esta sección, el número de iteraciones del corrector depende altamente de la exactitud de la predicción inicial. Por consiguiente, sila predicción se modifica de manera conveniente, se puede reducir el número de iteraciones necesarias para converger a un valor final del corrector. Este modificador puede derivarse simplemente suponiendo que la tercera derivada es relativamente constante de paso a paso. Por lo tanto, usando el resultado del paso anterior en i, la ecuación (17.16) se puede resolver por [17.19]
la cual, suponiendo que y ’ ción (17.12) para obtener
(t) = y ”’ (,$J.
se puede sustituir en la ecuaE17.201
que entonces se puede usar para modificar el resultado del predictor: O Yi+l
+YLl
+ 4 (y?
-
y:)
r17.211
EJEMPLO 17.3 Efecto de los modificadores en los resultados del predictor-corrector
Enunciado del problema: calcúlese nuevamente el ejemplo 17.1 usando losmodificadoresespecificadosen lafigura 17.3. Solución: como enel ejemplo 17.1, el resultado del predictor inicial es 5.607 004 675. Debido a que elpredictormodificador [Ec. (17.21)] requiere de valoresde una iteración previa, éste no puede emplearse para mejorar elresultadoinicial.Sin embargo, la ecuación (17.18) se usa
582
MÉTODOS
FIGURA 17.3
PARA INGENIEROS
NUMÉRICOS
Secuencia de fórmulas usadas en la implementación del método de Heun sin principio. Nótese que la aproximación al error del corrector se puede usar para modificar el corrector. N o obstante, debido a que esto puede afectar la estabilidad del corrector, el modificador no se incluye en el algoritmo. El error calculado del corrector se incluye debido a su utilidad en el ajuste del tamaño del paso.
paramodificarelvalorcorregidode como en: yí'' =
6.360 865 49 -
6.360 865 49 (e,
6.360 865 49 - 5.607 004 675 5
= -
=
2.684%),
6,210 093 327
que representa un E, = - 0.25%. Por lo tanto, el errorsereduceen cuanto a s u magnitud. Enla siguiente iteración el predictor [Ec. (17.411se usa para calcular y$ = 2 =
+
[4eU.8(')- 0.5(6.210 093 327112
13.594 234 10
e:, = 8.42%
MÉTODOS
583
DE PASOS MÚLTIPLES
es alrededor de la mitad del error del predictor de la segunda iteradel ejemplo 17. l , elcualfue E , = 18.6%. Esta mejora se debe a se est&usando unaaproximaciónsuperiorde y (6.210 093 327, opuesto a 6.360 865 49) en el predictor. En otras palabras, el error propagado y global se reducen mediante la inclusión del corrector modificador. Ahora debido a que se tiene información de la iteración anterior, la ecuación (17.21) se empleaparamodificar el predictor. =
13.594 234 10
=
14.197 322 75
+
4 - (6.360 865 49 - 5.607 004 675) 5 E, = -4.36%
que nuevamente, divideendosel error. Esta modificación no tieneefecto sobre el resultado final de los pasos del corrector subsiguientes. Independientemente de cuando se usen predictores modificados o sin modificar, el corrector finalmente converge a la misma respuesta. No obstante, debido a que la proporción o eficiencia de la convergencia depende dela exactitud de la predicción inicial, lamodificación puede reducir el número de iteraciones necesarias parala convergencia. La implementación del corrector llevaal resultado de 15.211 777 23 ( E , = - 2.48%) elcualrepresentaunamejoríasobreel ejemplo 17.1 debido a la reducción del error global. Finalmente, este resultado se modifica usando la ecuación (17.18): y 5 = 15.211 77723 =
14.888 268 60
15.211 77723 - 13.594 234 10 5 E, =
-0.30%
Nuevamente, elerror se hareducidoenmagnitud.
Como en el ejemplo anterior,la suma de los modificadores incrementa la eficiencia y la exactitud de los métodos de pasos múltiples. En particular, el corrector modificador efectivamente incrementa el orden del método. Por lo tanto, el método de Heun sin principio con modificadores, es el tercer orden en vez de segundo orden como fue el caso en la versión sin modificar. Sin embargo, se debe notar que existen casos en donde el correctormodificador afecta laestabilidaddel corrector. Como consecuencia, elmodificadorno se incluyeenelalgoritmodel método de Heun sin principio delineado en la figura 17.3. No obtante, el corrector modificador aún puede tener utilidad para el control del tamaño de paso analizado en la sección 17.1.5.
584
INGENIEROS
I
2
PARA
D I M E N S I O NX ( l O O ) , Y ( l O O ) COMMOH X I , Y l , U F-.S*V R E A D ( 5 . 1 >X( 1 > , X F Xl.X( ... ... I. > . FORMATU REIDCS.2)MX FORMAT( I S > READCS. 1 )ES
NUMERICOS
IFunclÓn que especiflca ecuaclón diferenclali
la
X i l l . XF = valores Inlclal y flnal de la variable Independiente
H
= tamaño del paso
M X = Iteraclones máxlmas del corrector
1.. Y0 .
ES = error aceptable (%I
LVLI
210
3
MÉTODOS
delcorrector
Y11 l = valor lnlclal de la varlable dependlente
220
230 240 250 260
(Subrutina para calcular el segundo valor de la varlable dependlente usando el método RK de cuarto orden1
27ü
"
280
N C = número de pasos de X I 1 1 a X F
290
30CI 310 320
333 340 350 300
aao
370
(Predlctorl
I) FOR J = I TU MX xx = X(h) 52 = FN F(f
IPredlctor modlflcadorl (Corrector) /
380
3uo 4üü 410 430 PI = PIJ 440 C I = CIJ 4sü NEXT I 46ü P R I N T X l I l . V l I ) 470 END
FIGURA 17.4
Programas en
FORTRAN Y BASIC delmétododeHeun
sin principio.
17.1.4 Programa para computadora de los métodos de pasos múltiples En la figura 17.4 se muestra un programa para la versión de tamaño de paso constante del método de Heunsin principio. Obsérvese que el programa incluye el predictor modificador delineado en la figura 1 7 . 3 . Debido a que este algoritmo emplea un tamaño de paso constante, se debe escoger un valor d e h al principio d e los cálculos. En general, la experiencia indica que un tamaño de pasoideal debe ser bastante pequeño para asegurar la convergencia dentro de dos iteraciones del corrector (Hully Creemer, 1963).Además, debe ser demasiado chico para generar un error d e truncamiento lo suficientemente pequeño. Al igual que conlos otros métodos paraEDOs, la única forma práctica d e valorar la magnitud del error global es la de comparar los resultados del mismo problema pero disminuyendo los tamaños de paso a la mitad cada vez. Obsérvese que se usa un método RK d e cuarto orden para generar los puntos necesarios al principio del cálculo. Para este propósito se escoge un método RK d e cuarto orden debido a que, aunque es un poco más difícil de programar que los métodos d e orden inferior, su mayor exactitud justifica su uso.
MÉTODOS
DE PASOS MÚLTIPLES
585
17.1.5 Beneficios en el control del tamaño de paso Con la excepción del método RK-Fehlberg analizado en la sección 16.3.5, se ha empleado un tamaño de paso constante para integrar numéricamente ecuaciones diferenciales ordinarias. Aunque tal esquema tiene una alta utilidad en muchos problemas de ingeniería, existen ciertos casos en donde es altamente ineficiente. Porejemplo, supóngase yue se está integrando una E D 0 con una solución del tipo mostrado en la figura 17.5. Para la mayor parte del rango, la solución cambia gradualmente un tamaño de paso grande para obtener resultados adecuados. Sin embargo, en unaregiónlocalizadade x = 1.75 a x = 2.25, la soluciónmuestra un cambio abrupto enla forma de una función impulso o pico. A las E D 0 cuyas soluciones consisten de componentes de variación rápida o lenta se lesllama ecuaciones rigidas. La consecuencia práctica al tratar con tales ecuaciones es que se requiere un tamaño de paso muy pequeño para capturar exactamente el comportamiento impulsivo. Si se empleara un algoritmo con tamaño de paso constante, el tamario de paso necesario m6s pequeño en la región de cambio abrupto tendría que aplicarse al rango entero de cálculo. Como una consecuencia, se aplicaría un tamaño de paso más pequeño que el necesario y , por lo tanto, muchos más cálculos a la región de cambio
FIGURA 17.5
" " " "
Ejemplo de la solución de una E D 0 que muestra un comportamiento tipo impulsivo. Los ajustes automáticos en el tamario del paso son desventajososenestos casos.
,.
586
INGENIEROS
PARA
MÉTODOS
NUMÉRICOS
gradual. En tales casos un algoritmo que ajuste automáticamente el tamaño de paso evitaría estas deficienciasy por lo tanto sería de gran ventaja Corno ya se dijo previamente, los mktodos de pasos múltiples descritos en este capítulo proporcionan una base para tal algoritmo. Porlo tanto, puede parecer accidental que el programa para computadora descrito en la sección anterior empleara un tamaño de paso constante. La razón por la que se ha separado esta ventaja del algoritmo general es que el ajuste al tamaño de paso no es una tarea de programación trivial. De heo el costo cho el costo (dado en términos del tiempo de programación un factordecisivocuando se dedesarrollo de programas)puedeser escoja la incorporación de esta opción. Con este antecedente, se describe la mecánica del control del tamaño de paso. Este análisis debe hacerse claro porque incluir este aspecto no es un ejercicio trivial. La manera de escoger el tamaño del paso se predice en base a un conjunto de factores. En general, el tamaño dellapsodebe hacerse lo suficientemente pequeño de tal forma que el corrector converja y que se mantenga asíen tantas iteraciones comosea posible. Adicionalmente, debe ser tan pequeño que los resultados sean lo sufientemente exactos para los requisitos de un problema. AI mismo tiempo, el tamaño del paso debe ser tan grande como sea posible de tal forma que minimice el tiempo al momento de la corrida y elerrorde redondeo. un cambio Comúnmente seusandoscriteriosparadecidircuando en el tamaño del paso se justifica. Primero, si la ecuación (17.17) es mayor que un criterio de error previamente especificado, entonces el tamaño del paso decrece. Segundo, se escogeel tamaño del paso de tal manera que el criterio de convergencia del corrector se satisfaga en dos iteraciones. Este criterio se propone considerar las ventajas y desventajas que existen entre la relación de convergencia y el número total de pasos en el cálculo. Para valores pequeños de h , la convergencia es más rápida pero se requierenmás pasos. Para h más grande, la convergenciaes lentapero se necesitan menos pasos. Laexperiencia (Hull y Cremer, 1963) sugiere que los pasos totales seminimizan si h se escoge de tal maneraqueelcorrector converja dentrodedos iteraciones. Por lo tanto, si se requieren más de dos iteraciones, el tamaño de paso disminuye y si se requieren menos de dos iteraciones, entonces el tamaño del paso se aumenta. Aunque la estrategia anterior especifica cuando se llevan a cabo las modificaciones del tamaño del paso no especifica cómo se debe cambiar. Esta es una pregunta crítica ya que los métodos de pasos múltiples por definición requieren de varios puntos para calcular uno nuevo. Una vez que el tamaño del paso se cambia, se debe determinar un nuevo conjunto de puntos. Una manera de hacerlo es la de reiniciar los cálculos y usar el método de un solo punto para generar un nuevo conjunto de puntos iniciales. Una manera más eficiente de hacerlo y que hace uso de la información existente es aumentar al doble y disminuirel tamaño de paso a la
587
MhODOS DE PASOS
mitad. Como se muestra en la figura 17.6a, si se ha generado un númeal doble, ro suficiente de valores anteriores, aumentando el tamaño del paso es algo relativamente correcto (Fig. 1 7 . 6 ~ )Todo . esto es necesario para mantener la información de los subindices de tal forma que los valores anteriores de x y y vengan a ser los nuevos valores. Disminuir a la mitad el tamaño del paso es algo más difícil ya que algunos de los nuevos valores no se encuentran disponibles (Fig. 1 7 . 6 ~ )Sin . embargo, se pueden usar los polinomios de interpolación del tipo desarrollado enel capítulo 1 1 paradeterminarestosvaloresintermedios. En cualquier caso, la decisión de incorporar el control sobre el tamaño del paso representa hacer una evaluación entre el tiempo para desa-
FIGURA 17.6
Gráfica que indica la estrategia de dividir y duplicar unsegmento que permite el uso de a) valores calculados previamente con un método de pasos múltiples de tercerorden. b) Dividiendo a la mitad y c) duplicando.
588
METODOS NUMÉRICOS
PARA INGENIEROS
rrollar un programa complejo paralos términos grandes y la eficiencia que se requiere. Obviamentela magnitud y la importancia del problema mism o ayudará a elegir una opción.
17.2 FóRMULAS DE INTEGRACIóN El método de Heun sin principio es característico de la mayor parte de los métodos de pasosrn~últiples.Emplea una fórmula de integración abierta
FIGURA 17.7
Ilustración de la diferencia fundamental entre el método de Newton-Cotes y la fórmula de integración de Adams. a) Las fórmulas de NewtonCotes usan una serie de puntos para obtener una aproximación a la integral sobre un conjunto de segmentos. La aproximación se usa después pura proyectarse sobre el rango completo b) Las fórmulas de Adams usan una serie de puntos para obtener una integral aproximada con un solo segmento. La aproximación seusa entonces para proyectarse sobre este segmento.
MÉTODOS
589
DE PASOS MúLTIPLES
(el método del punto medio) para calcular una aproximación inicial. Este paso predictor requiere un punto previo. En seguida se aplica iterativamente una fórmula de integración cerrada (la regla trapezoidal) para mejorar la solución. Es obvio que una estrategia de mejoramiento sobre los métodos de pasos múltiples podría ser la de usar fórmulas de integración de orden superior como predictores y correctores. Por ejemplo, podrían ser útiles para este propósito las fórmulas de Newton-Cotes de orden superior desarrolladas en el capítulo 13. Antes de describir estos métodos, se revisan algunas de las fórmulas de integración más comunes sobre las cuales estánbasados. Como se menciona anteriormente, las primeras de éstas son las fórmulas de NewtonCotes de orden superior. No obstante existe una segunda clase llamadas fórmulas de Adams que también se revisan y que seprefieren a menudo. Como muestra la figura 17.7, la diferencia fundamental entre las fórmulas de Newton-Cotes y de Adams está relacionada con la manera como se aplica la integral para obtener la solución. Como semuestra en la figura 17.7a, las fórmulas de Newton-Cotes calculan la integral sobre un intervalo generando varios puntos. Esta integrai se emplea para proyectar desde el principio hasta el final del intervalo. En contraste, las fórmulas de Adams (Fig. 17.7b) usan un conjunto de puntos deun intervalo para calcular la integral solamente del último segmento en el intervalo. La integral se usa después para proyectarse a través de este último segmento.
17.2.1 Fórmulas de Newton-Cotes Algunas de las fórmulas más comunes para resolver ecuaciones diferenciales ordinarias se basan en ajustar un polinomio de interpolación de n-ésimo grado para n + 1 puntos conocidos de y y después se usa esta ecuación para calcular la integral. Como seanaliza previamente en el capítulo 13, las fórmulas de integración de Newton-Cotes se basan en este esquema. Estas fórmulas son de dos tipos: abiertas y cerradas. Fórmulas abiertas. Para n puntos igualmente espaciados, las fórmulas abiertas se pueden expresar en la forma de una solución de una EDO, como se hizo anteriormente en la ecuación (17.10).La ecuación general para este propósito es
[17.22] donde !,(x) es un polinomio de interpolación de n-ésimo orden. La evaluación de la integral obtiene una fórmulade integración abierta de NewtonCotes de n-ésimo orden. Por ejemplo si n = 1.
590
METODOS
NUMÉRICOS
PARA INGENIEROS
donde f, es una abreviación de f(xi, y,), esto es, la ecuación diferencial evaluada en xi y y,. A la ecuación (17.23) se le llama método del punto medio y se usa previamente como el predictor del método de Heun sin principio. Para n = 2, Yi+ 1 = Yi-2
y para n
=
3h + 7j-ifi + fi-1)
3,
La ecuación (17.24) se muestra gráficamente en la figura 1 7 . 8 ~ 1
Yi+l
=
Y¡-n+l
+
I
Y+I
[17.251
f"(XMX
Xi-n+l
FIGURA 17.8
Esquema de las fórmulas de integración cerradadeNewton-Cotes. Tercera fórmula abierta [Ec. (17.24)] Y b) regla de Simpson de 1/3
(17.26)].
a)
[Ec.
METODOS DE PASOS
591
donde la integral se aproxima mediante unafórmula cerrada de NewtonCotes(cuadro 13.2). Porejemplo,para n = 1: Yi+l
=
Y¡ +
h
5 (fi + f i + l >
que es equivalente a la regla trapezoidal. Para n Y ~ + I=
yi-1 +
=
2:
h
-3 Cfi-1 + 4fi + f i + l )
C17.261
la cual es equivalente ala regla de Simpson de 1/3. La ecuación (17.26) se muestra en la figura 17.8b.
17.2.2 Fórmulas de Adams
El otro tipo de fórmulas de integración que se puede usar en la solución de E D 0 son las fórmulas de Adams. Muchos algoritmos de pasos múltiples muy utilizados en computación que resuelven E D 0 se basan en estas fórmulas. Fórmulas abiertas (Adams-Bashforth).Las fórmulas de Adams se pueden obtener de varias formas. Un método esel de escribir una expansión hacia adelante de la serie de Taylor alrededor del punto xi:
que se puede escribir como
[17.27] Recuérdese de la sección 3.5.4 que se puede usar una diferencia hacia atrás para aproximar la derivada: - fi-1 f I’ f; = fi+ -h
h
2
+ O(h2)
que se puede sustituir en la ecuación (17.27) para obtener
o, agrupando términos:
yi+l = y,
+ h($ fi
-
fi-1)
+ & b 3 fl‘ + O(h4)
[17.28]
592 -
MÉTODOS
NUMÉRICOS
PARAINGENIEROS
A estafórmula se le llama segunda fórmulaabierta de Adams. Las Fórmulas abiertas de Adams son designadas también como fórmulas de Adams-Bashforth. Por consiguiente a la ecuación (17.28) algunas veces se le llama segunda fórmula de Adams-Bashforth. Se pueden desarrollar fórmulas de Adams-Bashforth de orden superior sustituyendo las derivadas de orden superior por aproximaciones en la ecuación (17.27). La fórmula abierta de Adams de n-ésimo orden se puede representar por lo común como n-1
[17.29]
Los coeficientes Pk se muestran en el cuadro 17.1. La versión de cuarto orden se muestra en la figura 17.9a. Nótese que la primera versión es el método de Euler. Fórmulas cerradas (Adams-Moulton). Una expansión de la serie de Taylor alrededor de xi+ se puede escribir como
yi =
f :+1
Y¡+] - h+lh + -+*
L
-
Resolviendopara y j + seobtiene l17.301
Se puede usar una diferencia para aproximar la derivada: CUADRO 17.1
Coeficientes y error de truncamiento en los predictores de Adams-Bashforth
Orden
1
24
4
5
6
Po
PI
Pz
P3
P4
Error local de truncamiento
Ps
1
24
55 -
24 1 901 __
59 "
37 -
9 24 1 274 251
"
2 774 __ 2 616 720720 720 720 720 4 277 923 982 7 9 7 298 877 2 __ -~ __ __ 720 720 720 720 720 "
475 h6f'"([) 1440
" ~
"
475 720
"
19 087 h7f(6)(0 60 480
MÉTODOS
593
DE PASOS MÚLTIPLES
FIGURA 17.9
Esquema de las fórmulas de integración de Adams abiertas y cerradas. u). Fórmula abierta de Adams-Bashforth de cuarto orden y b) fórmula cerrada de cuarto orden de Adams-Moulton.
fi
fi+l f!I + 1 = ___
h
que se sustituyeenla
Y,+]= y; + h
+
&lh
+
2
O(h2)
ecuación (17.30) para obtener:
[i.,, -
A esta fórmula se le llama fórmula cerrada de Adams de segundo orden o segunda fórmula d e Adams-Moulton. Obsérvese también que ésta es la regla trapezoidal.
594
MÉTODOS
CUADRO 17.2
Coeficientes y error de truncamiento en Adams-Moulton
P 2
P3
-1 2 2 1 5 8 3 12 12 12 9 19 4 24 24 264 251 19 646106 5 720720 720720 1 427 798 482 475 _ _ 6 1 440 1 440 1 440 1 440 2
NUMÉRICOS
los correctores de Error local de truncamiento
PS
P 4
-1
1 12 1 h4{f'3)(() -- __ - - h3P(5)
"
"
"
PARA INGENIEROS
19 h5f'4'(5)
720 27 -.-.____
"
720 173 1 440
,!,6f(5)(5)
1 AA0
27 863 "
h7f(6,(5)
"~ ~"
1 440
& 480 I
L a fórmula cerrada de Adams se puede escribir generalmente como n-1
y!+] = yi
+h
Pkfiil-k
+ O(h"+')
k=O
Los coeficientes & se listan en el cuadro 17.2. El método de cuarto orden se muestra en la figura 17.9b.
17.3 MÉTODOS DE PASOSMúLTIPLES DE ORDEN SUPERIOR Ahora que se han desarrollado formalmente las fórmulas de integración de Newton-Cotes y de Adams, podemos usarlas en la derivación de métodos de pasos múltiples de orden superior. Como en el caso del método de Heun sin principio, las fórmulas de integración se aplican en fila como los métodos de predictor-corrector. Además, si las fórmulas abiertas y cerradas tienen errores locales de truncamiento del mismo orden, entonces los modificadores listados en la figura 17.3 se pueden incorporar en el mejoramiento de la exactitud y para permitir el control sobre los tamaños del paso. En el recuadro 17.1 se proporcionan ecuaciones generales para estos modificadores. Enla siguiente sección, se presentan dos de los
RECUADRO 17.1 Obtención de las relaciones generales de La relación entre el valor verdadero,laaproximación, un predictor se puede representar generalmente como
y el de error
los modificadores
Va,or verdadero =
+
"& %
+ I ~ ( ~ + I ) ( ~ ~ )
[B17.1.1]
MÉTODOS
595
DE
donde vc y 6, son el numerador y el denominador de la constante del error de truncamiento del predictor de cualquiera de los métodos abiertos de Newton-Cotes (cuadro 13.4) o de los métodos de Adams-Bashforth (cuadro 17.1) y n es el orden. Se puede desarrollar una relación similar para el corrector 'Jc Valor verdadero = y;"+l - s,h
n+l
y (n+l)(5,)
E, =
O
Yl+l rlc
+
-
YE1
'JP
WS,
Para el predictor modificador, la ecuación (B17.1.3) se puede resolver en el paso anterior mediante
[B17.1.2] donde y 6, son el numerador y el denominador de la constante del error de truncamiento para cualesquiera COrrector de Newton-Cotes abierto (cuadro 13.2) O de Adams-Moulton (cuadro 17.2). Como se hizo en la derivación de la ecuación (17.15),la ecuación (B17.1.1)se puede sustraer de la ecuación (B17.1.2) para obtener
[B17.1.3] Ahora dividiendo la ecuación entre vc + vp6J¿iP, multiplicando el último término por 6,/6, y reordenando términos se obtiene una aproximación del error local de truncamiento del corrector
que se puede sustituir en el término del error de la ecuación (B17.1.1) para obtener
[B17.1.5] Las ecuaciones (B17.1.4) y (B17.1.5) son versiones generales que se pueden usar para mejorar los algoritmos de pasos múltiples. Por ejemplo, el método de Milne tiene ?, = 14, 6, = 45, vc = l , y 6; = 90. Sustituyendo estos valores en las ecuaciones (B17.1.4) y en (B17.1.5) se obtienen las ecuaciones (17.33) y (17.34). Se pueden desarrollar modificadores sirnilares para otro par de fórmulas abiertas y cerradas que tienen errores locales de truncamiento del mismo orden.
métodos de paso múltiple de orden superior más comunes: el método de Milne y el método de Adams de cuarto orden.
17.3.1 Método de Milne El método de Milne es el método de pasos múltiples más común basado en las fórmulasde integración de Newton-Cotes. Este usa la fórmula abierta de Newton-Cotes de tres puntos como predictor: [17.31]
y la fórmula cerrada de Newton-Cotes de tres puntos (regla de Simpson
de 1/3) como corrector: y{+1 = yim_1+ !gfi"-l + 4jy
+ f{;!)
[17.32]
Los modificadores predictor y corrector del método de Milne se pueden desarrollar a partir de las fórmulas del recuadro 17.1 y los coeficientes del error de los cuadros 13.2 y 13.4:
E,
= % ( y ? - y?)
[17.331
596
METODOS
NUMERICOS PARA INGENIEROS
Y
EJEMPLO 17.4 Método de Milne Enunciado del problema: utilicese el método deMilne para integrar y ' = 4&.Y - 0.5 y desde x = 4 usando un tamaño de paso de 1.La condición inicial en x = O es y = 2. Debido a que se utiliza un método de paso múltiple, se necesitan los puntos anteriores. En una aplicación verdadera se debe usar bun método de un paso tal como RK de cuarto orden para calcular lospuntos necesarios. En este ejemplo, se usa la solución analítica [recuérdese la Ec. (E16.5.1) del ejemplo 16.51 para calcular los valores exactos e n xi-3 = - 3 , xi-2 = - 2 , y xi"l = 1 de yi-3 = 4.547 302 219, yi-2 = - 2.306 160 375 y yi-1 = - 0.392 995 325 respectivamente. Solución: el predictor [Ec. (17.31)]se emplea para calcular un valor en x = y;
= =
1: -4.547 302219
+
6.022 723 13
4[2(3) - 1.993 813 519 3
€,
=
+
2(1.960 666 259)]
2.8%
El corrector [Ec. (17.32)J se emplea entonces para calcular y: = -0.392 995 325 =
6.235 209 902
+
1
711.993 813 519 C,
+
4(3)
+
5.890 802 1-57]
-0.66%
Este resultado se sustituye en la ecuación (17.32) para corregir iterativamente la aproximación. Este proceso converge a un valor corregido final de 6.204 854 65 (E, = - 0.17%). Este valor es más.exacto que la aproximación comparable de 6.360 865 49 (E, = - 2.68%) obtenido previamente con el método de Heun sin principio (ejemplos 17.1 al 17.3).Los resultados en los pasos restantes son y (2) = 14.860 307 2 (E, - O . l l % ) , y (3) = 33.724 260 1 = - 0 . 1 4 % ) , y y (4) = 75.432 948 7 (E, = - 0 . 1 2 % ) .
Corno en el ejemplo anterior, el método de Milne, en general, obtiene resultados de alta exactitud. Sin embargo, existen ciertos casos en los que ésta es baja. Antes de entrar en detalle en estos casos. se describirá otro método de pasosmúltiples de orden superior, el método de Adams de cuarto orden.
597
METODOS D E PASOS MúLTIPLES
17.3.2 Método de Adams de cuarto orden Un método de pasos múltiples ampliamente usado basado en las fórmulas de integración de Adams utiliza la fórmula de cuarto orden de AdamsBashforth(cuadro 17.1) como predictor: y?+* = y?
+ h(zf!" 24 I
sf? 1 + zf"' 24 1-2 - zfF3)
- 24
I
[17.35]
y la fórmula de cuarto orden de Adams-Moulton (cuadro17.2) como corrector:
y?
y{+l
+ h (xfj-1 24 1+1 + Bf!" 24 - Af!" 24 1-1 + '24 f!" I
1-2 )
[17.36]
Los modificadores predictory corrector del método de Adams de cuarto orden se pueden desarrollar a partir de las fórmulas del recuadro 17.1 y los coeficientesdeerror de los cuadros 17.1 y 17.2 para obtener:
[17.37] [17.38]
EJEMPLO 17.5 Método de Adams de cuarto orden
Enunciado del problema: utilícese el método de Adams de cuarto orden 17.4. para resolver el mismo problema del ejemplo Solución: el predictor [Ec. (17.35)lse usa para calcular un valor en x = 1. y? = 2
+ I ( E 3 - $1.993
813 519
+
1.960 666259
-9 24 2.649 382 908) =
6.002 716 992
E,
=
3.1%
que es comparable pero un poco menos exacto que el resultado obtenidoconel métododeMilne. El corrector [Ec. (17.38)Jse empleapara calcular y{ = 2
+ l ( &5.900 805 218 + E 3 - & 1.993 813 519
+ & 1.960 666 259) =
6.254 118 568
E,
=
-0.96%
que nuevamente es comparable pero un poco menos exacto que el resultado obtenido con el método de Milne. Este resultado se puede susti-
598
MÉTODOS
NUMÉRICOS
PARA INGENfEROS
tuir en la ecuación (17.38) para corregir iterativamente la aproximación.
El proceso converge a un valor corregido final de 6.214 423 582 (E,
=
0.32%) el cual es un resultado exacto pero nuevamente algo inferior al obtenido con el método de Milne.
17.3.3 Estabilidad de los métodos de pasos múltiples La gran exactitud mostrada por el método de Milne en los ejemplos 17.4 y 17.5 puede anticiparse con base en los términos del error de los predictores [Ec. (17.33) y (17.37)] y a los de los correctores [Ec. (17.34) y (17.38)].Los coeficientes del método de Milne, 14/45 y 1/90, son más pequeños que para el método de Adams, 251/720 y 19/720. Adicionalmente, el método de Milne emplea algunas evaluaciones más de la función para alcanzar estas altas exactitudes. Por los valores obtenidos, estos resultados pueden llevar a la conclusión de que el método de Milne es superior y, por lo tanto, es preferible al método de Adams de cuarto orden. Aunque esta conclusión se cumple en la mayor parte de los casos, existen ejemplos en donde el método de Milne trabaja inadecuadamente. Este comportamiento se muestra en el ejemplo siguiente.
EJEMPLO 17.6 Estabilidad del método de Milne y del método de Adams de cuarto orden
Enunciado del problema: utiliceseel método de Milne y el método de Adams de cuarto orden para resolver -
"
dx con la condición inicial de que y = 1 en x = O. Resuélvase la ecuación de x = O a x = 10 usando un tamaño de paso h = 0.5. Nótese que la solución analítica es y = e "'. Solución: los resultados, resumidos en la figura 17.10. indican problemas con el método de Milne. Un pocodespués del arranquede los cálculos, los errores empiezan a crecer y a oscilar en el signo. En t = 10, el error relativo se ha inflado a 2 831% y el valor predecid0 mismo ha empezado a oscilar en el signo. En contraste, los resultados del método de Adams son mucho másaceptables. Aunque el error también crece, lo hace de manera lenta. Adicionalmente, las diferencias n o deberían exhibir los cambios bruscos de signo mostrados por el método de Milne.
MÉTODOS
599
DE PASOS
FIG1J RA 17. 10
Esquema de la inestabilidad del método deMilne.
AI comportamiento inaceptable manifestado enel ejemplo anterior del método de Milne se le llama inestabilidad. Aunque esto no siempre ocurre, su posibilidadllevaalaconclusiónde que el método de Milne debe evitarse. Porlo tanto, normalmente se prefiere el método de Adams de cuarto orden. La inestabilidad del método de Milne se debe al corrector. Por consiguiente, se han hecho intentos de rectificar este inconveniente desarrollando correctores estables. Una alternativa usada comúnmente que emplea este esquema es el método de Hamming, que usa el predictor de Milne y un corrector estable: .
Yi+l =
9yT - y r p
+ 3h(f{;: + 2fT - f rl) 8
que tiene un errorlocal de truncamiento
E, = &h5f4)(&) El método de Hamming también incluye modificadores
de la forma
600
MhODOS NUMERICOS PARA INGENIEROS
Y
El lector puede obtener información adicional sobre este y los otros métodos de pasos múltiples en otras obras (Hamming, 1973; Lapidus y Seinfield, 1971).
PROBLEMAS Cálculos a mano 17.1
Resuélvase el siguiente problema de valor inicial sobre el intervalo
x = 3:
dY -
de x = 2 a
-0.5,
dX
Utilicese el método de Heun sin principio con un tamaño de paso de 0.5 y las condiciones iniciales y(1.5) = 4.723 67 y y(2.0) = 3.678 79. ltérese con el corrector hasta E, = l%.[Nota: los resultados exactos obtenidos analíticamente son y(2.5) = 2.865 05 y y(3.0) = 2.231 30.1 Calcúlese el error relativo porcentual E" en los resultados. 17.2
Repítase el problema 17.1 usando el método de Milne. [Nota: y(0.5) = 7.788 y y(1.0) = 6.065 31.) Itérese el corrector hasta que E, = 0 . 0 1 8 .
O1 17.3
Repítase el problema 17.2 pero con el método de Adams de cuarto orden (EE = 0.01 56).
17.4
Resuélvase el siguienteproblemaconvalorinicial
dY -= dx
-
desde x
=
4 hasta x
=
5:
Y X
Utilícese un tamaño de paso de 0.5 y valores iniciales de y(2.5) = 1.2,y(3) = 1 , y(3.5) = 0.857 142 857 y y(4) = 0.75. Obténganse las soluciones usando los métodos siguientes: a) método de Heunsinprincipio (es = 1 %), b) método de Milne (ES = 0.01%) y c) método de Adams de cuarto orden (ES = 0.01%). [Nota:Las respuestas exactas obtenidas analíticamente son y(4.5) = 0.666 666 67 y y(5) = 0.6.1 Calcúlese el error relativo porcentual 6" de los resultados: 17.5
Resuélvase elsiguienteproblema de valorinicial desde y = O hasta y dv
-=yx
dx
2
=
0.5:
- y
Utilicese el método de Heun sinprincipio con un tamaño de paso de 0.25. Si y(-0.25) = 1.277 355 170, empléese un método RK de cuarto orden con tay(0). maño de paso l para predecir elvalorinicialen
MÉTODOS
60 1
DE PASOS MúLTIPLES
17.6
Resuélvase elsiguienteproblema
dY
de valorinicial desde x = 1.5 a x = 2.5:
-Y - -
"
dx
I + x
Utilicese el método de Adams de cuarto orden. Empléese un tamaiío de paso de 0.5 y el método RK de cuarto orden para predecirlos valores inicialesde arranque si y(0) = 2 .
17.7
Repítase elproblema 17.6 usando el método de Milne
17.8
Determínese el predictor, el corrector y los modificadores del método de Adarns de segundo orden. Empléese pararesolverelproblema 17.1.
17.9
Determínese el predictor, el corrector y los modificadores del método de Adarns de tercer orden. Empléese para resolver el problema 17.4.
Problemas relacionados con la computadora 17.10 Desarróllese un programa legible al usuario sobre el método de Heun sin principio con modificadores basado en la sección 17.1.3. Empléese un método RK de cuarto orden para calcular los valores iniciales. Pruébese el programa con el ejemplo 17.3. 17.11 Utilícese el programa desarrollado en el problema 17.10 para resolver el problema 17.5. 17.12 Desarróllese un programa legible al usuario sobre el método de Milne de cuarto orden con modificadores. Empléese un método RK de cuarto orden para calcular los valoresiniciales. Pruébese el programa con el ejemplo 17.5. 17.13 Utilícese el programa desarrollado en el problema 17.12 para resolver el problema 17.6.
C A P í T U L OD I E C I O C H O CASOSDE LA PARTE VI: ECUACIONES DIFERENCIALES ORDINARIAS
El próposito de este capítuloes el de resolver algunasecuaciones diferenciales ordinarias usando los métodos numéricos presentados en los capítulos 16 y 17. Las ecuaciones se originan de aplicaciones pr6cticas de la ingeniería. Muchas de estas aplicaciones generan ecuaciones diferenciales no lineales que no pueden resolverse usando métodos analíticos. Por lo tanto, comúnmente se necesitanlos métodos numéricos.En consecuencia, el uso de los métodos de solución numérica de ecuaciones diferencialesordinarias es unahabilidadfundamentalquecaracterizaalbuen ingeniero. Los problemas de este capítulo ilustran algunos de loselementos de juicio asociados con varios de los métodos analizados en los capítulos 16 y 17. En el caso 18.1 se usa una ecuación diferencial para predecir lastendencias de la venta de computadoras. Entre otrascosas, este ejemploilustra como se ajustan datos a un parámetro de un modelo matemático. Se usa el método RK de cuarto orden en esta aplicación. El caso 18.2tiene su origen en el contexto de los problemas de ingeniería química, que demuestra cómo escoger adecuadamente un tamaño de pasoy cómo se puedenusar las ecuaciones diferenciales para mejorar el proceso de producción química. Se usa el método de Runge-Kutta de segundo orden para este ejemplo. Los casos 18.3 y 18.4 tomados de la ingeniería civil y eléctrica respectivamente, tratan de la solución de un sistema de ecuaciones. En el caso 18.3, se usael método de Euler debido a que el problema no re-' quiere de resultados con una gran exactitud. En el caso 18.4,por el otro lado, se requiere de una exactitud alta, y por consiguiente, se usa el método RK de cuarto orden. Finalmente, en el caso 18.5 se emplea una variedad de métodos diferentes para investigar el comportamiento de un péndulo en oscilación. Este problema también usa dos ecuaciones simultáneas. Un aspecto importante de este ejemplo es eldeilustrar cómo los métodos numéricos permiten la fácil incorporación de efectos no lineales dentro del análisis de ingenería.
604
INGENIEROS
CASO 18.1
METODOS NUMERICOS
PARA
MODELOSMATEMÁTICOS PARAPROYECTOSDE VENTA DE COMPUTADORAS (INGENIERíA EN GENERAL) Antecedentes: las operaciones y las utilidades de una compañíade computadoras dependen mucho del conocimiento sobreel manejo del número de computadoras disponibles en el mercado en un tiempo cualquiera. Los métodos de extrapolación analizados en elcaso 12.1 han demostrado que no existe confiabilidad ni exactitud. Se tiene, por lo tanto, que derivar un modelo matemático que sea capaz de simular y predecir el número de computadoras disponiblesen el mercado en función del tiempo t . Se puede desarrollar una ecuación diferencial para este propósito. El departamento de mercadeo de la compañía ha determinado a través de la experiencia y de observaciones empíricas, que las ventas esperadas de las computadoras se describen mediante. Promedio de venta (número de computadoras o: vendidas por día)
número de computadoras en el mercado costo por computadora
[ 18.11
Es decir, mientras más computadoras se muestren al público, mayor venta de las mismas; y a mayor costo, menos ventas. Además, el costo de una computadora individual está relacionado con el número de computadorasenel mercado, [recuérdese la Eq. (15.1)] Costo porcomputadora ($) = 3 O00 - 1 750
N 10 O00
+N
[18.2]
donde N es el número de computadoras. La razón de cambio a través del tiempo del número de computadoras restantes en el mercado es igualal registro del promedio de ventas: -dN =-
dt
promedio de ventas
[ 18.3)
donde el promedio de ventasse deriva combinando las ecuaciones(18.1) (18.2):
y
ventas
de
Promedio
=
k
N 3 O00
-
1 750N/(10 O00
+
N)
I18.41
donde k es una constante de proporcionalidad que tiene unidades dedólares por tiempo. Sustituyendo la ecuación (18.4) enla ecuación (18.3) se obtiene
dN = - k dt
N 3 O00 - 1 750N/(10 O00
+
[18.5] N)
CASOSDELAPARTE
605
VI: ECUACIONES DIFERENCIALES ORDINARIOS
Las consideraciones de planeación requieren que se obtenga una estimación de cuánto tiempo permanecerán en el mercado 50 O00 nuevas computadoras. En el cuadro 12.1 se cuenta con algunos datos. Utilicese esta información para calcular el parámetro k. Después empléese el método RK de cuarto orden para resolver la ecuación (18.5) desde t = O hasta t = 90. Solución: el primer paso de este análisis será determinar un valor de k. Para hacerlo, se puederesolver la ecuación (18.5)
d N 3 x lo7 + 1 250N dtN(10 O00 + N)
k = --
Con base en esta ecuación, se puede evaluar k si tiene una aproximación a dN / dt. Esto se puede hacer con los datos del cuadro 18.1, usando diferencias divididas finitas para calcular dN / dt, [recuérdese la sección 3.5.41:
""I=
Ni+l
dt
-4-1
2At
.
Los resultados se muestran en el cuadro 18.1 y se pueden usar para determinar un valormedio de k = $49.3 diarios. Cuadro 18.1
Cálculos de k obtenidos de los datos de venta de computadoras.l a media de k es 49.3
t dias
N
O
dNldt
50 O00 35 O00 31 O00 20 O00 19 O00 12 050 1 1 O00
10 20 30 40 50 60
k
44.5 -950 40.6 -750 -600
55.0
-397.5 38.8 67.8 -400
Ahora este valor se puede sustituir en la ecuación (18.5) para obtener:
dN
-
-49.3
"
dt
N 3 O00 - 1 750
[N/( 10 O00
+ N)]
que se puede integrarusan¿o un método RK de cuarto orden conla condicióninicial N = 50 O00 y un tamaño de paso de un día. Obsérvese que se llevó a cabo la simulación usando un tamaño de paso de 0.5 días
MÉTODOS NUMÉRICOS PARA INGENIEROS
606
FIGURA 18.1
Gráfica del número de computadoras
N en el mercado contra el tiempo
t en días. Se usan tres simulaciones con un modelo de ecuación diferencial ordinaria [Ec. (18.5)], se muestran en el caso donde N = 50 O00 en t = O. Las tres simulaciones corresponden a valores diferentes del parámetro
k.
y se obtuvieron resultados casi idénticos, indicando que la exactitud al usar
un tamatio de paso de 1.0 es aceptable. Los resultados se muestran en lafigura 18.1 junto con los datos. Así como sucede enla regresión, se puede calcular la suma de los cuadrados de los residuos para cuantificar la calidaddel ajuste. El resultado es 2.85 X lo7.Aunque al ajuste parece ser satisfactorio, se llevan a cabo nuevamente los c6lculos usando valores de k que son f 20% del valor original de $49.3 diarios. Usando los valores de k de 59.2 y 39.4 se obtienen las sumas residuales de los cuadrados iguales a 1.05 x 10' y 5.35 x lo', respectivamente. Estas simulaciones también se muestranen la figura 18. l. En seguida se grafica la suma de los cuadrados de losresiduos contra k (Fig. 18.2) y se ajusta una parábola a través de los puntos usando un polinomio de interpolación, Después se determina k , como la suma mínima de los cuadrados, derivando la ecuación de segundo orden, igualándola a cero y resolviendo para k . El valor resultante de k = $46.8 diarios se sustituyeenla ecuación (18.5) y se obtiene dN dt
- =
-46.8
N 3 O00
-
1 750[N/(10 O00
+
N)]
FIGURA 18.2
Gráficc de la suma de los cuadrados de los residuos (S,) contra los valores del parámetro k del modelo. La curva es una parábola ajustada a tres puntos. El punto de pendiente cero de esta curva, representa una aproximación del valor k ($46.8/día) que corresponde a un valor mínimo de S,.
FIGURA 18.3
Modelo de predicciones usandola ecuación (1 8.5) con k igual a $46.8/día. 607 .
-
..
608
INGENIEROS MhODOS NUMÉRICOS
PARA
Este modelo produce una suma de los cuadrados de los residuos igual a 2.24 X lo7;se puedeusarparalospropósitospredictivos. Las predicciones se muestran en la figura 18.3 junto con los datos iniciales. Los resultados en t = 55, 65 y 90 días son 11 720, 9 383 y 5 596, respectivamente. Esta información, que es superiora la obtenida mediante ajuste de curvas enel capitulo 12, se puede usar en el manejo de toma de decisiones relacionadas con la venta de estas computadoras.
CASO 18.2
DISEÑODE U N REACTOR PARA PRODUCCIóN FARMACÉUTICA (INGENIERíA QUíMICA) Antecedentes: los ingenieros químicos diseñan reactores para el crecimiento poblacionaldeorganismosmicrobianos (recuérdese el caso 12.2). Los subproductos del crecimiento pueden ser productos farmacéuticos útiles. En la figura 18.4 se muestra el esquema de un reactor que opera a base de flujo continuo.El flujo de entradacontiene pocos microorganismos derivados, pero un alto contenido de nutrientes. Este flujo permanece en el reactor por algún tiempo mientras que ocurre la reacción bioquímica y después fluye hacia el exterior.El flujo de salida contiene una gran cantidadde nuevos microorganismos en crecimiento y una alta concentración de derivados del Crecimiento. Los nutrientes son más bajos que a la entrada debido a su utilización microbiana. El contenido del reactor se mezcla vigorosamente de tal manera que la composición de la mezcla de salida y del tanque sean iguales. Si la proporción de flujo y el contenido de los nutrientes es constante, el crecimiento de microorganismos se balancea por la pérdida de organismos del tanque y se alcanza con el tiempo una densidad de población estable. Al intervalo de tiempo en que los organismos se ajustan e incrementan su densidad se le llama periodo de inicio. La longitud del periodo de inicio es importante debidoa que éste es tiempo perdidoque cuesta dinero a la compañía. Al investigador se le propone desarrollarun modelo matemático para los microbios del reactor para predecir el periodo dearranque. El laboratorio de investigaciones bioquímicas ha determinado que los microorganismos crecen de acuerdo al modelo de crecimiento logístico(recuérdese el caso 6.3): Velocidad de crecimiento
=
K (pmAx - p)p
donde p máx = 2 x 10 células por litro es la densidad microbiana máxima y K = 2 x litrosporcélulapordíaeselcoeficientede la velocidad de crecimiento. Se requiere calcularel periodo de inicio parael caso donde p ( t = O) = 100 000 células por litro, el promedio de flujo de enirada al tanque Q = 100 I/día y el volumen del tanque V = 700 I . El perio-
DE
609
LA PARTE VI: ECUACIONES DIFERENCIALES ORDINARIOS
CASOS
FIGURA 18.4
Representación esquemáticade un reactor de fluio continuo con mezclado total empleado en el crecimiento de la población de organismos microbianos.
do de inicio se define como el tiempo necesario para que la población crezca a 6 x lo5 célulasporlitro. En este momento la producciónfarmacéutica puede empezar. Después de haber obtenido un cálculo confiable, se necesita usar el modelo para ayudar a los operadores de la planta a decidir el número óptimo de células a usarse en el tiempo t = O. Cuantos más organismos existan en t = O , más corto será el tiempo de inicio. Esto es importante debido a que cuesta a la compaiiía 1 O00 dólares diarios si el tanque está fuera de producción. Por lo tanto, existe la ventaja de reducir el tiempo deiniciousandomásorganismosen t = O. Por otro lado, los organismos nuevos son muy caros para comprarse. En la actualidad la compañía obtiene cepas de un laboratorio biológico con un costo de 3 O00 dólares por100 millones de células. Porlo tanto, el costo de 100 O00 célulasporlitrousadoenestean6lisls sería: Costo
100 O00 células/1(700 1)
$3 O00
= $2 100 100 x IO6 células El costo de 200 O00 células por litro seríael doble . Por consiguienteexisten ventajas y desventajas entre la reducción del periodo de arranque y el costo de nuevos organismos.El trabajo consiste en usar un modelo que proporcione unaguía a los operadores de la planta relacionado con el númeroidealdeorganismosen el tiempo t = O. Solución: primero se debe desarrollar la capacidad de simular el número de organismos en función del tiempo. Las consideraciones de balance de masassugierenque =
dP dt
Acumulaciónrnicrobiana en el tanque
-
crecimiento de biomasa microbiana
Sustituyendolospardmetros enla
"_".
__
-
-
pérdida de masa microbiana al exterior
ecuación (18.6) se obtiene:
610
INGENIEROS
dP = 2 dt
PARA
X
MÉTODOS NUMERICOS
10-~(2X lo6 - p)p - -100 p 700
o, reordenando términos
dP
___ =
dt
0.257 14 p - 2
X
p2
Esta ecuación se puede resolver analíticamente, pero se usará un método numérico para obtener la solución. Primero, se usa el método de Euler con un tamaño de paso deun día para calcular los resultados mostrados en la figura 18.5. Se usa el método Euler para este propósito debido a que es muy fácil de programar y proporciona una estimación rápida del comportamiento general de la solución. Como se puede ver, los microorganismos necesitan alrededor de 10 días para el periodo de inicio; en t = 20 días han alcanzado una población casi estable. A este periodo estable se le llama estado estacionario. En base al resultado anterior, se decide llevar a cabo la simulación en un periodo de 20 días. También se decidió usar el método de Ralston o RK de segundo orden debido a su fácil programación y a su creciente exactitud en el resto de los cálculos. Enel cuadro 18.2 se muestran los
FIGURA 18.5
Simulación del crecimiento microbiano en un proceso de producción química. Se usa el método de Euler en la simclación para hacer una evaluación rápida del comportamiento de la solución. Nótese que dentro de 1 O días se termina el periodo de inicio, y en 2 0 días el reactor ha alcanzado casi el estado estacionario.
DE
CASOS
61 1
VI: ECUACIONES DIFERENCIALES ORDINARIOS
CUADRO 18.2
Crecimiento microbiano simulado utilizando una ED0 y el metodo Se muestran resultadospara tade Ralston RK de segundo orden. maños de paso diferentes, así comola solucidn verdadera.
M6todo de Ralston RK de segundo orden t,
días O
2 4 6 8 10 12 14 16 18 20
h=2
h = l
h
100 O00 157 389 241 459 356 983 502 124 664 649 824 332 961 864 1 068 231 1 144 048 1 195 245
100 O00 158 482 244 265 361 805 508 550 671 699 831 161 968 558 1 074 745 1 150 200 1 200 719
100 O00 158 810 245 097 363 218 510 415 673 738 833 149 970 419 1 076 459 1 151 723 1 207 002
0.5
Solucidn verdadera
100 O00 158 931 245 403 363 736 511 095 674 479 833 867 971080 1 077 050 1 152 233 1 202 420
resultados para tamaños de paso de 2, 1y 0.5 días. Aunque el resultado analítico exacto espoco factible en la mayor parte de los problemas de aplicaciones verdaderas, se haincluidoenel cuadro 18.2 para propósitos de comparación. Obsérvese que todos los resultados numéricos son muy buenos, aun con el tamaño de paso t = 2 - h se muestran errores de menos del 5%. Si no se conoce la solución verdadera, la exactitud de los cálculos los resultados obtenidos variando el tamaño se puede apreciar comparando del paso. Por ejemplo, las diferencias entrelos resultados de h = 1 y 0.5 ocurren enla tercera cifra significativa. En consecuencia no se garantiza más exactitud debido a que una mayor precisión no sería discernible en una gráfica. Porlo tanto, se decide queh = 0.5 es adecuada para este propósito. Al usar este tamaño de paso y el modelo de Ralston se realizan dos simulaciones adicionales con las condiciones iniciales de 200 O00 y 400 O00 células por litro. En la figura 18.6 se muestran estos resultados, junto con el caso de 100 O00 células por litro.Como era de esperarse, cuanto más organismos se usen como base másse acortará el periodo de inicio, como se puede ver en los resultados del cuadro 18.3. Nótese que usando más organismos al incio, se reduce el costo de retardo de 9 200 a 2 500 dólares. Sin embargo, el costo de compra de los organismos aumenta de 2 100 a 8 400 dólares. El costo total, mostrado enlafigura 18.7, sugiere un mínimo alrededor de 250 O00 células por litro. El punto mínimo se puede aproximar ajustando una parábola a los tres puntos. Esta función puede diferenciarse, igualarse la derivada a cero y resolver para encontrar un valor de 264 O00 células por litro. Este nivel corresponde a un costo total de 10 O00 dólares, quelepresenta el costo total más bajo, tomando en cuenta tanto los costos del periodo de inicio como de los organismos semilla.
61 2
MÉTODOS
NUMÉRICOS
PARA INGENIEROS
FIGURA 18.6
Simulaciones delcrecimientomicrobialusando tres condiciones iniciales diferentes. Estos casos demuestran que, cuando se incrementa el número de organismos semilla, el periodo de arranque se acorta.
FIGURA 18.7
Gráfica del costo contra el número de organismos semilla (esto es, número de organismos en t = O). El hecho de que la curva sea plana sugiere que aunque exista ur mínimo en 264 O00 células por litro, este resultado es insensible relativamente al número de organismos semilla.
LA CASOS DE
VI:
613
ECUACIONES DIFERENCIALES ORDINARIOS
Inconvenientes de costo en varios niveles iniciales de organismos empleados en un proceso químico de producción Concentración Costo de inicial de compra de organismos organismos $ célulasllitro ~~
2 100 4 200 8 400
100 O00 200 O00 400 O00
CASO 18.3
~~
Tiempo de inicio
Costo por retardo
Costo total
h
$
$
~
-~
~
9 200 6 O00 2 500
9.2 6.0 2.5
11 300 10 200 10 900
DEFLEXIÓN DEL MÁSTIL DE UNVELERO (INGENIERíA CIVIL) Antecedentes: en la figura 18.8se muestra un velero similar al de los casos 12.3y 15.3,con una fuerza uniforme f distribuida a lo largo del mástil. En este caso, los cables que soportan al mástil se han quitado, pero el mástil se monta firmemente en el casco del velero. La fuerza del viento causa que el mástil se desvíe como se muestra en la figura 18.9. La desviación es similar a la de una viga en voladizo. Se puede usar la siguiente ecuación diferencial, basada en las leyes de la mecánica, para calcular la deflexión: d2Y --
(L - 2)*
[18.7]
"
dz2
FIGURA 18.8
2EI
Mástil del velero sujeto a una fuerza uniforme
f.
METODOS NUMERICOS PARA INGENIEROS
614
FIGURA 18.9
Deflexióndel mástil sujeto a unafuerzauniforme.
en donde E es el nódulo de elasticidad, L es la altura del mástil e I es el momento de inercia. En z = O y dy / dz = O. Calcúlese la deflexión e n el tope del mástil e n donde z = L usando métodos analíticos y numéricos. Supóngase que el casco no gira. Solución: la ecuación (18.7)se puede resolver analíticamente para la deflexión en z = L:
L4 y(z = L) = f8EI
[18.8]
Este problema incluye una ecuación diferencial que tiene una solución con características uniformes. Además, el intervalo de integración es relativamente corto y la desviación del mástil es pequeña. También los valores de f y E se basan en datos experimentales variables y difíciles de medir exactamente. Por lo tanto, parece satisfactorio usar un mBtodo de bajo orden para resolver la ecuación diferencial. Só10 se necesitará un valor inicial,y probablemente se use un tamaño de paso pequeñosin acumulación de errores de redondeo excesivos. La ecuación (18.7) se puede escribir como un sistema de dos ecuaciones de primer orden con una transformación de variables. Sea -dY =u
[18.9]
dz
y , por lo tanto, la ecuación (18.7) se expresa como
du
-
”-
dz
2El
(L - 2)*
[18.10]
DE
CASOS
LA PARTE VI: ECUACIONES DIFERENCIALES ORDINARIOS
615
Este par de ecuaciones diferenciales se puede resolver simult6neamente usando el método de Euler. Sin embargo, en primer lugar se puede obtenerla solución analítica por comparación.Dadaunacargauniforma f = 50 libras/pie, L = 30 pies, E = 1.5 x lo8 libras/pie2 e I = 0.06 pies4 la ecuación (18.8) se resuelve para:
50(30)4 = 0.5 625 pies y(30) = 8(1.5 x 108)0.06
~
En seguida se resuelven las ecuaciones (18.9) y (18.10)usando el método deEuler.Losresultadosdealgunospasosdeintegraciónson: Tamaño de paso de Euler
Y(30)
0.574 4 0.563 7 0.563 1 I
FIGURA 18.10
Gráfica de la deflexión del mástil de un velero calculada con el método de Euler.
CASO 18.4
1.0 0.1 0.05
Por lo tanto, la respuesta obtenidaparece satisfactoria;la deflexión del mástil muestra se figura la en 18.10. Los resultadossepuedenusarparapropósitosdediseño. Esto es especialmentevaliosoen casos donde lafuerzadelviento no es constante sino varía de una forma complicada en función de la altura sobre la cubierta del velero. El problema 18.13 proporciona un ejemplo de estasituación.
SIMULACIóN DE UNA CORRIENTE TRANSITORIA EN U N CIRCUITO ELÉCTRICO (INGENIERíA ELÉCTRICA) Antecedentes: son muy comunes los circuitos eléctricos en donde la corriente varíaconeltiempoenvezdemantenerse constante. Enelciclodelado derecho se establece una corriente transitoria del circuito mostrado en la figura 18.l l cuando elconmutadorsecierrade repente. Las ecuaciones que describen el comportamiento transitorio del circuito de la figura 18.11se basan en las leyes de Kirchhoff, que dicen que la suma algebraica de las caídas de voltaje alrededor de un ciclo cerrado es cero (recuérdese el caso 6.4). Por lo tanto, di
L - + + R i + " € 9( t ) = O dt C
r18.111
donde L(di/dt) es la caída de voltaje a través del inductor,L es la inductancia (en henrios), R es la resistencia (en ohmios), q es la carga del capacitor
616
MÉTODOS
.
Conmu-'#* Batería
-2Vo +
PARA INGENIEROS
Eit) . " h
, ,
a-.
- tador
NUMÉRICOS
i
*,.
1
' :,
Capacitor
,
Inductor
t / i
s .
Resistencia
FIGURA 18.1 1
Circuito eléctrico donde la corriente varía con el
tiempo.
(en coulombs),C es la capacitancia (en faradios),E ( t ) es la fuente de voltaje (en voltios)variablecon el tiempo, y [18.12]
Lasecuaciones (18.11) y (18.12) son un par deecuacionesdiferenciales lineales de primer orden que se pueden resolver analíticamente. Por ejemplo, si E(t) = Eo sen w t y R = 0 , q(t) =
-Eo w -senp t U P 2 - w2) P "
+
i/m
€0
L(p2 -
w2)
senw t
[18.13]
en donde p = Los valoresde q y dq/dt son cero en t = O. Empléese un método numérico para resolver las ecuaciones (18.11) y (18.12) y compárense los resultadoscon la ecuación (18.13). Solución:esteproblemaincluye un intervalodeintegración más grande y demanda el uso de métodos de gran exactitud para resolver ecuaciones diferenciales si seesperanbuenosresultados.Supongamosque L = 1 H, Eo = 1 V, C = 0.25 C y W2 = 3.5 s2. Estogenera p = 2 y lasolución analíticadelaecuación (18.13) viene a ser: q(t)
=
- 1.870 8 sen 2t
+
2 sen (1.870 8 t )
Esta función se muestra en la figura 18.12. La naturaleza de cambio r6pido de la función exige grandes requerimientosa cualquier procedimiento numérico para calcularq ( t ) .Además, debido a que la función exhibe una pequefia variación de naturaleza periódica así como un componente de variación rápida, se necesitan periodosde integración grandes para tratar de nuevo la solución. Por lo tanto, se espera que sea preferido un métododeordensuperiorenesteproblema. No obstante, se pueden probar los métodos de Euler y Runge-Kutta de cuarto orden y comparar los resultados. Con el método de Euler y usando un tamaño de paso de 0.1 S en t = 10 S se obtiene un valor de q igual a -6.638 mientras que con el método de Runge-Kutta de cuarto orden se obtiene un valorde -1.989 7 . Este resultado es comparable a la solución exacta, - 1.996 C.
CASOS DEECUACIONES LA PARTE VI:
FIGURA 18.1 2
DIFERENCIALES ORDINARIOS
617
Pantalla de la computadora mostrando la gráfica de una función [Ec. (18.13)].
La figura 18.13muestra los resultados de la integración de Euler cada 1.O S comparada con la solución exacta. Nótese que se grafica sólo cada décima de punto en la salida. Se puede ver que el error global aumenta a medida que t aumenta. Este comportamiento divergente se intensifica a medida que t tiende a infinito.
FiGURA 18.13
""-.
Resultados de la integración de Euler contra la solución exacta. Nótese que se grafica sólo cada décima de punto.
.
.
. . . ...~. . _ ~ _
- ~.
618
MÉTODOS
CASO 18.5
NUMÉRICOS
PARA INGENIEROS
EL PÉNDULO OSCILANTE (INGENIERíA MECÁNICA) Antecedentes: en la ingeniería mecánica (así como en las otras ingenierías) a menudo se enfrentan problemas relacionados con el movimiento periódico de cuerpos libres (recuérdese el caso 6.5).Los métodos de ingeniería requieren fundamentalmente que seconozca de la posición y la velocidad del cuerpo en función del tiempo. Estas funciones del tiempo invariablemente son ecuaciones diferenciales ordinarias. Las ecuaciones diferenciales, en general, se basan en la segunda ley de Newton del movimiento. Como ejemplo, considérese el péndulo simple mostrado previamente en la figura VI.l . La partícula de peso W se suspende de un hilo de peso despreciable, de longitud l. Las únicas fuerzas que actúan sobre la partícula son un peso y la tensión R del hilo. La posición de la partícula en cualquier tiempo se especifica completamente en términos del ángulo 0 y 1. El diagrama de cuerpo libre de la figura 18.14 muestra las fuerzas que actúan sobre la partícula así como su aceleración. Es conveniente aplicar la segunda ley de Newton del movimiento en la dirección x, tangente a la trayectoria de la partícula:
F
=
W
-Wseno =-a
9
donde g es la constante gravitacional (32.3pies/s2) y a es la aceleración en ladirección x. La aceleración angular de la partícula (a)es
Por lo tanto, en coordenadas polares
(a
= d2d/dt2),
O
d2e
g
+ -sen6 df2 1 W
FIGURA 18.14 Diagrama de cuerpo libre del péndulo oscilante mostrando las fuerzas sobre la partícula y la aceleración.
=
O
[18.14]
Esta ecuación aparentemente simple es una ecuación diferencial no lineal de segundo orden, En general, tales ecuaciones son difíciles o hasta imposibles de resolver analíticamente. Existen dos alternativas relacionadas con el avance en la solución de este problema. Primero, la ecuación diferencial se puede reducir a una forma deresolver analíticamente (recuérdese la sección (VI.l. 1). O se puede usar un método numérico para resolver la ecuación diferencial directamente. Se examinan ambas alternativas en este ejemplo.
PARTE CASOS DE LA
VI: ECUACIONES DIFERENCIALES ORDINARIOS
619
Solución: de acuerdo al primer método, se puede ver que la expansión de la serie Taylor del sen 8 está dada por s e n o = o - - + -o3 ."
o5
07
3! 5 !
7!
+
*
*
*
[18.15]
Para pequeños desplazamientos angulares, sen 6 es aproximadamente igual a 8 cuando se expresa en radianes. Por lo tanto, para desplazamientos pequeños la ecuación (18.14)se convierte en: g -d20 + o =o dt2 I
E18.161
que es una ecuación diferencial lineal de segundo orden. Esta aproximación es muy importante debido a que la ecuación (18.16)es muy fácil de resolver analíticamente. La solución, basada en la teoría de las ecuaciones diferenciales, esta dada por:
o(t) =
eo cos
4
[18.17]
t
donde es el desplazamiento en t = O y en donde se supone que la velocidad (u = dO/dt) de la partícula es cero en t = O. Al tiempo necesario para que la partícula complete un ciclo de oscilación se le llama periodo y está dado por
FIGURA 18.1 5
(e) eo
Gráfica del desplazamiento y la velocidad (d8/dt) en función del tiempo (t), colculada de la ecuación (18.17). es n / 4 y la longitud es de 2 pies.
" ."I.._""I_
.
,
.. .
-.
.._"_
620
MÉTODOS
NUMÉRICOS
PARA INGENIEROS
En la figura 18.15 se muestra una gráfica del desplazamiento (O) y la velocidad (de/&) en función del tiempo, como se calcula en la ecuación (18.17) con Bo = 7r/4 y 1 = 2 pies. El periodo, calculado con la ecuación (18.17) es 1.565 9 s. Los cálculos anteriores en esencia son una solución completa del movimiento de la partícula. Sin embargo también se debe considerar la exactitud de los resultados debido a la suposición inherente en la ecuación (18.16). Además, para evaluar la exactitud, es necesario obtener una solución numérica de la ecuación (18.14) que es una representación física más completa del movimiento. Se puede usar cualquiera de los métodos analizados en los capítulos 16 y 17 para este propósito, por ejemplo, los métodos de Euler y RK de cuarto orden. La ecuación (18.16)5% debe transformar en dos ecuaciones de primer orden compatibles con los métodos anteriores. Esto se lleva a cabo como sigue. La velocidad u se define como !
dO dt
-=u
[18.181
y , por lo tanto la ecuación (18.14)se puede expresar como [18.19]
Las ecuaciones (18.18)Y (18.19)son un par de ecuaciones diferenciales ordinarias simultáneas. En el cuadro 18.4se muestran los resultados generados con la solución numérica por el método de Euler y el método RK CUADRO 18.4
Comparación de la solución analitica lineal del péndulo oscilante con tres soluciones numéricasno lineales Soluciones no lineales Solución analitica Tiempo lineal S
( 4
0.0 0.2 0.4 0.6 0.8 1 .o 1.2 1.4 1.6
0.785 0.545 -0.026 "0.058 -0.783 -0.505 0.080 0.617 0.778
398 784 852 3104 562 912 431 698 062
Euler
(h= 0.05)
RK de cuarto RK de cuarto orden orden
(b)
(4
(h = 0.05)
(h = 0.0 1 )
0.785 398 0.615 453 0.050 228 -0.639 652 -1.050 679 -0.940 622 -0.299 819 0.621 700 1.316 795
0.785 398 0.566 582 0.021895 -0.535 802 -0.784 236 -0.595 598 -0.065 611 0.503 352 0.780 762
0.785 0.566 0.021 -0.535 -0.784 -0.595 -0.065 0.503 0.780
( 4
398 579 882 820 242 583 575 392 777
DE
CASOS
VI: ECUACIONES DIFERENCIALES ORDINARIOS
62 1
de cuarto orden. Enelcuadro 18.4 se comparalasoluciónanalíticadela ecuación lineal del movimiento [Ec. (18.17)]enla columna a) con la soluciónnuméricaenlascolumnas b), c) y d). Los métodos de Euler y RK de cuarto orden generan resultados diferentes y ambos divergen de la solución analítica, aunque el método RK de cuarto orden parael caso no lineal se acerca más a la solución analítica que el de Euler. Para evaluar propiamente la diferencia entre los modelos lineal y no lineal es importante determinar la exactitud delos resultados numéricos. Esto se lleva a cabo de tres formas diferentes. Primero, la solución numérica de Euler se reconoce fácilmente ya que es inadecuada debido a sus inconvenientesen la condición inicial en t = 0.8 s . Esto viola claramente laleydela conservación de la energía. Segundo, las columnas c) y d) delcuadro 18.4 muestranlasolucióndel métodode Runge-Kutta de cuarto orden con tamaños de paso 0.05 de y 0.01. Debido a que estos varíanenelcuartolugar decimal, es razonable suponer que la solución con un tamaño de paso de 0.01 también será exacta con este grado de certeza. Tercero, para el caso con un tamaño de paso de 0.01 S , 6 alcanza un valor local máximo de0.785 385 en t = 1.63 S (que no se muestra en el cuadro 18.4). Esto indica que la partícula regresa a su posición original con una exactitud de cuatro cifras con un periodo de 1.63 s. Estas consideraciones permiten tener la seguridad que la diferencia entre las columnas a) y d) del cuadro 18.4 representan realmente la diferenciaentre el modelolineal y no lineal. Otra manera de caracterizar la diferencia entre el modelo lineal y no lineal es en base al periodo. En el cuadro 18.5 se muestra el periodo de oscilación calculado con los modelos lineal y no lineal para tres valores diferentes iniciales del desplazamiento. Se ve que los periodos calculados casi son igualescuando 0 es pequeño debida a que 0 es una buena aproximación para sen 0 en la ecuación (18.15). Esta aproximación se deteriora a medida que 6 crece. Estos análisis son comunes en los casos en que rutinariamente se encuentra un ingeniero. La utilidad de los métodos numéricos viene a ser particularmente significativacuando se trata de problemas no lineales, y muchos problemas de la vida real son no lineales. CUADRO 18.5
Comparación del periodo de un cuerpo oscilante calculadode los modelos lineal y no lineal Periodo,
S ~
Desplazamiento inicial 60
Modelo lineal ( I 27rJ//g)
Modelo no lineal [solución numérica de la ecuación (1 8.14)] ~~~~~
a/l6 a/4
1.565 9 1.565 9 1.565 9
~
1.57
1.63 1.85
~~
622
METODOS NUMÉRICOS
PARA INGENIEROS
PROBLEMAS lngeniería en general 18.1
Repítase los cálculos realizados en el caso 18.1 usando los programas propios
18.2
Efectúense losmismos cálculos del caso 18.1 usando k = $60/día.
18.3
Efectuénse los mismos cálculos del caso 18.1 con una nueva ecuación del costo de las computadoras [reemplácese la Ec. (18.2)]: Costo por computadora individual ($) =
18.4
1 500 (I
+
e - 4 4x10-5N 1
Repítase el problema delparacaidista (ejemplo 1.2), pero con unafuerza actuando hacia arriba debida a la fuerza de rozamiento que es proporcional a la velocidad al cuadrado:
F, = -cu2 donde c = 2.4 g/cm. Grafíquense los resultados y compárense con los del ejemplo 1.1.
Ingeniería química 18.5 Repítanse los cálculos del caso 18.2 usando los programaspropios 18.6 Efectúense los mismoscdlculosdel = 50 O00 célulasporlitro.
caso 18.2 peroparaelcasoenque
p ( t = 0)
18.7
Efectúense los mismos cálculos del caso 18.2, pero para p ( t = 0) = 100 O00 células por litro y k = 3 X litros por célula por día.
18.8
Enel caso 12.2 se desarrolla la ecuación (12.5) paramodelar el crecimiento de la levadura empleada en la producción comercial de cerveza. Si el decaimiento de la levadura es proporcional a 0.8 p y sila proporción de cambio de f se describe como df dt
-
dP -_
"
dt
resuélvase para j y p en función del tiempo si f(0) = 100 y p(0) = 1. Intégrese el par de E D 0 hasta que p y f alcancen niveles estables. Grafíquense los resultados 18.9 Un balance de masa de una sustancia química en u n reactor mezclada comple tamente, se puede escribir como
Acumulación
=
velocidad de flujo de alimentación - salida - reacción
DE
623
VI: ECUACIONES DIFERENCIALES ORDINARIOS
CASOS
donde V es elvolumen (10 m3), c es la concentración, F es la alimentación (200 g./min), Q esla velocidad de flujo (1 m3/min), y K es la velocidad de reacción (0.1 m3/g/min). Si c(0) = O , Resuélvase la E D 0 hasta que la concentración alcance un nivel estable. Grafíquense los resultados. 18.10
Repítase el problema usando el método de disparo.
Ingeniería civil 18.11
Repítanse los cálculos del caso 18.3 usando los propios programas.
18.12
Efectúense los mismos cálculos del caso 18.3, pero con una carga uniforme de 80 libras/pie y una E = 2 x lo8 libras/pie2. Verifíquense los resultados comparándolos con la soluciónanalítica.
18.13
Efectuénse los mismos cálculos del caso 18.3, pero en vez de usarunafuerza del viento constante, utilícese una fuerza que varíe con la altura de acuerdo a (recuérdese el caso 15.3):
.
!(x) =
200 -e -22/30 5 + 2
Grafíquese y contra z compárense con los resultados con los del caso 18.3. 18.14
Duplíquese la figura 6.4 integrando numéricamente la E D 0 del caso 6.3. VerifC quense los resultados comparándolos con los de la soluci6n analítica [Ec. (6.9)].
18.15
El modelo de crecimiento logístico del caso 6.3 se puede aplicar tanto a la población microbial como a la humana. Supóngase que se planea un sistema de abastecimiento de agua para unaisla. Si pmlx = 100 O00 personas y K = personas . año y si la población inicial es de 10 O00 personas, ¿qué tiemPO pasará para que la población llegue a 90 O00 habitantes?
Ingeniería eléctrica 18.16
Repítanse los cálculos del caso 18.4 usando los programaspropios
18.17
Efectúense los mismos cálculos del caso 18.4, pero con
18.18
Resuélvase la E D 0 del caso 6.4 usando los métodos numéricos si q = 0.1 e i = - 3 . 2 8 1 5 i 5 en t = O.
18.19
En un circuito RL simple, la ley de los voltajes de Kirchhoff requiere que (si se cumple laley de Ohm): L-
di dt
+
Ri
R
= 203.
= O
donde i es la corriente, L la inductancia y R la resistencia. Resuélvase para i , si L = R = 1 e ¡(O) = amperios. Resuélvase este problema analíticamente y con un método numérico.
624
METODOS 18.20
NUMÉRICOS
PARA INGENIEROS
En contraste con el problema 18.9, las resistencias reales no siempre obedecen la ley de Ohm. Por ejemplo, la caída de voltaje puede ser no lineal y la dinámicz del circuito descrita por relaciones deltipo
donde todos los parámetros son iguales a los definidos enel problema 18.19 e I es una corriente de referencia igual a 1. Resuélvase para i en función del tiempo bajo las mismas condiciones especificadas en el problema 18.19.
Ingeniería mecánica 18.21 Repítanse los cálculos realizados en el caso 18.5 usando los programas propios. 18.22
Efectúense los mismos cálculos del caso 18.5 con un péndulo de 3 pies de longitud.
18.23
Empléese un método numérico para duplicar los cálculos mostrados en la figura 6.10.
18.24
La tasa deenfriamientode
un cuerpo se puede expresar como
donde T es la temperatura del cuerpo (en grados centígrados), T,es la temperatura del medio que rodea al cuerpo (también en grados centígrados) y k es una constante de proporcionalidad (por minuto). Por lo tanto, esta ecuación especifica que el enfriamiento es proporcional a la diferencia de temperaturas entre el cuerpo y el medio que lo rodea. Si se calienta una bola de metal a 90°C y se sumergeen el agua que se mantiene a unatemperatura constante To = 20" C, empléese un método numérico para calcular el tiempo que le toma a la bolaenfriarse a 30" C si k = O. 1 min 18.25
Léanse todos los casos del capítulo 18. Con base a la lectura y a la experiencia, invéntese un caso propio en cualquiera delos campos de la ingeniería. Esto puede implicarla modificación o la reexpresión de alguno de los casos. No obstante éste puede ser totalmente original. Como sucede en los ejemplos del texto, se debe elaborar dentro del contexto de la solución de problemas de la ingeniería y se debe demostrar el uso de los métodos numéricos en la solución de EDO. Escríbanse losresultadosusandolos casos de este libro como modelos.
EPíLOGO: PARTEVi
V1.4 ELEMENTOS DE JUICIO En la tabla V1.3 se muestran los factores de mayor importancia asociados con los métodos numéricos en la solución de ecuaciones diferenciales ordinarias. U n ingeniero debe evaluar los factores de esta tabla cuando seleccione un método para cada uno de los problemas en particular. Se pueden emplear los métodos simples de autoprincipio tales como el método de Euler, si los requisitos del problema comprenden intervalos de integración pequeños. En este caso, se puede obtener la exactitud adecuada empleando intervalos para evitar grandes errores de truncamiento, y los errores de redondeo serán aceptables. El método de Euler también es apropiado en casos donde el modelo matemático tenga un nivel inherentemente alto de incertidumbre o tenga coeficientes y funciones forzadas con errores significativos, como puede suceder durante las mediciones de un proceso. En este caso la exactitud del modelo mismo simplemente no justifica el esfuerzo aplicado en el empleo de un método numérico más complicado. Finalmente, los métodos más simples pueden ser los mejores cuando el problema o la simulación se necesiten llevar a cabo sólo pocas veces. En estas aplicaciones tal vez sea mejor probar un método simple que sea fácil de programar y de entender, a pesardeque el método pueda ser inefibente en cuanto al trabajo de cómputo, y consuma mucho tiempo para correrse en una computadora.
Si el intervalo de integración del problema es demasiado grande de tal forma que comprenda un gran número de pasos (más de 1 000), entonces puede resultar necesario y apropiado usar un método más exacto que el de Euler. Los métodos de Runge-Kutta de cuarto orden y el de Adams de cuarto orden son comunes y confiables en muchos problemas de ingeniería. En estos casos, es aconsejable calcular el error de truncamiento en cada paso como una guiaen la selección del mejor tamaño de paso.
.-u .-u
"
'U'U
LLLL
Y " í
N -"-"
5555 O000
o
0 0
ZZZZ
-
7
-
SS O 0
O
"
-
C
x C
x O
o O
3 S
0
z z
627
EPiLOGO PARTE VI
Esto se puede llevar a cabo con los métodos de cuarto orden de Adams o de Runge-Kutta-Fehlberg.Si los errores de truncamiento son extremadamente pequeños, puede ser útil aumentar el tamaño del intervalo, con lo cual se ahorra tiempo de cómputo. Por otro lado, si los errores de truncamiento son muy grandes, el tamaño del intervalo se debe disminuir para evitar acumulamiento de errores. El método de Milne se debe evitar si se esperan problemas cuya estabilidad sea significativa. El método de Runge-Kutta es simple de programar y conveniente en su uso pero puede ser menos eficiente que los métodos de pasos múltiples. Sin embargo, el método de Runge-Kuttaseemplea generalmente en cualquier evento para obtener valores inicialesen los métodos de pasos múltiples.
Si se necesitan respuestasextremadamente exactas o si la función tiene derivadas de orden superior, se podrán usarel método de Butcher de Runge-Kutta de quinto orden. Un gran número de problemas de ingeniería pueden caer en un intervalo medio de requisitos entre la integración y la exactitud. En estos casos los métodos de Heun sin principio y el método deRunge-Kutta de segundo orden son simples de usarse y son relativamente eficientes y exactos.
V I S RELACIONES Y FóRMULAS IMPORTANTES En el cuadro V1.4se resumen las fórmulas importantes se presentaron en la parte VI, y puede consultarse para un acceso rápido a las relaciones y fórmulas importantes.
V1.6 MÉTODOS AVANZADOS Y ALGUNAS REFERENCIAS ADICIONALES Aunque se han revisado una gran cantidad de métodos en la solución de ecuaciones diferenciales ordinarias, existe información adicional que es muy importante en la práctica de la ingeniería. El tema de estabilidad se introdujo en la sección 17.3.3; es de importancia fundamental en todos los métodos de solución deEDO. Se pueden encontrar anállsis más detallados acerca de este asunto en Carnahan, Luther y Wilkes ( 1 969), Gear ( 1 971) y Hildebrand ( 1 974). La estabilidad tiene un significado especial sobre un tema menciona-
do brevemente en la sección 17.1.5 y en el caso 18.4, la solución de ecuaciones rigidas. Estas ecuaciones contienen componentes con va-
MÉTODOS NUMÉRICOS
PARA INGENIEROS
X F
. .-+ '
.. .$ :
**
"
-+
c
.-O -o
E O
- + L
L
o
+
2?uL
o
U
II
.& -
EPíLOGO
VI
629
riaciones lentas y rápidas. Aunque el empleo de un método con tamaño de paso variableo de orden superior puede ayudaren algunas ocasiones, en general se necesitan métodos especiales para la solución adecuada de ecuaciones rígidas. Se puede consultar Enright et al. (1975), G e a r (1971) y Shampine y G e a r (1979))los cuales incluyen información adicional relacionada con estos métodos. En la sección 16.4.2 se introdujo el método de disparo en la solución de problemas con valores a la frontera. También se aludió al hecho de que los métodos de diferencias finitas del tipo utilizado en el caso 9.2 se pueden emplear en estos problemas. Se puede consultar Isaacson y Keller (1 966), Keller (1 968), N a (1 979) y Scott y Waits (1976) paraunainformaciónadicional sobre problemasde valoresala frontera. Finalmente, existen métodos númericos para la solución de ecuaciones diferenciales parciales. Carnahan, Luther y Wilkes (1969), Gerald y Wheatley (1 984) y Rice (1983) proporcionan buenas introducciones al tema. Se pueden consultar también Ames (1977))Gladwell y Wait (1979)) Vichnevetsky,(1 981, 1982) y Zienkiewicz (1 971) para tratamientos mas profundos. En resumen, lo anterior pretende proporcionar al lector un caminc para que pueda seguir con estudios más profundos sobre el tema. Adicionalmente, todas las referencias anteriores proporcionan descripciones de los métodos básicos cubiertos en la parte VI. Sugerimos al lector consulte lo más pronto posible estas referencias alternas para completar el dominio de los métodos numéricos en la solución de ecuaciones diferenciales ordinarias.
BIBLIOGRAFíA
Ames, W. F., Numerical Methods for Parhal Differential Equations, Academic Press, New York, 1977. Ang, A. H-S., and W. H. Tang, Probability Concepts in Engineering Planning and Design,Vol. 1: Basic Principles, Wiley,NewYork, 1975. Bent, R. J., and G. C. Sethares, An Introduction to Computer Programming, 2ded., BrookdCole, Monterey, Calif., 1982. Brigham, E. O., The Fast Fourier Transfom, Prentice-Hall, Englewood Cliffs, N.J.,
1974.
Butcher, J. C., “On Runge-Kutta Processes of Higher Order,”J. AustralianMath Soc., 4179 (1964). Camahan, B., H. A. Luther, and J. O. Wilkes, Applied Numerical Methods, Wiley, NewYork, 1969. Cheney, W., and D. Kincaid, Numerical Mathematics and Computing, Brooks/Cole, Monterey,Calif., 1980. Davis, P. J., and P. Rabinowitz, Methods of Numerical Integration, Academic P r e s s , New York, 1975. Draper, N. R., and H. Smith, Applied Regression Analysis, 2d ed., Wiley, New York,
1981.
Enright, W. H.,T.E. Hull, and B. Lindberg, “Comparing Numerical Methods for Stiff Systems of ODES,” BIT, 15:lO (1975). Forsythe, G. E., M. A. Malcolm,andC. B. Moler,ComputerMethodsforMathematical Compvtation, Prentice-Hall, Englewood Cliffs, N.J., 1977. Gear, C. W., Numerical Initial-Value Problems in Ordinary Differential Equations, Prentice-Hall,EnglewoodCliffs, N.J., 1971. Gerald, C. F., andP. O. Wheatley,AppliedNumericalAnalysis,3d ed., AddisonWesley,Reading,Mass., 1984. Gladwell, J., and R. Wait, A Survey of Numerical Methods for Partial Differential Equations,OxfordUniversityPress,New vork, 1979. Guest, P. G , Numerical Methodsof Curve Fitting, Cambridge University Press, New York, 1961. Hamming, R. W., Numerical Methods for Scientists and Engineers, 2d ed., McGrawHill, New York, 1973. Henrici, P. H., Elements of Numerical Analysis, Wiley, New York, 1964 Hildebrand,F. B., Introduction to NumericalAnalysis,2d ed., McGraw-Hill,New York, 1974.
BIBLIOGRAFíA
Hornbeck, R. W., Numerical Methods, Quantum, New York, 1975. Householder, A. S., The The0y of Matrices in Numerical Analysis, Blaisdell, New York, 1964. Hull, T. E.,and A. L. Creemer, “TheEfficiency of Predictor-CorrectorProcedures,” J. Assoc. Cornput. Mach., 10291 (1963). Isaacson, E.,and H.B. Keller, Analysis of Numerical Methods, Wiley, New York,
1966. James, M. L., G. M. Smith, and J. C. Wolford,Applied NumericalMethodsfor Digital Computations with FORTRAN and CSMP, Harper & Row, New York, 1977. Keller, H. B., Numerical Methods for Two-Point Boundary-Value Problems, Wiley, NewYork, 1968. Lapidus, L.,and J. H. Seinfield, Numerical Solution of Ordinary DifferentialEquations, Academic Press, New York, 1971. Lapin, L. L., Probability and Statistics for Modern Engineering, Brooks/Cole,Monterey, Calif., 1983. Lyness, J. M., “Notes on the Adaptive Simpson Quadrature Routine,” J. Assoc. Comput. Mach., 16483 (1969). A Guide to FORTRANNProgramming, Wiley, New York, 1965. McCracken, D.D., Malcolm, M.A., and R. B. Simpson, “Local Versus Global Strategies for Adaptive Quadrature,”ACM Trans. Math. Software, 1:129 (1975). Maron, M. J., NumericalAnalysis, A Practical Approach, Macmillan,NewYork, 1982. Merchant, M. J., The ABC’s of Computer Programming, Wadsworth,Belmont, Calif., 1979. and J. R. Sturgul, Applied FORTRAN Programming with Standard FORTRAN, WATFOR, WATFN andStructural WATFN; Wadsworth,Belmont, Calif., 1977. Muller, D. E., “A Method for Solving Algebraic Equations Using a Digital Computer,” Math. Tables Aids Comput., 10205 (1956). Na, T.Y., Computational Methods in Engineering Boundary Value Problems, Academic Press, New York, 1979. Noyce, R. N., “Microelectronics,”Scientific American, 237:62 (1977). Ortega, J., and W. Rheinboldt, lteratiue Solution of Nonlinear Equations in Seueral Variables, Academic Press. New York, 1970 Ralston, A,, “Runge-Kutta Methods with Minimum Error Bounds,” Match. Comp., 16:431 (1962). and P. Rabinowitz, A First Course in Numerical Analysis, 2d ed., McGrawHill, New York, 1978. Rice, J. R., Numerical Methods, Software and Analysis, McGraw-Hill,NewYork, 1983. Ruckdeschel, F. R., BASIC Scientific Subroutines, Vol. 2, ByteiMcGraw-Hill, Peterborough, N.H., 1981. 6th ed., Johns Hopkins Press, Scarborough,J. B., Numerical Mathematical Analysis, Baltimore, Md., 1966. Scott, M. R., and H. A. Watts, “A SystematizedCollection of Codes for Solving Two-Point Boundary-Value Problems,”in Numerical Methods for Differential Equations, L. Lapidus and W. E. Schiesser. eds., Academic Press, New York, 1976.
BIBLIOGRAF~A
633
Shampine, L. F., and R. C. Allen, Jr., NumericalComputing: An Introduction, Saunders, Philadelphia, 1973. and C. W. Gear, "A User's View of Solving Stiff Ordinary Differential Equations," SIAM Review, 21:l (1979). Stark, P. A., Introduction to Numerical Methods, Macmillan, New York, 1970. Swokowski, E. W., Calculus with Analytical Geometry, 2d ed., Prindle, Weber and Schmidt, Boston, 1979. Thomas, G. B., Jr., and R. L. Finney, Calculus and Analytical Geometry, 5th ed., Addison-Wesley, Reading, Mass., 1979. Vichnevetsky, R., Computer Methodsf o r Partial Differential Equations, Vol. 1 :Elliptical Equations and the Finite Element Method,Prentice-Hall, Englewood Cliffs, N.J., 1981. ,Computer Methods for Partial Differential Equations, Vol. 2: Initial Value Problems, Prentice-Hall, Englewood Cliffs, N.J., 1982. Wilkonson, J. H., T h e Algebraic Eigenualue Problem, Oxford University Press, Fair Lawn, N.J., 1965. Zienkiewicz, O. C., The Finite Element Methodin Engineering Science, McGraw-Hill, London, 1971.
INDICE
Ábaco, 22-23 Ajuste de curvas: con datosigualmenteespaciados, 368-369 elementosdejuicioen el, 409-411 interpolaciónsegmentaria(spline)en el, 370-383 métodos avanzados para el, 411-413 NUMERICOMP, 329-331. 366-368 polinomio: deLagrangeen el, 363-368 el, 350-364 deNewtonen regresión: linealen el, 319-337 múltipleen el, 342-344 polinomialen el, 337-341 resumendefórmulaspara el, 412 WdasetarnbidnInterpolación;Regresión) Algoritmo(s): de bisección, 124 de corrección de errores para la eliminación gaussiana, 252 definición de, 25 dediferenciadecocientes (DC), 201 diserio de, 25-26 deeliminacióngaussianasimple, 227-231 deintegraciónde Romberg, 470-472 ' deinterpolacióncúbicasegmentaria (spline), 383 parainversióndematrices. 268 delmétodo: de Gauss-Seidel,274 de Heun, 549 mejoradodelpolígono, 549 de los métodosdeRunge-Kutta, 563 delareglade Simpson, 452 deregresiónpolinomial, 341-342 desistemasde EDO, 565 desumasimple, 26 Almacenamiento, 45 AnSlisis: dedirección, 309, 387-391, 604.607 estructural, 287-291, 296-297 devibraciones (uéaseOsciladorarmónico) Aproximaciónfuncional, 413
Balance de masas, 297, 520, 624
BASIC: definicidn de, 29 tabladecomparación con FORTRAN, 32-40 (udase tarnbidnprogramasbajoComputadora) Búsquedaincremental, 124, 139-140 CSlculosdeestímulo-respuesta, 205-206, 266-267 Casos: elmétododeRKdecuartoorden, 605-607, 616-621 elmétododeRKdesegundoordende Ralston, 610-611 Cifrassignificativas, 64-66, 74-77 criteriosdeterminaci6n (€'I, 70-71 Circuitosintegrados, 22 Código, 27 Coeficiente(s): decorrelación (r), 328, 337 326, 338 dedeterminaci6n (r'), indeterminados,método de, 475-476 devariación, 312, 390 Computadora(s): definiciónde una, 22 grbficadpor, 54-56 grandes, 24 programas: paralaeliminacióngaussianasimple, 232-233 paraHeunsinprincipio, 583-584 paralaimplementaci6ndelacuadratura gaussiana, 482-483 paraiteracióndepuntofijo, 151 iterativoparalaimplementacióndelmétodo deHeun, 549 para el método: de bisección, 130 de Euler, 537-538 para los métodosdeRKdesegundoordende Ralston, 563 parapivote0parcial. 246 paraelpolinomiodeinterpolacióndeNewton, 360-361 paraelproblemadelparacaidista: versiónlegiblealusuario, 51 versiónsimple, 49 paralareglatrapezoidaldesegmentosmúltiples, 440-441
636
íNDlCE
para regresión lineal, 328-329 pollnomial, 341 para sistemas tridiagonales, 253 para suma simple, 30 Condicionamiento malo, 221, 238-243 de los determinantes, 241-243 de lamatriz inversa, 267-268 de la regresión polinomial. 342, 411 Conservación de masa ecuaciones algebraicas linealcs para la ley de. 296 EDO, 518, 522 Constante de integración. 521 Convergencia: de la iteración de punto fljo, 147-151 del método. de Heun, 544, 545 sin principio, 583 deNewton-Raphson.154-157 de la regla falsa. 139 para el método de Gauss-Seidel. criterlos de. 272-273 Corrección de errores, 249-252, 468-469, 579-580 Corrector modificador, 581-582, 594-597 Corriente raíz cuadrada media (RCM), 399-401, 496-499 Criterios de terminaclón ( E ’ ) , 70-71 corrector de Heun. 542 integración de Romberg. 472 iteración de punto fijo 146 método: de bisecclón, 127-130 deNewton-Raphson,154 de la regla falsa, 136-137 Cuadratura (véase Integración) Cuadratura gaussiana, 474-484 analisis del error para la, 478-479 cambio de variables en la. 484-485 caso, 497-498 fórmulas de Gauss-Legendre para la, 475-484 método de coeficientes indeterminados para la, 475-476
Descomposición LU (método de Choleskyi, 306 Desviación estandar. 311-314 Determinantes, 222-223 c6lculo de, 223-224. 243 de sistemas mal condicionados, 241-243 Diagonal dominante, 273 Diagramas de flulo para el caso simple del problema del paracaidista, 47 definición de los, 26 para integración: desigualmente espaclada, 459 de Romberg, 473 para el método: de Gauss-Jordan, 263 de Gauss-Seidel, 275 símbolos usados en los, 28 para la suma simple, 28 para la versión de segmentos múltiples de la regla de Simpson. 453 Diferenciación numérica. 16. 8 7 ~ 9 3 sensibilidad de los datos al ruldo en la. 489
Diferencias divididas finitas, 16. 86-95 caso, 282-287, 490-491 Interpolación igualmente espaciada con 368-369 método de la secante con, 159 polinomios de Newton con, 350, 352-361 DinBmica del crecimlento demográfico. 180-182, 192-193, 392-395, 608-612 Disco flexible, 4 5 Distribución normal, 313 Dtvergencla (uéase Convergencia) Documentación, 43-46. 52
Economía, 59. 172.176,189-190,404-405 Economización de Chebyshev. 413 Ecuaciónies) algebraicas (véase Sistemas de ecuaciones algebraicas lineales; diferenciales: ordinarias (EDO) de cuarto orden de Adams, 5 9 7 ~ 6 0 0 definidas, 515 elementos de JUICIO en las. 6 2 5 ~ 6 2 7 estabilidad de las. 627 linealización de las. 517 518 método(s): avanzados para la soluclón de las. 618-628 de Euler para la solución de las. 528-540 de Hamming, 600 de Heun. 541-547. 549-550 sin principio, 574-587 de RK-Fehlberg para la solución de las. 563 de Runge-Kutta para la soluclón de las. 550-563. 565-566 de Milne. 595-600 NUMERICOMP. 540 orden de las, 515 polígono mejorado, 547-550 problemas con valores a la frontera en las, 282-287. 522, 566-570. 627-628 con valorinicial, 522 reducaón de órdenes superiores. 516 resumen de fórmulas de las. 628 &idas, 627 sistemas de, 564-567 algoritmo para la computadora sobre, 565 usando el método de Euler, 564 usando métodos de two, 567-570 usando RK de cuarto orden. 566-567 solución analítica de las. 519 S23 parciales (EDP),629 defimdas, 515 distribución de la temperatura usando, 283-287 de Hazen-Wllliam, 404 de Laplace, 282-283 normales: de la regresión lineal, 324 múltiple, 344 polinominal, 338 del promedio de creclmiento en la saturaclón. 304
637
INDICE
caso, 392-395 raíces de (uéose Raíces de ecuaciones) rígidas. 585 s1mult6neas (uéose Sistemas de ecuaciones algebraicas lineales no lineales, 306 de Van der Waals, 177-178, 190-191 ED0 (uéose Ecuaciones diferenciales ordinarias): rígidas, 627 Elementos de juic~o, 101-106 comprendidos dentro del ajuste de curvas, 409-411 comprendidos dentro de las ecuaciones algebraicaslineales, 301-304 comprendidos dentro de las ecuaciones diferenciales ordinarias, 627 comprendidos dentro de la integración, 509-511 comprendidos dentro de las raíces de ecuaciones, 113 Eliminación: gaussiana: caso de la, 293, 294 desventajas de la, 236-243 efecto de los errores de redondeo en la. 237-238, 250-251 escalamiento en la, 240-243, 246-248 evaluación del determinante. 243 formulación para sistemas tridiagonales, 253-254 NUMERICOMP. 234-236 programa de computadora para la, 232-233 simple, 227-233 sistemas mal condicionados y, 238-243 de incógnltas, 225-227 Error(es) por equivocación, 95-96 en el momento de la ejecución. 42 global de truncamiento e n las EDO, 531 loca! de truncamiento: enlasEDO, 531, 579-580 enel método de Euler, 531-537 en los métodos de pasos múltiples, 579-580 de redondeo, 64, 67, 72-74 en las ecuaciones diferenciales ordinarias, 72-73, 530 enlaeliminación gaussiana, efectos de los, 237-238. 250-251 en los polinomios de interpolación, 366 enlaregla trapezoidal, 442, 467 en la regresión polinomial, 342 relativos, 68-71 aprox~mados (Ea), 69-70 enbisección, 127-130 en corrector de Heun, 544 en interacción de Romberg, 472 en interacción de punto fijo, 146 en el método: de Gauss-Seidel, 270 de Heun sin principio. 574-575 de Newton-Raphson. 154 de la regla falsa, 139 reales, 66-67 de semántica, 41 de sintaxis. 41 de truncamiento. 64, 67, 77-85, 531 en la integración, 434, 438, 444, 448, 450,
467, 482 en la interpolación, 358-363 en los métodos de un paso, 530-536, 539, 547, 551, 561-563 de pasos múltiples, 513 en las raíces de ecuaciones, 580-581, 153-154 vease tambign Propagación de errores de truncamiento; Criterios de terminación (Es) Escalemiento. 241-244, 246-248 Estabilidad, 598-599, 627 Estadistica, 310-314 de los coeficientes de variación, 312 de la desviación estAndar, 312 de ladistribución normal, 313 grados de libertad sobre, 312 histograma de, 314 de la media, 310 de la varianza, 311 Estimación del error estfmdar: para regresión lineal, 326 múltiple, 344 polinomial, 338 Euler modificado, 547-550, 553-556 Exactitud, 66-67 Expansiónenserie de Maclaurin, 59, 70-72, 99-100 Extrapolación, 309, 369-370 caso de, 387-391, 604-607 de Richardson, 467-469
Fluidos, 194, 401-403 Forma de codificación, 30-31 Formulación de errores, 97 Fórmula(s): compuestas de integración, 435 de Gauss-Legendre, 475-484 de integración: abierta de Adams-Bashforth, 591-592, 597 cerrada de Adams-Moulton, 592-594, 597 de interpolación de Newton-Gregory, 369, 434,
445 de Newton-Cotes, 429, 454, 460 integración' abierta con las, 458, 460-461, 590-591, 595 cerrada conlas, 453, 454-455, 591, 595 de Newton-Raphson. 152 FORTRAN: definición, 29 tabla de comparación de BASIC con, 32-39 (véase también programas, bajo Computadora) Función(es): de incremento, 550 suaves y continuas (spline), 370 trascendentes. 113
Grados, de libertad, 311
Histograma, 313
638
~NDICE Inestabilidad, 558-559, 629 Integración: abierta, 430 fórmulas de: de Adams-Bashforth, 591-592, 597 de Newton-Cotes, 458, 460-461. 589-590 595 adaptiva de Simpson, 511 cerrada, 431 fórmulas de: Adams-Moulton para, 592-594, 597 de Newton-Cotes para, 454-455. 591 595 cuadratura gaussiana en la, 475-484 definición de, 413 definida, 420 elementos de juicioen la, 509-511 fórmulas: de Adams. 591-594 cerradas deordensuperior para, 454-455 compuestas, 454 de Newton-Cotes, 454-460, 589-591 indefinida, 517 con interpolación cúbica segmentaria (spline), 51 1 con intervalos desiguales, 455-459 caso, 501-503 métodos avanzados para la, 511 NUMERICOMP, 442-444 promedio de funciones continuas, 4 1 9 con la regla 1/3 de Simpson, 443-448 con la regla 3/8 de Simpson, 449-451 reglatrapezoidal en la, 431-443 resumen defórmulas de, 512 de Romberg, 465-474 caso, 498 para implementar la extrapolación de Richard son, 467-469 soluciones analíticas de, 423-424 teorema fundamental de, 423 usando segmentación suave (spline), 511 Integral(es): definida, 423 indefinida, 516 de superficie. 421 tabla de, 423 de volumen, 421 Interpolación: caso, 387-391, 396-397, 400-401 cuadrstica, 351-354 segmentaria (spline), 373-378 cúbica segmentaria (spline). 378-383 algoritmo para la, 3 8 3 derivaciónde la, 379-380 integración con. 511 con datos igualmente espaciados, 368-369 lineal, 350-351 polinomial de Lagrange, 363-368 de Newton, 350-364 segmentarla (spline), 370-383 cúbica, 378-383 . Integración medlante. 51 1 lineal. 373-374 cuadrAtica, 374-379 Inversiónde matrices. 211-212 algoritmopara la. 268 enel cálculodeestímulos y respuestas, 2 6 6 ~ 2 6 7
caso, 281-282. 289-291
y mal condicionamiento, 267-268
método de Gauss-Jordan paracalcularla. 262-265 Iteración: de Jacobi. 272, 273 de punto fijo: aproximación gráficade la,148.151 convergencia de la, 148-151 programade computadora parala. 151
Ley(es): de Faraday, 519 deFickdeladifusión, 521 de Fourierdel calor, 521 de Kirchoff, 183.186, 194, 291-293. 298-299, 615-618 Leibnitz.GottFried W von, 22 Lmealización de ecuaciones no lineales, 332-336 de EDO. 519
Macrocornputadoras. 2 5 Mantenimiento, 4 5 Matriz(ces), 207-210 aumentada, 213-214 cuadrada, 2 0 8 ecuaciones algebraicas linealesque emplean. 213-214 inversa, 211-212 multiplicación de, 210-211 reglasde operación sobre, 209-214 transpuesta, 213-214 tridiagonal, 209 Media, 310-313 Método(s) avanzados: paralustede curvas, 411-413 paradeterminar raíces de ecuaciones. 199 201 en general, 107 para integración, 513 oara la solución. de ecuaclones diferenciales ordinartas. 627-629 desistemasde ecuaciones algebralcas linea les, 304-306 de Bairstow, 201 de bisección: algoritmo del, 123 análisisdeerror del. 127.130 casos del. 177, 183, 184-186, 188 criterios de termmaclón del. 126.130 en In determinaaón de raíces de ecuaciones, 122-132,136-139 NUMERICOMP. 54-56. 122-123.131-132 programas de computadora del. 130 de coeficlentes indeterminados. 475-476 de Crout ldescomposición LU), 306 de Cholesky idescomposiclón LU).306 de diferencias finltas. 282-287. 571 de disparo. 56?-569 de Euler, 528-541 análislsdeerror pala el. 531 caso del. 608. 614. 616~621
639
~NDICE
paraelejemplodelproblemadelparacaidista, 16-19, 538-539 errores: deredondeoen el, 531 detruncamientoen el, 531-537 fórmula del, 528 modificaciones y mejoras al, 541-551 NUMERICOMP, 538-539 deprimer orden, 534 programadecomputadora del, 538-539 paralasolucióndeEDO. 564 de Gauss-Jordan, 259-268 caso, 281-282, 289-292 diagramadeflujopara el, 263 matricesinversasmediante el, 262-265 pivoteo, 268 deGauss-Newton, 411 de Gauss-Seidel,268-274, algoritmopara el, 274 aplicacionesdel. 274, 247 casos, 285-287 criterios: deconvergenciapara el, 272-273 determinaciónpara el, 270 diagramadeflujopara el, 275 dominanciadiagonal, 273 y laiteraclónde Jacobl, 272-273 con relajación, 272-273 de Graeffe, 201 grdficos: paraecuacionesalgebraicaslineales, 220-221 paraintegración, 416-417 paralas rakes de ecuaciones, 119-122, 140, 145-152 resumende los, 5 deHamming, 600 deHeun. 541-550 corrector del: criteriosdeterminaciónpara el, 543 derivación del, 447-547 erroren el. 547 estimaciónde los erroresdetruncamientopara el. 547 fórmulas del, 543 métododeRunge-Kuttapara el, 552-554 sin principio, 576-586 an6lisisdel erra para el, 577-579 criterios determinaciónpara el. 574-575 derivación del, 579 estimaciónde los erroresdetruncamiento para el, 579-580 fórmulaspara el, 574 modificadorespara el, 580-583 programadecomputadorapara el, 584-517 programapara el. 549 queusanintervalos, 119-142 iterativos, 70-71 deMarquardt. 413 mejoradodelpolígono. 547-550, 553-556 deMilne. 596-597 estabilldad del, 598-599 deMuller, 201 deNewton-Raphson: los. 154-156 andlisisdeerroresen los, 158 aspectosdeprogramaciónde caso de los, 178-179 derivación delos. 151-154
.___
desventajasde los, 151-156 pararaícesmúltiples, 164-167 seriesdeTayloren los, 153-154 parasistemasnolineales, 306 de un paso, solución a los, 527-528 de pasos descendentes, 411 métodos: de un paso, 563 depasosmúltiples para, 585-586 delpunto medio, 460, 578, 590 delareglafalsa: andlisisdeerrorpara el, 135-136 casosparael. 177,183, 188 Y SU comparaciónconelmétododela secante,160-162 convergencia del, 138 criteriosdeterminaciónpara el, 136-137 desventajas del, 137-139 enladeterminaciónde raíces, 133-139, 160-163 fórmulapara el, 134 programadecomputadorapara el, 139 de Runge-Kutta, 550-563 decuartoordencldsicas, 558-559 errores en los, 561-563 dequintoordende Butcher, 559-560 desegundo orden, 551-556 algoritmoparacomputadora, 563 derivación de, 551 un solo corrector, métododeHeuncon 553 polígonomejorado, 554 de Ralston, 554 de tercer orden, 556-557 de Runge-Kutta-Fehlberg,562-563 dela secante: casos, 177.183. 188 convergencia del, 160-162 programadecomputadorapara el, 162 raícesmúltiples v el.167 deseriesdeTaylo;deordensuperiorparalas EDO, 540-541 devariospasos , 573 andlisisdelerroren los, 577-578 de cuartoordendeAdams. 529-597 derivación de, 577-579 fórmulasdeintegraciónpara los, 588-594 deAdams, 591-594 de Newton-Cotes, 589-591 deHamming, 599 métododeMilneen los, 589-596 estabilidad del, 598-599 Heun sin principio, 574-587 modificadoresdel, 579-583, 594-595 Microcomputadoras,24 Minicomputadoras, 24 Minimax, 333, 369 Modelaciónde entrada-salida, 413 Modelo(s): decrecimientologistico, 180-182, 192 exponencial, 332-333 macrovariables. 205 matemAtico, 1 1 microvariables, 206 depotencias. 333-335 caso, 398-399
640
íNDlCE
de temperatura, 283-287. 296-297, 525 devariable continua, 206 variables agrupados, 206 Modificadores. 580-583 derivación general de los, 594-595 del predictor, 581-583, 594-596
Nodos, 373 Normalización. 228 Notación matriclal, 207-209 NUMERICOMP, 53-56 bisección dentro de, 131.132 eliminación gaussiana dentro de, 233-235 gráficas dentro de, 54-56, 121-122 interpolaciónde Lagrange dentro de, 366-368 método de Euler dentro de, 538-539 reglatrapezoidal dentro de, 442-443 regresiónlineal dentro de, 329-332 I
~~
Oscilador armónico, 186-189. 194, 618-621
Pascal, 27 Blas, 2 2 Pendiente en un punto (véase Método de Euler) Pivoteo, 244-246 Polinomio(s): deinterpolación con diferenciasdivididas de I’íewton, 350-364 cuadraticos, 351-352 errores en los, 358-363 forma general de los, 3 5 4 ~ 3 5 8 lineales, 350-351 programa de computadora de los, 360-361 redondeo en los, 366 de Lagrange, 363-368 derivación del, 3 6 4 error en el, 363 errores de redondeo en el, 366 NUMERICOMP. 336-368 ortogonales, 411 Precisión, 66-67 Predictor-corrector, 542-543 (usose también Métodos de varios pasos) Principio de probalidad mdxima, 325 Problema(s): del paracaidista ejemplo: debisección para el, 131-132 de cuadratura gaussiana para el. 482-484 de eliminación gaussiana para el, 233-236 de interpolación de Lagrange para el. 366-368 del metodo de Euler para el, 538-539 de la reglatrapezoidalpara el, 441-443 de regresiónlinealpara el, 329-332 modelos del, 12-19 programa de computadora para el, 46-51 de valoresen la frontera, 282-287, 522. 567-570 métodos:
de dlferenciasfinitas, 282-287. 571 de disparopara la solución de. 567-570 enla solucióndediferencias finitas, 629 devalor inicial, 522 Programación: almacenamiento y mantenimiento de la, 45-46 composición de la. 27. 27-41 definiciónde la, 24 descendente, 4 8 diseño dealgoritmos de, 24-26 documentación de la. 43-44 modular. 41 rastreo y pruebadela. 41-42 símbolosdelosdiagramasdeflujopara la, 28 Programas, 2 4 (uéase también NUMERICOMP, programas, bajo Computadora) Propagación de errores de truncamiento, 531 Pruebas de hipótesis, 309, 395
Raíces complejas, 114.201 de ecuaciones. búsquedas mcrementales. 124139-140 elementos de jumo en las. 197-199 métodos analíticospara resolver, 109 avanzados paradeterminar las. 199. 201 de la bisecciónpara encontrar las. 123-133, 137-139 de Newton-Raphson para las, 152-158 delareglafalsapara encontrar las. 133-139. 160.162 métodos gráficospara la obtención de las, 119-122,145.148-152,157-158, 163-164 resumendefórmulas. 200 de la secante paradeterminar las, 158.162 NUMERICOMP. 131.132 múltiples, 121~122, 163-167 Rastreo, 4 1 Regla(s1: de la cadena en la derivach. 540-541. 551 de Cramer, 224-226 de redondeo, 75-77 de Simpson, 443-452 dlagrarnadeflujopara la. 453 de 1/3, 444-449 caso, 490. 491, 493-497. 500~501 derivación de. 4 4 5 estimacióndel error de, 445-446 fórmula de, 445. 454 relación con las EDO. 591 con el método de RungeKutta. 556-558 segmentos múltiples, 442-446. S91 de 3 / 8 , 449-451 caso, 502-503 estimaciónde errores de la. 451 fórmulade la, 450 trapezoidal, 431-443 caso, 489, 491. 493, 496-499. 500-503 de segmento(s) desiguales, 455-455 múltiples, 437-443 rorrección de errores, 467-470 ~~
64 1
~NDICE estimacióndelerror en, 439 extrapolaciónde Richardson, 467.470 fórmula de, 438 NUMERICOMP, 441-443 programaparaelmétodo de, 440-441 redondeo, 443, 466 simple. 431-437, 453, 547, 577, 590, 593 comparación conlacuadratura gaussiana, 474-475 derivación, 432, 434, 475-476 estimacióndel error, 433-434 fórmula. 431 relaciónconlas EDO. 547, 577, 591. 593 Regresión lineal, 321-336 caso, 388-389. 398-399 coeficiente: decorrelación (r) de la, 328 dedeterminación (r2) de la, 326 criteriodelmejor ajuste, 321-322 ecuaciones normales, 323 estimacióndelerrorestdndarpara el, 326 limitacionesde la, 336-337 linealizaciónde ecuaciones nolineales, 332-337 NUMERICOMP, 329-331 programadecomputadora para, 328-329 múltiple, 37, 342-344 casodeestudio, 402-403 ecuacióndepotenciasde la, 344 estimacióndelerrorestándarpara la, 344 n o lineal, 393, 411 pol~nomial,336-342 algoritmopara la, 341-342 caso, 388-392 ecuaciones normalesde la, 338 estimacióndelerroresrdndarde la, 338 subrutinaparalas ecuaciones normalesde la, 341 Regulafalsi(véaseregia falsa, baloMétodo) Relajación, 273-274 caso, 286-287 Resumendefórmulas: paraelajustedecurvas, 412 para ecuaciones: algebraicaslineales, 305 diferencialesordinarias, 628 paraintegración, 512 mtroducclón al, 107
Segunda ley deNewton, 11-14, 187, 293-294, 521, 620 Serie(s): degradientearitmético, 60, 174-175 de Taylor, 78-93 fórmulas: deintegraciónde Adam para la, 591-593 deNewton-Raphsonque usa, 154-155 métodos: deEulerenla. 531-534 deordensuperiorparalas E D 0 con, 540-541
residuoen la, 78-79, 82, 84-86 Sistemas: de ecuaciones algebraicaslineales definición, 203 eliminacióngaussianaen los, 227-252 factores deimportancia, 301-304 Gauss-Jordan, 259-268 Gauss-Seidel, 268-274 inversióndematricesmediante los, 262-267 métodosavanzados, 304, 306 NUMERICOMP, 234-235 depocas ecuaciones, 219-227 resumendefórmulas, 305 tridiagonales, 253-254, 380-381 singularesmalcondicionados, 221 Software, 24 (véase tambiénNUMERICOMp) Solución analítica: de EDO, 518-524 Paraelproblemadelparacaidista, 15 deintegrales, 422-423 enlasoluciónderaícesde ecuaciones, 109 Spline (véase interp0;aciÓn segmentaria cúbica) Tabladeintegrales. 423 Teorema: fundamentaldelcdlculointegral, 422, 577 del valormedlo. 85, 147 Transformada rdpidade Fourier, 413
Valorespropios, 306 Varianza, 312