Jorge Mahecha-Mecanica Clasica Avanzada-Editorial Universidad de Antioquia (2006) (1)

Jorge Mahecha Gómez

Mecánica clásica avanzada

Mahecha G´ omez, Jorge Mec´ anica cl´ asica avanzada / Jorge Mahecha Gómez. – Medell´ın : Editorial Universidad de Antioquia, 2006. xiv, 608 p. : il., diagrs. ; 24 cm. Incluye bibliograf´ıa e ´ındice. ISBN: 958-655-847-9 1. Mec´ anica 2. Est´ atica 3. Cinemática 4. Din´ amica I. T´ıt. 531 cd 19 ed. A1072576 ´ CEP-Banco de la Rep´ ublica-Biblioteca Luis-Angel Arango

Mecánica clásica avanzada Jorge Mahecha Gómez

Ciencia y Tecnolog´ıa

Editorial Universidad de Antioquia

Colecci´ on Ciencia y Tecnolog´ıa c Jorge Mahecha G´

omez c Editorial Universidad de Antioquia

ISBN: 958-655-847-9 Primera edici´ on: enero de 2006 Dise˜ no de cubierta: Erledy Arana Grajales, Imprenta Universidad de Antioquia Diagramaci´ on: Patricia Arredondo Correcci´ on de textos: Arley C´ ardenas Coordinaci´ on editorial: Gonzalo Montoya Vel´ asquez Impresi´ on y terminaci´ on: Imprenta Universidad de Antioquia Impreso y hecho en Colombia / Printed and made in Colombia Prohibida la reproducci´ on total o parcial, por cualquier medio o con cualquier prop´ osito, sin autorizaci´ on escrita de la Editorial Universidad de Antioquia Editorial Universidad de Antioquia Teléfono: (574) 210 50 10. Telefax: (574) 263 82 82 E-mail: [email protected] P´ agina web: www.editorialudea.com Apartado 1226. Medell´ın. Colombia Imprenta Universidad de Antioquia Teléfono: (574) 210 53 30. Telefax: (574) 210 53 32 E-mail: [email protected]

Índice general 1. Fundamentos de la mec´ anica newtoniana 1.1. Conceptos preliminares . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.2. Sistema de referencia. Estado de un sistema mecánico. Ligaduras. Ecuaciones de movimiento para un sistema de part´ıculas. Variables dinámicas. Problemas separables. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2. Ecuaciones generales de la est´ atica y la din´ amica 2.1. Las ligaduras . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.2. Las coordenadas generalizadas . . . . . . . . . . . . . . . . . . . . . . . 2.3. Los desplazamientos virtuales . . . . . . . . . . . . . . . . . . . . . . . 2.4. La ecuaci´ on general de la est´ atica . . . . . . . . . . . . . . . . . . . . . . 2.5. Las ecuaciones de la est´ atica en coordenadas generalizadas . . . . . . . . 2.6. La ecuaci´ on general de la dinámica . . . . . . . . . . . . . . . . . . . . . 2.7. Las ecuaciones de la din´ amica en coordenadas generalizadas para sistemas hol´ onomos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.8. Las ecuaciones de la din´ amica en coordenadas generalizadas para sistemas no hol´ onomos. Uso de coordenadas no independientes . . . . . . . . . . 3. El principio de Hamilton y las ecuaciones de Lagrange 3.1. Forma integral de la ecuaci´ on general de la dinámica para un sistema hol´ onomo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3.2. El principio de Hamilton . . . . . . . . . . . . . . . . . . . . . . . . . . . 3.3. Algunas propiedades de la funci´ on lagrangiana . . . . . . . . . . . . . . 3.4. Simetr´ıas de la lagrangiana y teoremas de conservaci´ on . . . . . . . . . 3.5. El teorema del virial . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4. La formulaci´ on hamiltoniana 4.1. Las variables hamiltonianas de estado . . . . . . . . . . 4.2. Simetr´ıas y el teorema de conservaci´ on . . . . . . . . . . 4.3. La segunda forma del principio de Hamilton . . . . . . 4.4. Las transformaciones puntuales. Las transformaciones en 4.5. Las transformaciones can´ onicas o de contacto . . . . . . . . . . . . . . . . . . . . . . . . v

. . . . . .

1 1

3 7 7 12 15 19 28 35

. 40 . 46 55 . . . . .

55 58 67 68 80

85 . . . . . . . . . . 85 . . . . . . . . . . 94 . . . . . . . . . . 97 el espacio de fases101 . . . . . . . . . . 107

vi 4.6. La funci´ on generatriz de una transformaci´ on canónica . . . . . . . . . . . . . . . . . . . . . . . . 108 4.7. La evoluci´ on temporal de un sistema considerada como una transformaci´ on can´ onica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 113 4.8. El teorema de Liouville . . . . . . . . . . . . . . . . . . . . . . . . . . . . 114 5. Movimiento de dos part´ıculas que interact´ uan por medio de una fuerza central 5.1. Coordenadas de centro de masa y coordenadas relativas . . . . . . . . . . . . . . . 5.2. El oscilador armónico tridimensional . . . . . . . . 5.3. El potencial 1/r . . . . . . . . . . . . . . . . . . . . 5.4. El problema de la dispersi´ on bajo fuerzas centrales

125 . . . .

. . . .

. . . .

. . . .

. . . .

. . . .

. . . .

. . . .

. . . .

. . . .

. . . .

. . . .

. . . .

125 136 140 156

6. Peque˜ nas oscilaciones de sistemas de varios grados de libertad 167 6.1. Modos normales de oscilación. Caso no degenerado . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 167 6.2. Modos normales de oscilación. Caso degenerado . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 181 6.3. Un campo mecánico unidimensional: la cuerda uniforme . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 195 7. Cinem´ atica del cuerpo r´ıgido 7.1. Definici´ on de cuerpo r´ıgido . . . . . . . . . . . . . . . . . . . . 7.2. Sistemas de coordenadas espacial y del cuerpo r´ıgido . . . . . . . . . . . . . . . . . . . . . . . . . 7.3. Los cosenos directores . . . . . . . . . . . . . . . . . . . . . . . 7.4. El teorema de Euler acerca del movimiento de un cuerpo r´ıgido 7.5. El rotador r´ıgido . . . . . . . . . . . . . . . . . . . . . . . . . . 7.6. Los ´ angulos de Euler . . . . . . . . . . . . . . . . . . . . . . . 7.7. Descripci´ on de las rotaciones en términos de n ˆ y Φ. Parámetros 7.8. Representación del grupo de rotaciones por medio de matrices 2 × 2. Los par´ ametros de Cayley-Klein . . . . . . . . . . . . . . . . . . . . . . . . . . 7.9. Las rotaciones infinitesimales. Cinemática de las rotaciones . .

205 . . . . . . 205 . . . . . . . . . . . . . . . . . . . . . . . . . de Euler

. . . . . .

206 210 217 221 222 226

. . . . . . 230 . . . . . . 241

8. Din´ amica del cuerpo r´ıgido 253 8.1. El tensor de inercia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 253 8.2. Diagonalización del tensor de inercia . . . . . . . . . . . . . . . . . . . . . 260 8.3. Las ecuaciones de movimiento de Euler . . . . . . . . . . . . . . . . . . . 268 8.4. El movimiento de un cuerpo r´ıgido libre . . . . . . . . . . . . . . . . . . . 277 8.5. El trompo con el punto inferior fijo en un campo gravitacional homogéneo 295 8.6. Movimiento en un sistema de referencia no inercial . . . . . . . . . . . . . 310

vii 9. Las 9.1. 9.2. 9.3. 9.4. 9.5. 9.6. 9.7. 9.8. 9.9.

transformaciones can´ onicas La acción en funci´ on de las variables de estado . . . . . La integral invariante de Poincaré-Cart´ an . . . . . . . . El principio de m´ınima acción y expresiones equivalentes El teorema de Li Hua Chung . . . . . . . . . . . . . . . Las transformaciones can´ onicas . . . . . . . . . . . . . . La ecuaci´ on de Hamilton-Jacobi . . . . . . . . . . . . . . Las transformaciones can´ onicas infinitesimales . . . . . . Los corchetes de Poisson . . . . . . . . . . . . . . . . . . Pruebas del car´ acter can´ onico de una transformaci´ on . .

. . . . . . . . .

. . . . . . . . .

. . . . . . . . .

. . . . . . . . .

. . . . . . . . .

319 319 323 328 332 343 364 374 378 400

10.La ecuaci´ on de Hamilton-Jacobi con variables de acci´ on-´ angulo 10.1. Los invariantes adiabáticos . . . . . . . . . . . . . . . . . . . . . . 10.2. Los toroides invariantes . . . . . . . . . . . . . . . . . . . . . . . . 10.3. Las variables acción-´ angulo . . . . . . . . . . . . . . . . . . . . . . 10.4. Problema de Kepler (coordenadas esféricas) . . . . . . . . . . . . . 10.5. Problema de Kepler (coordenadas parabólicas) . . . . . . . . . . .

. . . . .

. . . . .

. . . . .

. . . . .

415 415 420 429 445 462

. . . . . . . . .

. . . . . . . . .

. . . . . . . . .

. . . . . . . . .

. . . . . . . . .

11.Teor´ıa de perturbaciones 11.1. Teor´ıa de perturbaciones dependiente del tiempo . . . . . . . . . . . . . 11.2. Teor´ıa de perturbaciones independiente del tiempo . . . . . . . . . . . . 11.3. Multiplicidad de conjuntos de variables acción-´ angulo en los sistemas degenerados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11.4. Teor´ıa de perturbaciones de sistemas degenerados . . . . . . . . . . . . 11.5. Perturbaciones adiabáticas . . . . . . . . . . . . . . . . . . . . . . . . . . 11.6. Sistema de osciladores lineales con acoplamiento no lineal . . . . . . . . 11.7. Movimiento cerca de una resonancia aislada . . . . . . . . . . . . . . . 11.8. Movimientos regulares e irregulares . . . . . . . . . . . . . . . . . . . . .

479 . 480 . 482 . . . . . .

488 494 504 508 513 522

12.Correspondencia con la mec´ anica cu´ antica de Heisenberg 549 12.1. Representación matricial de variables dinámicas . . . . . . . . . . . . . . . 550 12.2. Corchetes de Poisson y conmutadores de matrices clásicas . . . . . . . . . 555 12.3. Problemas mecánicos a la manera de Heisenberg . . . . . . . . . . . . . . 558 12.4. Ecuaci´ on de Hamilton-Jacobi y diagonalización de la matriz hamiltoniana 561 12.5. Teor´ıa de perturbaciones con matrices clásicas . . . . . . . . . . . . . . . 564 13.Correspondencia con la mec´ anica cu´ antica de Schr¨ odinger 13.1. Ideas de Hamilton acerca de las transformaciones canónicas . 13.2. Funci´ on de distribuci´ on de probabilidades . . . . . . . . . . . 13.3. La mecánica ondulatoria . . . . . . . . . . . . . . . . . . . . . 13.4. La funci´ on de onda semicl´ asica seg´ un Keller y Maslov . . . .

. . . .

. . . .

. . . .

. . . .

. . . .

. . . .

. . . .

567 567 573 580 585

A Isabel. A Clara. A Eduardo y Andrés.

Prefacio No trataré de exponer razones para la aparici´ on de un nuevo texto de mecánica clásica. La acogida que reciba mi trabajo en la comunidad universitaria indicará si en su concepci´ on y realizaci´ on satisface una necesidad existente en este campo. Hay bellas canciones tradicionales, pero ello no impide que aparezcan nuevas composiciones. Tampoco se pide a un compositor que diga las necesidades del p´ ublico que pretende complacer. Tal vez en toda obra que se realice sin interés de lucro, la principal motivaci´ on esté en el placer experimentado por el autor al superar paulatinamente el reto que voluntariamente se ha impuesto. Considero que estas reflexiones son válidas respecto al presente trabajo. Aunque la redacci´ on del manuscrito y el trabajo mecanográfico se realizaron fuera de la Universidad, es justo reconocer que el origen y la finalidad del texto, as´ı como su reproduci´ on, est´ an dentro de ella. He dictado el curso de Mecánica Clásica Avanzada en varias ocasiones y el presente trabajo tiene como n´ ucleo los manuscritos de las clases distribuidos a los alumnos. Con sus discusiones muchos estudiantes colaboraron positivamente. Algunos colegas me contribuyeron con sugerencias y discusiones u ´ tiles, como los se˜ nores Fernando Medina, Alberto S´ anchez, Augusto Montes, Rom´ an Casta˜ neda y Roberto Mart´ınez. Debo reconocer que la idea de escribir un libro de mecánica clásica la recib´ı del profesor Fabio Machado. He tratado de hacer una presentación de los temas en forma muy clara, lo cual desafortunadamente ha resultado en contra de la concisi´ on. Especialmente en los ejemplos, no aconsejo una lectura sino un desarrollo de los problemas por parte del lector. Por tratarse de un texto de estudio y no de una obra divulgativa, no he considerado necesario esforzarme por suprimir algunas fórmulas y frases redundantes. He tratado más bien de evitar los errores en el contenido. De antemano pido excusas a los lectores por las deficiencias estil´ısticas de mi trabajo, y especialmente por los errores que puedan encontrar. El plan de la obra consiste en desarrolar los temas tradicionales (formulaciones dalambertiana, lagrangiana y hamiltoniana, fuerzas centrales, cuerpo r´ıgido, pequeãs oscilaciones, transformaciones can´ onicas, el método de Hamilton-Jacobi y la teor´ıa clásica de perturbaciones), con la elaboraci´ on de ciertos puntos en los que no se profundiza en los textos usuales, y especialmente en buscar ilustraciones concretas. He tratado también algunos problemas de la mecánica cl´ asica que son objeto de investigación en la actualidad. El lector encontrar´ a una presentación más completa que en los textos tradicionales de muchas cuestiones como: el tratamiento de sistemas hol´ onomos, el uso de las coordenadas generalizadas, las transformaciones canónicas, el oscilador isotrópico, el método variacional, la cuerda uniforme, los par´ ametros de Euler y los par´ ametros de Cayley-Klein, las funciones el´ıpticas de Jacobi, las ecuaciones de Euler en sistemas de referencia rotantes, la br´ ujula de Foucault, la formulaci´ on de la mecánica seg´ un Poincaré, el teorema de Liouville sobre los sistemas integrables, un tratamiento exhaustivo del problema de Kepler con variables acción-´ angulo, la teor´ıa canónica de perturbaciones, el teorema de K.A.M, los movimientos caóticos en sistemas hamiltonianos, una formulaci´ on de la mecánica cl´ asica con matrices, dos presentaciones de los fundamentos de la mecánica

x cuántica, y muchos otros temas que yo no soy el llamado a valorar. El tratamiento de la mecánica basado en la teor´ıa matemática de las variedades diferenciales y en el c´ alculo diferencial e integral de Cartan ha sido excluido por obvias razones. Esto no implica que le reste valor al uso de las matemáticas contemporáneas. El matemático A. N. Kolmogorov dec´ıa que es mucho más importante obtener resultados correctos que rigurosos. Para un f´ısico lo anterior es profundamente válido: no hay nada menos riguroso desde el punto de vista teórico que un resultado experimental, pero tampoco nada que sea más cierto ni bello. La aplicación de la teor´ıa de grupos a las vibraciones moleculares, los campos mecánicos, los sistemas con v´ınculos, los fractales y el caos en sistemas disipativos, son algunos temas importantes de la mecánica clásica contemporánea que no han sido incluidos. Tal vez si es posible una segunda edici´ on? Mis obras de consulta son excelentes textos (ver bibliograf´ıa) como los de Whittaker, Landau-Lifshitz, Arnold, Gantmacher, Goldstein, Born, Corben-Stehle, Marion, Lanczos, etc., as´ı como numerosas monograf´ıas y art´ıculos especializados. Mi trabajo se alimenta en gran parte de estas obras aunque me he esforzado por evitar el plagio. Dejo a los lectores la determinación del grado de originalidad del libro que tienen en sus manos. Esta es una obra de referencia para profesores y estudiantes de cursos de pregrado y posgrado en f´ısica, y puede servir como texto gu´ıa mediante una adecuada selecci´ on de los temas, complementado con ejercicios. Con los cap´ıtulos I, II, III, IV, V y VI, y un resumen del VII, puede cubrirse el curso de pregrado. Con un resumen de unas quince horas del curso de pregrado, los cap´ıtulos VIII y IX, y una selecci´ on de temas de los cap´ıtulos X, XI, XII y XIII puede cubrirse el curso de postgrado. La comprensi´ on de este material facilita la solución de problemas de investigación y escuchar sin grandes dificultades conferencias en el campo de la dinámica clásica. ´ JORGE MAHECHA GOMEZ Medell´ın, Junio de 1987.

1 Fundamentos de la mec´ anica newtoniana

1.1.

Conceptos preliminares

Mec´ anica. Es la ciencia que estudia el comportamiento de la materia a partir del movimiento de las part´ıculas constituyentes. En la mecánica la máxima información acerca de un sistema de part´ıculas consiste en obtener las posiciones y velocidades de cada una de ellas en cada instante de tiempo, respecto a un sistema de referencia dado. Para la solución de cualquier problema mecánico es necesario: definir un sistema de referencia, hallar las coordenadas más adecuadas para describir el sistema y plantear las ecuaciones de movimiento de cuya solución se obtendr´ an las coordenadas y velocidades en funci´ on del tiempo. Importancia. El mundo percibido por el hombre directamente a través de sus sentidos se denomina macroscópico. La mecánica clásica brinda la formulaci´ on más completa del comportamiento de la mayor´ıa de fenómenos macroscópicos, por ello es el instrumento teórico por excelencia en ramas como: arquitectura e ingenier´ıa de construcciones, ingenier´ıa mecánica que est´ a en la base de la moderna industria de la maquinaria, la aeron´ autica y la astronáutica, la geof´ısica, etc. Podemos decir que la ciencia de la mecánica ha sido estimulada por el desarrollo de la gran industria y a la vez le ha contribuido a ésta de manera importante. La mecánica cl´ asica no es una ciencia acabada. En primer lugar, hay muchos problemas fundamentales que son estudiados en la actualidad (Arnold, Abraham, Maslov, etc. son nombres asociados a desarrollos contemporáneos de la mecánica). En segundo lugar, hay problemas fundamentales de la f´ısica (entendida como la ciencia o conjunto de ciencias que estudian las propiedades elementales de la materia) que utilizan la mecánica clásica como teor´ıa b´ asica en el grado de validez de la misma (metrolog´ıa, f´ısica de los plasmas, estado sólido, astrof´ısica, sistemas atómicos, sistemas nucleares y de part´ıculas elementales en estados altamente excitados, etc.). Una revisión de los temas en que trabaja una inmensa mayor´ıa de los f´ısicos contemporáneos nos muestra que sus objetos de investigación no son las teor´ıas fundamentales sino problemas espec´ıficos referentes a las propiedades de sistemas f´ısicos reales (n´ ucleos, sólidos, átomos, gases, l´ıquidos, luz, 1

2 / Mec´ anica cl´ asica avanzada etc.). Una visión histórica nos muestra que los virajes en el desarrollo de la f´ısica se han producido a partir de las investigaciones en problemas espec´ıficos que se salen del rango de validez de las teor´ıas existentes. O sea que las modernas teor´ıas f´ısicas no han invalidado la mecánica clásica sino que simplemente han restringido su rango de validez. Por u ´ltimo, en la mecánica clásica est´ a el germen de las teor´ıas más completas como la mecánica cuántica o la relatividad general. Tales teor´ıas utilizan los conceptos de la mecánica cl´ asica y los introducen en sus formalismos cambiándoles el contenido. Las nociones de energ´ıa, momentum, velocidad, posición, etc., tienen su origen en la mecánica cl´ asica, pero mantienen una importancia relevante dentro de las nuevas teor´ıas. Podemos concluir que un conocimiento riguroso de la mecánica clásica es indispensable para el estudio cabal de la mecánica cuántica y dem´ as teor´ıas contemporáneas. Rango de validez. La mecánica clásica no relativ´ıstica es aplicable cuando las velocidades involucradas son mucho menores que la velocidad de la luz.1 La aplicabilidad de la mecánica cuántica a sistemas microscópicos como átomos y moléculas est´ a restringida a los estados en los cuales el producto del momento lineal de las part´ıculas por la dimensi´ on caracter´ıstica de la región que ocupan sea del orden Hde la constante de Planck (o más exactamente, la mecánica clásica es aplicable cuando pdq ≫ h). No es exacto afirmar que la mecánica clásica es aplicable sólo en el mundo macroscópico. Hay problemas de microf´ısica como: átomos en estados excitados, la dispersi´ on de electrones por una radiaci´ on LASER, el movimiento de electrones en algunas moléculas, el movimiento de electrones en campos eléctricos y magnéticos, etc., en los cuales se puede utilizar la mecánica cl´ asica. En fin, sólo un análisis del problema espec´ıfico que se tenga permite decidir si la mecánica clásica es aplicable, si se puede usar como una aproximación o si es completamente inadecuada. Modelos fundamentales en la mec´ anica. En las teor´ıas mecánicas los cuerpos reales son representados por medio de nociones abstractas como las de ”punto material”(part´ıcula), ”s´ olido r´ıgido”, etc. Un punto material es un cuerpo cuyas dimensiones, forma y estructura interna carecen de importancia para la resolución de un determinado problema; esto ocurre cuando las dimensiones que aparecen en el problema son mucho más grandes que las de los cuerpos involucrados y cuando la estructura interna dé lugar a efectos secundarios en el contexto en que se trabaja. Un sólido r´ıgido es un cuerpo que se considera formado por gran cantidad de part´ıculas, de tal modo que la distancia entre dos cualesquiera es constante y que la forma y dimensiones del cuerpo no cambian cuando éste se mueve. Usualmente un sólido r´ıgido se considera formado de un n´ umero muy grande de part´ıculas, que con muy buena aproximación se pueden considerar formando una distribuci´ on continua de masa. En la interacci´ on de dos cuerpos r´ıgidos por contacto se asumen dos modelos: el contacto perfectamente liso y el perfectamente rugoso. Lo anterior es importante en el análisis de las fuerzas internas llamadas de ligadura. Otro modelo es el de cuerpo deformable, b´ asico en las teor´ıas de campos mecánicos. Partes de la mec´ anica. Tradicionalmente se divide en est´ atica, cinem´ atica y 1 Estamos

adoptando el punto de vista que consiste en considerar como cl´ asica a toda teor´ıa f´ısica que no d´ e cuenta de los efectos indeterministas de tipo cu´ antico y permite una descripci´ on causal en sentido cl´ asico. En particular, consideramos cl´ asicas las teor´ıas especial y general de la relatividad.

Fundamentos de mecánica newtoniana / 3 dinámica. En el curso se tratan dos clases de temas: 1) Generales. Leyes generales de la est´ atica y la dinámica (formalismos lagrangiano, hamiltoniano, poissoniano y de Hamilton-Jacobi), cinem´ atica y dinámica del movimiento de rotación. 2) Espaciales. Problema de los dos cuerpos, movimiento del sólido r´ıgido y vibraciones mecánicas. Las teor´ıas, incluyendo la mecánica clásica, adquieren su verdadera relevancia cuando se las aplica a situaciones reales. Las teor´ıas tratan de las leyes generales pero el desarrollo de la f´ısica se halla impulsado por el estudio de problemas espec´ıficos. Por esto, hacemos especial énfasis en los ejemplos y en la presentación de c´ alculos detallados.

1.2.

Sistema de referencia. Estado de un sistema mec´ anico. Ligaduras. Ecuaciones de movimiento para un sistema de part´ıculas. Variables din´ amicas. Problemas separables.

Sistema de referencia. Se entiende por tal a un cuerpo r´ıgido real o ficticio que sirve de referencia para estudiar el movimiento del sistema mecánico considerado. Se supone que tal sistema de referencia est´ a r´ıgidamente unido con un sistema de coordenadas; esto permite ubicar la posición de cada part´ıcula del sistema mecánico respecto del sistema de referencia. Además en el sistema de referencia hay un “cronómetro” que permite determinar los instantes en que cada part´ıcula del sistema ocupa una posición dada del espacio. El sistema de referencia no tiene ninguna propiedad que pueda afectar al sistema mecánico, aunque s´ı es de esperarse que la descripci´ on obtenida dependa del estado del movimiento del sistema de referencia. As´ı como para especificar la longitud de un objeto se requiere un patrón de longitud con una unidad de medida asociada, la descripción del movimiento de un sistema mecánico requiere de un “patr´ on”mecánico que no es más que el sistema de referencia. La unidad de medida es análoga al sistema de coordenadas. La elección del sistema de coordenadas en un sistema de referencia es cuestión de comodidad. Hay un n´ umero infinito de sistemas de coordenadas posible. Con una elección de sistema de coordenadas se busca que las ecuaciones de movimiento sean fácilmente solubles y que la solución sea lo más simple posible. En cualquier sistema de coordenadas es posible escribir las ecuaciones de movimiento, pero puede ocurrir que no sean solubles. Encontrar el adecuado sistema de coordenadas que permita resolver las ecuaciones de movimiento es un importante problema matemático que llega a involucrar la teor´ıa de grupos, la geometr´ıa diferencial y otras ramas de las matemáticas. Estado de un sistema mec´ anico. Es necesario distinguir los conceptos de estado y de descripci´ on de estado. La noción de estado es intuitiva (análoga a las nociones de longitud, duraci´ on, etc.), involucra sólo aspectos cualitativos, de car´ acter objetivo. La descripci´ on del estado implica nociones geométricas a través del sistema de referencia

4 / Mec´ anica cl´ asica avanzada y el sistema de coordenadas que es necesario elegir (hay analog´ıa con las nociones de distancia, intervalo de tiempo, etc., que implican aspectos cuantitativos). Clásicamente para la especificaci´ on o descripción completa del estado de un sistema mecánico se requiere, por ejemplo, conocer la posición y velocidad de cada una de las part´ıculas en un tiempo dado. Es imposible obtener la descripción del estado sin tener un sistema de referencia y un sistema de coordenadas. En cualquier rama de la f´ısica, y en general cualquier ciencia cuantitativa, se requiere de la noción de estado. El tipo de descripción depende del sistema que se trate: el estado de un sistema de part´ıculas en mecánica cl´ asica se describe mediante posiciones y velocidades; en mecánica cuántica se describe mediante la funci´ on de onda del sistema. El estado termodinámico de un sistema macroscópico se describe mediante un conjunto de variables termodinámicas como P , V , T , etc. En econom´ıa, el estado finanaciero de una empresa, por ejemplo, se describe mediante una serie de par´ ametros que evolucionan con el tiempo; qué par´ ametros son relevantes, depende del modelo, as´ı como de la ecuaci´ on de evoluci´ on. El sistema de referencia se denomina a veces espacio f´ısico de representación. El sistema de coordenadas permite representar cada estado del sistema por un punto. La representación de los estados ya forma parte de la teor´ıa f´ısica, pero siempre existe el supuesto de que hay una correspondencia que permite asociar a cada estado de movimiento del sistema un punto del espacio de representación, o, para ser más exactos, una trayectoria en dicho espacio. A un sistema de N part´ıculas se le asocian 3N coordenadas y 3N velocidades. Los estados del sistema se pueden representar por puntos del espacio de representación, llamado espacio de configuración, y sus vectores tangente y velocidades. También los estados se pueden representar por puntos del espacio de fases 6N dimensional. Una descripción puede ser por medio de las 6N cantidades: { x1 (t), y1 (t), z1 (t); x2 (t), y2 (t), z2 (t); ...xN (t), yN (t), zN (t);

(1.1)

x˙ 1 (t), y˙ 1 (t), z˙1 (t); x˙ 2 (t), y˙ 2 (t), z˙2 (t); ...x˙ N (t), y˙ N (t), z˙N (t) } También es posible una descripción en términos de las coordenadas en dos tiempos diferentes, t y t′ . No basta, pues, conocer los valores iniciales de las coordenadas ya que además se requiere información acerca de c´ omo cambian con el tiempo para poder predecir cuál será la configuración del sistema en otro tiempo. Para lo anterior desde el punto de vista meramente matemático, se requerir´ıa conocer todas las derivadas temporales de las coordenadas y velocidades que en un tiempo determinan los valores de las mismas en cualquier otro instante. En conclusi´ on, el espacio de representación para un sistema de N part´ıculas tiene 6N dimensiones. Los distintos formalismos de la mecánica se caracterizan, entre otras cosas, por el tipo de espacio de representación que emplean. La formulaci´ on newtoniana utiliza las posiciones y velocidades de las part´ıculas. La formulaci´ on lagrangiana, las coordenadas y velocidades generalizadas. Las formulaciones de Hamilton y Poisson, las coordenadas y momentos generalizados. La formulaci´ on de Hamilton-Jacobi utiliza constantes de movimiento. La mecánica cuántica utiliza otro tipo de descrición del estado: los vectores de estado del espacio de Hilbert del sistema. Ligaduras. Si con sólo cambiar las fuerzas y las condiciones iniciales las part´ıculas del sistema pueden ocupar cualquier posición en el espacio o cualquier velocidad,

Fundamentos de mecánica newtoniana / 5 se dice que el sistema es libre. Si lo anterior no es posible, es porque hay restricciones, llamadas ligaduras mecánicas. Las ligaduras disminuyen el n´ umero de cantidades independientes necesarias para especificar completamente el estado del sistema. Si hay k condiciones de ligadura independientes, el n´ umero de cantidades independientes necesarias para especificar la configuraci´ on del sistema (llamado el n´ umero de grados de libertad) será 3N − k = 1. En lo que sigue supondremos conocidos los conceptos referentes a: trayectoria, primera ley de Newton, sistemas de referencia inerciales, segunda y tercera ley de Newton, trabajo y energ´ıa, y teoremas de conservaci´ on del momento lineal, la energ´ıa y el momento angular. Ecuaciones de movimiento para un sistema de part´ıculas. Supondremos que las fuerzas que act´ uan sobre una part´ıcula son funci´ on de las coordenadas y velocidades de todas las part´ıculas del sistema, y que se pueden descomponer a una parte debida a efectos exteriores al sistema y a otra debida a las dem´ as part´ıculas del sistema. La fuerza neta sobre la part´ıcula i (i = 1, 2, ...N ) será: F~i (~r1 , ~r2 , ...~rN ; ~r˙ 1 , ~r˙ 2 , ...~r˙ N ; t) = F~ei ~r1 , ~r2 , ...~rN ; ~r˙ 1 , ~r˙ 2 , ...~r˙ N ; t +

N X

′~ Fij

j=1

(1.2)

~r1 , ~r2 , ...~rN ; ~r˙ 1 , ~r˙ 2 , ...~r˙ N ; t

Se supone que las part´ıculas del sistema sólo interact´ uan entre pares; la prima en la sumatoria indica que excluye j = i. En el caso más general F~ei y F~ij dependen de las coordenadas y de las velocidades de todo el sistema. Usualmente se cumple lo siguiente: (a) Las fuerzas entre las part´ıculas i y j dependen sólo de las coordenadas y de las velocidades de éstas; (b) La fuerza externa sobre la part´ıcula i sólo depende de sus coordenadas y velocidades: F~i ~r1 , ~r2 , ...~rN ; ~r˙ 1 , ~r˙ 2 , ...~r˙ N ; t = F~ei (~ri , ~r˙ i ; t) +

N X

′~ Fij (~ri ,

~rj , ~r˙ i , ~r˙ j )

(1.3)

j=1

Las ecuaciones de movimiento serán: N X j=1

′~ Fij

~ri , ~rj , ~r˙ i , ~r˙ j + F~ei ~ri , ~r˙ i ; t = mi~¨r i

i = 1, 2, ...N

(1.4)

Este u ´ltimo es un sistema de N ecuaciones diferenciales, en general no lineales, de segundo orden, acopladas, con N inc´ ognitas (~r1 , ~r2 , ...~rN ), o si se quiere, de 3N ecuaciones diferenciales escalares con 3N inc´ ognitas. La solución de estas ecuaciones contiene 6N constantes de integraci´ on, que pueden tomarse como las 3N coordenadas y las 3N velocidades en el tiempo t = t0 , y proporciona directamente la especificaci´ on completa del estado del sistema.

6 / Mec´ anica cl´ asica avanzada Variables din´ amicas. Cualquier funci´ on del estado del sistema y del tiempo se denomina una variable dinámica. Las coordenadas o las velocidades mismas son variables din´ amicas. También lo son el momento angular, la energ´ıa, el momento lineal, las coordenadas del centro de masa, etc. Un conjunto de 6N funciones (independientes entre s´ı) de las coordenadas y las velocidades constituye un conjunto completo de variables din´ amicas y sirve para especificar completamente el estado del sistema. Una clase especial de variables din´ amicas es constituida por las constantes de movimiento. Un conjunto máximo de constantes de movimiento, 6N , permite describir completamente el estado del sistema. En mecánica cuántica pueden haber a lo sumo 3N constantes de movimiento independientes, exactamente definidas; entonces las otras 3N constantes serán completamente indefinidas. La mecánica newtoniana en su forma original es adecuada para el estudio de sistemas libres. Para sistemas con ligaduras es más conveniente el formalismo lagrangiano. Desde el punto de vista teórico es deseable un formalismo en el cual las ecuaciones del movimiento sean covariantes y en el cual la mecánica se deduzca de principios más generales (variacionales); en este sentido también es más u ´ til la mecánica lagrangiana. Problemas separables. Son aquellos en los cuales el sistema de ecuaciones de movimiento acopladas, es posible mediante alg´ un cambio de variables reducirlo a un sistema de 3N ecuaciones diferenciales desacopladas, o sea, 3N ecuaciones donde en cada ecuaci´ on hay sólo una inc´ ognita. En principio algunos problemas mecánicos son separables, pero en la mayor´ıa de los casos esto es un problema muy dif´ıcil (o imposible) de resolver matemáticamente. Algunos problemas que han sido resueltos matemáticamente son: el de N part´ıculas en un campo externo pero no interactuantes entre s´ı; N part´ıculas en un campo externo interactuando entre s´ı con fuerzas restauradoras lineales (cadena de osciladores acoplados, molécula lineal poliat´ omica, etc.); dos part´ıculas interactuando entre s´ı a través de un potencial central (problema de dos cuerpos, por ejemplo); sólido r´ıgido con un punto fijo en un campo gravitacional homogéneo. Pero la mayor parte de los problemas mecánicos no se han podido resolver anal´ıticamente, por ejemplo, el problema de tres part´ıculas interactuando entre s´ı a traves de un potencial central de tipo gravitacional (problema de los tres cuerpos), o el problema de una part´ıcula cargada en presencia del campo electrost´ atico de una carga fija y un campo magnético homogéneo. Los problemas solubles cl´ asicamente lo son también cuánticamente; en cuanto a la b´ usqueda de soluciones anal´ıticas exactas, la mecánica cuántica no aporta mucho en relación con la mecánica cl´ asica, sin embargo, la mecánica cuántica ha alcanzado una mayor flexibilidad en la b´ usqueda de soluciones aproximadas al problema de muchas part´ıculas interactuantes entre s´ı.

2 Ecuaciones generales de la est´ atica y la din´ amica 2.1.

Las ligaduras

Esta noci´ on aparece en f´ısica macroscópica con frecuencia y raras veces en f´ısica microscópica. Es de interés en las aplicaciones técnicas, como el dise˜ no de maquinaria. Por ejemplo, en la definición de sólido r´ıgido aparece el concepto de ligadura. Este sistema se define por la condición que la distancia entre cualquier par de part´ıculas permanece fija. Para N = 2, el cuerpo r´ıgido consiste de dos part´ıculas a una distancia fija entre s´ı; la condición de ligadura es: (x1 − x2 )2 + (y1 − y2 )2 + (z1 − z2 )2 = constante

(2.1)

El sistema posee seis coordenadas, pero la ligadura permite expresar una de ellas en términos de las otras, quedando sólo 6 − 1 = 5 coordenadas independientes. Por tales coordenadas pueden tomarse las tres del centro de masa y dos ángulos que especifican la orientación respecto al centro de masa. Para N = 3 hay nueve coordenadas y tres condiciones de ligadura que pueden expresarse en forma vectorial como: |r~1 − r~2 | = a |r~2 − r~3 | = b

(2.2)

|r~3 − r~1 | = c Hay sólo 9 − 3 = 6 coordenadas independientes que pueden tomarse as´ı: tres para especificar la posición del centro de masa del sistema total y tres ángulos que especifican la orientación del plano de las part´ıculas con el centro de masa fijo. Para un sólido r´ıgido en general se requieren 3N coordenadas pero habr´ a cierto n´ umero de condiciones de ligadura independientes. El n´ umero total de coordenadas independientes requeridas para especificar la posición de un sólido r´ıgido son seis, que pueden 7

8 / Mec´ anica cl´ asica avanzada tomarse as´ı: las tres coordenadas del centro de masa y tres ángulos que especifican la orientación del cuerpo con el centro de masa fijo. Se dice que un sólido r´ıgido de N part´ıculas tiene seis grados de libertad y 3N − 6 condiciones de ligadura. Otros tipos de ligaduras son las siguientes: (a) Hay alguna condición que obliga a las part´ıculas a moverse sobre una superficie o en una l´ınea. En una superficie cada part´ıcula posee sólo dos coordenadas independientes, o sea que el sistema tendrá N condiciones de ligadura y 2N grados de libertad. Para un sistema de part´ıculas sobre un plano las condiciones de ligadura son las siguientes, si se toma en el plano x − y: zi = 0 ;

i = 1, 2, ... N

(2.3)

Para una esfera de radio a y tomando el centro de la esfera como origen de coordenadas las ligaduras son: x2i + yi2 + zi2 − a2 = 0 ;

i = 1, 2, ... N

(2.4)

(b) Si hay cuerpos r´ıgidos en contacto que ruedan sin deslizarse sobre un plano. Sea un cilindro de radio a que rueda sin deslizar sobre el plano z = 0. El cilindro requiere de seis coordenadas para especificar su posición, pero hay dos condiciones de ligadura. zCM = a 2 x˙ 2CM + y˙ CM = a2 φ˙ 2

(2.5)

~ CM y R ~˙ CM son la posición y velocidad del centro de masa y φ˙ es la velocidad donde R angular de rotación alrededor del eje del cilindro. Si se escoge el sistema de coordenadas de modo que el eje del cilindro sea paralelo al eje x, la ecuaci´ on (2.5) puede integrarse para dar: yCM = aφ

(2.6)

La ecuaci´ on (2.5) puede también integrarse directamente para obtener una relación entre el ´ angulo de giro del cilindro y el desplazamiento del centro de masa. En (2.6) se ha escogido a φ de modo que yCM = 0 cuando φ = 0. Las ligaduras de “rodar” relacionan las velocidades entre s´ı y con las coordenadas, y en general son no hol´ onomas, o sea no integrables. Son los casos de un disco o una esfera rodando sobre un plano. Para un disco rodando sobre un plano se requieren dos coordenadas para especificar la posición del centro de masa, una para especificar el giro alrededor del eje y dos para especificar la posición del plano del disco. Hay dos ligaduras de “rodar” que relacionan las componentes de la velocidad del centro de masa con la velocidad angular de rotación al rededor del eje (véase la figura 2.1). Una de las coordenadas necesarias para especificar el plano del disco puede tomarse como el ´ angulo que hace el eje del disco con la direcci´ on x. La otra coordenada la especificamos exigiendo que el plano del disco sea siempre perpendicular al plano x − y. Una condición de ligadura es zCM = a. Las otras dos coordenadas del centro de masa

Ecuaciones generales de la est´ atica y la dinámica / 9 z

y

a ϕ

v

α

x

Figura 2.1 Disco rodando sobre un plano

son las mismas del punto de contacto del disco con el plano. Las condiciones de ligadura ˙ de rodar son: que la magnitud de la velocidad del centro de masa sea proporcional a φ, v = aφ˙

(2.7)

y que la direcci´ on de la velocidad del centro de masa siempre esté en el plano de rotación del disco, x˙ = v senα

y˙ = −v cos α

(2.8)

De estas tres condiciones de ligadura sólo hay dos independientes: dx − a senα dφ

=0

dy + a cos α dφ

=0

(2.9)

Las ecuaciones (2.9) no se pueden integrar para obtener relaciones que involucren sólo cantidades finitas. Para poder hacer esto ser´ıa necesario hallar ciertas funciones f (x, α; φ) y g(y, α; φ) tales que al multiplicar por ellas las ecuaciones (2.9) se obtengan diferenciales exactos. Lo anterior no es posible, o sea que las relaciones (2.9) no pueden usarse para expresar una coordenada en términos de las dem´ as; esto implica que las condiciones de ligadura deben considerarse simult´ aneamente con la solución del problema mecánico, que contendrá sólo tres coordenadas independientes. Los anteriores ejemplos nos muestran que un sistema de N part´ıculas y k condiciones de ligadura tendrá 3N − k grados de libertad. Un cuerpo r´ıgido tendrá 6 − k grados

10 / Mec´ anica cl´ asica avanzada de libertad. Las condiciones de ligadura para un sistema de part´ıculas pueden siempre expresarse en la forma: fα (~r1 , ~r2 , ... ~rN ; ~r˙ 1 , ~r˙ 2 , ... ~r˙ N ; t) = 0;

α = 1, 2, ... k

(2.10)

Ligaduras holon´ omicas. También se llaman integrables, finitas o geométricas. Su nombre se deriva de las ra´ıces griegas nomos (ley) y holo (entero, todo). Estas ligaduras sólo restringen las posiciones posibles del sistema, o sea que se pueden expresar por medio de igualdades que no involucran las velocidades. Para un sistema de N part´ıculas son de la forma: fα (~r1 , ~r2 , ... ~rN ; t) = 0

α = 1, 2, ... h

(2.11)

Para un cuerpo r´ıgido son: ~ θ, φ, ψ; t) = 0 fα (R,

α = 1, 2, ... h

(2.12)

~ denota la posición del centro de masa, φ, θ, ψ son tres ángulos que especifican donde R la orientación del cuerpo con el centro de masa fijo y h es el n´ umero de condiciones de ligadura hol´ onomas. Un sistema se dice que es hol´ onomo si no tiene ligaduras diferenciales no integrables. Ligaduras no holon´ omicas. También se llaman no integrables, diferenciales o cinem´ aticas. Son aquellas que no pueden integrarse. Para un cuerpo r´ıgido son de la forma: ˙ φ, ˙ ψ; ˙ t) = 0 ; ~ R, ~˙ θ, φ, ψ, θ, fα (R,

α = 1, 2, ... n

(2.13)

donde n es el n´ umero de ligaduras no hol´ onomas. En la mayor´ıa de los casos (por ejemplo el de la figura 2.1), se pueden expresar en la forma: ~lα · R ~˙ + mα θ˙ + nα φ˙ + σα ψ˙ + Pα = 0 ;

α = 1, 2, ... n

(2.14)

~ θ, φ, ψ, t. La generalizaci´ donde ~lα , mα , nα , σα , Pα , son funciones de R, on de (2.12), (2.13) y (2.14) para sistemas de cuerpos r´ıgidos es inmediata. Para un sistema de N part´ıculas usualmente son de la forma: N X i=1

~lα · r~˙i + Dα = 0 ; i

α = 1, 2, ... n

(2.15)

donde ~lαi y Dα son funciones de ~r1 , ~r2 , ... ~rN , t. Ligaduras reon´ omicas. Del griego reo (flujo). Son las ligaduras, holonómicas o no holonómicas, que dependen del tiempo. Ser´ıa el caso de dos part´ıculas unidas entre s´ı por una varilla cuya longitud var´ıa con el tiempo de manera conocida: |~r1 − ~r2 | = l(t)

(2.16)

Ligaduras escleron´ omicas. Del griego esclero (duro). Son las ligaduras r´ıgidas o que no cambian con el tiempo. Es el caso de dos part´ıculas unidas entre s´ı por una

Ecuaciones generales de la est´ atica y la dinámica / 11 varilla r´ıgida. La noci´ on de ligadura involucra dos aspectos. Por una parte, indica que el n´ umero de variables independientes necesarias para especificar el estado del sistema es menor. En segundo lugar aparecen las llamadas fuerzas de ligadura, que no se pueden conocer a priori porque dependen del problema espec´ıfico, es decir de las fuerzas aplicadas y de las condiciones iniciales. Vemos que las ligaduras introducen nuevas inc´ ognitas en el problema. Las ligaduras consideradas como fuerzas. La noción de ligadura es puramente macroscópica. Viendo las cosas en detalle en los ejemplos, notamos que las ligaduras son el resultado de interacciones. As´ı, en el caso de la part´ıcula que se mueve sobre la esfera, deben existir fuerzas que impiden que la part´ıcula salga de la superficie, bien sea hacia afuera o hacia adentro (por esto se dice que esta ligadura es bilateral. En el caso en que la part´ıcula pudiera ocupar sólo cualquier posición dentro de la esfera se dice que la ligadura es unilateral). En el caso del disco que rueda sin deslizar, debe haber alg´ un tipo de interacci´ on entre la superficie del disco y la del plano en la zona de contacto. En todos estos casos sucede que es imposible conocer las fuerzas a priori, independientemente de las fuerzas aplicadas y de las condiciones iniciales. Por ejemplo, en el caso de las dos part´ıculas unidas por una varilla, no sabemos cuál es la fuerza que ejerce la varilla sobre ellas. Obviamos esta dificultad diciendo simplemente que hay una “ligadura”: |~r1 − ~r2 | = l

(2.17)

Pero podemos, si queremos, modelar dicha fuerza, digamos que consider´ andola como un caso l´ımite de una interacci´ on del tipo restauradora lineal. As´ı, las fuerzas de la varilla sobre las part´ıculas ser´ıan de la forma: F~1′

= −k ′ (r − l)ˆ u

F~2′

= k ′ (r − l)ˆ u

(2.18)

donde k ′ ser´ıa la constante de resorte, l la separación de las part´ıculas en la posición ˆ un vector unitario en la direcci´ de equilibrio y u on del vector ~r2 − ~r1 = ~r. En el caso de dos part´ıculas interactuando a través de una fuerza central es posible separar el movimiento en dos partes: el movimiento del centro de masa, y el movimiento de una part´ıcula de masa reducida µ respecto al centro de masa bajo una interacci´ on idéntica a la interacci´ on entre las dos part´ıculas originales. Entonces, el movimiento relativo descrito como el movimiento de la part´ıcula ficticia de masa µ obedece la ecuaci´ on: s r 2E k′ r−l = sen (t − t0 ) (2.19) k′ µ donde E es la energ´ıa del movimiento, que consideraremos tiene un valor finito dado. Cuando k ′ → ∞, la frecuencia de las oscilaciones aumenta, en tanto que r − l tiende a cero, obteniéndose la relaci´ on cinem´ atica r = l. Por otra parte, como la energ´ıa E depende de otras condiciones –fuerzas externas y condiciones de ligadura–, es realmente indeterminada a priori. S´ olo un modelo microscópico nos permitir´ıa estimar el valor de

12 / Mec´ anica cl´ asica avanzada k ′ . Por lo tanto las fuerzas de ligadura F~ ′ 1 y F~ ′ 2 son indeterminadas; su valor depende de la solución al problema mecánico completo. Es claro que la indeterminación en las fuerzas de ligadura no proviene de la omisión de los detalles microscópicos, pues aun a escala microscópica las interacciones depender´ıan del movimiento completo del sistema.

2.2.

Las coordenadas generalizadas

Grados de libertad. El n´ umero de grados de libertad de un sistema mecánico es igual al n´ umero de coordenadas independientes necesarias para especificar completamente cada configuración del sistema. Entendemos por configuración la posición que ocupa cada una de las part´ıculas del sistema. Si hay h condiciones de ligadura hol´ onomas y n condiciones de ligadura no hol´ onomas (o sea si hay k = n + h condiciones de ligadura independientes), el n´ umero l de grados de libertad será: l = 3N − h − n

(2.20)

Clasificaci´ on de los grados de libertad. Sea un sistema de part´ıculas sin ligaduras, k = 0. Sus 3N coordenadas se pueden clasificar en traslacionales y rotacionales (cuando describen el movimiento del centro de masa y las rotaciones del sistema respecto al centro de masa), y en vibracionales (cuando describen los movimientos relativos de las part´ıculas que no trasladan el centro de masa y no rotan el sistema). Por ejemplo, sea un sistema de dos part´ıculas –molécula diatómica–, las seis coordenadas se pueden clasificar en tres grados de libertad traslacionales, dos grados de libertad rotacionales y un grado de libertad vibracional; en el caso de tratarse de una molécula de H2 , además hay grados de libertad internos a las dos part´ıculas: seis grados de libertad correspondientes a los dos electrones, un grado de libertad interno, el esp´ın para cada n´ ucleo y para cada electrón. Las modernas teor´ıas de las part´ıculas elementales consideran que a su vez el protón y el electrón poseen otros grados de libertad internos. Gran parte de los modelos que se construyen en la f´ısica consisten en hallar cuáles son los grados de libertad que tienen más relevancia para una situaci´ on dada. As´ı por ejemplo, en la mecánica se omiten los grados de libertad microscópicos. Las coordenadas generalizadas. Sea un sistema de N part´ıculas con h condiciones de ligadura hol´ onomas, dadas por las ecuaciones (2.11). Estas ecuaciones permiten expresar a h coordenadas en términos de 3N − h coordenadas, que sólo serán independientes en el caso en que no haya ligaduras no hol´ onomas. Es conveniente realizar una transformaci´ on de coordenadas de modo que se eliminen del problema las h coordenadas superfluas; para ello basta exigir que la transformaci´ on anule idénticamente las funciones fα en las ecuaciones (2.11) y (2.12). Es decir, si: xi =

xi (q1 , q2 , ... q3N −h , t)

yi =

yi (q1 , q2 , ... q3N −h , t)

zi =

zi (q1 , q2 , ... q3N −h , t) ;

(2.21) i = 1, 2, ... N

Ecuaciones generales de la est´ atica y la dinámica / 13 donde q1 , q2 , ... q3N −h son las coordenadas generalizadas y la transformaci´ on depender´ a del tiempo si las ligaduras hol´ onomas son además reónomas. La transformaci´ on además debe cumplir que se anulen idénticamente las funciones: f~α (q1 , q2 , ... q3N −h , t) ≡ fα [~r1 (q1 , q2 , ... q3N −h , t), ~r2 (q1 , q2 , ... q3N −h , t), ... t]

(2.22)

para α = 1, 2, ... h

Usaremos la siguiente notaci´ on: los sub´ındices latinos se refieren a cantidades que se pueden asociar a las part´ıculas. Para nombrar las coordenadas generalizadas reservamos los sub´ındices griegos: qν (ν = 1, 2, ... 3N − h). Para nombrar el conjunto de todas las coordenadas generalizadas usamos la notaci´ on (q). M´ as adelante usaremos también la notaci´ on ~q. Si k = h, o sea si n = 0, entonces q será un conjunto de coordenadas generalizadas independientes. Por ejemplo, para una part´ıcula que se puede mover sólo sobre una esfera de radio a la condición de ligadura est´ a dada por la ecuaci´ on (2.4); o sea que, por ejemplo, si el radio de la esfera cambia con el tiempo de manera conocida, f (x, y, z, t) ≡ x2 + y 2 + z 2 − a2 (t)

(2.23)

el sistema tiene una coordenada superflua que se puede eliminar introduciendo unas coordenadas en la superficie de la esfera. Si tomamos como coordenadas generalizadas los ángulos θ y φ definidos por: x(θ, φ, t) = a(t) senθ cos φ y(θ, φ, t) = a(t) senθ senφ

(2.24)

z(θ, φ, t) = a(t) cos θ Vemos que f (θ, φ, t) se anula idénticamente, o sea que la condición de ligadura (2.4), se reduce a 0 = 0. Veamos otro ejemplo, sea el sistema formado por dos bolas pegadas entre s´ı por varillas r´ıgidas sin masa y una de ellas unida por una varilla r´ıgida sin masa a un punto fijo. Este sistema se denomina péndulo doble (véase figura 2.2). El sistema posee seis coordenadas que no son independientes. Supongamos que sólo hay movimientos permitidos en un plano. Entonces las condiciones de ligadura serán, z1 =

0

z2 =

0

x22 + y22 − l22 =

0

(x1 − x2 )2 + (y1 − y2 )2 + l12 =

0

(2.25)

donde tomamos el plano x − y como el plano de movimiento, y el origen de coordenadas en el extremo fijo de la varilla l2 . El sistema tendrá dos grados de libertad que son las

14 / Mec´ anica cl´ asica avanzada

0

θ2

l2

m2 θ1

l1 m1

Figura 2.2 Péndulo doble

coordenadas θ1 , θ2 definidas por: x1 − x2 =

l1 cos θ1 ,

x2 =

l2 cos θ2 ,

z1 ≡ 0

y1 − y2 =

l1 sen θ1 ,

y2 =

l2 sen θ2 ,

z2 ≡ 0

(2.26)

son unas coordenadas generalizadas, ya que reducen las ecuaciones (2.25) a la identidad 0 = 0. Las coordenadas generalizadas se refieren al sistema como un todo y no a las part´ıculas individuales. Además, no necesitan tener dimensiones de longitud. En general, cualquier conjunto de 3N − h variables dinámicas independientes del sistema puede servir de sistema de coordenadas generalizadas. Velocidades generalizadas. Son las derivadas totales de las coordenadas generalizadas respecto al tiempo: (q) ˙ = (q˙1 , q˙2 , ... q˙3N −h )

(2.27)

En coordenadas cartesianas se cumple que el momento est´ a relacionado con la velocidad mediante la relación ~p = m~v. En coordenadas generalizadas no existe una relación de este tipo en general. Espacio de configuraci´ on. Es un espacio definido por las l coordenadas independientes del sistema, donde l = 3N −k. Al describir un sistema con ligaduras por medio del espacio 3N dimensional, estamos usando un espacio euclidiano (en ausencia de fuerzas, una part´ıcula se mueve en l´ınea recta); entonces las trayectorias no rectil´ıneas inmediatamente se atribuyen a la presencia de fuerzas de ligadura. Al describir un sistema con

Ecuaciones generales de la est´ atica y la dinámica / 15 ligaduras por medio del espacio de configuración l-dimensional, usamos un espacio no euclidiano; entonces las trayectorias no rectil´ıneas se atribuyen no a fuerzas, sino a la curvatura del espacio, como en relatividad general.

2.3.

Los desplazamientos virtuales

Sea un sistema sujeto a k condiciones de ligadura, h hol´ onomas, dadas por las ecuaciones (2.11) y n no hol´ onomas dadas por las ecuaciones (2.15), o por (2.12) y (2.14) respectivamente si se trata de un cuerpo r´ıgido, o sus generalizaciones para un sistema de cuerpos r´ıgidos. Para una configuración dada del sistema en un tiempo t, sólo hay ciertas velocidades compatibles con las n condiciones de ligadura no hol´ onomas. O sea que hay n componentes de las velocidades que se pueden expresar en funci´ on de las 3N − n componentes restantes. Velocidades posibles. Son las velocidades que para una configuración dada (~r1 , ~r2 , ... ~rN ) del sistema en el tiempo t son compatibles con las k condiciones de ligadura. S´ olo hay entre las velocidades posibles un conjunto de velocidades (~r˙ 1 , ~r˙ 2 , ... ~r˙ N ) que efectivamente toma el sistema. Las velocidades reales se hallan solamente al resolver el problema mecánico completo. Desplazamientos posibles. Son los ~r˙ i = ~r˙ i dt, i = 1, 2, ... N , cuando las ~r˙ i son las velocidades posibles. Cuando las ~r˙ i son las velocidades reales para una configuración dada, d~ri = ~r˙ i dt son los desplazamientos reales. Tanto los desplazamientos reales como los posibles deben ser compatibles con las h condiciones de ligadura hol´ onomas; es decir, estas deben satisfacerse tanto en la configuración (~r1 , ~r2 , ... ~rN ) como en la configuración (~r1 + d~r1 , ~r2 + d~r2 , ... ~rN + d~rN ), siendo los d~ri desplazamientos posibles. Se sigue entonces que los desplazamientos posibles deben satisfacer simult´ aneamente las k = h + n condiciones, N X i=1

~lα · d~ri + Dα dt = 0 i

N X ∂fα i=1

∂~ri

· d~ri +

α = 1, 2, ... n

∂fα dt = 0 α = 1, 2, ... h ∂t

(2.28)

(2.29)

que se siguen de (2.11) y (2.15). ∂/∂~ri denota el gradiente respecto a las coordenadas de la part´ıcula i. Desplazamientos virtuales. Son los desplazamientos posibles cuando se dejan fijas las ligaduras durante el desplazamiento. Por ejemplo, si en la situaci´ on representada por la figura 2.1 se permite que el plano x−y se mueva de manera conocida, las ligaduras serán re´ onomas; supongamos que se trate sólo de un movimiento del plano en la direcci´ on z. En un desplazamiento virtual del disco se deja el plano x − y fijo mientras se efect´ ua

16 / Mec´ anica cl´ asica avanzada el desplazamiento. En un desplazamiento posible, el centro de masa del disco tiene movimiento en la direcci´ on z y en el plano x − y; en un desplazamiento virtual el centro de masa sólo se mueve en el plano x − y. Para hallar la condición para que los desplazamientos virtuales sean compatibles con las ligaduras, consideremos dos conjuntos de desplazamientos posibles durante un tiempo dt, d~ri = ~vi dt y d′~ri = ~vi′ dt, donde ~vi y ~vi′ son dos conjuntos de velocidades posibles. Los d~ri satisfacen las ecuaciones (2.28) y (2.29) y d′~ri satisface, N X i=1

~lα · d′~ri + Dα dt = 0 ; i

N X ∂fα i=1

∂~ri

· d′~ri +

∂fα dt = 0 ; ∂t

α = 1, 2, ... n

α = 1, 2, ... h

(2.30)

(2.31)

an evaluadas en ~r1 , ~r2 , ... ~rN , t y En las ecuaciones (2.30) y (2.31), ~lαi y Dα est´ análogamente ∂fα /∂~ri y ∂fα /∂t. Definimos los desplazamientos virtuales δ~ri como: δ~ri = d′~ri − d~ri

(2.32)

y las condiciones de su compatibilidad con las ligaduras son: N X i=1

~lα · δ~ri = 0 ; i

N X ∂fα i=1

∂~ri

· δ~ri = 0 ;

α = 1, 2, ... n

α = 1, 2, ... h

(2.33)

(2.34)

Ejemplo 2.3.1 Sea una part´ıcula sometida a una fuerza externa F~ (x, y, t) y constre˜ nida a moverse solamente sobre una superficie descrita por la ecuaci´ on Φ(x, y, z) = 0

(2.35)

Como la ligadura es hol´ onoma, vemos que cualquier velocidad es posible si es tangente a la superficie. La u ńica condición sobre los desplazamientos virtuales es que sean compatibles con la ligadura. En este caso es que satisfagan la ecuaci´ on (2.34), donde Φ hace las veces de fα , es decir, ∂Φ ∂Φ ∂Φ δx + δy + δz = 0 ∂x ∂y ∂z

(2.36)

O sea que δx, δy, δz no pueden ser arbitrarios; sólo dos de ellos pueden serlo. En otras palabras, hay dos grados de libertad. La ecuaci´ on de movimiento, F~ = m ~¨r, y la ecuaci´ on de ligadura (2.35), deben ser compatibles. En efecto, (2.35) impone condiciones a las velocidades posibles y a las aceleraciones posibles: ∂Φ ˙ · ~r = 0 ∂~r

(2.37)

Ecuaciones generales de la est´ atica y la dinámica / 17 d ∂Φ ¨ ∂Φ ~r˙ · + ~r · =0 dt ∂~r ∂~r

(2.38)

la ecuaci´ on de movimiento será compatible con (2.38) sólo si: d ∂Φ F~ ∂Φ ~r˙ · + · =0 dt ∂~r m ∂~r

(2.39)

Como F~ puede darse arbitrariamente, vemos que sólo por accidente se cumplir´ıa (2.39). Por tanto concluimos que la superficie debe reaccionar sobre la part´ıcula con una ~ que dependerá de las condiciones iniciales, de la fuerza aplicada fuerza suplementaria R ~ se llama fuerza de reacción de la ligadura y ha de y de la ecuaci´ on de la superficie. R ser tal que: ~ m~¨r = F~ + R

(2.40)

Ahora tenemos seis inc´ ognitas para el problema: x, y, z, Rx , Ry , Rz , en tanto hay sólo las cuatro ecuaciones siguientes: m¨ x = Fx + Rx m¨ y = Fy + Ry (2.41) m¨ z = Fz + Rz Φ(x, y, z) = 0 Faltan pues, dos ecuaciones adicionales. Para obtenerlas basta imponer la condición ~ no realiza trabajo al efectuarse un de que la ligadura sea ideal. Esto quiere decir que R desplazamiento virtual. Es claro que si la superficie no tiene rozamiento (idealmente ~ será siempre normal a la superficie y como δ~r debe estar sobre la superficie se suave), R ~ y ~r son perpendiculares, sigue que R ~ · δ~r = 0 R

(2.42)

o también, Rx δx + Ry δy + Rz δz = 0

(2.43)

~ no realiza trabajo en desplazamientos virtuales. Seg´ Es decir, R un la ecuaci´ on (2.36), δx, δy y δz no son independientes. Podemos expresar a δz en términos de δx y δy. Entonces la ecuaci´ on (2.33) puede escribirse en la forma:

Rx − Rz

∂Φ/∂x ∂Φ/∂z

∂Φ/∂y δx + Ry − Rz δy = 0 ∂Φ/∂z

(2.44)

18 / Mec´ anica cl´ asica avanzada ~ ha de satisfacer Como δx, δy son diferentes de cero y arbitrarios, se sigue que R además las ecuaciones: ∂Φ/∂x ∂Φ/∂z

Rx =

Rz

Ry =

∂Φ/∂y Rz ∂Φ/∂z

(2.45)

complet´ andose as´ı las seis ecuaciones requeridas. Las ligaduras ideales. Se dice que las condiciones de ligadura sobre un sistema mecánico son ideales si se cumple que el trabajo realizado por las fuerzas de reacción de las ligaduras al efectuar desplazamientos virtuales de todas las part´ıculas es cero: N X i=1

~ i · δ~ri = 0 R

(2.46)

Las fuerzas de fricción dependen del tipo de ligadura, sin embargo para este tipo de fuerzas deben emplearse métodos que no impliquen la noción de “ligadura ideal”. “Ensambles” y desplazamientos virtuales. Entenderemos por “ensamble” a un conjunto de réplicas iguales de un sistema dinámico, donde la u ´ nica diferencia entre las réplicas es la configuración, que debe ser compatible con las condiciones de ligadura, además, en estas réplicas las ligaduras est´ an en idéntica condición; es decir, entre un sistema y otro, para un tiempo dado, las ligaduras son idénticas. Podemos imaginar las configuraciones de estos sistemas formando una red o matriz bidimensional: los elementos de las “filas” constituyen un “ensamble” y las “columnas” dan los distintos estados de un sistema cuando evoluciona el tiempo; cada fila est´ a caracterizada por un valor del tiempo y cada columna por una configuración. Al cambiar t a un valor vecino t + dt los sistemas del ensamble experimentan desplazamientos reales (de una fila a otra). Al realizarse un desplazamiento virtual, un sistema se convierte en otro vecino (de una columna pasa a otra). Ejemplo 2.3.2 Sean dos part´ıculas de masas m1 y m2 que interact´ uan entre s´ı a través de una varilla r´ıgida sin masa. Est´ an sometidas a una fuerza externa y en un estado de movimiento arbitrario. Se trata de mostrar que la ligadura es ideal. Todos los desplazamientos infinitesimales que no cambian la longitud de la varilla son virtuales. Las fuerzas ejercidas por la varilla sobre las part´ıculas son de ligadura y dependerán del estado de movimiento y de las fuerzas aplicadas sobre las part´ıculas. Por ejemplo, si rotan al rededor del centro de masa, las fuerzas de ligadura dependerán de la velocidad angular de rotación. ~1 y R ~ 2 las fuerzas ejercidas por la varilla sobre las part´ıculas, y G ~1 y G ~2 Sean R las fuerzas ejercidas por las part´ıculas sobre la varilla, por la tercera ley de Newton se ~ 1 = −R ~1 y G ~ 2 = −R ~ 2. cumple que G

Ecuaciones generales de la est´ atica y la dinámica / 19 ~1 y G ~ 2 podr´ıan producir aceleraci´ G on del centro de masa de la varilla y aceleraci´ on angular, pero como la masa de la varilla es cero, lo mismo que el momento de inercia, ~1 + G ~ 2 = 0, lo mismo que el torque. Por lo tanto también se cumple que se sigue que G ~ ~ R1 = −R2 y como no hay torques, estos vectores estar´ an a lo largo de la varilla. El trabajo virtual de las fuerzas de ligadura será: ~ 1 · δ~r1 + R ~ 2 · δ~r2 = R ~ 2 · (δ~r2 − δ~r1 ) R

(2.47)

Si llamamos ~r = ~r2 − ~r1 , δ~r = δ~r2 − δ~r1 , entonces un desplazamiento virtual δ~r puede descomponerse en uno perpendicular a la varilla y en uno paralelo a la misma, δ~r = δ~r⊥ + δ~rk

(2.48)

Como la varilla es r´ıgida, δ~rk → 0, luego: ~ 1 · δ~r1 + R ~ 2 · δ~r2 = R ~ 2 · δ~r = R ~ 2 · δ~r⊥ R

(2.49)

~ 2 est´ ~ 1 · δ~r2 = 0 concluyéndose por tanto que la pero R a a lo largo de la varilla, luego R ~ 1 · δ~r1 y R ~ 2 · δ~r2 no son cero por separado, pero s´ı su suma. ligadura es ideal. R

2.4.

La ecuaci´ on general de la est´ atica

Sea un sistema de N part´ıculas. La fuerza sobre la part´ıcula i se puede descomponer (a) ~ i ). Si el en una fuerza aplicada (F~i ) y en una fuerza de reacción de las ligaduras (R sistema est´ a en equilibrio se debe cumplir que: (a) ~ i = ~0 ; F~i = F~i + R

i = 1, 2, ...N

(2.50)

El trabajo virtual de las F~i también será cero, N X i=1

F~i · δ~ri =

N X i=1

(a) F~i · δ~ri +

N X i=1

~ i · δ~ri = 0 R

(2.51)

~ i no sean nulas, será nulo el Si suponemos que las ligaduras son ideales, as´ı las R (a) trabajo virtual realizado por ellas, ecuaci´ on (2.46). Aun en el equilibrio las F~i no serán nulas, pero de (2.46) y (2.51) se sigue que el trabajo virtual de las fuerzas aplicadas debe ser cero: N X i=1

(a) F~i · δ~ri = 0

(2.52)

La ecuaci´ on (2.52) se llama la ecuaci´ on general de la est´ atica o también el principio de los trabajos virtuales. El contenido de la ecuaci´ on (2.52) es el siguiente: “para que alguna configuración del sistema, compatible con las ligaduras, sea una posición de equilibrio, es necesario y suficiente que en esa posición la suma de los trabajos virtuales de las fuerzas efectivas sea cero”. Este enunciado se llama la “regla de oro de la mecánica” y fue formulado por J. Bernoulli en 1717.

20 / Mec´ anica cl´ asica avanzada La compatibilidad de los desplazamientos virtuales con las ligaduras se expresa a través de las ecuaciones (2.34). Por lo tanto los desplazamientos virtuales δ~ri en la ecuaci´ on (2.52) no serán independientes, por lo que se pueden expresar k de ellos en términos de los 3N − k restantes. Las coordenadas generalizadas independientes permiten hallar una expresión a partir de (2.52) que contenga los desplazamientos independientes e igualar a cero los coeficientes. Este procedimiento hace posible hallar la configuración de equilibrio pero no las fuerzas de ligadura. Sistema de ecuaciones de la est´ atica. La solución de un problema de est´ atica consiste en hallar la configuración de equilibrio (xi , zi , yi para i = 1, 2, ... N ), y las fuerzas de reacción de las ligaduras (Rxi , Ryi , Rzi para i = 1, 2, ... N ). Son seis inc´ ognitas que se obtienen resolviendo simult´ aneamente las siguientes ecuaciones algebraicas: (a) ~i = 0 ; F~i + R N X i=1

i = 1, 2, ... N

(2.53)

~ i · δ~ri = 0 R

(2.54)

fα (~r1 , ~r2 , ... ~rN ) = 0 ;

α = 1, 2, ... k

(2.55)

(a) ~ i en la posición Como las F~i son funciones conocidas de las coordenadas, las R de equilibrio se hallan con sólo conocer dicha posición, o sea que en (2.53) son 3N ~ i . Para hallar la configuración de equilibrio basta resolver ecuaciones que determinan las R las ecuaciones: N X i=1

(a) F~i · δ~ri = 0

y

fα (~r1 , ~r2 , ... ~rN ) = 0 ;

α = 1, 2, ... k

(2.56)

Como (2.55) debe cumplirse en las configuraciones ~r1 , ~r2 , ... ~rN y ~r1 + δ~r1 , ~r2 + δ~r2 , ... ~rN + δ~rN , es cierto que: N X ∂fα i=1

∂~ri

· δ~ri = 0 ;

α = 1, 2, ... k

(2.57)

Con lo cual es posible expresar k desplazamientos en términos de 3N − k. Escribamos el conjunto de 3N coordenadas x1 , y1 , z1 , x2 , y2 , z2 , ...xN , yN , zN , en la forma u1 , u2 , ... u3N de modo que tomamos a u1 , u2 , ... uk como k coordenadas que se pueden expresar en términos de las coordenadas uk+1 , uk+2 , ... u3N que tomaremos como (a) 3N − k coordenadas independientes. Llamaremos análogamente Fs a las componentes (a) atica pueden escribirse como: Fus . Con estas modificaciones las ecuaciones de la est´ 3N X

Fs(a) δus = 0

(2.58)

s=1

fα (u1 , u2 , ... u3N ) = 0 ;

3N X ∂fα s=1

∂us

δus = 0 ;

α = 1, 2, ... k

(2.59)

Ecuaciones generales de la est´ atica y la dinámica / 21 Introducimos las k cantidades λ1 , λ2 , ... λk , llamadas multiplicadores indeterminados de Lagrange, de la siguiente manera: multiplicamos las ecuaciones (2.59) que relacionan los δus por λα y sumamos sobre α para obtener: 3N X k X ∂fα λα δus = 0 ∂us s=1 α=1

(2.60)

Ahora sumamos (2.58) y (2.60): ! k 3N X X ∂f α δus = 0 Fs(a) + λα ∂us α=1 s=1

(2.61)

Tenemos k cantidades indeterminadas, λα , que podemos escoger de tal manera que en (2.61) se anulen los coeficientes de los k desplazamientos dependientes δu1 , δu2 , ... δuk , es decir, Fs(a) +

k X

λα

α=1

∂fα = 0; ∂us

s = 1, 2, ... k

(2.62)

Ahora, con (2.62), quedará (2.61) convertida en una combinaci´ on lineal igualada a cero de las cantidades linealmente independientes δuk+1 , δuk+2 , ... δu3N . Lo anterior es posible sólo si se anulan los coefientes, lo cual, junto con (2.62) conduce a: Fs(a) +

k X

λα

α=1

∂fα = 0; ∂us

s = 1, 2, ... 3N

(2.63)

La ecuaci´ on general de la est´ atica (2.58) queda convertida en las 3N ecuaciones (2.63). Ahora hay k inc´ ognitas adicionales, o sea 3N + k en total. Pero hay 3N + k ecuaciones que son las (2.55) y las (2.63). La solución nos dar´ a la posición de equilibrio del sistema. Las fuerzas de ligadura se hallan de cualquiera de las expresiones: Rs = −Fs(a) (u1 , u2 , ... u3N ) ; Rs =

k X

α=1

λα

s = 1, 2, ... 3N

∂ fα (u1 , u2 , ... u3N ) ; ∂us

(2.64)

s = 1, 2, ...k

(2.65)

Ejemplo 2.4.1 Sean dos part´ıculas de masas m1 y m2 , unidas por una varilla r´ıgida sin masa y colocadas dentro de un cascarón esférico, en presencia de la gravedad (véase figura la 2.3). Hallar la posición de equilibrio y las fuerzas de reacción de las ligaduras. Las ecuaciones de ligadura, cuando se toma el origen de coordenadas en el centro de la esfera, son: (x2 − x1 )2 + (y2 − y1 )2 + (z2 − z1 )2 − l2 =

0

x21 + y12 + z12 − a2 =

0

x22 + y22 + z22 − a2 =

0

(2.66)

22 / Mec´ anica cl´ asica avanzada Donde a es el radio de la esfera y l ≤ 2a la longitud de la varilla. Tomando el eje z en la direcci´ on vertical, las fuerzas aplicadas son: (a) F~1 = −m1 g kˆ ;

(a) F~2 = −m2 g kˆ

(2.67)

Ecuaci´ on de equilibrio (2.58): −m1 g δz1 − m2 g δz2 = 0

(2.68)

k

a m

1

0

m

l

2

Figura 2.3 Masas m1 y m2 unidas por una varilla r´ıgida sin masa y colocadas dentro de un cascarón esférico Compatibilidad de los desplazamientos virtuales con las ligaduras: (x1 − x2 )δx1 + (x2 − x1 )δx2 + (y1 − y2 )δy1

+

(y2 − y1 )δy2 + (z1 − z2 )δz1 + (z2 − z1 )δz2 = 0

(2.69)

x1 δx1 + y1 δy1 + z1 δz1 = 0 x2 δx2 + y2 δy2 + z2 δz2 = 0 Las ecuaciones (2.69) indican que sólo tres desplazamientos virtuales pueden darse independientemente. Escogeremos independientes a δy1 , δy2 , δz2 y dependientes a δx1 , δx2 , δz1 . Las seis ecuaciones correspondientes a las dadas por la expresión (2.63) se obtienen usando la matriz de tres filas y seis columnas ∂fα /∂us donde α = 1, 2, 3 y

Ecuaciones generales de la est´ atica y la dinámica / 23 s = 1, 2, ... 6. α = 1, 2, 3 corresponden a las ecuaciones (2.66) respectivamente y las us corresponden a x1 , x2 , z1 , y1 , y2 , z2 respectivamente. Los elementos de la matriz ∂fα /∂us son:   a −a b c −c −b     ∂fα  x 0 z y 0 0 = (2.70) 1 1 1   ∂us   0 x2 0 0 y2 z2 donde a = x1 − x2 , b = z1 − z2 y c = y1 − y2 . Las ecuaciones (2.63) serán: 0 + λ1 (x1 − x2 ) + λ2 x1 + 0 = 0

(2.71)

0 + λ1 (x2 − x1 ) + 0 + λ3 x2 = 0

(2.72)

−m1 g + λ1 (z1 − z2 ) + λ2 z1 + 0 = 0

(2.73)

0 + λ1 (y1 − y2 ) + λ2 y1 + 0 = 0

(2.74)

0 + λ1 (y2 − y1 ) + 0 + λ3 y2 = 0

(2.75)

−m2 g + λ1 (z2 − z1 ) + 0 + λ3 z2 = 0

(2.76)

De (2.71), (2.72) y (2.73) obtenemos para λ1 , λ2 , λ3 : λ1 = m1 g

x1 ; x2 z1 − x1 z2

λ2 = m1 g

x2 − x1 x2 z1 − x1 z2

x1 x1 − x2 λ3 = m1 g x2 x2 z1 − x1 z2

(2.77)

Reemplazando a (2.77) en (2.74), (2.75) y (2.76), obtenemos: x2 y1 − x1 y2 = 0; x2 z1 − x1 z2

x1 x2 y1 − x1 y2 =0 x2 x2 z1 − x1 z2

x1 x2 z1 − x1 z2 m2 + =0 m1 x2 x2 z1 − x1 z2

(2.78)

Si se cumple que x2 z1 − x1 z2 = 0, las ecuaciones (2.78) se convierten en: x2 y1 − x1 y2 = 0;

x2 z1 − x1 z2 = 0

(2.79)

La otra posibilidad es que x2 z1 − x1 z2 no sea cero. En este caso, de (2.78) salen las dos relaciones diferentes: x1 m2 x1 y2 = x2 y1 ; =− (2.80) x2 m1 La solución (2.79) no tiene sentido pues implica: ~r1 × r~2 = (y1 z2 − z1 y2 )î − (x1 z2 − z1 x2 )ˆj + (x1 y2 − x2 y1 )kˆ = 0

(2.81)

24 / Mec´ anica cl´ asica avanzada O sea que los vectores de posición de las part´ıculas son paralelos, independientemente de las masas y la longitud de la varilla. Esta solución podr´ıa ser aceptable en los casos l´ımites en que l = 0 o l = 2a. La solución (2.80) da:1 y1 m2 =− ; y2 m1

x1 m2 =− x2 m1

(2.82)

Las relaciones (2.82) implican que el centro de masa se encuentra siempre sobre el eje z. Las ecuaciones de ligadura se pueden escribir como: 2a2 − 2x1 x2 − 2y1 y2 − 2z1 z2 − l2 = 0

(2.83)

x21 + y12 + z12 − a2 = 0

(2.84)

x22 + y22 + z22 − a2 = 0

(2.85)

De reemplazar (2.82) en (2.83) obtenemos: 2a2 + 2

m2 2 m2 2 x +2 y − 2z1 z2 − l2 = 0 m1 2 m1 2

Usando (2.84) y (2.85) podemos escribir a (2.86) como: s 2 m m2 2 2 2 2 2 a − z2 − 2z2 a − (a2 − z22 ) − l2 = 0 2a + 2 m1 m1 Despejando en (2.87) a (a2 − z2 2 ) obtenemos luego para z22 : 2 m2 l2 2 1+ a − m1 2 z22 = 2 m2 2 m2 l a2 − 1+ m1 m1

z1 se obtiene de (2.74), (2.84) y (2.85): 2 m2 2 2 a − z1 = a2 − z22 m1 Lo cual conduce a: 2 m2 l 2 m2 2 a − 1+ m1 m1 2 z22 = 2 m1 m1 2 l 1+ a2 − m1 m1

(2.86)

(2.87)

(2.88)

(2.89)

(2.90)

Se ve f´ acilmente que al intercambiar las part´ıculas, o sea en (2.88) al reemplazar m2 por m1 y viceversa se obtiene (2.90). 1 En

(2.77) resulta entonces que las λ son infinitas, o sea que las fuerzas de ligadura son infinitas.

Ecuaciones generales de la est´ atica y la dinámica / 25 Las ecuaciones (2.82) nos indican que: y1 y2 = x1 x2

(2.91)

Observando la proyección de las part´ıculas sobre el plano xy, vemos que la varilla debe cortar el eje z, lo cual est´ a de acuerdo con el hecho de que el centro de masa est´ a sobre el eje z en la posición de equilibrio. Lo anterior nos dice que la proyección de la varilla sobre el plano xy es una l´ınea recta que pasa por el origen. Debido a que de las tres ecuaciones (2.78) sólo se obtienen dos relaciones independientes, vemos que habr´ a una indeterminación en los valores de x1 y y1 (y correspondientemente de x2 , y2 ), lo cual es debido a la simetr´ıa del problema bajo rotaciones en el eje z. Podemos determinar solamente a ax21 + y12 y ax22 + y22 : y

m

1

ϕ2

ϕ1 x

m

2

Figura 2.4 Proyecci´ on de las part´ıculas m1 y m2 sobre el plano xy

x22 + y22 =

x21

+

y12

=

l2 l 2 a2 − 4 2 m2 m2 2 a2 1 + l − m1 m1

m2 m1

2

(2.92)

(x22 + y22 )

De (2.86) y (2.68) obtenemos la siguiente expresión que nos permite analizar los signos de z1 y z2 : 2 m2 l4 m1 l2 1+ + a2 a2 − 2 m1 m2 4 z1 z2 = 2 m2 m1 a2 1 + − l2 m1 m2

(2.93)

26 / Mec´ anica cl´ asica avanzada Supongamos que l = 2a, con m1 6= m2 . Entonces, z1 z2 = −a2

(2.94)

De tal forma que (2.88), (2.90) y (2.83) a (2.85) dan z12 = z22 = a2 . Hay para este caso, pues, dos soluciones posibles: z1 = a, z2 = −a o z1 = −a, z2 = a, que corresponden a la varilla vertical. Si además m1 = m2 , (2.88), (2.89) y (2.90) conducen a valores indeterminados de z1 y z2 : cualquier posición es de equilibrio, lo cual est´ a de acuerdo con que el centro de masa est´ a en O para todas las posiciones de la varilla. Para m1 = m2 , con l arbitrario, se obtiene de (2.88), (2.89) y (2.90): z12 = z22 = a2 −

l2 4

(2.95)

y de (2.93) se obtiene: z 1 z 2 = a2 −

l2 4

(2.96)

que indica que z1 y z2 deben tener el mismo signo. Las condiciones de ligadura no contienen informaci´ on acerca de si las part´ıculas est´ an dentro del cascarón o pegadas a él (pudiendo moverse sin fricción); por esto (2.96) admite dos soluciones: z1 = z2 = a2 − l2 /4 o z1 = z2 = −(a2 − l2 /4). Es claro que la segunda solución es la u ´ nica aceptable cuando las part´ıculas est´ an colocadas simplemente dentro del cascarón. La posición del centro de masa en un caso general es: zCM =

m1 z 1 + m2 z 2 = m1 + m2 m2 m2 m2 l 2 l2 2 2 ±m1 1 + ± m2 1 + a − a − m1 m 2 m1 2 s1 2 m2 2 m2 l a2 − 1+ (m1 + m2 ) m1 m1

(2.97)

Es claro que cuando las part´ıculas est´ an dentro del cascarón debe excluirse la solución en que z1 y z2 tienen ambas signos positivos. Las otras soluciones son: Para z1 > 0 , z2 < 0: m2 1− a2 m1 zCM = s (2.98) 2 m m2 2 2 l a2 − 1+ m1 m1 Para z1 < 0 , z2 > 0: m2 − 1 a2 m1 zCM = s 2 m2 m2 2 1+ l a2 − m1 m1

(2.99)

Ecuaciones generales de la est´ atica y la dinámica / 27 Para z1 < 0 , z2 > 0: zCM

m1 =− m1 + m2

s

m2 1+ m1

2

a2 −

m2 2 l m1

(2.100)

Las ecuaciones (2.98), (2.99) y (2.100) serán la expresión correcta para zCM dependiendo del signo de z1 z2 en la ecuaci´ on (2.93). Estas ecuaciones pueden también escribirse como: zCM =

zCM =

m1 − m2 r m1 + m2 a2 − m2 − m1 r m1 + m2 a2 −

zCM = −

r a2 −

a2

(2.101)

1 m1 m2 2 l m1 + m2 m1 + m2 a2

(2.102)

1 m1 m2 2 l m1 + m2 m1 + m2

1 m1 m2 2 l m1 + m2 m1 + m2

(2.103)

Cuando p m1 = m2 sólo es válida (2.103). En ese caso, como es de esperarse zCM = z1 = z2 = − a2 − l2 /4. En general (2.101) y (2.102) sólo serán válidas cuando se cumple una de las desigualdades siguientes: m1 m2 a2 o l 2 > 2 1 + a2 (2.104) l2 > 2 1 + m1 m2 Para el c´ alculo de las fuerzas de reacción de las ligaduras se requiere evaluar los λα . Los denominadores en las ecuaciones (2.77) se calculan usando las ecuaciones (2.80): x2 m1 −z2 + z1 (2.105) = −zCM 1 + x1 m2 Con lo cual las ecuaciones (2.77) nos dan: λ1 = −

m1 m2 g ; m1 + m2 zCM

λ2 = m2

g ; zCM

λ3 = m2

g zCM

(2.106)

De acuerdo con (2.65), (2.71) a (2.76), se puede hallar la contribución de cada ligadura a las fuerzas de reacción de las ligaduras. λ1 est´ a asociada a la fuerza ejercida por la varilla sobre las part´ıculas, λ2 a la fuerza ejercida por el cascarón sobre la part´ıcula de masa m1 y λ3 a la fuerza ejercida por el cascarón sobre la part´ıcula de masa m2 . Estas fuerzas, en forma vectorial, son respectivamente: λ1 (~r1 − ~r2 );

λ1 (~r2 − ~r1 );

λ2~r1 ;

λ3~r2

(2.107)

La fuerza total, de la varilla y el cascarón, sobre la part´ıcula de masa m1 y sobre la de masa m2 respectivamente es: (λ1 + λ2 )~r1 − λ1~r;

(λ1 + λ3 )~r2 − λ1~r1

(2.108)

28 / Mec´ anica cl´ asica avanzada Utilizando las expresiones para los λα , las fuerzas ejercidas separadamente por la varilla y el cascarón sobre las part´ıculas de masas m1 y m2 respectivamente, son: m1 m2 g ~r1 − ~r2 ; m1 + m2 zCM

m1 m2 g ~r1 − ~r2 ; m1 + m2 zCM

m1 g

~r1 ; zCM

m2 g

~r2 zCM

(2.109)

Por ejemplo, tomemos la solución de equilibrio estable cuando l = 2a y m1 > m2 : ˆ r~2 = ak, ˆ ~r1 − ~r2 = −2akˆ y x1 = x2 = y1 = y2 = 0, z1 = −a, z2 = a. En este caso r~1 = −ak, zCM será: m1 − m2 zCM = − a (2.110) m1 + m2 Las fuerzas ejercidas sobre m1 por la varilla y el cascarón respectivamente son: −2aλ1 kˆ = −

2m1 m2 g ˆ k m1 − m2

y

− aλ2 kˆ =

m1 (m1 + m2 ) ˆ gk m1 − m2

(2.111)

Las fuerzas sobre la part´ıcula de masa m2 son: 2m1 m2 g ˆ 2aλ1 kˆ = k m1 − m2

y

m2 (m1 + m2 ) ˆ gk aλ3 kˆ = m1 − m2

(2.112)

Las ecuaciones (2.111) y (2.112) nos dicen que la fuerza ejercida por el cascarón sobre m2 no es cero y que la fuerza ejercida por el cascarón sobre m2 es diferente de (m1 + m2 )g, lo cual contradice nuestra idea intuitiva de que las part´ıculas están “colocadas” dentro del cascarón (véase figura 2.3). El resultado que acabamos de obtener nos dice que las part´ıculas est´ an “agarradas” del cascarón de alguna manera. Esto nos ilustra una propiedad de las ecuaciones de ligadura del tipo (2.88), (2.89), (2.90), o sea de las ligaduras hol´ onomas bilaterales: las fuerzas de ligadura asociadas a las ligaduras bilaterales se pueden ejercer en dos direcciones. Por esto en la parte más alta del cascarón, ecuaci´ on (2.112), éste ejerce sobre la part´ıcula de masa m2 una fuerza en la direcci´ on z negativa. La fuerza total sobre m1 y la fuerza total sobre m2 , usando las ecuaciones (2.100) y (2.106), son respectivamente: m1 g

~ CM R ; zCM

m2 g

~ CM R zCM

(2.113)

Cuando l = 2a, la fuerza neta ejercida por las ligaduras sobre m1 es m1 g kˆ y sobre m2 ˆ Es decir, las ligaduras ejercen sobre cada part´ıcula una fuerza que contrarresta es m2 g k. su peso, como debe ser cuando las part´ıculas est´ an “agarradas” al cascarón. El estudio del caso en que las part´ıculas est´ an simplemente “colocadas” en el cascarón requiere reemplazar (2.66) por dos condiciones de ligadura unilaterales: r1 ≤ a, r2 ≤ a. La solución se obtiene fácilmente a partir de la hallada cuando las ligaduras son bilaterales.

2.5.

Las ecuaciones de la est´ atica en coordenadas generalizadas

Las ligaduras hacen que los desplazamientos virtuales de las part´ıculas (δx1 , δy1 , δz1 ; ... δxn , δyn , δzn ) no sean todos independientes. Por esto en la ecuaci´ on general de

Ecuaciones generales de la est´ atica y la dinámica / 29 la est´ atica, ecuaciones (2.52) y (2.58), no se tienen combinaciones lineales de cantidades linealmente independientes y los coeficientes de los desplazamientos no se anulan. Si introducimos las coordenadas generalizadas independientes (q), para lo cual es necesario que el sistema sea hol´ onomo, mediante las ecuaciones de transformaci´ on (2.21), podemos expresar los δ~ri en términos de los δqν : δ~ri =

l X ∂~ri δqν ∂q ν ν=1

(2.114)

donde l es el n´ umero de grados de libertad; l = 3N − k, con k = h, puesto que en est´ atica no hay ligaduras no hol´ onomas. Entonces la ecuaci´ on (2.52) toma la forma: ! l N N l X X X X ∂~ r ∂~ r i i (a) (a) F~i · F~i · δqν = 0 (2.115) δqν = ∂qν ∂qν ν=1 ν=1 i=1 i=1

En la ecuaci´ on (2.115) se tiene una combinaci´ on lineal de los desplazamientos virtuales independientes δqν igualada a cero. Por esto se debe cumplir que: Q(a) ν

≡

(a)

N X

ri (a) ∂~ = 0; F~i · ∂q ν i=1

ν = 1, 2, ... l

(2.116)

Qν se denomina la fuerza generalizada asociada al grado de libertad qν . En coor(a) denadas generalizadas las condiciones de equilibrio son Qν = 0 para ν = 1, 2, ... l, que proporciona un sistema de l ecuaciones algebraicas simult´ aneas con las l inc´ ognitas q1 , q2 , ... ql que son las coordenadas generalizadas en la posición de equilibrio. En cuanto a las fuerzas de ligadura, de la ecuaci´ on (2.50) se sigue que la fuerza de reacción de las ligaduras asociada al grado de libertad qν también es cero: Eν =

N X

N X ∂~ri ~ i . ∂~ri = − R F~i (a) · ∂qν ∂qν i=1 i=1

ν = 1, 2, ... l

(2.117)

Se sigue de (2.117) que sólo serán diferentes de cero las fuerzas asociadas a las 3N − l = k coordenadas “superfluas”. Como en coordenadas generalizadas desaparecen las ecuaciones de ligadura, se sigue que las fuerzas de ligadura también se anulan, de acuerdo con la idea de que en el espacio de configuración no euclidiano, definido por las coordenadas generalizadas, el efecto de las ligaduras es asociado con la propiedad geométrica de “curvatura del espacio”. Fuerzas derivables de un potencial. Si las fuerzas aplicadas se pueden obtener a partir de una funci´ on V (~ rl , r~2 , ... ~rN , t) en la forma: ∂V (a) ; F~i = − ∂~ri

i = 1, 2, ... N

(2.118)

Las condiciones de equilibrio en coordenadas generalizadas son, para este caso: Q(a) ν

=−

N X ∂V i=1

∂~ri

·

∂~ri ∂V =− ; ∂qν ∂qν

i = 1, 2, ... l

(2.119)

30 / Mec´ anica cl´ asica avanzada Las ecuaciones (2.119) dicen que la posición de equilibrio est´ atica es aquella para la cual la funci´ on de energ´ıa potencial tiene un m´ınimo o un máximo respecto a todas las coordenadas generalizadas. Sin definir estrictamente la estabilidad de un sistema, podemos decir que un m´ınimo en V corresponde a equilibrio estable, y un máximo a equilibrio inestable; las condiciones rigurosas de estabilidad est´ an dadas por el teorema de Lagrange y los teoremas de Liapunov y Chetayev (véase el cap´ıtulo 5 del libro Lectures in analytical mechanics de Gantmacher). A manera de ilustraci´ on, consideraremos una part´ıcula colocada sobre una esfera de radio a que puede variar con el tiempo. Las coordenadas generalizadas pueden tomarse como θ, φ, de acuerdo con la ecuaci´ on (2.24). A las fuerzas aplicadas se les pueden asociar las fuerzas generalizadas Qθ , Qφ . La condición de equilibrio es Qθ = Qφ = 0, o sea que no haya torques externos en las direcciones de θ y φ. En el equilibrio, la part´ıcula se mover´ a sobre la superficie de la esfera sin aceleraci´ on o permanecer´ a en reposo respecto a la misma. Con coordenadas generalizadas no es posible obtener la fuerza de ligadura en la direcci´ on radial. Ejemplo 2.5.1 Hallar la configuración de equilibrio para el problema del ejemplo 2.4.1 en coordenadas generalizadas. La figura 2.5 muestra una configuración general del sistema. Se requiere hallar tres par´ ametros independientes compatibles con las ligaduras y expresar en términos de ellos las coordenadas de las part´ıculas. Luego, hallar las fuerzas generalizadas asociadas a esos par´ ametros. La configuración de equilibrio estar´ a dada por los valores de los par´ ametros que anulan las fuerzas generalizadas. Las coordenadas generalizadas serán tres par´ ametros que ubican la posición del triángulo r´ıgido: 012. Como el vector de posición del centro de masa ~rCM es fijo respecto al triángulo 012, dos par´ ametros podr´ıan ser φCM , θCM y el tercer par´ ametro ser´ıa un ángulo de rotación del triángulo alrededor de ~rCM . Sin embargo, resultan más convenientes los tres ángulos de Euler que determinan la ubicación de un sistema de coordenadas cartesianas x′ , y ′ , z ′ , fijo al triángulo, respecto al sistema de coordenadas espacial x, y, z. Los ´ angulos de Euler permiten mediante tres rotaciones sucesivas obtener los ejes x′ , y ′ , z ′ a partir de los ejes x, y, z: primero se rota alrededor del eje z por un ángulo φ, con lo cual el eje x pasa a ser cierto eje ξ; luego se rota alrededor del eje ξ por un angulo θ, con lo cual z pasar´ ´ a a ser cierto eje ξ ′ ; luego se rota alrededor del eje ξ ′ por un ´ angulo ψ, con lo cual se obtendr´ a la posición final de los ejes x′ , y ′ , z ′ . La figura 2.6 muestra estas tres rotaciones. La figura 2.7 muestra la ubicación del triángulo mediante los ángulos de Euler φ, θ, ψ. Se escoge el eje z ′ a lo largo de la l´ınea que une a O con el centro de masa, y ′ perpendicular a 0−CM en el plano del triángulo, y x′ perpendicular al plano del triángulo. Las coordenadas de las part´ıculas respecto a los ejes x′ , y ′ , z ′ son: x′1 =

0

y1′ =

−a sen

z1′ =

a cos

β −α 2

β −α 2

x′2 = 0 y2′ = a sen z2′ = a cos

β +α 2

β +α 2

(2.120)

Ecuaciones generales de la est´ atica y la dinámica / 31 z

2 l

1

θ2

θ1

r1

r2 y

ϕ2

ϕ1 x

Figura 2.5 Configuración de equilibrio del sistema de dos masas unidas por una varilla r´ıgida (del ejemplo 2.4.1)

ζ′

z,ζ

z θ

z

zi ′ θ

yi′

η′

η

x

ϕ

x ζ

y

y

y

x

ϕ

ϕ

ψ

xi′

ζ′

Figura 2.6 Los ángulos de Euler φ, θ y ψ

Llamando ~rm la posición del punto medio de la varilla, obtenemos la siguiente expresión que relaciona a cos α con cos β:

~rCM · ~rm =

a2 (1 + cos β) = rCM rm cos α 2

(2.121)

32 / Mec´ anica cl´ asica avanzada z zi ′

2

z i′

1 y i′

× CM 2

× CM

1

α

θ a

y

β

0

a

xi′ ϕ

y i′

ψ

0

x

Figura 2.7 Ubicación del triángulo mediante los ángulos de Euler

De la definición de ~rCM y de la geometr´ıa se sigue que: s l2 m1 m2 rCM = a 1 − 2 (m1 + m2 ) a2 rm = a

r

1−

l2 4a2

l2 cos β = 1 − 2 ; 2a

(2.122)

(2.123) β l sen = ; 2 2a

β cos = 2

r

1−

l2 4a2

(2.124)

Usando (2.122), (2.123) y (2.124) se obtienen de (2.121) las siguientes expresiones para senα y cos α: sen α =

l m1 − m2 s 2a m1 + m2 1−

v u u u cos α = u u t

1 m1 m2 l2 (m1 + m2 )2 a2

l2 1− 2 4a m1 m2 l2 1− 2 (m1 + m2 ) a2

(2.125)

De (2.120), (2.124) y (2.125) se deducen las siguientes expresiones para las coordenadas de las part´ıculas respecto a los ejes x′ , y ′ y z ′ : x′1 = x′2 = 0

(2.126)

Ecuaciones generales de la est´ atica y la dinámica / 33 v u u m2 u u ′ y1 = −l u m1 + m2 t

l2 4a2 m1 m2 l2 1− 2 (m1 + m2 ) a2 1−

l2 m2 1− 2 2a m1 + m2 ′ z1 = a s m1 m2 l2 1− (m1 + m2 )2 a2 v u l2 u u 1− 2 m 1 u 4a y2′ = l u m1 + m2 t m1 m2 l2 1− 2 (m1 + m2 ) a2 m1 l2 1− 2 4a m1 + m2 ′ z2 = a s l2 m1 m2 1− (m1 + m2 )2 a2

(2.127)

(2.128)

(2.129)

(2.130)

Definamos las variables c = cos ψ, c′ = cosφ, c′′ = cos θ, s = senψ, s′ = senφ y s = senθ. Las ecuaciones de transformaci´ on del sistema de coordenadas x′ , y ′ , z ′ al sistema de coordenadas x, y, z son las siguientes [ver (2.118)]:   x      y =     z (2.131)   ′  c c′ − s s′ c′′ −s c′ − c′′ s′ c s′′ s′ x        c s′ + c′′ c′ s −s s′ + c′′ c′ c −s′′ c′   y ′        s′′ s s′′ c c′′ z′ ′′

Como las componentes del vector de posición del centro de masa en los ejes x′ , y ′ , z son: ′

′ x′CM = yCM = 0;

′ = rCM , zCM

(2.132)

se deduce de (2.131) que respecto a los ejes x, y, z las coordenadas del centro de masa son: xCM = rCM senθ senφ yCM

= −rCM senθ cos φ

zCN

= rCM cos θ

(2.133)

34 / Mec´ anica cl´ asica avanzada Las fuerzas generalizadas se obtienen usando las ecuaciones (2.67) y (2.116): Qν = −m1 g

∂z1 ∂z2 ∂zCM − m2 g = −g(m1 + m2 ) ∂qν ∂qν ∂qν

(2.134)

donde en este caso tomanos q1 = φ, q2 = θ, q3 = ψ. De (2.133) y (2.134) se sigue inmediatamente que: Qφ

≡0

Qψ

≡0

Qθ

= (m1 + m2 )grCM senθ

(2.135)

Las condiciones de equilibrio son Qν = 0, lo cual da las siguientes ecuaciones: 0 = 0,

0 = 0,

senθ = 0

(2.136)

Se sigue de (2.136) que las configuraciones de equilibrio son aquellas para las cuales θ = 0 o θ = π, donde φ y ψ pueden tomar cualquier valor. Como para θ = 0 y θ = π, φ y ψ est´ an en el mismo plano, realmente sólo hay un ángulo arbitrario: todas las configuraciones que se obtienen por rotar alrededor del vector de posición del centro de masa son de equilibrio, donde el centro de masa est´ a sobre el eje z. Las configuraciones de equilibrio respecto a los ejes x, y, z se obtienen de (2.131) con ψ y φ arbitrarios:     ′  x cos(ψ ± φ) −sen(ψ ± φ) 0 x          ′   y  =  sen(φ ± ψ) cos(φ ± ψ)   0  y  (2.137)          z 0 0 ±1 z′ Donde el signo superior se refiere al caso en que θ = 0 y el inferior a φ = π. Expl´ıcitamente (2.137) da: x

= x′ cos(ψ ± φ) − y ′ sen(ψ ± φ)

y

= x′ sen(φ ± ψ) + y ′ cos(φ ± ψ)

z

= ±z ′

(2.138)

en concordancia con lo dicho anteriormente. En la configuración de equilibrio estable, θ = π, las coordenadas de las part´ıculas, de acuerdo con (2.138) y (2.126) a (2.130), son: m2 l2 1− 2 2a m1 + m2 ; z1 = −a s m1 m2 l2 1− (m1 + m2 )2 a2

m1 l2 1− 2 2a m1 + m2 z2 = −a s m1 m2 l2 1− (m1 + m2 )2 a2

(2.139)

de acuerdo con los resultados obtenidos anteriormente [ecuaciones (2.88) y (2.90)]. Los resultados (2.80) también se obtienen directamente de (2.138).

Ecuaciones generales de la est´ atica y la dinámica / 35

2.6.

La ecuaci´ on general de la din´ amica

Si un sistema no est´ a en equilibrio, la fuerza neta sobre cada una de las part´ıculas no es cero sino, de acuerdo con la segunda ley de Newton, es igual al producto de su masa por su aceleraci´ on: (a) ~ i = mi~¨ri ; F~i = F~i + R

i = 1, 2, ...N

(2.140)

Debido a que consideramos ligaduras ideales, que no realizan trabajo sobre el sistema como un todo al desplazar virtualmente todas las part´ıculas, se sigue que: n X i=1

(a) F~i − mi~¨r i · δ~ri = 0

(2.141)

(a) La cantidad F~i − mi~¨r i ·δ~ri no es cero, pero su suma s´ı lo es. La fórmula (2.141) se llama la ecuaci´ on general de la dinámica o también el principio de D’alembert. Esta ecuaci´ on establece lo siguiente: “en todo instante en un sistema dinámico la suma de (a) las fuerzas efectivas F~i y de las fuerzas de inercia −mi~rï no realiza trabajo al efectuar desplazamientos virtuales del sistema”, o más en general establece que: “la ecuaci´ on general de la din´ amica expresa una condición necesaria y suficiente para que un movimiento compatible con las ligaduras sea a la vez compatible con las fuerzas aplicadas”. Esta ecuaci´ on es aplicable a cualquier sistema ideal, hol´ onomo o no hol´ onomo. Como hay 3N − k desplazamientos virtuales independientes, la ecuaci´ on general de la din´ amica proporciona 3N − k ecuaciones, al igualar a cero los coeficientes de los desplazamientos virtuales independientes, que junto con las k ecuaciones de ligadura constituye un sistema de 3N ecuaciones con 3N inc´ ognitas. Esta vez, a diferencia del caso est´ atico, las ecuaciones no serán algebraicas sino diferenciales. (a) (a+f ) on (2.141) queda as´ı: = F~i − mi~rï la ecuaci´ Si llamamos F~i N X i=1

(a+f ) · δ~ri = 0 F~i

(2.142)

o sea que la ecuaci´ on general de la dinámica toma la misma forma de la ecuaci´ on general de la est´ atica. Esta ecuaci´ on puede interpretarse como una ecuaci´ on para caracterizar en cada instante del tiempo la posición de equilibrio del sistema donde a las fuerzas (a) as precisamente, efectivas F~i se les adicionan las fuerzas ficticias o inerciales −mi~¨r i . M´ el principio de D’alembert (1760) dice: “cualquier posición de un sistema dinámico puede considerarse como una posición de equilibrio instant´ aneo si a las fuerzas aplicadas que act´ uan sobre el sistema se agregan las fuerzas ficticias o de inercia”. La regla de oro de J. Bernoulli queda aplicable también en la dinámica. A −mi~¨r i se llama fuerza inercial de D’alembert. En el problema est´ atico asociado, las fuerzas de reacción de las ligaduras coinciden con las del problema original, dinámico. Ejemplo 2.6.1 Sea un recipiente lleno de agua que se mueve con una aceleraci´ on ~a perpendicular a la fuerza de gravedad (véase figura 2.8). Hallar la forma y la posición de la superficie del agua.

36 / Mec´ anica cl´ asica avanzada Cuando ~a = 0, la u ńica fuerza aplicada sobre cada elemento de volumen es la de gravedad; las fuerzas ejercidas por el resto del l´ıquido pueden asumirse como de reacción. La forma de la superficie en el caso est´ atico es plana y horizontal, perpendicular a la fuerza aplicada.

dm –dma

a ϕ ϕ

F ( a) = –dmgk Figura 2.8 Diagrama de fuerzas ejercidas sobre el elemento de masa dm En el caso din´ amico, a cada elemento de masa dm se le aplica adicionalmente una fuerza ficticia −dm ~a. La superficie del agua será ahora un plano perpendicular a la fuerza F~ (a+f ) . La inclinación de la superficie estar´ a dada por: tan φ =

a g

(2.143)

Ejemplo 2.6.2 Sean dos part´ıculas en un doble plano inclinado, unidas por una cuerda inextensible sin masa (véase figura 2.9). Hallar la condición de equilibrio. Resolver el problema din´ amico. Las ligaduras son: z1 =

0 z2 = 0

y1 =

x1 tan α1

y2 =

−x2 tan α2

(2.144) p p x21 + y12 + x22 + y22 =

l

Ecuaciones generales de la est´ atica y la dinámica / 37 y α2

z

α1

m

m1

2

α2

α1

Figura 2.9 Dos part´ıculas en un doble plano inclinado, unidas por una cuerda inextensible sin masa.

Hay sólo un grado de libertad. Los desplazamientos virtuales son a lo largo de los planos, como los desplazamientos reales. El principio de los trabajos virtuales nos conduce a: −m1 g ˆj · δ~r1 − m2 g ˆj · δ~r2 = 0

(2.145)

−m1 tan α δx1 + m2 tan α2 δx2 = 0

(2.146)

es decir:

De la condición de ligadura impuesta por la cuerda se obtiene: δx1 =

cos α1 δx2 cos α2

(2.147)

Con lo cual la ecuaci´ on de equilibrio queda as´ı: cos α1 −m1 tan α1 + tan α2 δx2 = 0 cos α2

(2.148)

Como δx2 es arbitrario, se obtiene que: m1 senα1 = m2 senα2

(2.149)

O sea que cuando los ´ angulos y las masas sean tales que se cumple la anterior condición, el sistema estar´ a en equilibrio en cualquier posición. Para el caso din´ amico, o sea cuando m1 senα1 6= m2 senα1 , aplicamos la ecuaci´ on general de la din´ amica: (m1~g − m1~a1 ) · δ~r1 + (m2~g − m2~a2 ) · δ~r2 = 0

(2.150)

Las aceleraciones deben ser compatibles con las ligaduras, con lo cual se obtienen las siguientes relaciones: a1x = a2x

cos α1 ; cos α2

a1y = a1x tan α1 ;

a2y = −a2x tan α2

(2.151)

38 / Mec´ anica cl´ asica avanzada Además, entre los desplazamientos virtuales hay estas tres relaciones: cos α2 senα2 δy1 = δx1 tan α1 ; δx2 = δx1 ; δy2 = −δx1 cos α1 cos α1

(2.152)

Al expresar en la ecuaci´ on general de la dinámica todas las componentes de las aceleraciones en términos de a1x y todos los desplazamientos virtuales en términos de δx1 , obtenemos: " senα2 − m1 g tan α1 + m2 g senα1 (2.153) # −(m1 sec2 α1 + m2 sec2 α1 ) a1 x δx1 = 0

Con lo cual se obtiene a a1x y por consiguiente a a1y . La magnitud de ~a1 será: a1 =

|m1 g senα1 − m2 g senα2 | m1 + m2

(2.154)

La aceleraci´ on a2 tiene igual magnitud. Las componentes x de las aceleraciones son iguales y de signos contrarios. Sistema de ecuaciones de la din´ amica. Para sistemas hol´ onomos, el principio de D’alembert permite usar los resultados obtenidos en el caso estático. Las ecuaciones (a) (2.63) nos permiten obtener las ecuaciones de movimiento con sólo reemplazar a F~i (a) por F~i − mi~¨r i : (a) F~i − mi~¨r i +

N X

λα

α=1

∂fα =0 ∂~ri

(2.155)

Para un sistema no hol´ onomo, además de lo anterior, los desplazamientos virtuales deben satisfacer las relaciones (2.33): N X i=1

~lα · δ~ri = 0 ; i

α = 1, 2, ... n

(2.156)

Debemos entonces introducir los multiplicadores de Lagrange adicionales µ1 , µ2 , ...µn , que escogeremos de modo que se anulen los coeficientes de los n desplazamientos dependientes adicionales. Para ello, multiplicamos (2.33) por µα y sumamos sobre α: N X n X

i=1 α=1

µα ~lαi · δ~ri = 0

(2.157)

Claramente se ve que en este caso las ecuaciones de movimiento tomarán la siguiente expresión: (a) mi~rï = F~i +

h X

α=1

n

λα

∂fα X ~ + µα lαi ; ∂~ri α=1

i = 1, 2, ... N

(2.158)

Ecuaciones generales de la est´ atica y la dinámica / 39 Estas 3N ecuaciones contienen las 3N + n + h inc´ ognitas ~r1 , ~r2 , ... ~rN , λ1 , λ2 , ...λh , µ1 , µ2 , ...µn que junto con las n + h condiciones de ligadura (2.11) y (2.15) nos dan 3N + n + h ecuaciones con 3N + n + h inc´ ognitas. Esta vez las ecuaciones serán diferenciales acopladas. Las fuerzas de ligadura estar´ an dadas por: ~i = R

h X

α=1

n

λα

∂fα X ~ + µα lαi ; ∂~ri α=1

i = 1, 2, ... N

(2.159)

Las ecuaciones (2.158) se llaman ecuaciones de Lagrange de la primera clase y fueron dadas por Lagrange en el a˜ no de 1788. La ecuaci´ on (2.159) nos permite obtener la contribuci´ on de cada ligadura a las fuerzas de reacción de las ligaduras. Este formalismo es aplicable a cualquier sistema mecánico con ligaduras ideales, hol´ onomo o no hol´ onomo, sometido a fuerzas conservativas o no conservativas. Ejemplo 2.6.3 Sea un alambre largo, r´ıgido, que gira uniformemente alrededor de un eje perpendicular a él. Una bolita se desliza en el alambre sin fricción. No hay fuerzas aplicadas (véase figura 2.10). Hallar la trayectoria de la part´ıcula y las fuerzas de reacción de la ligadura. Elegimos las coordenadas de modo que el alambre permanece en el plano x − y. La ecuaci´ on de ligadura es: tan ωt x − y = 0

(2.160) y

m

ωt 0

x

Figura 2.10 Alambre largo y r´ıgido que gira uniformemente alrededor de un eje perpendicular a él. La masa m se desliza sobre él sin fricci´ on. Las ecuaciones (2.158) y (2.159) para este caso son: m¨ x = λ tan ωt

(2.161)

m¨ y = −λ

(2.162)

Rx = λ tan ωt ;

R − y = −λ

(2.163)

40 / Mec´ anica cl´ asica avanzada La ecuaci´ on de ligadura nos proporciona la siguiente ecuaci´ on diferencial, que junto con (2.161) y (2.162) nos permite obtener a x, y, λ: y¨ = x ¨ tan ωt + 2xω ˙ sec2 ωt + 2ω 2 x sec2 ωt tan ωt

(2.164)

La ecuaci´ on diferencial para x es: x ¨ + 2ω x˙ tan ωt + 2ω 2 x tan2 ωt = 0

(2.165)

Haciendo la sustitución x = u cos ωt obtenemos la siguiente ecuaci´ on diferencial para u: u ¨ − ω2u = 0

(2.166)

Con lo cual la solución para x, y, λ es: x = A cosh ωt cos ωt

(2.167)

y = A cosh ωt senωt

(2.168)

λ = −2Amω 2 senhωt cos ωt

(2.169)

Las componentes de la fuerza de reacción de la ligadura son: Rx = −2Amω 2 senhωt senωt ;

Ry = 2Amω 2 senhωt cos ωt

(2.170)

~ con el eje x est´ El ´ angulo de R a dado por: Ry = cot ωt Rx

(2.171)

~ es siempre perpendicular al alambre y su magnitud es R = 2Amω 2 senhωt. o sea que R

2.7.

Las ecuaciones de la din´ amica en coordenadas generalizadas para sistemas hol´ onomos

Al introducir las coordenadas generalizadas independientes las ecuaciones de ligadura se satisfacen idénticamente. El paso a coordenadas generalizadas de la ecuaci´ on general de la din´ amica se puede realizar en forma análoga al caso de la est´ atica en virtud del principio de D’alembert. De acuerdo con las ecuaciones (2.142) y (2.116) las ecuaciones de movimiento en coordenadas generalizadas son: ) Q(a+f = ν

N X

ri (a+f ) ∂~ = 0; · F~i ∂qν i=1

ν = 1, 2, ... l

(2.172)

o, más expl´ıcitamente, N ∂~r X i (a) = 0; F~i − mi~¨r i · ∂q ν i=1

ν = 1, 2, ... l

(2.173)

Ecuaciones generales de la est´ atica y la dinámica / 41 Definimos la fuerza generalizada aplicada asociada al grado de libertad ν por: Q(a) ν =

N X

ri (a) ∂~ F~i · ∂qν i=1

(2.174)

La fuerza generalizada asociada correspondiente a la fuerza de inercia se puede relacionar con la energ´ıa cinética de la siguiente manera: ) Q(f ν

=

=

N X

d~r˙i ∂~ri · dt ∂qν i=1 N X d ˙ ∂~ri d ∂~ri ˙ − mi ~ri · − mi~ri · dt ∂qν dt ∂qν −

mi

(2.175)

i=1

Podemos expresar en (2.175) a ∂~ri /∂qν y su derivada temporal en términos de derivadas respecto a ~r˙ i . Para ello partimos de la siguiente expresión para ~r˙ i : ~r˙ i =

l X ∂~ri ∂~ri q˙µ + ∂q ∂t µ µ=1

(2.176)

mediante la cual obtenemos: ∂~ri ∂~r˙i = ; ∂ q˙ν ∂qν

l X ∂ 2~ri d ∂~ri ∂ 2~ri = q˙µ + dt ∂qν ∂qµ ∂qν ∂t∂qν µ=1

(2.177)

Por otra parte tenemos que: l X ∂~r˙ i ∂ d~ri ∂ 2~ri ∂ 2~ri = q˙µ + = ∂qν ∂qν dt ∂qν ∂qµ ∂qν ∂t µ=1

(2.178)

De (2.177) y (2.178) se sigue entonces que: ∂~r˙i ∂~ri = ; ∂ q˙ν ∂qν

d ∂~ri ∂~r˙i = dt ∂qν ∂qν

(2.179)

Mediante (2.179) el lado derecho de (2.175) se transforma en: ! # " N ˙i X ∂ ~ r d ˙ ∂~r˙ i − mi~r˙ i · = ~ri · mi − dt ∂q ∂qν ν i=1

(2.180)

N N d X1 ∂ ˙2 X 1 ∂ ˙2 − mi ~ri + ~r mi dt i=1 2 ∂ q˙ν 2 ∂qν i i=1

Las ecuaciones (2.174) y (2.180) nos permiten escribir a (2.173) en la forma: Q(a) ν −

∂T d ∂T + = 0; dt ∂ q˙ν ∂qν

ν = 1, 2, ... l

(2.181)

42 / Mec´ anica cl´ asica avanzada Igual que en el caso est´ atico las fuerzas generalizadas de ligadura se anulan, seg´ un una ecuaci´ on análoga a la (2.117). Las ecuaciones (2.181) se denominan las ecuaciones de Lagrange de la segunda clase. En esas ecuaciones T es la energ´ıa cinética del sistema. Una vez resueltas las ecuaciones (2.181) mediante las fórmulas de transformaci´ on (2.21) y (2.23) se hallan los ~ri (t) (a) ¨ ~ con los cuales se pueden hallar Fi (t) y ~ri que permiten obtener de (2.140) las fuerzas de reacción de las ligaduras. Fuerzas derivables de un potencial. Si todas las fuerzas aplicadas se pueden obtener de una funci´ on V mediante las fórmulas (2.118), las fuerzas generalizadas tomarán la forma: Q(a) ν =−

∂ V (q, t) ; ∂qν

ν = 1, 2, ... l

Como ∂V /∂ q˙ν = 0, (2.181) se pueden escribir: ∂ d ∂(T − V ) − (T − V ) = 0 ν = 1, 2, ... l dt ∂ q˙ν ∂qν

(2.182)

(2.183)

T en coordenadas generalizadas depende de (q), (q) ˙ y de t en el caso en que las ligaduras sean re´ onomas. Se define la funci´ on lagrangiana, o simplemente “el lagrangiano” L as´ı: L(q, q, ˙ t) ≡ T (q, q, ˙ t) − V (q, t)

(2.184)

Entonces las ecuaciones de movimiento para un sistema hol´ onomo con fuerzas derivables de un potencial que no depende de las velocidades son: d ∂L ∂L − = 0; dt ∂ q˙ν ∂qν

ν = 1, 2, ... l

(2.185)

Las ecuaciones (2.185) se denominan usualmente “ecuaciones de Lagrange” y hay una por cada grado de libertad del sistema. Covariancia de las ecuaciones de Lagrange. Sean dos conjuntos diferentes de on: coordenadas generalizadas (q) y (q) relacionadas mediante la transformaci´ qν = qν (q, t) ;

q ν = q ν (q, t) ;

ν = 1, 2, ... l

(2.186)

Esta transformaci´ on que no mezcla coordenadas con velocidades se denomina puntual. Queremos hallar si en las coordenadas (q) las ecuaciones de Lagrange toman la forma de (2.185) en las coordenadas (q). Mediante la transformaci´ on (2.186) tenemos que: l l X X ∂L ∂L ∂ q˙α ∂L ∂qα = = ˙ ˙ ∂ q ˙ ∂ q˙α ∂qν ∂ qν α ∂ qν α=1 α=1

(2.187)

Ecuaciones generales de la est´ atica y la dinámica / 43 ˙ y t, que se obtiene de L(q, q, donde L es la funci´ on de (q), (q) ˙ t) al realizar la transfor ˙ q˙ , t), t . Por otra parte: maci´ on: L(q, q,˙ t) ≡ L q(q, t), q(q, " l X d ∂L ∂qα d ∂L = dt ∂ q˙ ν dt ∂ q˙α ∂qα α=1 !# l ∂L X ∂ 2 qα ∂ 2 qα (2.188) + + ∂ q˙α µ=1 ∂qµ ∂q ν ∂t∂q ν l X ∂L ∂qα ∂L ∂ q˙α ∂L = + ∂q µ ∂qα ∂q ν ∂ q˙α ∂qν α=1

(2.189)

Entonces se sigue de (2.188), (2.189) y (2.185) que: l X d ∂L d ∂L ∂L ∂ q˙α ∂L − = =0 − dt ∂ q˙ ν ∂q ν dt ∂ q˙α ∂qα ∂q ν α=1

(2.190)

Es decir, la forma de las ecuaciones de Lagrange es la misma en cualquier sistema de coordenadas generalizadas. Es interesante la siguiente relación que se obtiene directamente usando la transformaci´ on puntual (2.186): l l X X ∂L ∂L ˙ qν q˙ν = ∂ q ˙ ∂ q˙ ν ν α=1 ν=1

(2.191)

Sistema sin ligaduras. Si no hay ligaduras las fórmulas (2.185) siguen siendo válidas, donde l = 3N . Se sigue de (2.190) que cuando el sistema no tiene ligaduras las ecuaciones de Lagrange (2.185) constituyen la forma de las ecuaciones de movimiento en cualquier sistema de coordenadas, propiedad que no cumplen las ecuaciones de la segunda ley de Newton, que son de naturaleza vectorial: las ecuaciones de Lagrange contienen la misma informaci´ on que la segunda ley de Newton con la ventaja adicional de ser ecuaciones completamente covariantes. En coordenadas cartesianas las fuerzas generalizadas son de la forma Qxi , Qyi , Qzi . Qxj =

T =

N X

N

X (a) ri (a) (a) ∂~ ˆx δij = Fix F~i · µ = F~i · ∂x j i=1 i=1

N X 1 i=1

2

mi x˙ 2i + y˙ i2 + z˙i2

(2.192)

(2.193)

Con lo cual las ecuaciones (2.181) nos dan: (a)

mi x ï = Fix

es decir, las ecuaciones de Lagrange conducen a la segunda ley de Newton.

(2.194)

44 / Mec´ anica cl´ asica avanzada Comparaci´ on de los formalismos newtoniano y lagrangiano. Llamaremos newtoniano al formalismo basado en la ecuaci´ on general de la dinámica directamente. Este formalismo tiene la ventaja de su generalidad. Sin embargo, para sistemas hol´ onomos con fuerzas derivables de un potencial, el formalismo basado en las ecuaciones de Lagrange presenta algunas ventajas: las ecuaciones de movimiento se obtienen a partir de una sola funci´ on escalar, la lagrangiana L, en tanto que en el formalismo newtoniano se trabaja con las fuerzas que act´ uan sobre las part´ıculas. El uso de coordenadas generalizadas permite en el formalismo lagrangiano eliminar del problema las fuerzas de ligadura y las coordenadas superfluas. En el formalismo lagrangiano se trabaja con l parametros independientes que no se refieren a las part´ıculas sino al sistema como un todo, en cambio en el formalismo newtoniano se trabaja necesariamente con coordenadas de las part´ıculas. Finalmente, la covariancia de las ecuaciones de Lagrange es claramente una ventaja del formalismo lagrangiano. Ejemplo 2.7.1 Sea un alambre largo y r´ıgido que rota uniformemente alrededor de un punto O como se muestra en la figura 2.11. Una part´ıcula de masa m est´ a sometida a la ligadura de permanecer sobre el alambre. No hay fricción y act´ ua la fuerza de gravedad en el plano de rotación del alambre. Resolver el problema usando coordenadas generalizadas y las ecuaciones de Lagrange.

y

A c ωt

h

m β

ωt O

B

x

–mgj

Figura 2.11 Alambre largo y r´ıgido que gira uniformemente alrededor de un punto O

Suponer que en t = 0 la part´ıcula parte del punto C con velocidad cero a lo largo del alambre. La ligadura es hol´ onoma y reónoma, dada por la ecuaci´ on de la linea del alambre: y = x tan β + OA

(2.195)

Ecuaciones generales de la est´ atica y la dinámica / 45 De la geometr´ıa se sigue que sen ωt = h/OA y tan β = − cot α, con lo cual la ecuaci´ on de ligadura toma la forma: x cos ωt + y senωt − h = 0

(2.196)

Es una ligadura dependiente expl´ıcitamente del tiempo. El sistema tiene sólo un grado de libertad. Podemos tomar como coordenada generalizada el desplazamiento de part´ıcula sobre el alambre respecto el punto C. Las ecuaciones de transformaci´ on son: x(q, t) =

q senωt + h cos ωt

y(q, t) =

−q cos ωt + h senωt

(2.197) Al reemplazar (2.197) en (2.196) se obtiene la identidad 0 = 0. El lagrangiano del problema es: L=

1 m(x˙ 2 + y˙ 2 ) − mgy 2

(2.198)

L expresado en términos de la coordenada generalizada q y la velocidad generalizada q˙ es: ˙ L(q, q, ˙ t) = 21 m(q˙2 + q 2 ω 2 + h2 ω 2 − 2qhω)

(2.199)

−mg(h senωt − q cos ωt) Para escribir la ecuaci´ on de Lagrange se requiere conocer: ∂L = mqω 2 + mg cos α ; ∂q

∂L = m(q˙ − hω) ∂ q˙

(2.200)

Con lo cual la ecuaci´ on de movimiento para la coordenada generalizada q (ecuación de Lagrange) es: q¨ − qω 2 = g cos ωt

(2.201)

Claramente la solución de (2.201) es de la forma: q = Aeωt + Be−ωt + C cos ωt

(2.202)

que satisface las condiciones iniciales q(0) = 0, q(0) ˙ = 0 sólo si A = B = −(1/2)C. C se determina reemplazando (2.202) en (2.201), obteniéndose finalmente para q(t): q(t) =

g (cosh ωt − cos ωt) 2ω 2

(2.203)

Las fuerzas de reacción de las ligaduras se determinan a partir de la ecuaci´ on (2.140): Rx =

m¨ x

Ry =

mg + m¨ y

(2.204)

46 / Mec´ anica cl´ asica avanzada Las ecuaciones (2.197) y (2.203) permiten calcular a x ¨ y y¨: x¨

= q¨ senωt + 2qω ˙ cos ωt − qω 2 senωt − hω 2 cos ωt

(2.205)

y¨ = −q cos ωt + 2qω ˙ senωt + qω 2 cos ωt − hω 2 senωt Con lo cual se obtiene para Rx y Ry: Rx = mg(senhωt + 2senωt) cos ωt − mhω 2 cos ωt Ry

(2.206)

= mg(senhωt + 2senωt)senωt − mhω 2 senωt

El vector ~l est´ a dirigido a lo largo del alambre: ~l = îsenωt − ˆj cos ωt

(2.207)

~ es cero: ~l· R ~ = 0 o sea que R ~ es siempre perpendicular El producto escalar de ~l con R al alambre. Su magnitud es: R = mg(senhωt + 2senωt) − mhω 2 (2.208)

2.8.

Las ecuaciones de la din´ amica en coordenadas generalizadas para sistemas no hol´ onomos. Uso de coordenadas no independientes

Con sistemas no hol´ onomos no es posible, mediante la introducción de coordenadas generalizadas independientes, eliminar las condiciones de ligadura. Por alguna raz´ on ser´ıa deseable trabajar con un conjunto de 3N coordenadas no cartesianas q1 , q2 , ... q3N , que no serán independientes. Incluso ser´ıa posible trabajar con un conjunto de 3N − h coordenadas generalizadas no independientes definido de tal manera que se eliminen del problema las ligaduras hol´ onomas. En cualquiera de estos dos casos debemos trabajar con coordenadas generalizadas no independientes. Se trata de hallar las ecuaciones de movimiento usando estas coordenadas. Para ello basta partir de las ecuaciones de Lagrange de la segunda clase, ecuaciones (2.181), considerando esta vez las Qν como formadas de las fuerzas aplicadas y de las fuerzas de ligadura (2.159): ! h N n X X X ∂f ∂~ri α (a) λα F~i + Qν = + µα~lαi · ∂~ r ∂q i ν α=1 α=1 i=1 ν = 1, 2, ... 3N

(2.209)

definimos las cantidades dα y aαν de la siguiente manera: ∂fα ; dα = ∂t

aαν =

N X ∂fα i=1

∂~ri

·

∂~ri ∂fα = ∂qν ∂qν

para α = 1, 2, ... h

(2.210)

Ecuaciones generales de la est´ atica y la dinámica / 47

dα = Dα ;

aαν =

N X

~lα · ∂~r1 ∂qν i=1 para α = h + 1, h + 2, ... h + n = k

(2.211)

Con lo cual podemos escribir a (2.209) como: Qν = Q(a) ν +

k X

λα aαν

(2.212)

α=1

donde esta vez λα representan los k multiplicadores de Lagrange λ1 , λ2 , ... λh , µ1 , µ2 , ... µn . Las ecuaciones de Lagrange de la segunda clase se pueden escribir entonces en la forma: k X ∂T d ∂T − = Qν(a) + λα aαν ; dt ∂ q˙ν ∂qν α=1

ν = 1, 2, ... 3N

(2.213)

En resumen, con las coordenadas generalizadas q1 , q2 , ... q3N las ecuaciones de ligadura se pueden escribir en la forma: 3N X

aαν q˙α + dα = 0 ;

α = 1, 2, ... h, h + 1, h + 2, ... h + n = k

(2.214)

α=1

que junto con las 3N ecuaciones de Lagrange nos proporcionan 3N + k ecuaciones con las 3N + k inc´ ognitas siguientes: q1 , q2 , ... q3N , λ1 , λ2 , ... λh , µ1 , µ2 , ... µn . Las fuerzas de reacci´ o n de las ligaduras en estas coordenadas no independientes estar´ an dadas por Pk λ a , o m´ a s expl´ ıcitamente: α=1 α αν h X

n

∂fα X + µα aαν Rν = λα ∂qα α=1 α=1

(2.215)

Ejemplo 2.8.1 Resolver el problema del ejemplo 2.7.1 usando multiplicadores de Lagrange y coordenadas no independientes. Tomaremos a q y h como coordenadas generalizadas no independientes. En la ecuaci´ on de ligadura escribiremos a la distancia OC como h0 : f (x, y, t) = x cos ωt + y senωt − h0

(2.216)

Haciendo la transformaci´ on de las coordenadas x, y a las coordenadas q, h, ecuaci´ on (2.197), obtenemos para ~r y f : f (q, h, t) = h − h0

(2.217)

~r(q, h, t) = q(î senωt − ˆj cos ωt) + h(î cos ωt + ˆj senωt)

(2.218)

48 / Mec´ anica cl´ asica avanzada con lo cual se obtienen las siquientes expresiones para los coeficientes aq , ah , d, seg´ un (2.210): aq =

∂f =0 ∂q

ah =

∂f =1 ∂h

(2.219)

∂f =0 ∂t Las fuerzas aplicadas generalizadas serán: d=

∂~r Qν = −mg î · ∂qν

(2.220)

con lo cual: Qh = −mg senωt ;

Qq = mg cos ωt

(2.221)

La energ´ıa cinética será: ˙ + h˙ 2 ) ˙ t) = 1 m(q˙2 + q 2 ω 2 + h2 ω 2 − 2qhω ˙ + 2q hω T (q, q, ˙ h, h, 2

(2.222)

Entonces las ecuaciones (2.213) serán: ˙ − m(qω 2 + hω) ˙ m(¨ q − hω) = mg cos ωt

(2.223)

¨ + qω) m(h ˙ − m(hω 2 − qω) ˙ = −mg sen ωt + λ La ecuaci´ on (2.214) será: h˙ = 0 ⇒ h = h0

(2.224)

Reemplazando (2.224) en (2.223) obtenemos: q¨ − qω 2 = g cos ωt

(2.225)

λ = 2qω ˙ − hω 2 + g senωt m La solución de las ecuaciones (2.225) de acuerdo con (2.224) será: g (cosh ωt − cos ωt) q = 2ω 2 λ

= mg(senhωt + 2senωt) − mhω

(2.226)

2

Las fuerzas generalizadas de ligadura serán, de (2.226) y (2.215): Rh = mg(senhωt + 2senωt) − mhω 2 ;

Rq = 0

en completo acuerdo con los resultados de (2.208).

(2.227)

Ecuaciones generales de la est´ atica y la dinámica / 49 Ejemplo 2.8.2 Sea un disco de radio R que rueda sobre un plano inclinado con el plano del disco perpendicular al plano inclinado (podr´ıa ser una de las ruedas de un carro). Hallar y resolver las ecuaciones de movimiento. Tomaremos el plano xy en el plano inclinado, con lo cual se tendrá una configuración como en la figura 2.1. Las coordenadas del sistema serán: xCM , yCM , α, φ, que tomamos como coordenadas genaralizadas no independientes. De las ecuaciones de ligadura, no hol´ onomas dadas por las ecuaciones (2.9): x˙ − R senα φ˙ = 0

(2.228)

y˙ + R cos α φ˙ = 0 obtenemos las siquientes expresiones para los coeficientes aαν que aparecen en (2.214): a1x = 1

a1y = 0

a1α = 0

a1φ = −R senα

a2x = 0

a2y = 1

a2α = 0

a2φ = R cos α

(2.229)

Los momentos de inercia de un disco alrededor de su eje y alrededor de un diámetro son respectivamente: 1 1 mR2 ; Iα = mR2 (2.230) 2 4 La energ´ıa cinética contendrá una parte debida al movimiento del centro de masa y otra debida al movimiento respecto al centro de masa:2 Iφ =

1 1 1 m(x˙ 2 + y˙ 2 ) + mR2 φ˙ 2 + mR2 α˙ 2 (2.231) 2 4 8 Tomaremos los ejes xy de modo que el eje x esté horizontal y el eje y haciendo un ángulo β con la horizontal. Las fuerzas generalizadas serán entonces: T =

(a)

Q(a) α = Qφ = 0 ;

Q(a) x = 0;

Q(a) y = mg senβ

(2.232)

Usando las ecuaciones (2.229), (2.231) y (2.232), las ecuaciones (2.213) se transforman en: m¨ x = µ1 m¨ y = mg senβ + µ2 1 2 R m¨ α= 0 4

(2.233)

1 2 ¨ R mφ = −µ1 R senα + µ2 R cos α 2 La tercera de las ecuaciones (2.233) nos da: α = ωα t + α0 2 Para

una justificaci´ on rigurosa de (2.231) ver secci´ on 8.3.

(2.234)

50 / Mec´ anica cl´ asica avanzada Las dos primeras ecuaciones (2.233) junto con las (2.228) nos dan las siguientes expresiones para µ1 y µ2 en términos de φ: µ1 = mRωα cos(ωα t + α0 ) φ˙ + mR cos(ωα t + α0 ) φ¨ (2.235) µ2 = mRωα sen(ωα t + α0 ) φ˙ − mR cos(ωα t + α0 )φ¨ − mg sen β

Ahora, reemplazando a µ1 y µ2 en la u ´ltima de las (2.233) obtenemos: 2 g φ¨ = − senβ cos(ωα t + α0 ) 3 R que al ser integrada nos da: 2g senβ cos(ωα t + α0 ) + At + B φ= 3Rωα2 ˙ = 0, (2.237) será: Tomando la condición inicial φ(0) = 0 y φ(0) 2g senβ[cos(ωα t + α0 ) − cosα0 + ωt senα0 ] φ= 3Rωα2

(2.236)

(2.237)

(2.238)

Tomando además a α0 = 0, lo que equivale a tomar en t=0 a α = 0, obtenemos: α

= ωα t

φ

=−

µ1 µ2

2gsenβ ωt sen2 3Rωα2 2

2 = − mg senβsen2ωα t 3 2 = −mgβ 1 − cos 2ωα t 3

x

g senβ =− 3ωα2

y

=

(2.239)

1 ωα t − sen2ωα t 2

gsenβ sen2 ωα t 3ωα2

Donde hemos tomado que x = 0, y = 0, x˙ = 0, y˙ = 0 en t = 0. Las fuerzas de reacción de las ligaduras serán, usando (2.215): Rx = µ1 Ry = µ2 Rα = 0 Rφ = −µ1 R senωα t + µ2 R cos ωα t 1 = − mgR senβ cos ωα t 3

(2.240)

Ecuaciones generales de la est´ atica y la dinámica / 51 Si se deja la rueda inicialmente alineada en el eje y, se tiene que ωα = 0, con lo cual: α=

0

φ=

−

x=

0

y=

1 gsenβ t2 3

g senβ 2 t 3R

Rx =

0

Ry =

1 − mg senβ 3

Rα =

0

(2.241)

1 − mgR senβ 3

R=

Si en vez de un disco se tuviera una masa que baja sin rozamiento a lo largo del eje y, la fuerza a lo largo del plano ser´ıa mg senβ. En este caso se tiene que el plano ejerce sobre la rueda una fuerza en y dada por (−1/3)mg senβ y que la hace rodar hacia abajo en la direcci´ on de y positiva. Rφ es el torque que produce la rotación. La aceleraci´ on del centro de masa será (2/3)g senβ con lo cual y = (1/3) senβ t2 y φ = (1/3)g senβ t2 /R. Ejemplo 2.8.3 Sean dos part´ıculas de masas m1 = m2 = 1 unidas por una varilla r´ıgida de longitud l, sin masa. El sistema de alguna manera est´ a constre˜ nido a moverse en un plano vertical, de modo que la velocidad del centro de masa siempre est´ a en la direcci´ on de la varilla (véase figura 2.12). Hallar y resolver las ecuaciones de movimiento.

x r1 r r2

1 · α

g

2 y Figura 2.12 Part´ıculas de masas m1 = m2 = 1 unidas por una varilla r´ıgida y constreñidas a moverse en un plano vertical

52 / Mec´ anica cl´ asica avanzada La ligadura hol´ onoma es: |~r1 − ~r2 | = l

(2.242)

La ligadura no hol´ onoma es: x˙ = tan α y˙

(2.243)

Escogemos como coordenadas generalizadas no independientes a x, y y α. Definimos el vector ~l como: ~l = ~r1 − ~r2

(2.244)

con magnitud l y direcci´ on α. Las ecuaciones de transformaci´ on de coordenadas son: ~r1 = ~r +

~l 2

(2.245)

~l ~r2 = ~r − 2 La energ´ıa cinética se puede escribir como: 1 T = x˙ 2 + y˙ 2 + l2 α˙ 2 4

(2.246)

Los coeficientes en la ecuaci´ on de ligadura no hol´ onoma son: ax = − tan α ;

ay = 1 ;

aα = 0

(2.247)

La fuerza aplicada generalizada es: Qx = 0 ;

Qy = 2g ;

Qα = 0

(2.248)

Las ecuaciones de Lagrange, (2.213), serán: 2¨ x=

−µ tan α

2¨ y − 2g =

µ

1 2 l α ¨= 2

0

(2.249)

Para α se halla: α = ωt + δ

(2.250)

x, y y µ se hallan de las ecuaciones: 2¨ x=

−µ tan(ωt + δ)

2¨ y=

2g + µ

y˙ − x˙ tan(ωt + δ) =

0

(2.251)

Ecuaciones generales de la est´ atica y la dinámica / 53 x˙ obedece la ecuaci´ on diferencial: 2¨ x + 2xω ˙ tan α = g sen2α

(2.252)

Esta es una ecuaci´ on diferencial lineal de primer orden en x˙ cuya solución general est´ a dada por una f´ ormula est´ andar. La solución para x˙ es: x˙ = −

g (1 + cos 2α) + A cos α 2ω

(2.253)

Su integral nos da directamente: x=−

A g (2ωt + sen2α) + senα + B Aω 2 ω

(2.254)

donde A y B son constantes de integraci´ on. Para y y µ se halla: y=

A g cos 2α − cos α + C 2 4ω ω

µ = −2g(1 + cos 2α) + 2Aω cos α

(2.255) (2.256)

Las fuerzas de reacción de las ligaduras serán: Rx =

2g sen2α − 2Aω senα

Ry =

−4g cos 2α + 2Aω cos α

Rα =

0

(2.257)

Se sigue que si al sistema se aplica una fuerza dada por (2.257), se moverá con la condición de ligadura (2.243). ω, δ, A, B, y C son constantes de integraci´ on que dependen de las condiciones iniciales.


3 El principio de Hamilton y las ecuaciones de Lagrange 3.1.

Forma integral de la ecuaci´ on general de la din´ amica para un sistema hol´ onomo

Trayectorias variadas. La ecuaci´ on general de la dinámica, ecuaci´ on (2.141), es válida en cada instante t, ya que por definición los δ~ri se realizan instant´ aneamente alrededor de la posición real del sistema. La ecuaci´ on general de la dinámica es un “principio diferencial” que expresa la anulaci´ on del trabajo virtual de las fuerzas de ligadura en cada instante t, o equivalentemente en cada configuración del sistema. Tomemos fijos t1 y t2 . Si en cada instante t, entre t1 y t2 , se realiza un desplazamiento virtual en las coordenadas de cada part´ıcula, δ~ri (t), y se impone la condición δ~ri (t1 ) = δ~ri (t2 ) = 0 se obtendr´ a que la secuencia de desplazamientos virtuales define una trayectoria diferente entre t1 y t2 . A esta trayectoria se le denomina “trayectoria variada” y la trayectoria seguida por el sistema se denomina “trayectoria real” (véase figura 3.1 ). La funci´ on del tiempo ~ri (t) determina la trayectoria real y la funci´ on ~ri (t) + δ~ri (t) determina la trayectoria variada. A la funci´ on δ~ri (t) se le denomina la “variación” de la funci´ on ~ri (t). También se suele llamar “trayectoria recta” a la real y “trayectoria circuitosa” a la variada (véase figura 3.1). ~ri (t) es una representación paramétrica de la trayectoria con par´ ametro t. De acuerdo con los comentarios de la secci´ on 2.3, el conjunto de desplazamientos virtuales en un tiempo t puede asociarse a un “ensamble” muy grande de sistemas. Las trayectorias se forman uniendo un elemento de una “fila”, t, a un elemento de la “fila” t + dt, en forma de “zig-zag” en la matriz bidimensional mencionada en la secci´ on 2.3; una trayectoria será “recta”; todas las dem´ as serán “circuitosas”. Si el trabajo virtual de las fuerzas de ligadura es cero en cada instante t: N X i=1

~ i (t) · δ~ri (t) = 0, R

(3.1)

también será cero el promedio de los trabajos virtuales realizados por las fuerzas de 55

56 / Mec´ anica cl´ asica avanzada z Trayectoria variada

2

δri mi 1 Trayectoria real ri y x

Figura 3.1 Representación de trayectorias en desplazamientos virtuales

ligadura entre t1 y t2 : 1 t2 − t1

Z

N t2 X

t1

i=1

~ i (t) · δ~ri (t)dt = 0 R

(3.2)

Como consecuencia de lo anterior, la ecuaci´ on general de la dinámica toma la forma: Z

N h t2 X

t1

i=1

i (a) F~i (t) − mi~¨r i (t) · δ~ri (t)dt = 0

(3.3)

Esta es una expresión integral, en términos ya no de desplazamientos virtuales sino de variaciones globales de las trayectorias de las part´ıculas. Transformando la ecuaci´ on (3.3) llegaremos a una expresión completamente equivalente a la ecuaci´ on general de la din´ amica y por lo tanto a las ecuaciones de Lagrange de la primera y de la segunda clase, para sistema hol´ onomos. Cada punto de la trayectoria variada se puede obtener de un punto de la trayectoria real, para cada una de las part´ıculas, por medio de un desplazamiento virtual. Como consecuencia de esto, tanto la trayectoria real como la variada han de ser compatibles con las condiciones de ligadura. En cada instante t podemos escribir los δ~ri como: δ~ri (t) = ~ri v (t) − ~ri r (t)

(3.4)

donde v denota “variada” y r “real”. Se impone la condición de que las variaciones se anulen en t1 y en t2 para cada part´ıcula. Es decir que ~riv (t) = ~rir (t) en t = t1 y t = t2 para i = 1, 2, ...N .

El principio de Hamilton y las ecuaciones de Lagrange / 57 La integral de acci´ on. Es la integral (3.3) haciendo algunas transformaciones. En la ecuaci´ on (3.3) hacemos la siguiente transformaci´ on: d ˙ d mi~¨r i · δ~ri = mi~ri · δ~ri − mi~r˙ i · (δ~ri ) (3.5) dt dt Notando que las operaciones δ y d/dt conmutan:

d d (δ~ri ) = [~ri v (t) − ~ri r (t)] = ~r˙ i v − ~r˙ i r = δ~r˙ i dt dt

(3.6)

podemos escribir a (3.5) en la forma: 1 2 d ˙ mi~ri · δ~ri − mi δ~r˙ i mi~¨r i · δ~ri = dt 2

(3.7)

Con lo cual se tiene que:

N X

N X

d mi~¨r i · δ~ri = dt i=1

i=1

mi~r˙ i · δ~ri

!

−δ

N X 1 i=1

2

2

mi~r˙ i

Por tanto la ecuaci´ on (3.3) tomará la forma: # " ! Z t2 X N N N X 2 d X ˙ (a) ˙ ~ mi~ri dt = 0 Fi · δ~ri − mi~ri · δ~ri + δ dt i=1 t1 i=1 i=1

(3.8)

(3.9)

Notamos que en (3.9) aparecen el trabajo virtual de las fuerzas aplicadas, δA, y la energ´ıa cinética:1 N X

N

1 X ˙2 mi~ri 2 i=1

(3.10)

O sea que (3.9) se puede escribir como: t2 Z t2 N X ˙ mi~ri · δ r~i = 0 (δA + δT )dt − t1

(3.11)

δA =

i=1

(a) F~i · δ~ri ;

i=1

T =

t1

En virtud de la condición impuesta a los desplazamientos virtuales en t = t1 y t = t2 , el término integrado se anula con lo cual (3.11) queda finalmente: Z t2 (δA + δT )dt = 0 (3.12) t1

Podr´ıa pensarse que la presencia de condiciones de ligadura har´ıa que δ~ri (t1 ) = δ~ri (t2 ) = 0 no es posible imponerla para todas las coordenadas sino sólo para las independientes, quedando la posibilidad de que no se cumpla para las coordenadas dependientes. 1 Como para pasar de r a r +δ~ ri se requiere realizar un trabajo, la energ´ıa en cada trayectoria variada i i es diferente. Esto caracteriza al principio de Hamilton, a diferencia de otros principios variacionales como el de “m´ınima acci´ on” (v´ ease secci´ on 9.3).

58 / Mec´ anica cl´ asica avanzada Sin embargo este no es el caso, pues de una transformaci´ on a coordenadas generalizadas independientes q1 , q2 , ...ql se sigue que: δ~ri =

l X ∂~ri δqν ∂qν ν=1

(3.13)

Basta pues que se imponga la condición siguiente sobre los desplazamientos virtuales de las coordenadas generalizadas: δqν (t1 ) = δqν (t2 ) = 0 ;

ν = 1, 2, ...l

(3.14)

para que se satisfaga la condición requerida para los desplazamientos virtuales δ~ri . En el caso particular en que las fuerzas aplicadas se pueden obtener como el gradiente de una funci´ on de las coordenadas y del tiempo, V (~r, t) vemos que: δV (~r, t) =

N X ∂V i=1

∂~ri

.δ~ri = −

N X i=1

(a) F~i .δ~ri = −δA

(3.15)

Para este caso la ecuaci´ on (3.12) toma la forma: Z t2 Z t2 Z t2 L dt = 0 δL dt = δ δ(T − V )dt = t1

t1

(3.16)

t1

donde el segundo signo igual en (3.16) est´ a justificado por lo siguiente: Z t2 Z t2 Z t2 Z t2 Z t2 r v v r L dt L dt = δ L dt − (L − L )dt = δL dt = t1

t1

t1

t1

(3.17)

t1

Por medio de las transformaciones a coordenadas independientes se ve que T es funci´ on de (q), (q), ˙ t, y V es funci´ on de (q) y t, con lo cual (3.16) se puede escribir como: Z t2 L(q, q, ˙ t)dt = 0 (3.18) δS = δ t1

Esta ecuaci´ on es equivalente a la ecuaci´ on general de la dinámica y de ella se pueden obtener también las ecuaciones de Lagrange usando el c´ alculo variacional. A la integral S se la denomina integral de acci´ on

3.2.

El principio de Hamilton

Es posible el desarrollo formal de la mecánica tomando la ecuaci´ on (3.12) como postulado fundamental en vez de partir del principio de D’Alembert, ecuaci´ on (2.141). En este formalismo se denomina al contenido de la ecuaci´ on (3.18), el principio de Hamilton. El principio de Hamilton para sistemas con fuerzas aplicadas derivables de un potencial. El movimiento del sistema, descrito por las coordenadas generalizadas qν (t), es tal que entre dos instantes t1 y t2 se satisface: Z t2 L(q1 , q2 , ...ql ; q˙1 , q˙2 , ...q˙l ; t)dt = 0 (3.19) δ t1

El principio de Hamilton y las ecuaciones de Lagrange / 59 Este es un principio variacional, formulado por W. Hamilton en 1835. Matem´ aticamente (3.19) es la condición para que la acción S sea una extremal. S es una funcional de la trayectoria q(t). En análisis de funciones, se tiene que si F (x1 , x2 , ...xn ) es una funci´ on de muchas variables, F tendrá un valor extremal, máximo o m´ınimo, si al realizar un cambio infinitesimal en las variables F no cambia al primer orden en dichos cambios infinitesimales. Es decir si: F (x1 + δx1 , x2 + δx2 , ...xn + δxn ) − F (x1 , x2 , ...xn )

(3.20)

= δF (x1 , x2 , ...xn ) entonces: δF (x1 , x2 , ...xn ) =

N X ∂F δxi + 0(δx2i ) = 0 ∂x i i=1

(3.21)

Se sigue que F (x1 , x2 , ...xn ) será extremal para aquellos valores de x1 , x2 , ...xn que hacen que se anulen todas las derivadas parciales de primer orden de F : ∂F =0 ∂xi

i = 1, 2, ...n

(3.22)

En el análisis de funciones F (x1 , x2 , ...xn ) es un n´ umero que se asocia al conjunto de n´ umeros x1 , x2 , ...xn . Al cambiar los n´ umeros x1 , x2 , ...xn cambia el n´ umero F . Se dice que F es extremal si no cambia al primer orden en δxi cuando los xi se cambian por xi + δxi . 2 En el análisis funcional I [f1 (x), f2 (x), ...fn (x)] es un n´ umero que se asocia al conjunto de funciones f1 (x), f2 (x), ...fn (x). Al cambiar las funciones f1 (x), f2 (x), ...fn (x) cambia el n´ umero I. Se dice que I es extremal si no cambia al primer orden en δfi (x) cuando las funciones fi (x) se cambian por las funciones fi (x) + δfi (x). A δfi (x) se le denomina variaci´ on de la funci´ on fi (x). Toda funci´ on continua en un punto x0 puede expandirse en serie de Taylor alrededor de x0 : fi (x) =

∞ X 1 (k) f (x0 )(x − x0 )k k! i

(3.23)

k=0 (k)

on fi (x) en x = x0 y donde fi (x0 ) denota el valor de la derivada k-ésima de la funci´ (n) (0) ametros fi (x0 ) para k = 0, 1, 2, ...∞ se obtiene una fi (x0 ) ≡ fi (x0 ). Variando los par´ funci´ on diferente. S es una funcional de qν (t), pues a cada posible solución q1 (t), q2 (t), ...ql (t) le corresponde un valor definido a la integral de acción S. El principio de Hamilton dice que al variar las funciones qν (t) se obtiene el conjunto de funciones verdaderas que describen la evoluci´ on del sistema por hallar qué conjunto es el que hace que S sea una extremal. Para la mayor´ıa de las situaciones f´ısicas se encuentra que S es m´ınima para 2 El m´ aximo o m´ınimo de una funci´ on se halla resolviendo el sistema de ecuaciones algebraicas (3.22), como en la est´ atica. Los extremales de una funcional se hallan resolviendo un sistema de ecuaciones diferenciales, como en la din´ amica.

60 / Mec´ anica cl´ asica avanzada la solución correcta. En otras palabras, S tiene un valor m´ınimo cuando las funciones qν (t) describen las trayectorias reales.3 El n´ umero S asignado a cualquier trayectoria variada es mayor que el n´ umero S asociado a la trayectoria real. Ejemplo 3.2.1 Ilustrar el principio de Hamilton con el problema del tiro parabólico en presencia del campo gravitacional (véase figura 3.2). Sabemos que la trayectoria real est´ a descrita por: 1 2 gt 2 Eliminando el par´ ametro t se obtiene que la trayectoria es parabólica: g 2 x y= 2Vx2 x(t) = Vx t ;

y(t) =

(3.24)

(3.25)

Esta trayectoria pasa por el punto (x = 0, y = 0) en t = 0 y por el punto (x2 , y2 = gx22 /(2Vx2 )) en t = t2 (véase figura 3.2). La siguiente trayectoria variada pasa por los mismos puntos que la trayectoria real en t = t1 = 0 y t = t2 : x = Vx t y = y2

(3.26)

ex/x2 − 1 e−1

Se trata de mostrar que la integral de acción tiene menor valor para la trayectoria real que para esta trayectoria variada. El lagrangiano del problema es: 1 m(x˙ 2 + y˙ 2 ) + mgy 2 Sobre la trayectoria real L es: L=

1 m(Vx2 + g 2 t2 ) + 2 La integral de acción es: Z t2 1 L dt = mVx2 t2 + 2 0 L=

(3.27)

1 1 mg 2 t2 = mVx2 + mg 2 t2 2 2

(3.28)

1 1 x2y2 mg 2 t32 = mVx x2 + 0, 666 mg 3 2 Vx

(3.29)

Sobre la trayectoria variada: x˙ = Vx ;

y˙

y2 Vx eVx t/x x2 (e − 1)

Con lo cual L es: 1 mgy2 Vx t/x2 y22 Vx2 2Vx t/x2 L = m Vx2 + + e − 1) (e 2 2 2 (e − 1) x2 e−1 3 De

(3.30)

(3.31)

acuerdo con el principio de D’Alembert esto equivale a decir que las posiciones verdaderas son de “equilibrio” estable.

El principio de Hamilton y las ecuaciones de Lagrange / 61

P1

x

P2 (x2,y2) g

y

Figura 3.2 Trayectoria parab´ olica en presencia de un campo gravitacional. Trayectoria variada.

La integral de acción es: Z

t2

L dt =

0

1 81e − 60 mgx2 y2 mVx x2 + 2 72(e − 1) Vx

(3.32)

mgx2 y2 1 = mVx x2 + 0,689 2 Vx Vemos que la acción en la trayectoria real es menor que la acción en la trayectoria variada. Cuando no se conoce la trayectoria, es decir cuando no se ha resuelto el problema, el principio de Hamilton directamente no proporciona un método práctico: se requiere un método de ensayo y error; suponer una solución y evaluar S; obtener una “tabla” de soluciones posibles en funci´ on de la acción. La solución correcta ser´ıa aquella para la cual S es m´ınima. Ejemplo 3.2.2 Resolver el problema del oscilador armónico lineal usando directamente el principio de Hamilton, con las siguientes condiciones en t = 0 y t = t1 : x(0) = 0 ,

x(t1 ) = x1 ,

x(0) ˙ = v0

(3.33)

62 / Mec´ anica cl´ asica avanzada Las posibles funciones de t las asumiremos de la forma: ∞ X x(t) = a n tn

(3.34)

n=0

O sea que a cada conjunto de par´ ametros a0 , a1 , a2 , ...a∞ le corresponderá una solución.4 El conjunto de par´ ametros que determina la solución real es aquel para el cual δS = 0. De la condición x(0) = 0 se sigue que a0 = 0, con lo cual: ∞ X a n tn (3.35) x(t) = n=1

El lagrangiano para el oscilador armónico unidimensional es: 1 1 L = µx˙ 2 − kx2 2 2 Reemplazando (3.35) en (3.36) obtenemos: ∞ ∞ ∞ ∞ 1 XX 1 XX L= µ nman am tn+m−2 − k an am tn+m 2 n=1 m=1 2 n=1 m=1 Con lo cual la integral de acción será: Z t1 L dt = S=

(3.36)

(3.37)

0

∞ ∞ nm 1 1XX n+m−1 n+m+1 t t −k an am µ 2 n=1 m=1 n+m−1 1 n+m+1 1

La condición δS = 0 nos da: "∞ # ∞ X X nm 1 am µ tn+m−1 − k tn+m+1 δan = 0 n+m−1 1 n+m+1 1 n=1 m=1

(3.38)

(3.39)

En la ecuaci´ on (3.39) los δan son los cambios de los coeficientes an que dar´ an lugar a la variaci´ on δx(t). Los δan no son independientes, pues se debe además cumplir la condición δx(t1 ) = 0: n X δx(t1 ) = δan tn1 = 0 (3.40) n=1

En virtud de (3.40) un δan puede expresarse en términos de los dem´ as. Vamos a introducir un multiplicador indeterminado λ multiplicando la ecuaci´ on (3.40) por λ y el resultado lo sumamos a la ecuaci´ on (3.39) para obtener: " ∞ ∞ X X mn µ t1n+m−1 n + m − 1 n=1 m=1 (3.41) 1 tn+m+1 am + λtn1 δan = 0 −k n+m+1 1 4 La

ecuaci´ on (3.34) constituye una representaci´ on multiparam´ etrica de la trayectoria en el espacio de configuraci´ on.

El principio de Hamilton y las ecuaciones de Lagrange / 63 Ahora escogemos a λ de modo que se anule el coeficiente de δa1 : ∞ X 1 m+2 µtm − k am + λt1 = 0 t 1 m+2 1 m=1

(3.42)

En la ecuaci´ on (3.41) quedará una combinaci´ on lineal de los δa2 , δa3 , ...δa∞ , igualada a cero. Como estas cantidades son ahora independientes, se debe cumplir que sus coeficientes se anulen. Igualando a cero los coeficientes de δa2 , δa3 , ...δa∞ y reemplazando el valor de λ que se obtiene de (3.42), llegamos a: ∞ X m−1 m 1 m+2 µ am = 0 (3.43) t +k t m+n−1 1 (m + 2)(m + n + 1) 1 m=1 De (3.43) se obtiene la siguiente relación de recurrencia para coeficientes, por igualar a cero los coeficientes de las tm 1 : am = −

k 1 am−2 ; µ m(m − 1)

m = 2, 4, ...

(3.44)

Como a0 = 0, se sigue que: a0 = a2 = a4 = ... = 0

(3.45)

Los coeficientes impares se pueden expresar en términos de a1 , que se determina de la condición x(0) ˙ = v0 : a1 = v0

(3.46)

Con lo cual se obtiene que: (m−1)/2 k (m−1)/2 1 v0 ; am = (−1) m! µ

m = 1, 3, ...

(3.47)

o también en la forma: a2n+1 = (−1)n

n k 1 v0 ; µ (2n + 1)!

n = 0, 1, 2, ...

(3.48)

Con lo cual x(t) será: x(t) = v0

r

∞ 1 µX (−1)n k n=0 (2n + 1)!

Llamando ω = x(t) =

s !2n+1 k µ

p k/m llegamos a:

v0 sen(ωt) ω

Claramente el método es engorroso en problemas más complicados.

(3.49)

(3.50)

64 / Mec´ anica cl´ asica avanzada Deducci´ on de las ecuaciones de Lagrange a partir del principio de Hamilton generalizado. La ecuaci´ on (3.12) se denomina el principio de Hamilton generalizado. Es aplicable a cualquier sistema hol´ onomo independientemente de la naturaleza de las fuerzas aplicadas. Como T es una funci´ on de (q), (q), ˙ t, δT (q, q, ˙ t) =

l X ∂T

ν=1

∂T δqν + δ q˙ν ∂qν ∂ q˙

(3.51)

En tanto que δA puede escribirse en términos de las fuerzas generalizadas Qν : δA =

N X i=1

(a) F~i · δ~ri =

l X

Qν δqν

(3.52)

ν=1

En δT podemos hacer la transformaci´ on siguiente: ∂T d ∂T ∂T d d ∂T δqν δ q˙ν = δqν − δqν = ∂ q˙ν ∂ q˙ dt dt ∂ q˙ν dt ∂ q˙ν

(3.53)

Reemplazando (3.51), (3.52) y (3.53) en la ecuaci´ on (3.12): Z t2 (δA + δT )dt = t1

l t1 X

Z

Qν δqν +

t1 ν=1

d ∂T − ∂qν dt

∂T ∂ q˙ν

δqν

dt

(3.54)

t2 δqν = 0 + ∂ q ˙ ν ν=1 l X ∂T

t1

La parte integrada en (3.54) es nula debido a que las δqν se anulan en t = tl y t = t2 , con lo cual se llega a: ) Z t1 (X l ∂T d ∂T (3.55) Qν + δqν dt = 0 − ∂qν dt ∂ q˙ν t1 ν=1 Como las δqν son arbitrarias, el integrando es una funci´ on arbitraria del tiempo; si la integral es cero, es necesario entonces que el integrando sea cero. Ahora queda una combinaci´ on lineal de las cantidades independientes δqν igualada a cero, l X ν=1

∂T d Qν + − ∂qν dt

∂T ∂ q˙ν

δqν = 0

Como las δqν son independientes, se debe cumplir también que: d ∂T ∂T = 0 ; ν = 1, 2, ...l − Qν + ∂qν dt ∂ q˙ν

(3.56)

(3.57)

El principio de Hamilton y las ecuaciones de Lagrange / 65 A estas ecuaciones no podr´ıamos haber llegado cuando el sistema es no hol´ onomo. Estas ecuaciones son las correspondientes ecuaciones en c´ alculo funcional a las ecuaciones (3.22) del c´ alculo de funciones, a las cuales se reducen en el caso est´ atico cuando las fuerzas son derivables de un potencial. Hemos llegado a las ecuaciones de Lagrange de la segunda clase a partir del principio de Hamilton. Supongamos que las fuerzas aplicadas se pueden descomponer en una parte derivable de un potencial monogénico y otra no derivable de tal potencial. Se entiende por potencial monogénico o potencial generalizado a una funci´ on de las coordenadas, las velocidades y el tiempo, a partir de la cual se pueden derivar todas las fuerzas monogénicas del sistema, mediante las f´ ormulas: ∂V d ∂V (a) F~i = − + + F~i′ ; ∂~ri dt ∂~r˙ i

i = 1, 2, ...N

(3.58)

Las fuerzas generalizadas correspondientes serán: Qν = −

d ∂V ∂V + + fν ; ∂qν dt ∂ q˙ν

ν = 1, 2, ...l

(3.59)

donde fν es la fuerza generalizada correspondiente a las fuerzas F~i′ . Es posible con este tipo de fuerzas definir una funci´ on lagrangiana asociada a las fuerzas derivables del potencial generalizado. fν contiene las fuerzas no incluidas en L. Las ecuaciones de Lagrange toman la forma: d ∂L ∂L − + fν = 0 ; ∂qν dt ∂ q˙ν

ν = 1, 2, ...l

(3.60)

donde L est´ a definido como: L(q, q, ˙ t) = T (q, q, ˙ t) − V (q, q, ˙ t)

(3.61)

El lagrangiano para N part´ıculas en un campo electromagn´ etico. Sea un sistema de part´ıculas cargadas en presencia de un campo electromagnético descrito por ~ r , t) y B(~ ~ r , t). La fuerza de interacci´ los campos E(~ on con la part´ıcula i es: ~ ri , t) + qi ~ri × B(~ ~ ri , t) F~i ~ri , ~r˙ i , t = qi E(~ (3.62) c

Los campos eléctrico y magnético se pueden derivar de los potenciales escalar y ~ vectorial φ, A: ~ r , t) ∂φ(~r, t) 1 ∂ A(~ − ∂~r c ∂t

~ r , t) = E(~

−

~ r , t) = B(~

∂ ~ r , t) × A(~ ∂~r

Entonces F~i se puede escribir como: ∂φ(~ri , t) 1 ∂A(ri~, t) 1 ∂ ~ ri , t) F~i (~ri , ~r˙ i , t) = qi − − + r~i × × A(~ ∂~ri c ∂t c ∂~ri

(3.63)

(3.64)

66 / Mec´ anica cl´ asica avanzada Algunas manipulaciones con el rotacional nos llevan a:5 ~ ~ ∂ ~ ri , t) = ∂ ~r˙ i · A ~ i − dAi + ∂ Ai ~r˙ i × × A(~ ∂~ri ∂~ri dt ∂t

(3.65)

Con lo cual (3.63) se puede escribir como: F~i ~ri , ~r˙ i , t =

(3.66)

Como φ no depende de ~r˙ i : F~i ~ri , ~r˙ i , t =

(3.67)

∂ ∂ ˙ ~ 1 ~ ri , t) − 1 d qi − ~ri · A(~ri , t) φ(~ri , t) − ~r˙ i · A(~ ∂~ri c c dt ∂~r˙ i

qi

∂ − ∂~ri

1˙ 1 d ∂ 1˙ ~ φi − ~ri · Ai φi − ~ri · Ai + c c dt ∂~r˙ i c

Si se define la funci´ on V :

" # N X ˙i ~ r ~ ri , t) , qi φ(~ri , t) − · A(~ V ~r1 , ~r2 , ...~rN , ~r˙ 1 , ~r˙ 2 , ...~r˙ N , t = c i=1

(3.68)

las fuerzas de interacci´ on con el campo electromagnético se pueden derivar del potencial monogenico V : ∂V d ∂V F~i = − + ∂~ri dt ∂~r˙ i

(3.69)

Entonces el lagrangiano de un sistema de part´ıculas en un campo electromagnético puede escribirse como: " !# N X 1 ˙2 ~r˙ i ~ ˙ ˙ ˙ L(~r1 , ~r2 , ...~rN , ~r1 , ~r2 , ...~rN , t) = (3.70) mi~ri − qi φi − · Ai 2 c i=1 En este lagrangiano no est´ an incluidas las fuerzas de interacci´ on de las part´ıculas entre s´ı. Fuerzas viscosas. Son un tipo de fuerzas que no se pueden derivar de un potencial. Para muchos casos de interés se pueden escribir en la forma: F~i′ = −~k.~r˙ i

(3.71)

Se define la funci´ on de disipación de Rayleigh como: N

5 Ver

1X F= kx x˙ 2i + ky y˙ i2 + kz z˙i2 2 i=1 el texto Mec´ anica cl´ asica de Goldstein, 1a ed, secci´ on 1.5. ¯

(3.72)

El principio de Hamilton y las ecuaciones de Lagrange / 67 Las fuerzas viscosas (3.71) se pueden obtener como el gradiente de velocidades de F:

∂F F~i = − ∂~r˙ i

(3.73)

La fuerza generalizada correspondiente será: Fν =

N X i=1

Fi′ ·

N X ∂~ri ∂F ∂~r˙ i ∂F · =− =− ˙ i ∂ q˙ν ∂qν ∂ q˙ν ∂ ~ r i=1

(3.74)

Para el caso en que las fuerzas no potenciales sean todas viscosas, las ecuaciones de Lagrange toman la forma: ∂L ∂F d ∂L − + = 0; dt ∂ q˙ν ∂qν ∂ q˙ν

ν = 1, 2, ...l

(3.75)

de modo que deben darse dos funciones escalares, L y F , para obtener las ecuaciones de movimiento. Estas serán las ecuaciones a aplicarse en el caso de un sistema de osciladores amortiguados por ejemplo; L contiene las fuerzas de “resorte” y F las fuerzas disipativas.

3.3.

Algunas propiedades de la funci´ on lagrangiana

Aditividad de L. Si el sistema consta de dos partes, A y B, que no interact´ uan, entonces el lagrangiano del sistema se descompone en dos partes: L = LA + LB . Donde LA contiene sólo las coordenadas y velocidades de la parte A y similarmente LB . Es el caso de dos part´ıculas que se mueven en presencia de un campo externo sin interactuar entre s´ı. También en el caso de un sistema de part´ıculas que interact´ uan entre s´ı pero no con un campo externo, L se puede descomponer en una parte que contiene sólo las coordenadas y velocidades del centro de masa y otra que sólo contiene las coordenadas y velocidades de las part´ıculas respecto al centro de masa: no hay interacci´ on del movimiento del centro de masa con el movimiento respecto al centro de masa. Adici´ on a L de una derivada total respecto al tiempo de una funci´ on arbitraria. Sean dos funciones lagrangianas, que dependen de las mismas coordenadas y velocidades generalizadas, tales que difieren por una derivada total respecto al tiempo: L′ (q, q, ˙ t) = L(q, q, ˙ t) +

d f (g, t) dt

(3.76)

Las integrales de acción de L y de L′ tienen valores extremales simult´ aneamente: S ′ = S + f [q(t2 ), t2 ] − f [q(t1 ), t1 ]

(3.77)

Como δq(t2 ) = δq(t1 ) = 0 se sigue que δS ′ = δS = 0. Esto implica que L y L′ dan lugar a las mismas ecuaciones de movimiento; a este resultado se puede llegar de manera más convincente transformando las ecuaciones de Lagrange mismas.6 que eiS/¯h es el l´ımite cl´ asico de la funci´ on de onda Ψ. Entonces la arbitrariedad de f implica una arbitrariedad en la fase de Ψ. 6 Veremos

68 / Mec´ anica cl´ asica avanzada Ejemplo 3.3.1 Sea una part´ıcula libre, descrita en un sistema de referencia inercial O mediante el lagrangiano. L=

1 ˙2 m~r 2

(3.78)

Si se realiza una transformaci´ on de Galileo, a un nuevo sistema de referencia inercial O′ que se mueve respecto a O con velocidad constante V~ : ~ ~υ = ~υ ′ + V

(3.79)

Entonces el lagrangiano en el nuevo sistema de referencia inercial será: 1 2 1 1 ~ +V ~2 (3.80) L′ = m~r˙ ′2 = m~r˙ + m −2~r · V 2 2 2 Los dos lagrangianos est´ an relacionados as´ı: d m ~ 2t L′ = L + −2~r · V~ + V (3.81) dt 2 A la funci´ on: m ~ +V ~ 2t −2~r · V (3.82) f (r, t) = 2 por razones que se verán más adelante, se le denomina “función generadora de la transformaci´ on de Galileo”. Vemos que: m ~ − 2~r2 · V ~ +V ~ 2 t2 − ~υ 2 t1 S′ = S + (3.83) 2~r1 · V 2

y por tanto δS ′ = δS dado que δ~r = δ~r ′ = 0 en t = t1 y t = t2 .

3.4.

Simetr´ıas de la lagrangiana y teoremas de conservaci´ on

Simetr´ıa. Se dice que L posee una simetr´ıa cuando no cambia bajo una transformaci´ on de las coordenadas y del tiempo. Por ejemplo, sea una part´ıcula libre, cuyo lagrangiano esté dado por (3.78). Se le realiza un desplazamiento de la part´ıcula por una cantidad arbitraria ~a, ~r → ~r + ~a

(3.84)

como ~a˙ = 0, se sique que L no cambia. Se dice que este lagrangiano es simétrico bajo translaciones. Veremos que esta simetr´ıa est´ a asociada a la conservaci´ on del momento lineal. Si se realiza una rotación arbitraria de la part´ıcula, digamos alrededor del eje z por un ´ angulo α, x

→ x cos α + y senα

y

→ −x senα + y cos α

z

→ z

(3.85)

El principio de Hamilton y las ecuaciones de Lagrange / 69 y L no cambia, se dice que L es simétrico bajo rotaciones alrededor del eje z arbitrarias. Veremos que esta simetr´ıa est´ a asociada con la conservaci´ on del momento angular. Si se realiza una inversi´ on de las coordenadas, x, y, z → −x, −y, −z

(3.86)

y L no cambia, esto implica la conservaci´ on de la paridad: L es siempre par o impar en el transcurso del movimiento. Al aplicar un campo externo las simetr´ıas de L dependerán de las simetr´ıas del campo. Si el campo tiene menor simetr´ıa que el lagrangiano libre, el nuevo lagrangiano tendrá la simetr´ıa del campo. Supongamos que se coloca una fuerza constante y uniforme en la direcci´ on z. L ahora será: L=

1 ˙2 m~r + Fz z 2

(3.87)

Las simetr´ıas de L son alteradas. Bajo la transformaci´ on de translaci´ on espacial, (3.84): L → L + Fz az

(3.88)

L se altera a no ser que az sea cero. Ya no habr´ a simetr´ıa de translaci´ on a lo largo del eje z. Veremos que esto implica que sólo son constantes las componentes x y y del momento lineal. L no cambia bajo rotaciones alrededor del eje z (a lo largo del cual act´ ua la fuerza), pero obviamente no tendrá simetr´ıa de rotación alrededor de ning´ un otro eje. Antes de aplicar la fuerza, L ten´ıa simetr´ıa de rotación alrededor de cualquier eje (simetr´ıa esférica), ahora sólo tiene simetr´ıa de rotación en el eje z (simetr´ıa cil´ındrica). Esta simetr´ıa implica que sólo se conserva la componente z del momento angular, en tanto que en ausencia del campo se conservan las tres componentes. En general, hay una relación entre las simetr´ıas de L y las variables dinámicas que se conservan. Variables din´ amicas. A cualquier funci´ on del estado del sistema y del tiempo se le llama una variable din´ amica. Para un sistema con l grados de libertad las variables din´ amicas son de la forma Dα (q1 , q2 , ...ql , q˙1 , q˙2 , ...q˙l , t). Ejemplos de variables dinámicas son: ~ri ; P~ =

mi~r˙ i ; N X i=1

mi~r˙ i ;

~li = mi~ri × ~r˙ i ; ~ = L

N X i=1

mi~ri × ~r˙ i ;

(3.89) T =

N X 1 i=1

2

2 mi~r˙ i

(3.90)

Obviamente es posible definir un n´ umero infinito de variables dinámicas para un sistema dado, pero sólo hay un n´ umero de variables dinámicas independientes igual al doble del n´ umero de grados de libertad. En efecto, sólo es posible formar conjuntos de 2l funciones independientes de q1 , q2 , ... ql , q˙1 , q˙2 , ...q˙l , pero pueden definirse muchos conjuntos diferentes. En general las 2l variables dinámicas independientes de un sistema no son constantes de movimiento, aunque en principio siempre es posible encontrar un

70 / Mec´ anica cl´ asica avanzada conjunto de 2l constantes de movimiento, si el sistema es integrable. Constantes de movimiento. Las ecuaciones de Lagrange dan lugar a un sistema de l ecuaciones diferenciales acopladas de segundo orden con 2l inc´ ognitas, q1 , q2 , ...ql , q˙1 , q˙2 , ...q˙l , independientes entre s´ı. La solución a las ecuaciones de movimiento contendrá 2l constantes de integraci´ on arbitrarias que determinan los valores iniciales de (q) y (q). ˙ En el cap´ıtulo 1 se definió la especificaci´ on del estado del sistema mecánico en un tiempo t por medio de los valores de las coordenadas y velocidades en ese instante. Ahora vemos que las constantes de integraci´ on determinan no sólo el estado en el tiempo inicial, sino además todos los estados subsiguientes. Con sólo dar valores a t, para unos valores dados de las constantes de integraci´ on, se obtienen los valores correspondientes de las variables de estado. Las constantes de integraci´ on suministran una noción global de estado: se dice que a cada conjunto de valores de las constantes de integraci´ on le corresponde un estado de movimiento del sistema. El tiempo inicial, o comienzo del movimiento, siempre puede tomarse como una de las constantes de integraci´ on. La integraci´ on de las ecuaciones de movimiento dar´ a lugar a 2l funciones de la forma: qν = qν (c1 , c2 , ...c2l−1 , t + t0 ) (3.91) q˙ν = q˙ν (c1 , c2 , ...c2l−1 , t + t0 ) ;

ν = 1, 2, ...l

Podemos en principio invertir estas ecuaciones para expresar las 2l constantes de integraci´ on en funci´ on de (q), (q), ˙ t: t0 = −t + θ(q, q) ˙ ;

cα = cα (q, q) ˙ ;

α = 1, 2, ..,2l − 1

(3.92)

Por otra parte, con las 2l constantes de integraci´ on se puede obtener cualquier otro conjunto de 2l constantes independientes. En conclusi´ on, a cualquier sistema dinámico integrable se le pueden asociar 2l funciones de (q), (q) ˙ y t cuya derivada total respecto a t sea cero. Estas cantidades son variables dinámicas, o sea que para cada sistema mecánico integrable siempre es posible hallar 2l constantes de movimiento independientes, o en otras palabras 2l variables dinámicas que se conservan, si es integrable. En mecánica cuántica se pueden encontrar a lo sumo l variables dinámicas que pueden tomar simult´ aneamente valores constantes. Se dice que para un sistema cuántico de l grados de libertad hay sólo l operadores herm´ıticos independientes que conmutan entre s´ı y que tienen estados propios con valores definidos de las correspondientes variables din´ amicas. Conservaci´ on de la energ´ıa. Se trata de mostrar que para aquellos sistemas en que L sea simétrica bajo el cambio del origen del tiempo hay una constante de movimiento que es la energ´ıa.7 Sea un sistema que cumple estas tres condiciones: (a) puede ser descrito completamente a partir de L, es decir, se puede definir una funci´ on V de la cual se obtienen todas las fuerzas; (b) el potencial no depende de las (q) ˙ ni de t; (c) el sistema es tal que L no dependerá expl´ıcitamente de t al introducir las coordenadas generalizadas y además es esclerónomo. Mediante la condición (c) se garantiza que las 7 Veremos

que si L no cambia al cambiar E, ∂L/∂E = 0, entonces t0 se conserva. Se dice que t0 y E son dos cantidades can´ onicamente conjugadas.

El principio de Hamilton y las ecuaciones de Lagrange / 71 ligaduras no realizan trabajo sobre el sistema, entonces para tal sistema se cumple que L es simétrica bajo el cambio de origen del tiempo: ∂L ∂L =0 ⇒ =0 ∂t0 ∂t

(3.93)

La derivada total de L respecto al tiempo es: l ∂L ∂L dL X ∂L q˙ν + q¨ν + = dt ∂qν ∂ q˙ν ∂t i=1

(3.94)

De las ecuaciones de Lagrange se tiene que: ∂L d ∂L = − fν ∂qν dt ∂ q˙ν

(3.95)

Con lo cual (3.94) toma la forma: l ∂L dL X d ∂L q˙ν − fν q˙ν + = dt dt ∂ q˙ν ∂t ν=1

(3.96)

O sea que se cumple: dL dt

l X ∂L q˙ν − L ∂ q˙ν ν=1

!

=

l X

ν=1

fν q˙ν −

∂L ∂t

(3.97)

La cantidad entre paréntesis se llama la funci´ on energ´ıa, denotada h(q, q, ˙ t) con lo cual: ˙ q, h(q, ˙ t) =

l X

ν=1

fν q˙ν −

∂L ∂t

(3.98)

De las condiciones (a) y (c) y del hecho de que V no depende de t se sigue que fν = 0 y ∂L/∂t = 0, con lo cual: h(q, q, ˙ t) = constante

(3.99)

Esta constante se llama “energ´ıa” o “constante de Jacobi”. La funci´ on h es igual al hamiltoniano H. La diferencia es que éste se define como una funci´ on de (q), (p), t y aquella es funci´ on de (q), (q) ˙ y t. Veremos que si además se cumple que V no depende de las (q), ˙ h coincide con la energ´ıa total T +V . (a) implica que el sistema es hol´ onomo. Teorema de Euler acerca de las funciones homog´ eneas. Sea una funci´ on f de n variables: f (x1 , x2 , ...xn ) tal que: F (λx1 , λx2 , ...λxn ) = λr F (x1 , x2 , ...xn )

(3.100)

Se dice que F es una funci´ on hom´ ogenea de grado r. El teorema dice que: N X i=1

xi

∂F = rF ∂xi

(3.101)

72 / Mec´ anica cl´ asica avanzada La prueba es la siguiente: derivando ambos lados en (3.101) respecto a λ, d F (λx1 , λx2 , ...λxN ) = rλn−1 F (x1 , x2 , ...xn ) dλ

(3.102)

la derivada del lado izquierdo es: n

X ∂F (λx1 , λx2 , ...λxN ) ∂(λxi ) d F (λx1 , λx2 , ...λxN ) = dλ ∂(λxi ) ∂λ i=1

(3.103)

Se sigue entonces que: n X ∂F (λx1 , λx2 , ...λxN )

∂(λxi )

i=1

xi = λn−1 rF (x1 , x2 , ...xn )

(3.104)

Haciendo ahora λ = 1 se obtiene la igualdad (3.101). Teorema acerca de la energ´ıa cin´ etica de un sistema escler´ onomo. Si el sistema es descrito mediante coordenadas generalizadas, en virtud de la ecuaci´ on (2.176) la energ´ıa cinética puede escribirse como: N

T =

1 X ˙2 mi~ri = 2 i=1

" l l 2 # l N X X ∂~ri ∂~ri X ∂~ri ∂~ri ∂~ri 1X mi · q˙ν q˙µ + 2 · q˙ν + 2 i=1 ∂qν ∂qµ ∂qν ∂t ∂t ν=1 µ=1 ν=1

(3.105)

Como ~ri es funci´ on (q) y t, se sigue que T en coordenadas generalizadas toma la forma: T (q, q, ˙ t) =

l X l X

Aνµ (q, t)q˙ν q˙µ +

ν=1 µ=1

l X

Aν (q, t)q˙ν + A(q, t)

(3.106)

ν=1

O sea que T se puede escribir como la suma de tres funciones homogéneas de las velocidades generalizadas de grados 2, 1 y 0: T = T2 + T1 + T0

(3.107)

Se sigue que para un sistema esclerónomo (∂~ri /∂t = 0) T (q, q, ˙ t) = T2 (q, q, ˙ t) =

l X l X

Aνµ (q, t)q˙ν q˙µ

(3.108)

ν=1 µ=1

Es decir, que la energ´ıa cinética es una funci´ on homogénea cuadrática en las velocidades. La funci´ on Aνµ (q, t) es simétrica: Aνµ (q, t) = Aµν (q, t)

(3.109)

El principio de Hamilton y las ecuaciones de Lagrange / 73 En virtud del teorema de Euler acerca de las funciones homogéneas se sigue que para un sistema escler´ onomo: l X ∂T q˙ν = 2T ∂ q˙ν ν=1

(3.110)

Conservaci´ on de la energ´ıa total T + V. Si se cumple (b), como L = T − V se sigue que: ∂L ∂T = ∂ q˙ν ∂ q˙ν

(3.111)

Entonces h tomará la forma, en virtud de (3.110) y (3.111): h(q, q, ˙ t) =

l X ∂T q˙ν − T + V = T + V ∂ q˙ν ν=1

(3.112)

En este caso h coincide con la energ´ıa total. Las fuerzas que son derivables de un potencial que no depende de las velocidades ni del tiempo se llaman fuerzas conservativas. Si V depende de las (q) ˙ cumpliéndose las otras condiciones, h es una constante de movimiento pero no es la energ´ıa total. Si se cumple (c) y que V no dependa de las (q), ˙ será cierto que h = T + V , pero h no será una constante de movimiento. En este caso: l

X dE ∂L dh = = fν q˙ν − dt dt ∂t ν=1

(3.113)

donde la dependencia que tiene L de t puede provenir sólo de que V dependa del tiempo. Si las fuerzas fν son viscosas y se pueden obtener de la funci´ on de disipación de Rayleigh, que es una funci´ on homogénea cuadrática de las velocidades, en virtud de las ecuaciones (3.72), (3.74) y (3.101), se sigue que: l X

ν=1

fν q˙ν = −

l X ∂F q˙ν = −2F ∂ q˙ν ν=1

(3.114)

En este caso (3.113) será: ∂L dh = −2F − dt ∂t

o

∂E ∂V = −2F + ∂t ∂t

(3.115)

En (3.115) resulta claro que la rata de cambio de la energ´ıa total consta de la rata de disipación de energ´ıa 2F y de la rata de suministro de energ´ıa debida a la variación temporal de V . Ejemplo 3.4.1 Hallar la constante de Jacobi y la rata de cambio de la energ´ıa total para una part´ıcula cargada en presencia de un campo electromagnético.

74 / Mec´ anica cl´ asica avanzada De acuerdo con la ecuaci´ on (3.70): L=

1 ˙2 q ~ m~r − qφ + ~r˙ · A 2 c

(3.116)

La funci´ on energ´ıa será: h=

∂L ˙ 1 2 · ~r − L = m~r˙ + qφ 2 ∂~r˙

(3.117)

Se ve que h no es la energ´ıa total E = T + V , lo cual es consecuencia de que V dependa de la velocidad, h incluye sólo la energ´ıa potencial eléctrica. En virtud de (3.98) h será: ~ ∂L ∂V ∂φ q ˙ ∂ A h˙ = − = =q − ~r · ∂t ∂t ∂t c ∂t

(3.118)

O sea que en general h será constante de movimiento sólo si los campos no dependen ~ tengan una forma tal que h sea del tiempo, además del caso particular en que φ y A cero, como: q ~ E = h − ~r˙ · A c Se sigue que para un campo electromagnético est´ atico: q d ~ − ~r˙ · A E˙ = dt c

(3.119)

(3.120)

Es decir, E no se conserva porque el potencial magnético no es constante. Si se ~ sea uniforme, A ~ se puede aplica el campo electromagnético constante de modo que B escribir en la forma: ~ = 1B ~ × ~r A 2

(3.121)

~ es uniforme. En este caso el potencial magnético será: que satisface a (3.63) si B q ~ · (~r × ~r˙ ) = − q B ~ · ~l ~ = − q ~r˙ · (B ~ × ~r) = − q B − ~r˙ · A c 2c 2c 2mc

(3.122)

donde ~l es el momento angular de la part´ıcula. Entonces (3.120) y (3.122) nos dan: qB ˙ q ~ ~˙ B·l = − lB E˙ = − 2mc 2mc

(3.123)

~ lo lB se conserva si L es simétrico bajo rotaciones alrededor del eje determinado por B, cual en general no se cumplir´ a; para ello basta que φ tenga simetr´ıa cil´ındrica alrededor ~ de B. Ejemplo 3.4.2 Una part´ıcula est´ a sometida al efecto de la gravedad y a la condición de ligadura de moverse siempre sobre un alambre circular de radio a. El alambre rota uniformemente con velocidad angular ω alrededor de un eje vertical en el plano del alambre que pasa por el centro. Calcular h y E˙ y analizar su significado.

El principio de Hamilton y las ecuaciones de Lagrange / 75 El problema tiene un grado de libertad. Tomemos el eje z en la direcci´ on de la fuerza de gravedad, coincidiendo con el eje de rotación. Definamos un sistema de ejes que rotan solidariamente con el alambre as´ı: el eje z ′ en la direcci´ on de la fuerza de gravedad, coincidiendo con el eje de rotación; el eje y ′ en el plano del alambre; y el eje x′ perpendicular al alambre en el centro. Las fórmulas que expresan a x, y y z en términos de x′ , y ′ y z ′ son: x = x′ cos ωt − y ′ senωt ;

y = x′ senωt + y ′ cos ωt ;

z = z′

(3.124)

Tomemos como coordenada generalizada el ángulo que hace el vector de posición de la part´ıcula con el eje z ′ y en términos del cual podemos expresar a x′ , y ′ y z ′ , puesto que x′ = 0. Entonces, mediante (3.124) obtenemos: x = −a senq senωt ;

y = a senq cos ωt ;

z = a cos q

(3.125)

El lagrangiano del problema es en consecuencia: L(q, q, ˙ t) =

1 ma2 (q˙2 + ω 2 senq) + mga cos q 2

(3.126)

El lector puede verificar f´ acilmente que si ω 2 < g/a, la posición q = 0 es de equilibrio estable con frecuencia de peque˜ nas oscilaciones dada por Ω = ω 2 − g/a. Si 2 ω > g/a, la posición de equilibrio estable no es q = 0 sino alg´ un valor de q entre 0 y π/2 con frecuencia de peque˜ nas oscilaciones dada por Ω2 = g/a − ω 2 . Finalmente, si ω 2 ≫ g/a, la posición de equilibrio estable será q = π/2, siendo ω la frecuencia de peque˜ nas oscilaciones. Sabemos que si se cumplen las condiciones (a) y (b), pero no se cumple (c), es decir, si las ligaduras son re´ onomas, lo cual es el caso para este problema, entonces h no será la energ´ıa total. De (3.107) y (3.112) se sigue, usando el teorema de Euler acerca de las funciones homogéneas, que: h = 2T2 + T1 − L = T + V − T1 − 2T0

(3.127)

De (3.98) se sigue que cuando fν = 0, ∂L = E˙ − T˙1 − 2T˙0 (3.128) h˙ = − ∂t Por tanto, si como en este ejemplo las ligaduras reónomas no dan lugar a que t aparezca en L, h será constante de movimiento pero E no lo será. En efecto, en este caso las ligaduras realizan trabajo sobre el sistema ya que los desplazamientos virtuales son tangentes al alambre (o sea que éste no realiza trabajo virtual), pero como un desplazamiento real de la part´ıcula no coincide con una virtual, la ligadura realiza trabajo bajo desplazamientos reales. Para este problema, T2 = 12 ma2 q˙2 ; T1 = 0 ; T0 = 1 2 2 2 ma ω sen q y V = −mga cos q. De (3.127) se sigue entonces que: 1 ma2 (q˙2 − ω 2 senq) − mga cos q (3.129) 2 la cual es una constante de movimiento. Podemos reinterpretar a h diciendo que es la energ´ıa total respecto al sistema de ejes rotantes x′ , y ′ y z ′ . La energ´ıa cinética h = T2 − T0 + V =

76 / Mec´ anica cl´ asica avanzada es T ′ = (1/2)ma2 q˙2 y la energ´ıa potencial consta de dos partes, la energ´ıa potencial gravitacional y la energ´ıa potencial centr´ıfuga que resulta debido a que el sistema de referencia x′ , y ′ y z ′ es no inercial, es decir: T′ =

1 ma2 q˙2 ; 2

1 V ′ = − ma2 ω 2 senq − mga cos q 2

(3.130)

En efecto, V ′ puede escribirse como V ′ = −(1/2)maω 2y ′ − mgz ′ y de él se deriva la fuerza siguiente: 1 ∂V ′ F~ ′ = − ′ = maω 2î′ + mg kˆ′ ∂~r 2

(3.131)

O sea que (1/2)maω 2 es la fuerza centr´ıfuga; es como si existiera un campo gravitacional homogéneo en la direcci´ on x′ . La energ´ıa total respecto a los ejes x, y y z será E y constará de dos términos: h y el trabajo realizado por el alambre. Como h˙ = 0, de (3.128) se sigue que: E˙ = T˙1 + 2T˙0 = ma2 ω 2 cos q q˙

(3.132)

˙ ma2 ω 3 q0 senΩt, Para peque˜ nas oscilaciones alrededor de q = 0, E˙ es de la forma E= o sea que E = h − (ma2 ω 3 /Ω)q0 cos Ωt, lo cual nos muestra que la energ´ıa total tendrá fluctuaciones periódicas. Conservaci´ on del momento lineal. Sea un sistema que cumple las siguientes condiciones: (a) se describe completamente a partir de un lagrangiano; (b) L no depende de alguna de las coordenadas generalizadas. Entonces se cumple: ∂L =0 ∂qν0

(3.133)

on donde la coordenada qν0 que no aparece en L se llama c´ıclica o ignorable. La ecuaci´ de Lagrange para la coordenada qν0 implica que: d ∂L = f0 (3.134) dt ∂ q˙ν0 O sea que si fν0 = 0 la siguiente cantidad se conserva: Pν0 ≡

∂L = constante ∂ q˙ν0

(3.135)

Se define el momento canónico conjugado a la coordenada qν as´ı:8 Pν =

∂L ; ∂ q˙ν

ν = 1, 2, ...l

(3.136)

luego, el momento canónico conjugado a una coordenada c´ıclica es una constante de movimiento. Si L no depende de qν0 y fν0 = 0 se dice que el sistema es simétrico bajo cualquier cambio en la coordenada qν0 . 8 La palabra “can´ onico” viene desde de ´ epoca de Hamilton; significa “de acuerdo con el canon”. Se usa ampliamente en f´ısica para designar diversos aspectos del formulismo hamiltoniano, que describe los sistemas mec´ anicos mediante las variables (q, p).

El principio de Hamilton y las ecuaciones de Lagrange / 77 Sea un lagrangiano dado por (3.87). Como L no depende de x ni de y, se sigue que px = mx˙ y py = my˙ son constantes de movimiento. Como L depende de z, pz = mz˙ no se conserva. Si qν0 es una coordenada lineal, pν0 será un momento lineal. Homogeneidad espacial. Sea un sistema aislado. Es de esperarse que L no cambie cuando se traslada el sistema como un todo. Esto equivale a desplazar todas las part´ıculas por la misma cantidad sin cambiarles su movimiento: ~r˙ i → ~r˙ i

~ri → ~ri + ~ǫ ;

(3.137)

Entonces el cambio experimentado por L será: δL =

N N X X ∂L ∂L · δ~ri = ~ǫ · ∂~ r ∂~ qi i i=1 i=1

(3.138)

Por hip´ otesis no hay ligaduras, con lo cual las ecuaciones de Lagrange nos dan: δL = ~ǫ ·

N N X d X d ∂L dP~ = ~ǫ · p~i = ~ǫ · , dt ∂~r˙ i dt i=1 dt i=1

(3.139)

donde P~ es el momento total del sistema. Se sigue que si hay homogeneidad espacial, δL = 0, entonces se sigue que la variable dinámica ~ǫ· P~ se conserva. Como E es arbitrario, se sigue que P~ es una constante. Si sólo hay simetr´ıa de translaci´ on en determinada direcci´ on ~ǫ se sigue que sólo se conserva la componente de P~ en la direcci´ on de ~ǫ. Como L = T − V y T sólo depende de las velocidades de las part´ıculas, ∂V ∂L =− = F~i ∂~ri ∂~ri

(3.140)

Entonces en (3.138) se tiene: δL = ~ǫ ·

N X

F~i

(3.141)

i=1

δL será cero si el sistema no est´ a sometido a una fuerza neta externa, es decir si el sistema est´ a aislado. O también: si el sistema es aislado, no debe haber fuerzas sobre el centro de masa: ∂V F~CM = − =0 (3.142) ~ CM ∂R luego V no depende de RCM y ésta será c´ıclica. El momento canónico conjugado de ~ CM será el momento lineal total y será una constante de movimiento: R P~CM =

N X ∂L ∂L ∂~r˙ i = · ~ CM ~˙ CM r˙ i ∂ R ∂R i=1 ∂ ~

(3.143)

~ CM est´ Como R a dado por N

1X ˙ ˙ ~ CM R = mi~ri 2 i=1

(3.144)

78 / Mec´ anica cl´ asica avanzada Se sigue que: ∂~r˙ i ~ = ~1 ˙ ~ ∂ RCM

(3.145)

~1 es el diádico unidad, que se representa por una matriz unidad de dimensi´ donde ~ on 3 × 3 (véase secci´ on 7.4). Por tanto: N

N

X X ∂L ∂L mi~r˙ i = P~CM = = ˙ ˙~ ∂ ~ r i ∂ RCM i=1 i=1

(3.146)

Conservaci´ on del momento angular. Sea un sistema que se describe completamente a partir de un lagrangiano y además tal que no depende de alguna coordenada angular qν0 , entonces su momento canónico conjugado será un momento angular que se conserva. Por ejemplo, sea una part´ıcula cuyo lagrangiano es: 1 ˙2 m~r − V (~r) (3.147) 2 Sea n ˆ un eje arbitrario y δφ una rotación alrededor de ese eje (véase figura 3.3). L=

n

δϕ

δr r r + δr θ

Figura 3.3 Rotación por ángulo δφ alrededor de n ˆ Supongamos que φ es una de las coordenadas generalizadas del sistema. En una rotación alrededor de n ˆ bajo un ángulo δφ, ~r se cambia en ~r + δ~r donde δ~r es un vector perpendicular a ~r y a n ˆ y cuya magnitud es r senθ δφ. Por tanto se cumple que: δ~r = n ˆ × ~rδφ

(3.148)

El principio de Hamilton y las ecuaciones de Lagrange / 79 y que: ∂~r =n ˆ × ~r ∂φ

(3.149)

El momento can´ onico conjugado de φ será: pφ =

∂L ∂~r˙ ∂~r = m~r˙ · (ˆ n × ~r) = n ˆ · m~r × ~r˙ = m~r˙ · = m~r˙ · ∂φ ∂ φ˙ ∂ φ˙

(3.150)

Se sigue que pφ es la componente del momento angular a lo largo de n ˆ . Si L no depende de φ, pφ es una constante de movimiento. Isotrop´ıa espacial. Sea un sistema tal que no cambia L cuando se rota como un todo alrededor de un eje n ˆ . Esto es, si para cada part´ıcula: ~ri → ~ri + n ˆ × ~ri δφ ;

~r˙ i → ~r˙ i + n ˆ × ~r˙ i δφ

el cambio en L será: X N N X ∂L ˙ ∂L p~˙ i · δ~ri + p~i · δ~r˙ i · δ~ri = · δ~ri + δL = ∂~ri ∂~r˙ i i=1 i=1

(3.151)

(3.152)

Usando (3.151) y usando la invariancia del triple producto escalar bajo permutación c´ıclica de los factores: δL =

N X d ˆ δφ · n ˆ · ~ri × p~˙ i + p~i × ~r˙ i δφ = n ~ri × p~i dt i=1 i=1

N X

(3.153)

Con lo cual ~˙ δL = δφˆ n·L

(3.154)

~ es el momento angular total. Por otra parte, en virtud de las ecuaciones de donde L Lagrange: δL =

N X i=1

F~i · δ~ri + p~i · δ~ri =

(3.155)

N N X X ~ki = δφˆ ~ n·K n· ~ri × F~i + ~r˙ i × p ~i = δφˆ δφˆ n· i=1

i=1

~ es el torque total, por tanto: donde K ∂L ~˙ = n ~ =n ˆ ·L ˆ ·K ∂φ

(3.156)

Si no hay torque neto sobre el sistema entonces éste será is´ otropo y en consecuencia se conserva el momento angular total. Si simplemente se anula el torque en cierta direcci´ on, L será simétrico bajo rotaciones alrededor de esa direcci´ on y se conservará la

80 / Mec´ anica cl´ asica avanzada ~ en esa direcci´ componente de L on. Integrales de movimiento aditivas. Para un sistema aislado la energ´ıa total ~ y el momento lineal P~ se conservan: hay siete constantes de E, el momento angular L movimiento. Quedan a´ un otras 6N − 7 constantes de movimiento. Estas siete constantes de movimiento tienen la caracter´ıstica de ser aditivas. Es decir, si el sistema consta de varias partes que no interact´ uan, cada parte tendrá valores determinados de la energ´ıa, el momento angular y el momento lineal totales. Las correspondientes cantidades del sistema total se pueden obtener adicionando las respectivas constantes de movimiento de las partes.

3.5.

El teorema del virial

Es un teorema de naturaleza estad´ıstica porque se refiere a promedios temporales. Sea un sistema que: (a) la energ´ıa potencial es funci´ on homogénea de las coordenadas; (b) el movimiento es tal que en todo momento las coordenadas y las velocidades toman valores finitos (el sistema es ligado). Se trata de calcular los valores medios de T y V cuando el tiempo tiende a infinito. Del teorema de Euler acerca de las funciones homogéneas se sigue: N X ∂T ˙ · ~ri = 2T ∂~r˙ i

(3.157)

i=1

Entonces se cumple, dado que V no depende de las velocidades: N N X d X ˙ ~p˙ i · ~ri p~i · ~ri − pi · ~ri = ~ 2T = dt i=1 i=1 i=1 N X

2T =

N N X d X F~i · ~ri pi · ~ri − ~ dt i=1 i=1

(3.159)

si tomamos en (3.159) la media temporal a ambos lados, as´ı: Z 1 τ l´ım 2T dt = τ →∞ τ 0 1 l´ım τ →∞ τ

N X i=1

! τ Z N 1 τ X~ p~i · ~ri − l´ım Fi · ~ri dt τ →∞ τ 0 0

(3.158)

(3.160)

i=1

La condición (b) conduce a la anulaci´ on del primer miembro del lado derecho, con lo cual llegamos a: 2T = −

N X i=1

F~i · ~ri ,

(3.161)

El principio de Hamilton y las ecuaciones de Lagrange / 81 donde la barra indica promedio temporal. La ecuaci´ on (3.161) se denomina el teorema del virial. El lado derecho de (3.161) es el doble del llamado virial de Clausius. Si V es funci´ on homogénea de las coordenadas, se cumple: −

N X i=1

F~i · ~ri =

N X ∂V i=1

∂~ri

· ~ri = kV = 2T

(3.162)

donde k es el grado de homogeneidad de V . Como T + V = E es una constante, se sigue que T + V = E. Por lo tanto se cumple que: 2T + 2V = 2E ;

kT + kV = kE

(3.163)

De (3.162) y (3.163) se sigue que: V =

2 E; 2+k

T =

k E; 2+k

T =

k V 2

(3.164)

Para un potencial del tipo r−1 se cumple que 2T = −V = −2E. Para un potencial del tipo r2 se cumple: T = V = (1/2)E. Se deduce que para un potencial del tipo r−1 hay movimientos acotados solamente si E < 0, dado que T es positiva, y que para un potencial del tipo r2 sólo hay movimientos acotados para E > 0. Ley de Boyle. Sea un sistema constituido por un gas de moléculas en un recipiente. En este caso N es muy grande. Si la energ´ıa cinética media por part´ıcula es t, entonces: T = Nt

(3.165)

La energ´ıa por part´ıcula est´ a relacionada con la temperatura θ a través de la relaci´ on: 3 t = kB θ (3.166) 2 donde kB es la constante de Boltzmann. La ecuaci´ on (3.166) se obtiene del teorema de la equipartici´ on de la energ´ıa, seg´ un el cual por cada grado de libertad hay una energ´ıa de (1/2)kθ. La fuerza sobre la part´ıcula i depende de la ligadura impuesta por el recipiente: ~i F~i = F~ig + R

(3.167)

F~ig

donde es la fuerza ejercida por todas las otras part´ıculas del gas sobre la part´ıcula i ~ y Ri es la fuerza ejercida por las paredes del recipiente sobre la part´ıcula i. Si llamamos I a: I=

N X

F~ig .~ri

(3.168)

i=1

El virial de Clausius se descompone en dos partes: N X i=1

F~i .~ri = I +

N X i=1

~ i .~ri R

(3.169)

82 / Mec´ anica cl´ asica avanzada ~ i act´ Las fuerzas R uan sólo cuando la part´ıcula i choca con las paredes del recipiente. Estas fuerzas representan la reacción del muro a la colisi´ on ejercida por los átomos sobre la pared. Esto es lo que se denomina la reacción a la presi´ on P que ejerce el gas sobre el recipiente. PN ~ En un tiempo t dado, en i=1 R ri sólo contribuyen los términos correspondientes i ·~ a las part´ıulas que en ese instante chocan con las paredes del recipiente. Podemos dividir el ´ area de las paredes en elementos infinitesimales de área dA. Todas las dN part´ıculas que choquen sobre un dA dado tendrán aproximadamente el mismo radio vector ~ri que llamaremos ~r. La contribución de las dN part´ıculas a la sumatoria será aproximadamente ~ dN · ~r, donde R ~ es la fuerza que ejerce el elemento de área sobre cada una de las dN R ~ dN = dR, ~ entonces tenemos que: part´ıculas que inciden sobre ella. Si llamamos R N X i=1

~ i · ~ri = R

Z

~ ~r · dR

(3.170)

~ en términos de la Si n ˆ es un vector normal a la superficie, podemos escribir a dR presi´ on de la siguiente manera: ~ = −ˆ dR nP dA

(3.171)

Como la presi´ on es constante escribimos: N X i=1

~ i · ~ri = −P R

Z

n ˆ · ~r dA

(3.172)

Ahora, en virtud del teorema de la divergencia, podemos pasar de la integral de superficie a una integral de volumen: Z Z ~ ∇ · ~rdV = 3V (3.173) ~r · dS = V

S

Entonces: N X i=1

~ i · ~ri = −3P V R

(3.174)

Como esta cantidad no depende del tiempo se sigue que: N X i=1

F~i · ~ri = I − 3P V

(3.175)

En virtud del teorema del virial, que es válido en este caso porque el movimiento es acotado, y usando (3.162) y (3.166) se sigue que: 3N KB θ = −I + 3P V

(3.176)

Llegándose a la ecuaci´ on de estado para un gas real: 1 P V = N KB θ + I 3

(3.177)

El principio de Hamilton y las ecuaciones de Lagrange / 83 El término (1/3)I es una medida de la separación de la ecuaci´ on de estado del gas real respecto al ideal en el cual no se consideran los efectos de interacci´ on entre las moléculas dada por 3.168, en tanto que P V proviene de la ligadura impuesta por el recipiente.


4 La formulaci´ on hamiltoniana 4.1.

Las variables hamiltonianas de estado

En el formalismo lagrangiano el estado de un sistema mecánico hol´ onomo con l grados de libertad se describe por medio de las qν y q˙ν . Por medio de la funci´ on L(q, q, ˙ t) se hallan las ecuaciones de movimiento a partir de las ecuaciones de Lagrange. Las variables (q, q, ˙ t) se llaman variables lagrangianas. Hamilton (1805-1865) propuso describir el sistema mediante las variables (q, p, t), donde los pν son los momentos generalizados canónicamente conjugados a las coordenadas generalizadas qν definidos por: pν =

∂L(q, q, ˙ t) ; ∂ q˙ν

ν = 1, 2, ...l

(4.1)

Las variables (q, p, t) se llaman variables hamiltonianas. Las ecuaciones (4.1) constituyen las f´ ormulas de transformaci´ on de las variables (q, q, ˙ t) a las variables (q, p, t). En (4.1) hay l ecuaciones que relacionan las l cantidades pν con las l cantidades q˙ν . En principio se pueden expresar las (q) ˙ en términos de las (p) por la transformaci´ on inversa: q˙ν = Φν (q, p, t) ;

ν = 1, 2, ...l

(4.2)

Es claro que el estado del sistema puede ser descrito indistintamente por las variables lagrangianas o por las hamiltonianas. Decimos que L “genera” la transformaci´ on (q, q, ˙ t) → (q, p, t). Seg´ un (3.106) y (3.107) T se puede escribir como: T = T2 + T1 + T0

(4.3)

Si V no depende de las (q), ˙ pν =

l X ∂T ∂L = = Aνµ q˙µ + Aν ; ∂ q˙ν ∂ q˙ν µ=1

ν = 1, 2, ...l

(4.4)

Mediante este sistema de ecuaciones lineales podemos expresar a (q) ˙ en términos de (p): q˙ν =

l X

bνµ pµ + bν ;

ν = 1, 2, ...l

µ=1

85

(4.5)

86 / Mec´ anica cl´ asica avanzada Si V depende de las (q), (q) ˙ en la forma: V (q, q, ˙ t) =

l X

Πν (q, t)q˙ν + Π(q, t)

(4.6)

ν=1

que ser´ıa por ejemplo la forma que tomar´ıa el potencial electromagnético (3.68) al ser expresado en coordenadas generalizadas, entonces pν será: pν =

l X

µ=1

Aνµ q˙µ + Aν − Πν ;

ν = 1, 2, ...l

(4.7)

Notaci´ on. Usaremos L para denotar a T −V , expresada en funci´ on de las variables lagrangianas. Es claro que al expresarla en términos de las variables hamiltonianas la funci´ on es diferente, aunque a veces, sin mucho rigor, se le escribe también como L. Lo correcto es: L(q, q, ˙ t) = L [q, q(q, ˙ p, t), t] = L(q, p, t)

(4.8)

Ejemplo 4.1.1 Sea el lagrangiano: 1 2 ~ r , t) − Π(~r, t) L(~r, ~r˙ , t) = m~r˙ − ~r˙ · Π(~ 2

(4.9)

El momento can´ onico será: p= ~

~ ∂L ~ ⇒ ~r˙ = p~ + Π = m~r˙ − Π ˙ m ∂~r

(4.10)

Con lo cual: L(~r, p~, t) =

~2 ~2 − Π p −Π 2m

(4.11)

La funci´ on hamiltoniana. Se definió en (3.97) la funci´ on energ´ıa como: h(q, q, ˙ t) =

l X ∂L(q, q, ˙ t) q˙ν − L(q, q, ˙ t) ∂ q ˙ ν ν=1

(4.12)

A la funci´ on energ´ıa expresada en términos de las variables hamiltonianas se le llama la funci´ on hamiltoniana: H(q, p, t) ≡ h(q, p, t) = h[q, q ′ (q, p, t), t] =

l X

ν=1

pν q˙ν − L(q, p, t)

(4.13)

Los generadores de la transformaci´ on de Legendre. Sea X(x1 , x2 , ...xn ; α1 , α2 , ... αm ) una funci´ on que “genera” la siguiente transformaci´ on de variables (x1 , x2 , ...xn ) → (y1 , y2 , ...yn ): yi =

∂X ; ∂xi

i = 1, 2, ...n

(4.14)

La formulaci´ on hamiltoniana / 87 entonces existe una transformaci´ on de las variables y1 , y2 , ...yn a las variables x1 , x2 , ...xn , la transformaci´ on inversa, “generada” por cierta funci´ on Y (y1 , y2 , ...yn ; α1 , α2 , ...αm ): xi =

∂Y ; ∂yi

i = 1, 2, ...n

(4.15)

Demostremos que las funciones X y Y est´ an relacionadas por la fórmula: Y (y1 , y2 , ...yn ; α1 , α2 , ...αm ) = n X i=1

(4.16) xi yi − X(x1 , x2 , ...xn ; α1 , α2 , ...αm )

En efecto, es posible expresar las variables xi en términos de las yi : xi = fi (x1 , x2 , ...xn ; α1 , α2 , ...αm ) ;

i = 1, 2, ...n

(4.17)

Con lo cual escribimos (4.16) como: Y (y1 , y2 , ...yn ; α1 , α2 , ...αm ) = n X

k=1

(4.18) yk fk − X(f1 , f2 , ...fn , α1 , α2 , ...αm )

Entonces: n

X ∂Y = ∂yi

k=1

∂fk yk + fk δik ∂yi

n X ∂fk k=1

∂fk yk − yk ∂yi ∂yi

−

n X ∂X ∂fk = ∂fk ∂yi k=1

(4.19)

+ fi = xi

Demostremos el siguiente teorema: ∂X ∂Y =− ; ∂αi ∂αi

i = 1, 2, ...m

(4.20)

Para evaluar ∂y/∂αi usemos la ecuaci´ on (4.18): n

n

k=1

k=1

X ∂fk X ∂X ∂fk ∂X ∂Y = yk − − ∂αi ∂αi ∂fk ∂αi ∂αi

(4.21)

En virtud de (4.14), los términos de la sumatoria se cancelan, con lo cual queda demostrado el teorema. Una transformaci´ on de este tipo es llamada transfomaci´ on de Legendre (1752-1833). En s´ıntesis, las f´ ormulas caracter´ısticas de una transformación de Legendre son: X = X(x1 , x2 , ...xn ; α1 , α2 , ...αm )

(4.22)

88 / Mec´ anica cl´ asica avanzada Y = Y (y1 , y2 , ...yn ; α1 , α2 , ...αm ) yi =

∂X ; ∂xi

Y =

X k

xi =

∂Y ; ∂yi

xk yk − X ;

(4.23)

i = 1, 2, ...n

∂X ∂Y =− ; ∂αi ∂αi

(4.24) i = 1, 2, ...m

(4.25)

Las ecuaciones de movimiento hamiltonianas. La transformaci´ on de las variables lagrangianas a las hamiltonianas es una transformaci´ on de Legendre generada por la funci´ on L. Aqu´ı las q˙ν hacen el papel de las xi , el conjunto (q), t, hace el papel de las (α), y las pν hacen el papel de las yi ; L es X. Comparando (4.13) y (4.16) vemos que H es Y : H(q, p, t) =

l X

ν=1

pν q˙ν − L(q, q, ˙ t)

(4.26)

Es decir, L genera la transformaci´ on (q) ˙ → (p) y H genera la transformaci´ on inversa (p) → (q): ˙ q˙ν =

∂H(q, p, t) ∂pν

(4.27)

De las ecuaciones (4.20) se sigue inmediatamente que: ∂H ∂L =− ; ∂qν ∂qν

ν = 1, 2, ...l

(4.28)

∂H ∂L =− ∂t ∂t

(4.29)

teniendo en cuenta que el conjunto (q), t, hace el papel de las (α). De las ecuaciones de Lagrange se sigue que: ∂L d ∂L = − fν = p˙ − fν ; ∂qν dt ∂ q˙ν

ν = 1, 2, ...l

(4.30)

Las ecuaciones (4.27) a (4.30) nos dan: q˙ν =

∂H ; ∂pν

p˙ν = −

∂H + fν ; ∂qν

ν = 1, 2, ...l

(4.31)

Las ecuaciones (4.31) se denominan las ecuaciones can´ onicas de Hamilton y constituyen las ecuaciones de movimiento en las variables hamiltonianas. Son 2l ecuaciones diferenciales que involucran sólo primeras derivadas de (q) y (p), en tanto que las de Lagrange son l ecuaciones deferenciales de segundo orden en las (q). En esencia sólo el segundo conjunto de ecuaciones (4.31) constituye las ecuacionnes de movimiento, pues el primer conjunto sólo proporciona la transformaci´ on inversa a pν = ∂L/∂ q˙ν .

La formulaci´ on hamiltoniana / 89 La funci´ on hamiltoniana. H no sólo permite escribir las ecuaciones de movi˙ miento sino que tiene significado f´ısico directo. Veamos qué es H: l X ∂H ∂H ∂H ˙ H= q˙ν + p˙ ν + ∂q ∂p ∂t ν ν ν=1 =

l X

[(fν − p˙ ν ) q˙ν + q˙ν p˙ ν ] +

l X

fν q˙ν +

ν=1

=

ν=1

∂H ∂t

(4.32)

∂H ∂t

Si las ligaduras re´ onomas no dan lugar a que t aparezca en H y el potencial no depende del tiempo, ∂H/∂t = 0, y si además no hay fuerzas no derivables del potencial, se sigue que H˙ = 0, o sea que H es una constante de movimiento. Si además las fuerzas son derivables de un potencial que no depende de las velocidades, sabemos de (3.112) que H = T + V . O sea que bajo estas condiciones la energ´ıa total E = T + V se conserva, de lo contrario se cumple que H es constante pero no es cierto que H = E. Si V no depende de (q) ˙ ni de t y las ligaduras reónomas no dan lugar a que t aparezca en H se cumple que ∂H/∂t = 0 y que H = T + V . En este caso: l

d(T + V ) X dE = = fν q˙ν dt dt ν=1

(4.33)

Luego, dE/dt es igual a la rata a la cual las fuerzas no conservativas realizan trabajo sobre el sistema. Si estas son nulas, la energ´ıa total se conserva. Por otra parte, si las fν son cero, o bien V depende de t, o las ligaduras reónomas dan lugar a que t aparezcan en H, dH ∂H = dt ∂t

(4.34)

Ejemplo 4.1.2 Usando la transformaci´ on de Legendre inversa, derivar las ecuaciones de movimiento lagrangianas a partir de las ecuaciones de movimiento hamiltonianas. Supongamos que fν = 0. Las ecuaciones de movimiento serán: q˙ν =

∂H ; ∂pν

p˙ = −

∂H ; ∂qν

ν = 1, 2, ...l

(4.35)

La transformaci´ on de Legendre inversa es (p) → (q) ˙ y est´ a generada por H: q˙ν =

∂H(q, p, t) ; ∂pν

ν = 1, 2, ...l

(4.36)

El generador de la transformaci´ on (q) ˙ → (p) es L: L(q, q, ˙ t) =

l X

ν=1

q˙ν pν − H(q, p, t)

(4.37)

90 / Mec´ anica cl´ asica avanzada En virtud del teorema dado por (4.20): ∂L ∂H =− ; ∂qν ∂qν

ν = 1, 2, ...l ;

∂L ∂H =− ∂t ∂t

(4.38)

O sea: ∂L = p˙ν ; ∂qν

ν = 1, 2, ...l

(4.39)

Como L genera la transformaci´ on (q) ˙ → (p) pν =

∂L ; ∂ q˙ν

ν = 1, 2, ...l

(4.40)

Con lo cual llegamos a las ecuaciones de Lagrange: d ∂L ∂L = ; ∂qν dt ∂ q˙ν

ν = 1, 2, ...l

(4.41)

Ejemplo 4.1.3 Hallar las ecuaciones de movimiento correspondientes a las variables (p), (p) ˙ y t obtenidas mediante una transformaci´ on de Legendre. El generador de la transformaci´ on (q) → (−p) ˙ es H: −p˙ ν =

∂H ; ∂qν

ν = 1, 2, ...l

(4.42)

Entonces el generador de la transformaci´ on (−p) ˙ → (q) será cierta funci´ on L′ (p, p, ˙ t) dada por: L′ (p, p, ˙ t) =

l X

(−p˙ν )qν − H(q, p, t)

(4.43)

ν=1

En virtud del teorema (4.20): ∂L′ ∂H =− ; ∂pν ∂pν

ν = 1, 2, ...l;

∂L′ ∂H =− ∂t ∂t

(4.44)

Como en virtud de las ecuaciones de Hamilton: ∂H = q˙ν ; ∂pν

ν = 1, 2, ...l

(4.45)

y debido a que L′ genera la transformaci´ on (−p) ˙ → (q) −qν =

∂L′ ; ∂ p˙ ν

ν = 1, 2, ...l

(4.46)

Se sigue de (4.44), (4.45) y (4.46) que: d ∂L′ ∂L′ = −q˙ν = ; ∂pν dt ∂ p˙ ν

ν = 1, 2, ...l

(4.47)

La formulaci´ on hamiltoniana / 91 Entonces las ecuaciones de movimiento lagrangianas para las variables (p) y (p) ˙ son: ˙ t) ∂L′ (p, p, ˙ t) d ∂L′ (p, p, − = 0; ∂pν dt ∂ p˙ ν

ν = 1, 2, ...l

(4.48)

Esta es la representación de momentos, que nos dice que mediante las variables (p), (p) ˙ es posible describir completamente el sistema. Ejemplo 4.1.4 Hallar las ecuaciones de movimiento lagrangianas y hamiltonianas para una part´ıcula de masa m en el potencial V = −k/r (r distancia del origen a la part´ıcula). L=T −V =

1 2 k mr˙ + 2 r

(4.49)

L es esféricamente simétrico, luego se conserva el momento angular ~l = m~r × ~r˙ : ~l es constante en magnitud y direcci´ on. Entonces ~r y ~r˙ son perpendiculares a ~l y en consecuencia el movimiento es en un plano. Elegimos un sistema de coordenadas polares en el plano del movimiento, con lo cual: L=

k 1 m(r˙ 2 + r2 φ˙ 2 ) + 2 r

(4.50)

El sistema, para ~l dado, tiene en esencia dos grados de libertad, luego hay dos ecuaciones de Lagrange: k m¨ r − mrφ˙ + 2 = 0 y r

mr2 φ˙ = constante

(4.51)

Como ~l vale: ~l = m~r × ~r˙ = mr2 φ˙ kˆ

(4.52)

donde kˆ es un vector unitario normal al plano del movimiento, se sigue de (4.51) y (4.52) que: m¨ r−

k l2 + 2 =0 mr3 r

(4.53)

La anterior es una ecuaci´ on que permite hallar a r(t) para l dado. Una vez conocido r(t), tenemos que φ(t) se determina al integrar: φ˙ =

l mr2

(4.54)

Para pasar al formalismo hamiltoniano partimos de las fórmulas de transformaci´ on: pr =

∂L = mr˙ ; ∂ r˙

pφ =

∂L = mr2 φ˙ = l = constante ∂ φ˙

(4.55)

92 / Mec´ anica cl´ asica avanzada El hamiltoniano será: H(r, φ, pr , pφ ) = pr r˙ + pφ φ˙ − L = p2φ p2r 1 + 2 − m m r 2

p2φ p2r 2 + r m2 m2 r 4

!

−

k r

(4.56)

Con lo cual: H=

p2φ p2r k − =T +V + 2m 2mr2 r

(4.57)

Las ecuaciones de Hamilton serán: r˙ = − φ˙ =

∂H pr = ; ∂pr m

pφ ∂H = ; ∂pφ mr2

p˙ r = −

p2φ k ∂H =− 3 + 2 ∂r mr r

(4.58)

∂H p˙ φ = − =0 ∂φ

Las ecuaciones (4.58) de la izquierda no son más que las ecuaciones de la transformaci´ on inversa a (4.55). Al reemplazar éstas en las ecuaciones (4.58) de la derecha, se obtienen las ecuaciones (4.51), como es de esperarse. Es decir, el formalismo hamiltoniano no aporta nada nuevo en cuanto a las ecuaciones de movimiento se refiere. Notamos que φ es c´ıclica tanto en L como en H. En consecuencia pφ se conserva. H presenta las mismas simetr´ıas que L y por tanto tiene los mismos teoremas de conservaci´ on. Ejemplo 4.1.5 Hallar el hamiltoniano y las ecuaciones de movimiento para una part´ıcula en un sistema de coordenadas que rota uniformemente con velocidad angular ~ω . En el sistema de ejes espaciales: 1 L ~r, ~r˙ = m~r˙2 − V (~r) 2

(4.59)

Si instant´ aneamente coinciden los ejes espaciales y los ejes rotantes, se cumple que: ~r = ~r ~r˙ = ~r˙ + ~ ω × ~r

(4.60)

donde ~r es el vector de posición de la part´ıcula respecto a los ejes rotantes y ~r˙ su velocidad en esos ejes. Entonces usando la transformaci´ on (4.60), (4.59) tomará la forma: 1 2 2 ˙ ˙ ˙ ~ ~ ~ ~ ~ ~ − V ~r L r, r = m r + 2r · ~ω × r + ~ω × r (4.61) 2 Las componentes del momento canónico son: px =

∂L ... ∂ x˙

(4.62)

La formulaci´ on hamiltoniana / 93 O vectorialmente: ~p = ∂L = m ~r˙ + ~ ω × ~r ∂~r˙

(4.63)

La velocidad expresada en términos del momento es: ~ ~r˙ = p − ~ ω × ~r m

(4.64)

El lagrangiano (4.61) en términos de las variables hamiltonianas es: 1 p2 L ~r, ~p = − V ~r 2m

(4.65)

El hamiltoniano será:

H ~r, ~p =

X ν

pν q˙ν − L = ~p ·

~p − ~ω × ~r m

Con lo cual: H=

1 p2 ~ ω × ~r + V ~r −p· ~ 2m

!

−

1 p2 + V ~r 2m

(4.66)

(4.67)

˙ H es: En términos de ~r y ~r, h=

2 1 ~˙ 2 1 mr − m ~ ω × ~r + V ~r 2 2

(4.68)

N´ otese que el hamiltoniano correspondiente a L(~r, ~r˙ ) difiere de h por el término ~ m(~ω × r)2 /2. Comparando las ecuaciones (4.61) y (4.68) vemos que h no es T + V . De acuerdo con (3.124), h es T + V sólo si T es funci´ on cuadrática de las velocidades, en tanto que en este caso hay en T términos de las formas T1 y T0 . T2 =

1 ˙2 mr 2

T1 = m~r˙ · (~ ω × ~r ) T0 =

(4.69)

1 m(~ ω × ~r)2 2

h es una constante de movimiento porque L no depende del tiempo y no hay fuerzas disipativas, pero E = T + V no es constante de movimiento. De acuerdo con (3.126): E˙ = T˙1 + 2T˙0

(4.70)

Vemos que T1 + 2T0 act´ uan como un trabajo sobre el sistema que hace que E no sea constante. Esto es debido a la rotación del sistema de coordenadas. Sucede que en este caso la transformaci´ on ~r → ~r depende del tiempo debido a la rotación, con lo cual la transformaci´ on es de tipo re´ onomo. T1 + 2T0 es un potencial “ficticio” inercial. T1

94 / Mec´ anica cl´ asica avanzada est´ a asociada con la fuerza de Coriolis y T0 con la fuerza centr´ıfuga. H puede escribirse como: H=

p2 −~ ω · ~r × ~p + V ~r 2m

(4.71)

en términos de ~l = ~r × ~p se escribe como: H=

p2 −~ ω · ~l + V ~r 2m

(4.72)

como ~r depende expl´ıcitamente del tiempo, es de esperarse que ~l no se conserve. Las ecuaciones de movimiento son: ∂H ~ ∂V = p × ~ω − ∂~r ∂~r

~p˙ =

−

~r˙ =

~p ∂H = − ~ω × ~r m ∂~p

(4.73)

Como suponemos a ~ω constante, ~p × ~ω ~˙ 1 ∂V ~¨r = p − ~ − ~ω × ~r ω × ~r˙ = − m m m ∂~r

(4.74)

Expresando en (4.74) a ~p en términos de ~r˙ obtenemos: 1 ∂V ~¨r + 2~ ω × ~r˙ + ~ ω × ~ω × ~r = − m ∂~r

(4.75)

Vemos que la fuerza en el sistema rotante no es masa por aceleración, sino que tiene dos términos adicionales, el centr´ıfugo y el de Coriolis, que caracterizan el movimiento de una part´ıcula descrito desde un sistema de referencia no inercial.

4.2.

Simetr´ıas y el teorema de conservaci´ on

Una coordenada c´ıclica en L también es c´ıclica en H. En efecto, de las ecuaciones de Lagrange y de las ecuaciones de Hamilton se sigue respectivamente que: ∂L ∂qν

p˙ν =

fν +

p˙ν =

∂H ; fν − ∂qν

(4.76) ν = 1, 2, ...l

Con lo cual siempre se cumple: ∂L ∂H =− ; ∂qν ∂qν

ν = 1, 2, ...l

(4.77)

La formulaci´ on hamiltoniana / 95 que en realidad es una propiedad general de la transformaci´ on de Legendre (q) ˙ → (p) seg´ un (4.28). Se sigue que todos los resultados obtenidos para L en cuanto a la relación entre simetr´ıas y teoremas de conservaci´ on se aplican directamente en el formalismo hamiltoniano. De (4.32) se sigue que si no hay fuerzas disipativas y H no contiene el tiempo expl´ıcitamente (o, de (4.29), cuando L no contiene el tiempo expl´ıcitamente): dH ∂H =− =0 dt ∂t

(4.78)

Además, si la transformaci´ on a coordenadas generalizadas no contiene el tiempo expl´ıcitamente y V no depende de las velocidades, H = T + V = E, o sea que la energ´ıa se conserva. Si H no depende de t pero hay fuerzas disipativas: l

X dA dH = fν q˙ν = dt dt ν=1

(4.79)

Si además H = T + V = E, se sigue: dA dE = dt dt

(4.80)

Si la transformaci´ on de coordenadas depende del tiempo expl´ıcitamente, V no depende de (q) ˙ y fν = 0, T = T0 + T1 + T2

(4.81)

entonces se sigue que: pν = 2

l X

Aµν q˙µ + Aν ;

ν = 1, 2, ...l

(4.82)

µ=1

con lo cual H = T2 − T0 + V = E − T1 − 2T0

(4.83)

la H anterior en general no se conserva. Simetr´ıas de cambio de escala. Supongamos que el sistema es conservativo, de modo que E = T + V . Por simplicidad supondremos que no hay ligaduras, de modo que las coordenadas cartesianas pueden tomarse como coordenadas generalizadas independientes. La simetr´ıa de cambio de escala se da en una clase restringida de sistemas: aquellos en los cuales la energ´ıa potencial V es una funci´ on homogénea de grado k: V (λ~r1 , λ~r2 , ...λ~rN ) = λk V (~r1 , ~r2 , ...~rN )

(4.84)

En coordenadas cartesianas T no depende de las coordenadas y es una funci´ on homogénea cuadrática de las velocidades: ˙ ) = λ2 T (~r˙ 1 , ~r˙ 2 , ...~r˙ N ) T (λ~r˙1 , λ~r˙2 , ...λ~rN

(4.85)

96 / Mec´ anica cl´ asica avanzada Supongamos la siguiente transformaci´ on de cambio de escala en las longitudes y tiempos: ~ri t

→ α~ri ;

i = 1, 2, ...N (4.86)

→ βt

Entonces: V → αk V ; T →

2 α T β

(4.87)

El cambio en H será: 2 α T + αk V H→ β

(4.88)

H será funci´ on homogénea de grado k bajo la transformaci´ on (4.86) si: α2 = αk ; β2

H → αk H

(4.89)

Esta transformaci´ on no cambia la forma de las ecuaciones de Hamilton: α2 1 β 2 ∂H α 1 ∂H → ~r˙ i = ; ~r˙ i = m ∂~r˙ i β m α ∂~r˙ i β

i = 1, 2, ...N

α2 α ∂H β 2 ∂H → m 2 ~¨r i = m~¨ri = − ∂~ri β α ∂~ri

(4.90)

(4.91)

Esta transformaci´ on pertenece a la clase de las transformaciones can´ onicas, o sea a las transformaciones que no cambian la forma de las ecuaciones canónicas. La ecuaci´ on (4.86) dice que si las longitudes l se cambian por l′ = αl y los tiempos ′ t por t = βt, el sistema tendrá simetr´ıa de cambio de escala si α y β son tales que se cumple (4.89), β = α1−k/2 , o sea si la transformaci´ on en longitudes y tiempos cumple: ′ 1−k/2 t′ l (4.92) = t l La ecuaci´ on (4.92) permite obtener algunas simples relaciones entre los per´ıodos de oscilaci´ on de sistemas periódicos que sólo difieren entre s´ı por sus dimensiones caracter´ısticas y para los cuales V sea funci´ on homogénea. Para el péndulo simple, donde el potencial mgz es funci´ on homogénea de grado 1: r t′ l′ = , (4.93) t l como se ve, es general; vale no sólo para peque˜ nas oscilaciones.

La formulaci´ on hamiltoniana / 97 Para el oscilador armónico simple V es funci´ on homogénea de grado k = 2. En este caso: t′ =1 t

(4.94)

Nos dice que el per´ıodo del movimiento no depende de la amplitud. Para el potencial gravitacional, V = −Gm1 m2 /r, k = −1. Entonces: t′ = t

′ 3/2 l l

(4.95)

En este caso la longitud caracter´ıstica es la distancia media al sol. La ecuaci´ on (4.95) expresa la tercera ley de Kepler, que vale para un potencial del tipo 1/r solamente. Una transformaci´ on can´ onica se refiere sólo a transformaciones de las coordenadas y momentos, pero no del tiempo. Sin embargo, la transformación (4.86), cuando las coordenadas cartesianas son a la vez generalizadas, es equivalente a la transformación can´ onica ~ri → α~ri ; ~ pi → (α/β)~ pi , i = 1, 2, ...N . En rigor (4.86) debe llamarse transfomaci´ on de semejanza mec´ anica.

4.3.

La segunda forma del principio de Hamilton

La segunda forma del principio de Hamilton es simplemente el principio variacional del cual puede obtenerse la trayectoria del sistema en el espacio de fases. En otras palabras, se busca hallar qué principio variacional conduce a las ecuaciones de Hamilton como ecuaciones de Euler-Lagrange, en el espacio de fases: Z x2 ∂f d ∂f − =0 (4.96) f (y, y ′ , x)dx = 0 implica que δ ′ dx ∂y ∂y x1 Sea la funci´ on: ˜ p, q, L(q, ˙ p, ˙ t) =

l X

ν=1

pν q˙ν − H(p, q, t)

(4.97)

˜ es funci´ L on de las variables se˜ naladas tomadas independientemente. En particular (p) y (q) ˙ toman todos los valores compatibles con las ligaduras, independientemente de que se puedan relacionar mediante una transfomación de Legendre. Sea ahora el siguiente principio variacional en el espacio de fases: δ

Z

t2

˜ p, q, L(q, ˙ p, ˙ t) dt = 0

(4.98)

t1

Con las condiciones en los extremos: δpν = 0 ,

δqν = 0

en

t = t1

y

t = t2 ;

ν = 1, 2, ...l

(4.99)

98 / Mec´ anica cl´ asica avanzada Las ecuaciones correspondientes de Euler-Lagrange son: ˜ ˜ d ∂L ∂L − = 0; dt ∂ q˙ν ∂qν

ν = 1, 2, ...l

˜ ˜ d ∂L ∂L − = 0; dt ∂ p˙ ν ∂pν

ν = 1, 2, ...l

(4.100)

Las ecuaciones (4.97) y (4.100) conducen a las ecuaciones canónicas de Hamilton. ˜ y L coinciden solamente sobre las trayectorias verdaderas, para las cuales se debe L cumplir que: pν =

∂L ∂ q˙ν

ν = 1, 2, ...l

(4.101)

El espacio de fases. La formulaci´ on lagrangiana est´ a definida en el espacio de configuraci´ on l-dimensional constituido por las coordenadas generalizadas q1 , q2 , ...ql . Matem´ aticamente, el espacio de configuración puede considerarse como una variedad diferenciable de l dimensiones. El espacio de los momentos generalizados también es l dimensional y est´ a constituido por los p1 , p2 , ...pl y se llama espacio de los momentos, que también es una variedad diferenciable de l dimensiones. Como sabemos, el estado del sistema puede describirse igualmente por (q, q) ˙ o por (p, p), ˙ o por dos puntos del espacio de configuración o el de momentos respectivamente. q1 , q2 , ...ql ; p1 , p2 , ...pl forman el espacio de fases que es una variedad diferenciable 2l-dimensional. Cada punto del espacio de fases representa un estado del sistema y cada trayectoria de fases representa un estado de movimiento del sistema. En efecto, las variables hamiltonianas (q, p) especifican exhaustivamente el estado del sistema. Ejemplo 4.3.1 Sea una part´ıcula de masa m sometida a la condición de ligadura de moverse sobre la superficie de un cilindro, y sometida a una fuerza restauradora lineal dirigida hacia el centro del cilindro, F~ = −k~r, donde se toma el origen de coordenadas en el centro del cilindro. Hacer un estudio de la trayectoria en el espacio de fases. Tomando el eje z a lo largo del eje del cilindro, la condición de ligadura se puede expresar por: x2 + y 2 = R2

(4.102)

Las coordenadas generalizadas pueden tomarse θ, z, donde θ es un ángulo en el ˙ z, z) plano perpendicular al eje del cilindro. Entonces L(θ, θ, ˙ será: 1 1 m(R2 θ˙2 + z˙ 2 ) − k(R2 + z 2 ) 2 2 Los momentos canónicos son: L=T −V = pθ = mR2 θ˙ ;

pz = mz˙

(4.103)

(4.104)

El hamiltoniano será: H =T +V =

1 p2θ p2z + kz 2 + 2 2m 2mR 2

(4.105)

La formulaci´ on hamiltoniana / 99 donde hemos suprimido una constante aditiva. Planteando las ecuaciones de Hamilton e integrándolas se llega a la solución: θ = θ0 + at z = z0 sen

(4.106) r

k t+δ m

!

(4.107)

donde θ0 , a, z0 y δ son constantes de integraci´ on. Las ecuaciones (4.106) y (4.107) permiten hallar la ecuaci´ on de la trayectoria en el espacio de configuración: ! r 1 k θ+φ , (4.108) z = z0 sen a m p gráficamente tomamos θ0 = 0, δ = 0, de modo que φ = 0. Llamando ω = k/m obtenemos: ω (4.109) θ = at ; z = z0 sen ωt ; z = z0 sen θ a x R –R m z

–z0

z0 R

y

–R w=a

Figura 4.1 Part´ıcula constre˜ nida a moverse sobre la superficie de un cilindro La figura 4.1 representa el caso en que ω = a. La trayectoria en el espacio de configuración siempre será cerrada cuando ω/a sea un n´ umero racional. La proyección del movimiento sobre el eje z es armónica simple y sobre el plano x − y es circular uniforme. Como l = 2, el espacio de fases es 4-dimensional, constituido por θ, pθ , z, pz . Como pθ es constante, pθ = mR2 a, basta representar la proyección del espacio 4-dimensional sobre el subespacio 3-dimensional θ, z, pz . La proyección de la trayectoria de fases sobre pθ es un punto. El movimiento en z es armónico simple. El diagrama de fases z, ˙ z, es una elipse. Igualmente la proyección de la trayectoria de fases sobre el plano z, pz será una elipse. El

100 / Mec´ anica cl´ asica avanzada ˙ θ, es una l´ınea recta, como también la proyección de la trayectoria diagrama de fases θ, de fases sobre el plano θ, pθ . La proyección de la trayectoria de fases en el subespacio tridimensional θ, z, pz , es una hélice el´ıptica. Esto es representado en la figura 4.2. pz

Ez = cte

pθ

pθ = cte θ

z

pθ = mR2a pz2 1 Ez = + kz 2 zm i2

pθ

pz

pθ = cte

θ z Superficie Ez = cte

Figura 4.2 Arriba: diagramas de fases sobre los planos z-pz y θ-pθ respectivamente. Abajo: Proyecci´ on de la trayectoria de fases en el subespacio tridimensional θ, z, pz . Para este ejemplo, el principio de Hamilton dice que la trayectoria correcta en el espacio de configuración es aquella para la cual la integral de acción es extremal: # Z t2 "X Z t2 l ∂L L(q, q, ˙ t) dt = δ δ q˙ν − h(q, q, ˙ t) dt = 0 ∂ q˙ν t1 t1 ν=1 (4.110) {δqν (t1 ) = δqν (t2 ) = 0} En tanto que el principio de Hamilton en el espacio de fases (segunda forma del principio de Hamilton) dice que la trayectoria correcta en el espacio de fases es aquella ˜ (véase figura 4.2): para la cual es extremal la integral sobre dt de L δ

Z

t2

˜ q, L(q, ˙ p, p, ˙ t) dt =

δ

Z

l t2 X

t1 ν=1

t1

[pν q˙ν − H(q, p, t)] dt = 0

δqν (t1 ) =

δqν (t2 ) = 0

δpν (t1 ) =

δpν (t2 ) = 0

(4.111)

La formulaci´ on hamiltoniana / 101

4.4.

Las transformaciones puntuales. Las transformaciones en el espacio de fases

Puntuales son las transformaciones de un sistema de coordenadas generalizadas a otro: qν → q ν = q ν (q, t) ;

ν = 1, 2, ...l

(4.112)

Las velocidades generalizadas se transforman como: q˙ µ =

l X ∂q ν ∂q ˙ t) ; q˙µ + ν = q˙ ν (q, q, ∂qµ ∂t ν=1

ν = 1, 2, ...l

(4.113)

Bajo estas transformaciones, tanto las ecuaciones de Lagrange como las de Hamilton son covariantes. Transformaciones en el espacio de fases. Son transformaciones más generales que las puntuales. Si para definir el estado del sistema se requiere todo el espacio de fases, podemos pensar que cualquier conjunto de variables (2l) sirve equivalentemente para describir el estado. Un cambio de variables en el espacio de fases involucra no sólo las coordenadas generalizadas sino también los momentos: qν , pν → q ν = q ν (q, p, t) ;

pν = pν (q, p, t) ;

ν = 1, 2, ...l

(4.114)

Ejemplo 4.4.1 Un oscilador armónico unidimensional. El espacio de fases es bidimensional, definido por las “coordenadas cartesianas” x − px . Definir en el espacio de fases una transformaci´ on a “coordenadas polares”; hallar a H y las ecuaciones de Hamilton en esas variables (véase figura 4.3). Nota: es irrelevante reemplazar a px por px /mω. La transformaci´ on a coordenadas polares est´ a dada por: p2x = r2 m2 ω 2 px tan φ = mωx x+

(4.115) (4.116)

Entonces H se transforma as´ı: H=

p2x 1 p2 1 1 + mω 2 x2 = mω 2 x2 + 2x 2 = mω 2 r2 2m 2 2 m ω 2

(4.117)

Es decir, el nuevo hamiltoniano es: 1 mω 2 r2 2 Las ecuaciones de Hamilton se transforman as´ı: ∂H ∂r ∂H ∂φ ∂H = + x˙ = ∂px ∂r ∂px ∂φ ∂px H=

∂H px 1 ∂H = + ∂r m2 ω 2 r ∂φ mωx sec2 φ

(4.118)

(4.119)


px / mω

r

ϕ

x

Figura 4.3 Espacio de fases para el oscilador armónico unidimensional

p˙ x = −

∂H ∂x

=− =−

∂H ∂φ ∂H ∂r + ∂r ∂x ∂φ ∂x

−px ∂H x ∂H + ∂r r ∂φ mωx2 sec2 φ

(4.120)

Se obtiene entonces para ∂H/∂px y ∂H/∂x: ∂H ∂H senφ ∂H cos φ = + ∂px ∂r mω ∂φ mωr

(4.121)

∂H ∂H ∂H sen φ = cos φ − ∂x ∂r ∂φ r Por otra parte se tiene para x˙ y p˙ x : x˙ =

∂x ˙ ∂x φ = cos φ r˙ − r senφ φ˙ r˙ + ∂r ∂φ (4.122)

p˙x =

∂px ∂px ˙ φ = mω senφ r˙ + mωr cos φ φ˙ r˙ + ∂r ∂φ

o sea que las ecuaciones de Hamilton se transforman en: ∂H senφ ∂H cos φ cos φ r˙ − r senφ φ˙ = + ∂r mω ∂φ mωr

(4.123)

La formulaci´ on hamiltoniana / 103 ∂H ∂H senφ mω senφ r˙ + mωr cos φ φ˙ = − cos φ + ∂r ∂φ r

(4.124)

˙ El resultado se Podemos resolver simult´ aneamente a (4.123) y (4.124) para r˙ y φ. obtiene f´ acilmente con notaci´ on matricial:    r˙ cos φ −senφ   = ˙ senφ cos φ rφ 

∂H senφ cos φ  ∂r 1     1 ∂H mω − cos φ senφ r ∂φ 





(4.125)

   

Esto se puede escribir también como:     r˙ cos φ senφ cos φ −senφ    = ˙ −senφ cos φ senφ cos φ rφ 

∂H cos φ +senφ senφ cos φ  ∂r 1     mω  1 ∂H −senφ cos φ − cos φ senφ r ∂φ 





De donde:



∂H r˙ 0 1  ∂r  = 1    mω  1 ∂H −1 0 rφ˙ r ∂φ 











(4.126)

   



 1 ∂H   1    r ∂φ  =    mω  ∂H  − ∂r

(4.127)

Con lo cual las ecuaciones de movimiento en las nuevas variables son: r=

1 ∂H ; mωr ∂φ

1 ∂H φ˙ = − mωr ∂r

(4.128)

Vemos que en las variables (r, φ) las ecuaciones de movimiento no toman la misma forma que las ecuaciones can´ onicas (no son r = ∂H/∂φ; φ˙ = −∂H/∂r, por ejemplo). En general, una transformaci´ on de variables en el espacio fásico cambia la forma de las ecuaciones de movimiento. En general, las ecuaciones de Hamilton no son covariantes bajo transformaciones arbitrarias en el espacio de fases. Notemos sin embargo, que hay una transformaci´ on can´ onica en términos de (r, φ). Hagamos ahora el nuevo cambio de variables: (r, φ) → (r2 , φ)

(4.129)

104 / Mec´ anica cl´ asica avanzada Si llamamos ρ = r2 , tenemos que: ∂H ∂H = 2r ; ∂r ∂ρ

ρ˙ = 2r r˙

(4.130)

O sea que las ecuaciones de Hamilton para las variables (ρ, φ), que obtenemos de (4.128) y (4.130), son: mω ∂H ρ˙ = ; 2 ∂φ

2 ∂H φ˙ = − mω ∂ρ

Notemos finalmente que si llamamos q, p, a: mω q = −φ ; p = ρ 2

(4.131)

(4.132)

las ecuaciones (4.131) se convierten en: ∂H ; p˙ = − ∂q

∂H q˙ = ∂p

(4.133)

O sea que la transformaci´ on en el espacio fásico bidimensional definida por: r √ 2p cos q ; x= px = − 2ωp senq mω (4.134) 2 mω p p x p= x2 + 2x 2 ; q = −tan−1 2 m ω mωx deja covariantes las ecuaciones de Hamilton, donde el nuevo hamiltoniano se obtiene del anterior simplemente expresando a x y px en funci´ on de q y p mediante las fórmulas (4.134): H = (q, p) = H [x(q, p), px (q, p)]

(4.135)

Se dice entonces que la transformaci´ on (4.134) es can´ onica. La referencia hecha en el enunciado al oscilador armónico no es importante, pues la covariancia de las ecuaciones de Hamilton bajo la transformaci´ on (4.134) no depende de la forma de H, siendo aplicable a cualquier sistema de un grado de libertad. En general, a la pregunta acerca de la covariancia de las ecuaciones de Hamilton bajo una transformaci´ on arbitraria en el espacio de fases, (q, p) → (q, p), se responde que no necesariamente son covariantes. Pero existe una clase de transformaciones para las cuales esto se cumple; tales transformaciones se llaman canónicas o de contacto. La transformaci´ on empleada en las ecuaciones (4.90), (4.91) y (4.134), son ejemplos de transformaciones can´ onicas. Ejemplo 4.4.2 Efectuar una rotación con velocidad angular constante a en el espacio de fases bidimensional. Mostrar que tal transformaci´ on es canónica sólo si al nuevo hamiltoniano se le adiciona un término. Mostrar que las fórmulas de transformaci´ on y el nuevo hamiltoniano se pueden obtener a partir de las primeras derivadas de cierta on diferencial parcial si se anula el funci´ on F (q, q, t). Mostrar que F satisface una ecuaci´ nuevo hamiltoniano, lo cual es posible para un oscilador armónico.

La formulaci´ on hamiltoniana / 105 Las f´ ormulas de la transformaci´ on y su inversa son: p q = q cos at + sen at ; p = −cq sen at + p cos at c q q = q cos at − sen at ; p = cq sen at + p cos at c donde a y c son par´ ametros de la transformaci´ on que permanecen constantes. Es simple probar que:      q˙  q˙ cos at −sen at       =  ˙  p˙ p sen at cos at c c   q  −sen at − cos at   +a   p  cos at −sen at c y que:     ∂H ∂H   cos at −sen at     ∂p ∂p       =    1 ∂H   1 ∂H  sen at cos at − − c ∂q c ∂q Igualando los lados derechos de (4.137) y (4.138) obtenemos:  ∂H   ˙    q  q 0 −1   ∂p         =  ˙  + a  p   1 ∂H  q 1 0 − c c c ∂q

(4.136)

(4.137)

(4.138)

(4.139)

Las ecuaciones de movimiento para las variables q y p son: a ∂H = q˙ − p ; ∂q c

∂H = −p˙ − acq ∂q

(4.140)

Estas ecuaciones serán de forma canónica solamente si se cambia el nuevo hamiltoniano:1 2 p 1 (4.141) H(q, p) = H [q(q, p), p(q, p)] + a + cq 2 2 c Notemos que las ecuaciones (4.136) permiten expresar a p/c y p/c en términos de q, q: q − q cos at p = ; c sen at 1 En

p −q + q cos at = c sen at

(4.142)

as ciertos general una transformaci´ on dependiente del tiempo es can´ onica si H es igual a H m´ t´ erminos adicionales.

106 / Mec´ anica cl´ asica avanzada Si F es la funci´ on de q, q y t siguiente: F (q, q, t) = c

2qq − (q 2 + q 2 ) cos at 2 sen at

(4.143)

Comparando a (4.142) y (4.143) vemos que: p=

∂F (q, q, t) ; ∂q

p=−

∂F (q, q, t) ∂q

(4.144)

Como las ecuaciones (4.144) son completamente equivalentes a las ecuaciones de transformaci´ on (4.136), se dice que F es la funci´ on generatriz de la transformaci´ on, que será can´ onica solamente si el nuevo hamiltoniano es: H =H+

∂F ∂t

(4.145)

puesto que, ∂F (q, q, t) −2qq cos at + q 2 + q 2 ca = ca = 2 ∂t 2 sen at 2

p2 2 q + 2 c

(4.146)

Los anteriores resultados valen para cualquier sistema de un grado de libertad. Para un oscilador armónico encontramos que: k 2 1 c2 p2 H[q(q, p), p(q, p)] = + q + − k q 2 sen2 at 2m 2 2 m (4.147) p2 k c 1 k q p sen at cos at + sen2 at + − − m c 2 c2 m Si escogemos el valor de c tal que: c2 = km

(4.148)

Obtenemos que: H(q, p) =

k q2 a p2 + q 2 + ( + cq 2 ) 2m 2 2 c

(4.149)

H será cero solamente si a y c cumplen: 1 a + = 0; m c

k + ac = 0

(4.150)

Es decir, si a =√ −c/m = −k/c, valor que es compatible con el valor de c dado por (4.148). Como c = ± km, a debe valer: r k (4.151) a=± m Tomamos negativo el valor de c para que a sea positiva y coincida con la frecuencia p del oscilador ω = k/m. Notamos que H = 0 implica que q y p son constantes, o sea que las f´ ormulas (4.136) nos dan directamente la solución en términos de q y p que se

La formulaci´ on hamiltoniana / 107 determinan por las condiciones iniciales de q y p.2 Es simple verificar que F satisface la ecuaci´ on diferencial llamada de Hamilton-Jacobi para el oscilador armónico: 2 ∂F 1 ∂F 1 + kq 2 + =0 (4.152) 2m ∂q 2 ∂t F es una solución de (4.152) que no posee la propiedad de ser la suma de una funci´ on de t y una funci´ on de q. Posteriormente veremos que (4.152) posee otra solución por el método de separación de variables (llamada solución completa) que genera otra trasformaci´ on can´ onica que anula el hamiltoniano para un oscilador armónico.

4.5.

Las transformaciones can´ onicas o de contacto

Estas transformaciones en el espacio de fases son importantes, entre otras cosas, porque conservan el formalismo canónico y permiten reemplazar el hamiltoniano H por una H que tenga una forma mucho más simple. As´ı por ejemplo, es posible mediante una transformaci´ on can´ onica hacer que todas las coordenadas sean c´ıclicas; con ello la solución de un problema mecánico se reduce a un problema de geometr´ıa en el espacio de fases: hallar la transformaci´ on canónica adecuada. Ejemplo 4.5.1 Mostrar que la transformaci´ on de cambio de escala es canónica independientemente de las propiedades de homogeneidad del potencial. Tal transformaci´ on es:

q ν = αqν ;

pν = βpν ;

α 6= 0 ,

β 6= 0 ;

ν = 1, 2, ...l

(4.153)

Mediante esta transformaci´ on se tiene: ∂H ∂H =α ; ∂qν ∂q ν 1 q˙ν = q˙ν ; α

∂H ∂H =β ∂pν ∂pν 1 p˙ ν = p˙ ν ; β

(4.154)

ν = 1, 2, ...l

con lo cual las ecuaciones de Hamilton se convierten en: ∂H ; q˙ ν = αβ ∂pν

∂H ; p˙ ν = −αβ ∂q ν

ν = 1, 2, ...l

(4.155)

En las nuevas variables (q, p) las ecuaciones de movimiento serán de la forma canónica solamente si se cambia el hamiltoniano. H(q, p, t) = αβH(q, p, t)

(4.156)

2 Tambi´ en H = 0 si tomamos C = mω, a = −ω. Como el punto representativo del estado del oscilador en el espacio f´ asico (v´ ease figura 4.3), rota en el sentido de las agujas del reloj con velocidad angular ω, a el punto estacionario. H describe pues, un problema de equilibrio. con las coordenadas q y q se ver´

108 / Mec´ anica cl´ asica avanzada Este ejemplo, al igual que los dos anteriores, ilustra el hecho de que el car´ acter can´ onico de una transformaci´ on es algo inherente a la transformaci´ on misma, independientemente de la forma del hamiltoniano, en particular, independientemente de sus propiedades de simetr´ıa. Por esto cualquier sistema de l grados de libertad posee ecuaciones de movimiento covariantes bajo la transformaci´ on (4.153), aunque solamente si el potencial es funci´ on homogénea de las coordenadas el sistema posee simetr´ıa de semejanza mecánica, ecuaci´ on (4.92). As´ı mismo las transformaciones (4.115) y (4.116), no can´ onicas, y (4.134), canónica, pueden hacerse sin referencia alguna a la forma del hamiltoniano. Sin embargo, para un hamiltoniano dado, sólo cierta transformaci´ on canónica permite obtener un nuevo hamiltoniano de forma simple. As´ı, para un oscilador armónico lineal la transformaci´ on canónica (4.134) conduce a que H = ωp, o sea a que φ sea c´ıclica en H. Sin embargo (4.134) es aplicable a cualquier sistema de un grado de libertad. De forma similar (4.136) conduce a H = 0 para el oscilador. Ejemplo 4.5.2 Mostrar que es canónica la transformaci´ on: q ν = αpν ;

pν = βqν ;

α 6= 0 ,

β 6= 0 ;

ν = 1, 2, ...l

(4.157)

En este caso: H = −αβH

(4.158)

En particular, la transformaci´ on con α = 1, β = −1: q ν = pν ;

pν = −qν ;

ν = 1, 2, ...l,

(4.159)

es can´ onica con H = H. Este ejemplo muestra que las nociones de “coordenada” y “momento” pierden su sentido inicial, pues mediante una transformaci´ on canónica (T.C.) es posible hacer que los momentos pasen a hacer el papel de coordenadas y viceversa. Como en general q ν = q ν (q, p, t) y pν = pν (q, p, t), con las fórmulas inversas qν = qν (q, p, t); pν = pν (q, p, t), se ve que se requieren tanto (q) como (p) para poder especificar la posición del sistema en el espacio de configuración. (q) y (p) no son pues “coordenadas” y “momentos” generalizados, sino simplemente pares de cantidades can´ onicamente conjugadas. En conclusi´ on, en el espacio de fases el estado del sistema se especifica mediante un conjunto completo (de 2l) de cantidades canónicamente conjugadas.

4.6.

La funci´ on generatriz de una transformaci´ on can´ onica

Las ecuaciones canónicas pueden deducirse de un principio variacional en el espacio de fases (segunda forma del principio de Hamilton) y viceversa: ! Z t2 X l ∂H δ pν q˙ν − H dt = 0 ↔ q˙ν = ∂pν t1 ν=1 (4.160) ∂H ; ν = 1, 2, ...l p˙ν = − ∂qν

La formulaci´ on hamiltoniana / 109

que:

Si la transformaci´ on (q, p) ↔ (q, p) es canónica, entonces debe también cumplirse δ

Z

t2

t1

l X

!

pν q˙ ν − H

ν=1

∂H ; p˙ ν = − ∂qν

∂H dt = 0 ↔ q˙ ν = ; ∂pν

(4.161)

ν = 1, 2, ...l

Las ecuaciones (4.160) y (4.161) indican que hay dos expresiones variacionales de las cuales pueden deducirse las ecuaciones de Hamilton. De acuerdo con la propiedad enunciada en (3.76), se sigue que los integrandos en las variacionales deben diferir a lo sumo por la derivada total respecto al tiempo de una funci´ on arbitraria de las “coordenadas” de que depende dicho integrando y del tiempo, o sea de (q, p, t), o de (q, p, t): l X

ν=1

pν q˙ν − H =

l X

ν=1

pν q˙ ν − H +

d F (q, p, t) dt

(4.162)

an relacionadas mediante la transformaci´ on canónica, Debido a que (q, p) y (q, p) est´ F (q, p, t) puede expresarse en funci´ on de cualquier subconjunto de 2l cantidades indeon pendientes extraidos del conjunto de 4l cantidades (q, p, q, p) dependientes. La ecuaci´ (4.162) puede escribirse como: dF =

l X

ν=1

pν dqν −

l X

ν=1

pν dq ν + H − H dt

(4.163)

En el caso en que las 2l cantidades (q, q) sean independientes, podemos expresar a F en funci´ on de (q, q, t). En ese caso la T.C. se llama “transformación canónica libre de la primera clase”. Matem´ aticamente, la independencia de las 2l cantidades (q, q) se expresa mediante la condición de que el jacobiano de las (q) respecto a las (p) sea diferente de cero, lo cual garantiza que las (p) se puedan expresar en términos de las (q): ∂qµ q 1 , q 2 , ...q l J ≡ det 6= 0 (4.164) p1 , p2 , ...pl ∂pν Si se cumple (4.164) entonces es posible expresar los pν en funci´ on de (q, q, t) y por lo tanto representar cualquier funci´ on de (q, p, t) en términos de (q, q, t). En este caso es posible escribir: F (q, p, t) = F1 (q, q, t)

(4.165)

Esto permite escribir: dF = dF1 =

l l X X ∂F1 ∂F1 ∂F1 dqν + dq ν + dt ∂qν ∂qν ∂t ν=1 ν=1

(4.166)

Como las 2l + 1 cantidades (dq, dq, dt) son independientes, vemos que para una transfomaci´ on can´ onica libre de la primera clase, de (4.163) y (4.166) se sigue que: pν =

∂F1 (q, q, t) ; ∂qν

pν = −

∂F1 (q, q, t) ; ∂qν

ν = 1, 2, ...l

(4.167)

110 / Mec´ anica cl´ asica avanzada Además se sigue que: ∂F1 (q, q, t) (4.168) dt La ecuaci´ on (4.167) dice que a cada transformaci´ on canónica libre de la primera clase le corresponde una funci´ on F1 y viceversa. F1 se llama la funci´ on generatriz de la transformaci´ on can´ onica.3 H(q, p, t) − H(q, p, t) =

Ejemplo 4.6.1 Hallar la transformaci´ on canónica generada por la funci´ on: F1 (q, q, t) = −

l X

qν q ν

(4.169)

ν=1

En (4.169) est´ a impl´ıcito que (q) y (q) son independientes. Por lo tanto las fórmulas de la transformaci´ on canónica serán: ∂F1 (4.170) pν = = −q ν ⇒ q ν = −pν ; ν = 1, 2, ...l ∂qν pν = −

∂F1 = qν ⇒ pν = qν ; ∂qν

ν = 1, 2, ...l

(4.171)

Es esencialmente la misma transformaci´ on (4.159), que intercambia coordenadas y momentos. Este ejemplo muestra que cada funci´ on de (q, q, t) define una transformaci´ on can´ onica Ejemplo 4.6.2 Probar que la transformaci´ on canónica (4.134) es libre de la primera clase. Hallar la correspondiente funci´ on F1 . Sea q = x y p = px . Las fórmulas de transformaci´ on serán entonces: r p 2p q= cos q ; p = − 2mωp sen q mω p2 1 p p = mω x2 + 2 2 ; q = −tan−1 2 m ω mωq El jacobiano (4.164) es trivial y diferente de cero: ∂q q J 6= 0 = p ∂p

(4.172) (4.173)

(4.174)

O sea que la transformaci´ on es libre de la primera clase y puede ser generada por cierta funci´ on de las variables independientes q y q. La transformaci´ on no depende del tiempo, pues suponemos a m y a ω constantes. Notamos de (4.174) que toda transformaci´ on can´ onica no puntual es libre de primera clase para sistemas de un grado de libertad. F1 (q, q, t) ha de ser tal que, de acuerdo con (4.163): p2 1 dF1 = p dq − pdq = p dq − mω q 2 + 2 2 dq (4.175) 2 m ω 3 La

funci´ on del ejemplo 4.4.2, (4.143), es la funci´ on generatriz de la transformaci´ on can´ onica (4.136).

La formulaci´ on hamiltoniana / 111 Debemos expresar a p en términos de q y q lo cual se obtiene directamente de (4.173): p = −mωq tan q

(4.176)

Reemplazando a (4.176) en (4.175) obtenemos: 1 = −mωq tan q dq − mωq 2 sec2 q dq 2 1 2 q tan q = −mωd 2

dF1

(4.177)

Se sigue entonces que, salvo una constante aditiva: 1 F1 (q, q) = − mωq 2 tan q 2

(4.178)

Podemos probar directamente, usando las fórmulas (4.167), que F1 dada por (4.178) efectivamente genera la transformaci´ on dada por (4.172) y (4.173): ∂F1 = −mωq tan q ; ∂q

∂F1 1 = − mωq 2 sec2 q ∂q 2

(4.179)

O sea que: p = −mωq tan q ;

p=

1 mωq 2 sec2 q 2

(4.180)

Al despejar en (4.180) a p y q obtenemos a (4.170), y al despejar a p y q obtenemos a (4.173). Notemos que −Et − mωq 2 tan q/2 es una solución a la ecuaci´ on de HamiltonJacobi (4.152). Ejemplo 4.6.3 Sea una part´ıcula descrita por el hamiltoniano: H=

p2 − aq 2m

(4.181)

donde m y a son constantes. Hallar la T.C. que lleva al hamiltoniano: H=0

(4.182)

En las nuevas variables las ecuaciones de Hamilton con H = 0 conducen a la solución trivial: p = constante ;

q = constante

(4.183)

La transformaci´ on ha de ser tal que se cumpla para F1 , seg´ un (4.167) y (4.168): ∂F1 = p; ∂q

∂F1 = −p ; ∂q

−H =

∂F1 ∂t

(4.184)

112 / Mec´ anica cl´ asica avanzada Se sigue de (4.181) y (4.184) que F1 debe ser solución a la ecuaci´ on diferencial de Hamilton-Jacobi: 2 1 ∂ ∂ F1 (q, q, t) − aq = − F (q, q, t) (4.185) 2m ∂q ∂t La ecuaci´ on diferencial es de primer orden e involucra derivadas respecto a q y respecto a t. La solución debe contener constantes de integraci´ on arbitrarias; una de ellas puede ser aditiva. Podemos tomar a q como la constante no aditiva de integraci´ on. La ecuaci´ on (4.185) tiene una solución de la forma: F1 (q, q, t) = −qt + f (q, q)

(4.186)

La ecuaci´ on (4.186) equivale a tomar la constante q igual a la energ´ıa, puesto que H en (4.181) es constante, H = E: q=E

(4.187)

Con esta solución, (4.184) se reduce a: 2 1 df (q, q) − aq = q 2m dq Integrando (4.188) obtenemos: √ 2 2m (q + aq)3/2 + constante f (q, q) = ± 3 a Con lo cual, omitiendo la constante aditiva: √ 2 2m F1 (q, q, t) = −qt ± (q + aq)3/2 3 a

(4.188)

(4.189)

(4.190)

La ecuaci´ on (4.190) genera la siguiente transformaci´ on canónica, de acuerdo con las f´ ormulas (4.167): √ p 2m p −p = −t ± q + aq (4.191) p = ± 2m(q + aq) ; a Expl´ıcitamente la transformaci´ on es:

a q (t − p)2 q(q, p, t) = − + a 2m

p(q, p, t) = (t − p)a ; p(q, p, t) = t −

p ; a

q(q, p, t) =

p2 − aq 2m

(4.192) (4.193)

Como q y p son constantes, (4.192) proporciona la solución al problema del movimiento descrito por (4.181). En particular describe el problema del movimiento de una part´ıcula en presencia de la gravedad (a = −mg , q = z , p = mz). ˙ z=

1 E − g(t − p) ; mg 2

mz˙ − mg(t − p)

(4.194)

La formulaci´ on hamiltoniana / 113 Las constantes E y p tienen las siguientes expresiones en funci´ on de los valores de z y z˙ en t = 0: E=

1 mv 2 + mgz0 ; 2 0

p=

v0 g

(4.195)

Entonces para z(t) y z(t) ˙ obtenemos: 1 z = z0 + v0 t − gt2 ; z˙ = v0 − gt (4.196) 2 de acuerdo con el resultado obtenido usando métodos elementales. Es claro que la transformaci´ on dada por (4.192) y (4.193) es canónica independientemente de la forma de H y aplicable a cualquier sistema de un grado de libertad; sin embargo, sólo para H dado por (4.181) mediante (4.192) se consigue H = 0 y por tanto que q y p sean constantes. Este problema ilustra el método de resolver un problema mecánico mediante una transformaci´ on canónica sin integrar las ecuaciones de Hamilton.

4.7.

La evoluci´ on temporal de un sistema considerada como una transformaci´ on can´ onica

Sean qν0 y p0ν los valores de qν y pν en t = t0 (ν = l, 2, ...l). Estos valores determinarán todos los valores sucesivos de las (q, p), de modo que en un tiempo t podemos escribir: qν (t) = qν (q 0 , p0 , t − t0 ) ;

ν = 1, 2, ...l (4.197)

pν (t) = pν (q 0 , p0 , t − t0 ) La ecuaci´ on (4.197) puede considerarse como una cierta transformaci´ on en el espacio de fases, donde (q 0 , p0 ) son las viejas variables y (q, p) las nuevas. Esta transformación es can´ onica pues tanto (q 0 , p0 ) como (q, p) satisfacen las ecuaciones de Hamilton. La funci´ on generatriz de esta transformaci´ on satisface: dF =

l X

ν=1

p0ν dqν0 −

l X

ν=1

pν dqν + (H 0 − H) dt

(4.198)

Si no hay fuerzas disipativas y las ecuaciones que definen las coordenadas generalizadas no dependen del tiempo, H se conserva, H = H 0 , luego: t l l l X X X 0 0 dF = pν dqν − pν dqν = − pν dqν (4.199) ν=1

ν=1

ν=1

t0

Por otra parte, escribamos la integral de acción entre t0 y t: Z t L dt S= t0

(4.200)

114 / Mec´ anica cl´ asica avanzada Una variaci´ on de las (q) nos conduce a: Z tX l ∂L ∂L δS = δqν + δ q˙ν dt ∂ q˙ν t0 ν=1 ∂qν Z tX l d ∂L d ∂L ∂L δqν dt δqν + δqν − = dt ∂ q˙ν dt ∂ q˙ν t0 ν=1 ∂qν =

Xl

ν=1

(4.201)

t # Z t "X l ∂L ∂L ∂L d δqν dt δqν + − ∂ q˙ν dt ∂ q˙ν t0 ν=1 ∂qν t0

Si asumimos que la trayectoria es real, se cumplen sobre ella las ecuaciones de Lagrange, luego: t t l l X X ∂L (4.202) pν δqν δqν = δS = ∂ q˙ν t0 ν=1

ν=1

t0

Comparando a (4.199) y (4.202) vemos que: F = −S

(4.203)

En conclusi´ on, la acción es la funci´ on generatriz de la transformaci´ on canónica ´ de evoluci´ on temporal del sistema. Esta es una transformaci´ on del espacio de fases en s´ı mismo: cambia el punto del espacio de fases (q 0 , p0 ) por el punto del espacio de fases (q, p). En el ejemplo del oscilador armónico lineal, la figura 4.3 es una circunferencia. La evoluci´ on temporal consiste simplemente en una rotación del vector de posición del punto del espacio f´ asico que representa al sistema, lo cual también puede verse en las f´ ormulas (4.172), y más claramente a´ un mediante el ejemplo 4.4.2.

4.8.

El teorema de Liouville

El teorema de Liouville es un teorema b´ asico para la mecánica estad´ıstica, o sea la mecánica de sistemas tales que: (a) El n´ umero de grados de libertad es muy grande. (b) No se pueden determinar las 2l condiciones iniciales, y por lo tanto tampoco el estado del sistema en sentido clásico. Solamente se conoce el hamiltoniano del sistema, las condiciones de ligadura, y a lo sumo siete de las 2l constantes de movimiento (las ~ P~ ). aditivas: H, L, (c) Respecto a las condiciones iniciales, o sea a las posibles trayectorias del espacio de fases, sólo se pueden hacer suposiciones estad´ısticas. En particular se puede asumir que todas las trayectorias de fase compatibles con las ligaduras y con los valores de las siete constantes de movimiento aditivas son igualmente probables (distribuci´ on uniforme). En general, habr´ a una región del espacio de fases que es accesible al sistema y se puede postular alguna distribuci´ on de probabilidades de las distintas trayectorias de fase dentro de la región accesible (las trayectorias externas a la regi´ on accesible tienen probabilidad cero).

La formulaci´ on hamiltoniana / 115 Ejemplo 4.8.1 Analizar un oscilador armónico lineal cuando sólo se conoce exactamente su energ´ıa. Mediante la transformaci´ on canónica (4.172), la dinámica del oscilador est´ a descrita por: q=

r

2p cos q ; mω

p=−

p 2mωp senq ;

H = ωp = E

(4.204)

Las ecuaciones can´ onicas en las variables (q, p) tienen la solución: E = constante (4.205) ω donde δ es una constante arbitraria. La otra constante arbitraria es E. O sea que dados E y δ queda determinado completamente el estado de movimiento: r 2E cos (ωt + δ) q(E, δ, t) = mω 2 (4.206) √ p(E, δ, T ) = − 2mE sen(ωt + δ) q = ωt + δ ;

p=

p / mω

r

t>0

δ

q

(2E / mω 2 ) 1/2 t=0

Figura 4.4 Espacio de fases del oscilador armónico lineal para E conocida E define el radio de la trayectoria y δ el tiempo inicial de la misma (véase figura 4.4). on accesible la constituyen todos los puntos de una circunferencia de radio p La regi´ 2E/(mω 2 ). Las diferentes trayectorias est´ an definidas por los valores de δ.

Ejemplo 4.8.2 Analizar el oscilador tridimensional sometido a la ligadura de moverse u ńicamente sobre la superficie de un cilindro, cuando sólo se conoce exactamente la energ´ıa y el momento angular en la direcci´ on z (ver ejemplo 4.3.1).

116 / Mec´ anica cl´ asica avanzada La figura 4.2 muestra que cada valor de Ez determina un “cilindro” en el espacio de fases. La energ´ıa total es, de acuerdo con la ecuaci´ on (4.105): L2z (4.207) 2mR2 Parte de la energ´ıa est´ a asociada al movimiento en z y parte a la rotación, siendo ambas constantes por separado. Para Lz arbitrario, la región accesible del espacio fásico est´ a definida por el “cilindro” E = constante. Todos los puntos interiores a este cilindro son accesibles. Para Lz y Ez dados, habr´ a un conjunto infinito de trayectorias de fase en “espiral”, caracterizada cada una por los valores de θ0 y δ [ecuaciones (4.106) y (4.107)], que pueden estar entre 0 y 2π. En el caso en que se conozcan Lz y Ez , la distribuci´ on uniforme para este sistema es aquella en la cual todos los valores de θ0 y δ tienen igual probabilidad. En general cuando sólo se conocen exactamente la energ´ıa total, el momento lineal total y el momento angular total del sistema, además de las ligaduras, la región del espacio de fases accesible al sistema est´ a definida por las ecuaciones: E = Ez +

E(q, p) = E0 ;

~ p) = L ~0 ; L(q,

P~ (q, p) = P~0

(4.208)

que definen una variedad de 2l − 7 dimensiones en el espacio de fases.4 Las 2l − 7 constantes de movimiento adicionales no son determinadas; la distribuci´ on microcan´ onica asigna a cada uno de los estados caracterizados por (4.208) y los valores de las 2l − 7 constantes restantes igual probabilidad. Conjunto estad´ıstico. Es una noción u ´til en los casos donde hay 2l−7 constantes de movimiento no determinadas. Consiste en un conjunto de sistemas iguales (el mismo n´ umero de grados de libertad, la misma clase de part´ıculas y de interacciones, las mismas ligaduras y los mismos valores de las constantes de movimiento aditivas). Es decir, dos sistemas de un conjunto estad´ıstico sólo pueden diferir por los valores de las 2l − 7 constantes no aditivas. Se considera que el n´ umero de sistemas es muy grande, de modo que es una muestra estad´ısticamente representativa de la distribuci´ on de los valores de las 2l − 7 constantes indeterminadas. En cada instante del tiempo, el estado de cada sistema del conjunto será representado por un punto del espacio fásico, y su estado de movimiento por una trayectoria de fases. El conjunto estad´ıstico de sistemas de l grados de libertad estar´ a representado en cada instante por un “enjambre” de puntos del espacio f´ asico. Como los sistemas del conjunto estad´ıstico no interact´ uan, cada punto se mueve independientemente de los dem´ as en el espacio fásico 2l-dimensional.5 Teorema de Liouville. En cada elemento de volumen del espacio fásico la densidad de puntos representativos del conjunto estad´ıstico permanece constante en el tiempo. Sea dΓ = dq1 dq2 , ...dql dp1 , dp2 , ...dpl = dΓq dΓp un elemento de volumen infinitesimal del espacio de fases. Sea: dN = ρ(p, q, t)dΓq dΓp

(4.209)

4 Estas constantes tienen la propiedad de ser aditivas. La variedad puede reducirse si tomamos en cuenta que asociadas a la posici´ on del centro de masa de un sistema libre hay tres constantes; quedar´ıan en ese caso 6N − 10 constantes no determinadas. 5 Un conjunto estad´ ıstico tiene analog´ıa con los “ensambles” que mencionamos en la secci´ on 2.3.

La formulaci´ on hamiltoniana / 117 el n´ umero de sistemas dentro de dΓ. A ρ(q, p, t) se le llama la funci´ on de distribuci´ on estad´ıstica y hace el papel de funci´ on de densidad de probabilidad en el espacio de fases. ρ satisface la condición de normalizaci´ on: Z ρdΓq dΓp = 1 (4.210) donde la integral abarca todo el espacio de fases. Matem´ aticamente el teorema dice que: l

ρ˙ = 0

o

dρ X = dt ν=1

∂ρ ∂ρ q˙ν + p˙ ν ∂qν ∂ p˙ ν

+

∂ρ =0 ∂t

(4.211)

Una forma cualitativa de visualizarlo se da a continuación. Sea un volumen arbitrario del espacio de fases en t = t0 . Como el n´ umero de sistemas es muy grande, en la frontera de tal volumen habr´ a un gran n´ umero de puntos representativos de sistemas del conjunto, de modo que aproximadamente podemos decir que la frontera del elemento de volumen est´ a definida por un conjunto de puntos representativos del conjunto estad´ıstico. Cuando transcurre el tiempo, el volumen se mueve al moverse los puntos de la frontera. El tama˜ no del volumen podrá cambiar, pero no el n´ umero de puntos que lo constituyen. En efecto, sea (q, p) un punto arbitrario de la frontera. Todo punto que entre o salga del elemento de volumen deberá pasar por la frontera, pero al llegar a la frontera tendrá los mismos (q, p) de un punto de la misma. Ambos puntos tendrán las mismas condiciones iniciales para el movimiento posterior, en consecuencia deberán seguir moviéndose juntos. En conclusi´ on, el n´ umero de puntos en cualquier región del espacio f´ asico es constante. Se puede demostar que: Z Z (4.212) dΓq dΓp = dΓq dΓp donde la transformaci´ on (q, p) → (q, p) es canónica. Como la evoluci´ on temporal es una T.C., se sigue que: Z Z dΓq0 dΓp0 = dΓq dΓp (4.213) Como no cambian con el tiempo ni el volumen ni el n´ umero de puntos dentro de él, la densidad será constante. Demostraci´ on del teorema de Liouville. Sea un conjunto estad´ıstico de sistemas de un grado de libertad, entonces el espacio fásico es bidimensional y dΓ = dq dp. Además, dN = ρ dq dp es el n´ umero de sistemas en dΓ. Consideremos que cada uno de los sistemas del conjunto tiene energ´ıa entre E y E + ∆E. La figura 4.5 muestra la región accesible, definida por las l´ıneas E = constante y E + ∆E =p constante (depser osciladores armónicos, tal región ser´ıa una corona circular de radios 2E/mω 2 y 2(E + ∆E)/mω 2 ). Cuando el tiempo transcurre, los puntos representativos del conjunto se mueven dentro de esta región. Entre t y t + dt entran al elemento de volumen dΓ todos los puntos que se mueven hacia el frente a las caras de la izquierda e inferior. El n´ umero de los puntos que entran a dΓ durante el tiempo dt

118 / Mec´ anica cl´ asica avanzada p

E + dE

t

t + dt dp

E

pdt (q,p) dq

q

qdt

Figura 4.5 Espacio fásico. Región accesible definida por las l´ıneas E = constante y E +∆E = constante.

será igual a: ρq˙ dt dp + ρp˙ dt dq

(4.214)

O sea que el n´ umero de puntos que entran a dΓ por unidad de tiempo es: ρq˙ dp + ρp˙ dq = ρ(q˙ dp + p˙ dq)

(4.215)

Para hallar los puntos que salen, debemos considerar los que se mueven dentro de dΓ hacia las caras derecha y superior y que las alcanzar´ an en el tiempo dt. Esto se puede obtener de (4.215) mediante una expansi´ on de Taylor alrededor de (q, p), para hallar (4.215) en (q + dq, p + dp): (ρq)| ˙ q+dq dp + (ρp)| ˙ p+dp dq˙ = ∂ ∂ (ρq) ˙ dq dp + ρp˙ + (ρp) ˙ dp dq ρq˙ + ∂q ∂p

(4.216)

La variaci´ on del n´ umero de puntos dentro de dΓ es igual a lo que entra menos lo que sale por unidad de tiempo, o sea a (4.215) menos (4.216): ∂ ∂ − (ρq) ˙ + (ρp) ˙ dq dp (4.217) ∂q ∂p Dentro de dΓ la rata de incremento temporal de la densidad será ∂ρ/∂t y el cambio del n´ umero de puntos en dΓ por unidad de tiempo es (∂ρ/∂t).dq dp y debe ser igual a (4.217): ∂ ∂ ∂ρ dq dp = − (ρq) ˙ + (ρp) ˙ dq dp (4.218) ∂t ∂q ∂ρ

La formulaci´ on hamiltoniana / 119 Se sigue entonces que: ∂ρ ∂ q˙ ∂ρ ∂ p˙ ∂ρ +ρ + q˙ + ρ + p˙ = 0 ∂t ∂q ∂q ∂p ∂p

(4.219)

Usando las ecuaciones de Halmilton se tiene: ∂2H ∂2H ∂ q˙ ∂ p˙ + = − =0 ∂q ∂p ∂q∂p ∂p∂q

(4.220)

Con lo cual (4.219) nos da el resultado: ∂ρ ∂ρ ∂ρ dρ + q˙ + p˙ = =0 ∂t ∂q ∂p dt

(4.221)

La generalizaci´ on a sistemas de varios grados de libertad es análoga. En ese caso debemos reemplazar el plano p − q por el plano pν − qν correspondiente al grado de libertad ν. dΓ → dqν dpν es la proyección del elemento de volumen dΓq dΓp sobre el plano ν. Las l´ıneas E y E + dE son el corte del plano ν con las hipersuperficies en el espacio de fases E = constante, E + dE = constante. dΓ será: dΓ = dΓp dΓq = dq1 dq2 ...dqν−1 dqν+1 ...dql dp1 dp2 (4.222) ...dpν−1 dpν+1 ...dpl dqν dpν = dΓν dqν dpν ;

ν = 1, 2, ...l

Debemos reemplazar las ecuaciones (4.215) y (4.216) por: ρ dΓν (q˙ dpν + p˙ ν dqν ) y, ∂ ν ν ρ dΓ q˙ν + (ρ dΓ q˙ν ) dqν dpν ∂qν

∂ ν ν + ρ dΓ p˙ ν + (ρ dΓ p˙ ν ) dpν dqν ∂pν

(4.223)

(4.224)

Por tanto la variaci´ on del n´ umero de puntos en el área dqν dpν será igual a (4.223)(4.224): ∂ ∂ ν ν (ρ dΓ q˙ν ) + (ρ dΓ p˙ ν ) dqν dpν = − ∂qν ∂pν (4.225) ∂ ∂ (ρq˙ν ) + (ρp˙ν ) dΓ − ∂qν ∂pν La variaci´ on del n´ umero de puntos en todo el volumen dΓ es igual a la suma de las variaciones de los n´ umeros de puntos sobre sus proyecciones q1 − p1 , q2 − p2 , ...ql − pl . ´ Esta será: l X ∂ ∂ (ρq˙ν ) + (ρp˙ ν ) dΓ (4.226) − ∂qν ∂pν ν=1 Usando el resultado (4.220) para cada grado de libertad e igualando (4.226) a ∂ρ/∂t dΓ obtenemos el teorema de Liouville, ecuaci´ on (4.211).

120 / Mec´ anica cl´ asica avanzada Ejemplo 4.8.3 Sea un conjunto de cuatro part´ıculas iguales que se lanzan hacia arriba en un campo gravitacional uniforme, con las siguientes condiciones iniciales: z10 = z0 ,

z20 = z0 + ∆z0

z30 = z0 ,

z40 = z0 + ∆z0

pz10 = p0 ,

pz20 = p0

(4.227)

pz30 = p0 + ∆p0 , pz40 = p0 + ∆p0 (a) Hallar la región que inicialmente ocupa el conjunto en el espacio de fases. (b) Hallar las trayectorias de fase de las part´ıculas. (c) Considerar c´ omo cambia la región ocupada por el conjunto para t > 0. El espacio f´ asico de cada sistema es 6-dimensional, pero sólo hay variaciones en la proyección bidimensional z − pz . x, px , y y py permanecen constantes, ya que por definición las part´ıculas no interact´ uan entre s´ı. La energ´ıa de cada part´ıcula es constante. Entonces: Hi =

p2zi + mgzi = Ei = constante ; 2m

i = 1, 2, 3, 4

(4.228)

La ecuaci´ on de la trayectoria de cada part´ıcula en el espacio de fases será parabólica: p (4.229) pzi = ± 2m(Ei − mgzi )

De acuerdo con (a) y (b) las Ei serán:

p20 + mg(z0 + ∆z0 ) 2m

E1 =

p20 + mgz0 ; 2m

E3 =

(p0 + ∆p0 )2 + mgz0 2m

E4 =

(p0 + ∆p0 )2 + mg(z0 + ∆z0 ) 2m

E2 =

(4.230)

Asumiendo positivos a ∆p0 y ∆z0 , vemos que: E4 > E3 ;

E4 > E2 ;

E3 > E1 ;

E2 > E1

(4.231)

Además, para precisar, asumamos que ∆p0 y ∆z0 son tales que E3 > E2 , de modo que: E4 > E3 > E2 > E1

(4.232)

La solución a este problema es: pzi = pzi0 − mgt ;

zi = zi0 +

pzi0 1 t − gt2 ; m 2

i = 1, 2, 3, 4

(4.233)

La formulaci´ on hamiltoniana / 121 De modo que: pz 1 = z1 = pz 3 =

pz2 = p0 − mgt

p0 − mgt ; z0 +

p0 1 t − gt2 ; m 2

p0 + ∆p0 − mgt ;

z2 = z0 + ∆z0 +

p0 1 t − gt2 m 2

pz4 = p0 + ∆p0 − mgt

(4.234)

1 p0 + ∆p0 t − gt2 m 2

z3 =

z0 +

z4 =

z0 + ∆z0 +

1 p0 + ∆p0 t − gt2 m 2

Las ecuaciones (4.234) nos dicen que: Pz1 = pz2 = p < p0 ; z3 = z1 + z2 = z1 + ∆z0 ;

∆p0 t m

Pz3 = pz4 = p + ∆p0 (4.235)

∆p0 t; z4 = z2 + m

z4 = z3 + ∆Z0

z1 = z La figura 4.6 muestra la regi´ on ocupada por el conjunto en el espacio de fases, en t = 0 y en t > 0. Vemos que el ´ area (volumen) del espacio fásico ocupada por el conjunto de sistemas permanece constante en el tiempo y es igual a: ∆z0 ∆p0

(4.236)

Dicha regi´ on se mueve distorsionándose pero sin cambiar el valor del área. El resultado es el mismo en el caso en que dentro del área en menci´ on haya un n´ umero arbitrario de puntos: el ´ area de la región limitada por las l´ıneas 1 − 2, 2 − 4, 3 − 4 y 1 − 3 permanecer´ıa constante y todos los puntos quedar´ıan dentro. La densidad de puntos en el espacio de fases también es una constante; en este caso. 4 = constante ∆z0 ∆p0

(4.237)

De haber inicialmente en el centro del rectángulo una quinta part´ıcula, esta permanecer´ıa en el centro del cuadril´ atero en t > 0. La figura 4.7 muestra las trayectorias de fase. Ejemplo 4.8.4 Sea una part´ıcula que se lanza hacia arriba en presencia de un campo gravitacional uniforme. Sus condiciones iniciales se conocen con cierta indeterminación:


pz p0 + ∆p0

3

4

1

2

∆p0t / m

p0 3

p + ∆p0

4

p 1 z0 + ∆z0

z0

2 z + ∆z0

z

z

Figura 4.6 Región ocupada por el conjunto de sistemas en el espacio de fases pz p0 + ∆p0 p0

3

4

1

2

z z0

z0 + ∆z0 2

1 3

1 2

4

3 4

Figura 4.7 Trayectorias de fase. Caso en que dentro del área hay un número arbitrario de puntos

z(0) = z0 ±

∆z0 ; 2

pz (0) = p0 ±

∆p0 2

(4.238)

Es decir, se sabe que en t = 0 la part´ıcula est´ a en un rectángulo de área ∆z0 ∆p0 en el espacio de fases. Analizar la evoluci´ on de la part´ıcula. Basta considerar el movimiento de la part´ıcula en los valores extremos de las condiciones iniciales (z0 − ∆z0 /2 , p0 − ∆p0 /2 ; z0 − ∆z0 /2 , p0 + ∆p0 /2 ; z0 + ∆z0 /2 , p0 −

La formulaci´ on hamiltoniana / 123 ∆p0 /2 ; z0 + ∆z0 /2 , p0 + ∆p0 /2), que coinciden con las condiciones iniciales (4.227) del ejemplo anterior, cambiando z0 por z0 + ∆z0 /2 y p0 por p0 + ∆p0 /2. Se concluye inmediatamente que para una part´ıcula se cumple: ∆z(t) ∆pz (t) = ∆z(0) ∆pz (0) = constante = ∆z0 ∆p0

(4.239)

Para un valor dado de esta constante, si se reduce la indeterminación en z, se aumenta la indeterminación en ∆pz y viceversa. Clásicamente no hay l´ımite al valor más peque˜ no que puede tomar la constante ∆p0 ∆z0 . Cu´ anticamente no puede ser menor que ¯h/2, donde ¯h es la constante de Planck, luego: ∆z ∆pz ≥

¯ h 2

(4.240)

La ecuaci´ on (4.240) se denomina la desigualdad de Heisenberg. El resultado (4.239) es válido en general, de acuerdo con el teorema de Liouville. La proyección del volumen del espacio fásico dentro del cual inicialmente se encuentra la part´ıcula, ∆Γ0 = ∆p10 ∆q10 ∆p20 ∆q20 ...∆pl0 ∆ql0 , sobre el plano qν − pν , tiene un ´ area ∆pν0 ∆qν0 . Se tiene entonces que: ∆pν (t) ∆qν (t) = ∆pν0 ∆qν0 = constante

(4.241)

O sea que, cuánticamente se cumple que para cualquier par de variables can´ onicamente conjugadas: ∆pν ∆qν ≥

¯ h 2

(4.242)

Clásicamente, para un valor dado de la constante ∆pν0 ∆qν0 , al aumentar la indeterminaci´ on de pν , se disminuye la indeterminación de qν y viceversa. Lo espec´ıfico de la desigualdad de Heisenberg (el “efecto cuántico”) es que la constante no puede ser cero sino que tiene un m´ınimo valor.


5 Movimiento de dos part´ıculas que interact´ uan por medio de una fuerza central ´ Este es un problema que en principio es soluble de manera exacta para cualquier fuerza central. Pertenece a los pocos problemas de la mecánica clásica en que es posible la separación de las variables. Como se sabe, no existen soluciones anal´ıticas exactas para el problema general de más de dos part´ıculas interactuando mutuamente por fuerzas de dos part´ıculas.

5.1.

Coordenadas de centro de masa y coordenadas relativas

En general las coordenadas de las part´ıculas individuales, por ejemplo X1 , Y1 , Z1 , X2 , Y2 y Z2 , no permiten desacoplar las ecuaciones de movimiento. S´ olo cuando las fuerzas son lineales ha sido dise˜ nado un formulismo que desacopla las ecuaciones de movimiento mediante la transformaci´ on a coordenadas normales. Afortunadamente, el problema de dos part´ıculas que interact´ uan a través de una fuerza central admite la separación de variables mediante la transformaci´ on a las coordenadas relativas y de centro de masa. ~ = m1~r1 + m2~r2 , ~r = ~r2 − ~r1 , R m1 + m2 (5.1) m m 2 1 ~− ~+ ~r1 = R ~r , ~r2 = R ~r M M Un potencial central es aquel que depende sólo de la distancia entre las part´ıculas: V (~r1 , ~r2 ) = V (|~r2 − ~r1 |) = V (r)

(5.2)

Las f´ ormulas (5.1) permiten escribir la energ´ıa cinética as´ı: T =

2 2 1 1 ~˙ 2 1 ˙ 2 1 m1~r˙ 1 + m2~r˙ 2 = M R + µ~r 2 2 2 2

125

(5.3)

126 / Mec´ anica cl´ asica avanzada donde M es la masa total y µ la masa reducida: m1 m2 m1 + m2 Entonces en vez de L ~r1 , ~r2 , ~r˙ 1 , ~r˙ 2 podemos escribir: M = m1 + m2 ;

µ=

2 ~˙ + 1 µ~r˙ 2 − V (r) ~ ~r˙ , R ~˙ = 1 M R L ~r, R; 2 2

(5.4)

(5.5)

~ es c´ıclica y por lo tanto el momento lineal del centro de masa es una constante de R movimiento. L consta de términos desacoplados, es decir, describe un sistema equivalente de dos part´ıculas, una libre de masa M colocada en el centro de masa y otra de masa µ colocada por ejemplo en la posición de la part´ıcula 2, y sometida al efecto de un centro de fuerzas inmóvil colocado en la posición de la part´ıcula 1, y exactamente sometida a la misma energ´ıa potencial de interacci´ on de las dos part´ıculas originales: LCM =

1 ~˙ 2 MR ; 2

Lrel =

1 ˙2 µ~r − V (r) 2

(5.6)

Lrel es esféricamente simétrico pues depende sólo de la magnitud de los vectores ~r y ~r˙ . En consecuencia, el momento angular de la part´ıcula de masa reducida µ, ~l = ~r × µ~r˙ , es una constante de movimiento. Para pasar al formalismo hamiltoniano, evaluemos los momentos canónicos conju~ gados de ~r y R: p= ~

∂L = µ~r˙ ; ∂~r˙

∂L ~˙ = MR P~ = ˙ ~ ∂R

(5.7)

Entonces el hamiltoniano del sistema será: H=

P~2 p~2 + + V (r) 2M 2µ

(5.8)

H es una constante de movimiento, as´ı como por separado lo son la energ´ıa del centro de masa y la de la part´ıcula de masa reducida. Sistema de coordenadas de centro de masa. Es un sistema de coordenadas con origen colocado en el centro de masa. Las fórmulas de transformaci´ on son (véase la figura 5.1): ~r1c = ~r2c

m2 m2 ~r (~r1 − ~r2 ) = − M m1

m1 m1 = (~r2 − ~r1 ) = ~r M M

(5.9)

Además se cumple que: m1~r1c + m2~r2c = 0 ;

~r2c − ~r1c = ~r

No existen f´ ormulas que expresen a ~r1 , ~r2 en funci´ on de ~r1c y ~r2c .

(5.10)

Movimiento de dos part´ıculas que interact´ uan ... / 127 La energ´ıa total de las dos part´ıculas en el sistema de referencia del centro de masa es: Ec =

2 2 1 1 1 2 m1~r˙ 1c + m2~r˙ 2c + V (r) = µ~r˙ + V (r) 2 2 2

(5.11)

y el momento angular respecto al centro de masa: ~ c = ~r1c × m1~r˙ 1c + ~r2c × m2~r˙ 2c = µ~r × ~r˙ L

(5.12)

1 r1c

r2c r1 2 R

r2

O Figura 5.1 Sistema de coordenadas de centro de masa para dos part´ıculas Se ve que la energ´ıa total en el sistema del centro de masa coincide con la energ´ıa total de la part´ıcula de masa reducida, y el movimiento angular total coincide con el momento angular de la part´ıcula de masa reducida. El momento angular total en el sistema de referencia del laboratorio es: ~ ×R ~˙ + µ~r × ~r˙ ~ = ~r1 × m1~r˙ 1 + ~r2 × (m2~r˙ 2 ) = M R (5.13) L

vemos que es igual al momento angular del centro de masa más el momento angular respecto al sistema de referencia del centro de masa. Finalmente podemos afirmar que los aspectos no triviales del problema est´ an en el movimiento de la part´ıcula de masa reducida. Ecuaciones de Lagrange para las coordenadas relativas. Tomemos un sistema de coordenadas esféricas para ubicar la part´ıcula de masa reducida µ (véase figura

128 / Mec´ anica cl´ asica avanzada z êϕ

êΦ êr

r

Θ y

ϕ

êΦ

x

Figura 5.2 Posici´ on ~r de la part´ıcula µ en coordenadas esféricas

5.2). No hay ninguna raz´ on f´ısica para suponer d´ onde est´ a el origen de ese sistema de coordenadas. Si queremos podemos colocarlo en el centro de masa o, como se propuso antes, en la posición de la part´ıcula 1. Las componentes de ~r y ~r˙ es conveniente expresarlas en coordenadas esféricas; esto es simple mediante las fórmulas de transformaci´ on entre vectores unitarios: eˆr =

senθ cos φ î + senθ senφ ˆj + cos θ kˆ

eˆθ =

−senφ î + cos φ ˆj

eˆφ =

senθ kˆ − cos θ (cos φ î + senφ ˆj)

(5.14)

y las f´ ormulas inversas: î =

senθ cos φ eˆr − senφ eˆθ − cos θ cos φ eˆφ

ˆj =

senθ senφ eˆr + cos φ eˆθ − cos θ senφ eˆθ

kˆ =

cos θ eˆr + senθ eˆφ

(5.15)

éstos son dos conjuntos ortonormales de vectores de base (véase figura 5.2). Entonces ~r y ~r˙ tienen las siguientes expresiones: ˙eφ + r senθ φˆ ˙ eθ ~r = rˆ er ; ~r˙ = rˆ ˙ er − rθˆ

(5.16)

Movimiento de dos part´ıculas que interact´ uan ... / 129 El lagrangiano en coordenadas esféricas es: 1 L = µ r2 + r2 θ˙2 + r2 sen2 θ φ˙ 2 − V (r) (5.17) 2 donde hemos suprimido la parte correspondiente al centro de masa. La coordenada φ es c´ıclica y por ello su momento can´ onico conjugado pφ es una constante de movimiento: pφ =

∂L = µr2 sen2 θ φ˙ = constante ∂ φ˙

(5.18)

Debido a la simetr´ıa de rotación del lagrangiano, todas las componentes del momento angular son constantes de movimiento. Las componentes esféricas, o sea, a lo largo de los vectores unitarios eˆr , eˆθ , eˆφ , son: lr = 0 ,

lθ = µr2 θ˙ ,

lφ = µr2 senθ φ˙

(5.19)

en tanto que las componentes cartesianas son: ˙ + φ˙ senθ cos θ cos φ) lx = −µr2 (θsenφ ly = µr2 (θ˙ cos φ − φ˙ senθ cos θ senφ)

(5.20)

lz = µr2 sen2 θ φ˙ Los otros momentos can´ onicos conjugados son: pr =

∂L = µr˙ ; ∂ r˙

pθ =

∂L = µr2 θ˙ ∂ θ˙

(5.21)

pr y pθ no son constantes de movimiento. Podemos expresar las componentes de ~l, (5.19) y (5.20), en funci´ on de los momentos canónicos: lθ = pθ ;

lφ =

pφ ; senθ

l2 = p2θ +

p2φ sen2 θ

(5.22)

lx = −pθ senφ − pφ cot θ cos φ ly = −pθ cos φ − pφ cot θ senφ

(5.23)

lz = pφ N´ otese la similitud de (5.23) con las correspondientes expresiones cuántico-mecánicas, y aun con las componentes l± = lx ± ily : l+ = (ipθ − pφ cot θ)eiφ ;

l− = (−ipθ − pφ cot θ)e−iφ

(5.24)

En coordenadas esféricas la constante de movimiento pφ , el momento canónico conjugado a φ, coincide con la componente Z del momento angular. lθ y lφ no son constantes de movimiento, pero s´ı lx , ly y lz , como también: lr = 0 ;

lz = pφ ;

l2 = p2θ +

p2φ = µ2 r4 (θ˙2 + sen2 θφ˙ 2 ) sen2 θ

(5.25)

130 / Mec´ anica cl´ asica avanzada de lo anterior se sigue que existe un valor m´ınimo de θ dado por: pφ senθmin = ; θmax = π − θmin l

(5.26)

Como ~l es constante, tenemos que los vectores ~r y ~r˙ siempre permanecer´ an en un plano perpendicular a ~l, o sea que cuando las fuerzas son centrales la part´ıcula de masa reducida permanece siempre sobre un plano; las órbitas son planas. θmin y θmax son los ´ angulos de máximo y m´ınimo acercamiento de la part´ıcula al eje Z respectivamente, donde θ˙ cambia de signo. Comparando la expresión (5.25) para ~l 2 , con (5.17), obtenemos: L=

l2 1 − V (r) µr˙ + 2 2µr2

(5.27)

En esta forma se nota la completa simetr´ıa esférica del lagrangiano, ya que sólo depende de r pues ~l es una constante. El hamiltoniano es: H=

p2r l2 + V (r) + 2µ 2µr2

(5.28)

En esta expresión para H podemos tomar ventaja del hecho de depender sólo de la parte radial: H describe el movimiento unidimensional equivalente de una part´ıcula de masa µ en un potencial efectivo: Vef (r) =

l2 + V (r) 2µr2

(5.29)

La segunda ley de Kepler. Podemos definir las coordenadas de manera que desaparezca del problema uno de los ángulos. Si tomamos el eje Z de modo que coincida con la direcci´ on de ~l, que es constante, entonces el movimiento permanecer´ a siempre sobre el plano X − Y : θ = π/2 = constante; θ˙ = 0, con lo cual la magnitud del momento toma la forma: l = pφ = µr2 φ˙ = constante

(5.30)

En el plano de la órbita, el área barrida por el radio vector en un tiempo dt es dA = (1/2)r2 dφ, siendo dφ el ángulo que gira el radio vector en el tiempo dt. Entonces, 1 l A˙ = r2 φ˙ = = constante 2 2µ

(5.31)

Nos dice que la velocidad areolar es constante para cualquier movimiento bajo fuerzas centrales (segunda ley de Kepler, descubierta emp´ıricamente en 1609 en observaciones planetarias. La primera y la tercera leyes de Kepler valen sólo para potenciales de la forma 1/r). El problema unidimensional equivalente. Del lagrangiano (5.27) se sigue la ecuaci´ on de movimiento: l2 d d V + = − Vef = fc + f (5.32) µ¨ r=− dr 2µr2 dr

Movimiento de dos part´ıculas que interact´ uan ... / 131 donde f es la fuerza derivable de V y fc es la llamada fuerza centr´ıfuga, derivada del potencial centr´ıfugo l2 /(µr2 ). La ecuaci´ on radial (5.32) supone un observador fijo respecto a la direcci´ on del radio; como el radio vector gira, para este observador aparece una fuerza inercial que es precisamente fc . Como el hamiltoniano (5.28) es una constante de movimiento, la energ´ıa total en el centro de masa, que llamaremos E, proporciona una ecuaci´ on diferencial para r que puede integrarse por cuadratura: Z r dr t − t0 = (5.33) 1/2 r0 2 l2 (E − V ) − 2 2 µ µ r de (5.33) en principio puede obtenerse a r en funci´ on del tiempo, para cada conjunto de valores de t0 , r0 , µ, E y l. Es de interés encontrar a r en funci´ on de φ, o sea, hallar la ecuaci´ on de la ´ orbita en coordenadas polares en el plano de la misma. De (5.30) podemos notar que: r˙ =

l dr µr2 dφ

de donde: φ − φ0 =

Z

(5.34)

r

r0

l r2

dr 1/2 l2 2µ E − V − 2µr2

(5.35)

De manera similar puede hallarse a φ(t) si se conoce a r(t): Z r l dt φ − φ0 = 2 r0 µ r (t)

(5.36)

Las f´ ormulas (5.34) y (5.35), recordemos, valen si se eligen las coordenadas de modo que el eje z coincide con la direcci´ on de ~l. Para una elección general de las coordenadas, las expresiones para hallar la ecuaci´ on de la órbita y la dependencia temporal de θ y φ resultan más complicadas: estas fórmulas las consideramos más adelante usando el formalismo de Hamilton-Jacobi. La fórmula (5.33) no depende de la elección de las coordenadas. Hallemos ahora la llamada ecuaci´ on diferencial de la órbita. Es una ecuaci´ on diferencial para r en funci´ on de φ. Se halla a partir de (5.34) y de: r˙ = −

l dυ ; µ dφ

r¨ = −

l2 2 d2 υ υ ; µ2 dφ2

donde υ =

1 r

(5.37)

Con la ayuda de (5.37), la ecuaci´ on (5.32) se transforma en la ecuaci´ on diferencial de la o ´rbita: µ F (υ) d2 υ =− 2 2 , dφ2 l υ

(5.38)

donde F (υ) = f (1/υ). Esta ecuaci´ on permite, dada f (r) hallar a r(φ), y dada r(φ) hallar a f (r).

132 / Mec´ anica cl´ asica avanzada Coordenadas de retorno. Son los valores de las coordenadas en que la respectiva velocidad se anula, o sea, que cambia de signo. Los puntos de retorno en r son aquellos para los cuales r˙ = 0, o sea, los que satisfacen la ecuaci´ on algebraica: l2 + V (r) − E = 0 2µr2

(5.39)

En estos puntos la velocidad no es cero pues θ˙ y φ˙ no se anulan necesariamente. Si ocurre que r˙ se anula solo cuando r es finito y que el movimiento es acotado o ligado, habr´ a un punto de máximo acercamiento y uno de máximo alejamiento de la part´ıcula al centro de fuerza. Si r˙ = 0 en un punto r → ∞, el movimiento es no ligado; éste es el caso de los procesos de colisiones o de dispersi´ on. Los puntos de retorno en θ son aquellos en que θ˙ = 0, o sea pθ = 0; en esos puntos θ vale θmax o θmin , ecuaci´ on (5.26). La ecuaci´ on (5.26) nos dice que no existen valores de φ en los cuales φ˙ = 0; no hay puntos de retorno en φ. Si r tiene dos l´ımites, rmin y rmax , el movimiento es ligado y la órbita est´ a contenida dentro de una corona limitada por las circunferencias r = rmin y r = rmax . La órbita puede o no ser cerrada; en general no lo será. Para los potenciales de la forma 1/r o r2 las ´ orbitas son cerradas y pueden ser no circulares (son el´ıpticas1 ). Para precisar, consideremos un oscilador bidimensional armónico en el plano de la ´ orbita; este se obtiene tomando fuerzas restauradoras lineales perpendiculares de la forma fx = −kX x y fy = −kY y donde kX y kY son las “constantes de resorte”.2 La dependencia temporal de x y y es: x(t) = Ax sen(ωX t + φX ) ;

y(t) = Ay sen(ωY t + φY )

(5.40)

Eliminando t obtenemos la ecuaci´ on de la órbita en coordenadas cartesianas. Cuando ωX es un m´ ultiplo racional de ωY la órbita es una figura de Lissajous. Si ωX = ωY , la figura es una elipse; si ωX y ωY difieren ligeramente, la elipse aparece como si estuviera sometida a un movimiento de precesi´ on (véase figura 5.3). ∆α es el ´ angulo que se desplaza el semieje mayor cuando la variación temporal de r ha completado un per´ıodo completo. La trayectoria será cerrada si después de cierto n´ umero de ciclos completos de variación r la trayectoria se repite; o sea si al transcurrir n per´ıodos de variaci´ on de r, el radio a partir del cual la órbita se repite ha dado un n´ umero m de vueltas completas, es decir, si: n∆α = m2π

(5.41)

Si la condición (5.41) no se cumple, entonces la trayectoria no es cerrada y cuando t → ∞ llena toda la corona. Otra forma de obtener este resultado es la siguiente. El movimiento en r tiene una frecuencia νr y el movimiento angular tiene una frecuencia να . La ´ orbita será cerrada sólo si νr y να son conmensurables. ~rmax y ~rmin se llaman vectores absidales. La órbita siempre es simétrica por reflexi´ on en los vectores absidales, o sea que con sólo conocer la porción de órbita comprendida entre dos ~rmax y ~rmin consecutivos es posible por reflexión construir toda la órbita. Esto se puede obtener fácilmente analizando la ecuaci´ on diferencial de la órbita. 1 Para otros potenciales pueden haber ´ orbitas cerradas no circulares pero s´ olo accidentalmente, es decir, para valores muy bien determinados de l y E. 2 Cuando k X 6= kY la fuerza es no central. Esto no es esencial, pues aun con fuerzas centrales puede presentarse la precesi´ on de las ´ orbitas.

Movimiento de dos part´ıculas que interact´ uan ... / 133

∆α rmáx

rmín

´ Figura 5.3 Orbitas de un oscilador armónico bidimensional

Ejemplo 5.1.1 Hallar la velocidad angular de precesi´ on de la órbita de una part´ıcula sometida a fuerzas restauradoras lineales con kX ≈ kY . Se cumple que ωX ≈ ωY . En (5.40) tomamos φX = φY = 0 y llamamos ∆ω a ωY − ωX . Para hallar la ecuaci´ on de la órbita notemos que, al primer orden en ∆ω t: y = AY cos ωY t = AY (cos ωX t − ∆ωt senωX t)

(5.42)

de este modo la ecuaci´ on de la ´ orbita es, al primer orden en ∆ω t: y2 xy x2 + 2 +2 ∆ω t = 1 2 Ax Ay Ax Ay

(5.43)

que es la ecuaci´ on de una elipse con el eje mayor rotado. La ecuación (5.43) puede escribirse como una forma cuadrática no diagonal:    A2y Ax Ay ∆ω t x   = A2x A2y (x, y)  (5.44) 2 y Ax Ay ∆ω t Ax

Para llevar (5.43) a la forma est´ andar de la ecuaci´ on de la elipse, realicemos una rotación de los ejes coordenados por cierto ángulo δ:     ′  x cos δ −senδ x  =   (5.45) ′ y senδ cos δ y

134 / Mec´ anica cl´ asica avanzada Luego, la matriz de la forma cuadrática será diagonal si: tan 2δ =

2Ax Ay ∆ω t A2x − A2y

(5.46)

Si t es el tiempo que tarda r en completar un per´ıodo en este problema de fuerza no central, entonces, al primer orden en ∆ωt, la velocidad angular de precesi´ on de la orbita es: ´ δ˙ ≈

Ax Ay (ωy − ωx ) A2x − A2y

(5.47)

si AX no es del orden de AY (´ orbitas muy excéntricas). Ejemplo 5.1.2 Hallar para qué valores del momento angular es posible que sea acotado el movimiento en presencia del potencial: A l2 V (r) = − e−αr r 2µr2

(5.48)

La energ´ıa potencial efectiva es: l2 A Vef (r) = − e−αr + r 2µr2

(5.49)

Vemos que Vef → +0 para r → ∞, y Vef → +∞ para r → 0. La figura 5.4 muestra la forma de Vef . Hay posibilidad de movimiento acotado sólo si Vef tiene un m´ınimo, o ′ sea si la ecuaci´ on Vef = 0 tiene solución, esto es: l2 Aα −αr Ae−αr − =0 e + r r2 µr3

(5.50)

Si llamamos x = αr, entonces (5.50) se puede llevar a la forma: (x2 + x)e−x =

αl2 µA

(5.51)

Hay solución solamente si la curva f (x) = (x2 + x)e−x corta a la recta αl2 /(µA) (véase figura 5.5), esto es, si: f (x0 ) >

αl2 µA

(5.52)

donde x0 es la posición en la cual f (x) tiene un máximo. f ′ (x) = 0 si: x2 − x − 1 = 0 La u ńica solución aceptable de (5.53) es: √ 1+ 5 ≈ 1,618 x0 = 2

(5.53)

(5.54)


Vef l2 2µr2

E 1/α r –Ae–αr/r

Figura 5.4 Energ´ıa potencial efectiva Vef componente de los potenciales centr´ıfugo y de Yukawa

Entonces: √ 1+√5 f (x0 ) = 2 + 5 e− 2 ≈ 0,84

(5.55)

′ Hay solución a Vef (r) = 0 sólo si:

0, 84 >

αl2 µA

(5.56)

Si (5.48) se usa para describir la interacci´ on nuclear, por ejemplo entre un neutrón y un protón, habr´ a resonancias, o sea estados ligados de energ´ıa positiva, si se cumple la condición (5.56). El momento angular l = 0 presenta estados ligados pero no resonancias. Puede haber resonancias sólo si: 0, 84

µA >¯ h2 α

(5.57)

La barrera que se forma en Vef se llama “barrera centr´ıfuga”. Se entiende por resonancia (“de forma”) el efecto t´ unel que se produce cuando la part´ıcula viene desde r → ∞ y atraviesa la barrera quedando atrapada por el pozo de potencial durante cierto tiempo. Este proceso no es cl´ asicamente posible.


αl 2 µA

f(x)

x0 Figura 5.5 Solución f (x) al potencial efectivo

5.2.

El oscilador arm´ onico tridimensional

Es el problema del movimiento de la part´ıcula de masa reducida en presencia de la interacci´ on central: f~(r) = −kr eˆr

(5.58)

Soluci´ on en coordenadas cartesianas. Tomando coordenadas cartesianas en el plano de la ´ orbita, la solución al oscilador armónico bidimensional es (5.40). La ecuaci´ on de la ´ orbita es: x2 y2 2xy cos δ = sen2 δ ; + − A2x A2y Ax Ay

δ = φy − φx

(5.59)

˜ r = sen2 δ, La ecuaci´ on (5.59) es la forma cuadrática bidimensional de la forma ~r · M~ ˜ donde M es la matriz:   a − cos δ ˜ = A−1 A−1   ; a = Ay (5.60) M x y Ax −cosδ a−1

˜ . Sea la rotaRealizando una rotación de coordenadas es posible diagonalizar a M ′ ˜ ci´ on ~r = R~r , entonces: ˜T M ˜ R~ ˜ r ′ = sen2 δ ~r ′ · R

(5.61)

Movimiento de dos part´ıculas que interact´ uan ... / 137 ˜ es ortogonal, R ˜R ˜ T = I˜ y diagonaliza a M ˜ si es de la forma: La matriz R   cos α −senα 2 cos δ ˜= ; R tan 2α = −1 a −a senα cos α

(5.62)

˜ T es la transpuesta de R. ˜ R ˜ diagonalizada son: Por simplicidad tomaremos Ay = Ax (a = 1). Entonces α y M  1 − cos δ 1 ˜ =  M A2 0

π α = (cos δ > 0) ; 4

0 1 + cos δ

 

(5.63)

La ecuaci´ on de la ´ orbita (5.60) se torna la est´ andar de la elipse, con semiejes mayor a y menor b, y excentricidad ǫ: r r δ 2 cos δ b2 δ a = A cos ; ǫ= 1− 2 = (5.64) b = A sen ; 2 2 a 1 + cos δ δ est´ a relacionado con el momento angular y A con la energ´ıa total: l=−

E senδ ; ω

E = µA2 ω 2

(5.65)

Entonces la excentricidad y el semieje mayor tienen la siguiente expresión en términos de E y l: s kl2   s 2 1− 2 2 µE kl  1E  s 1+ 1− (5.66) E2 = ; a2 = 2 2 k µE 2 kl 1+ µE Soluci´ on en coordenadas polares. En vez de hacer la transformaci´ on de coordenadas, usaremos las f´ ormulas halladas en el numeral anterior, cuando se toma el eje Z perpendicular al plano de la ´ orbita. De la ecuaci´ on (5.35) se sigue: l φ − φ0 = √ 2µ

Z

r

r0

r2

dr

s

l2 1 E − kr2 − 2 2µr2

(5.67)

Haciendo la sustituci´ on ρ = r2 , (5.67) toma la forma: l φ − φ0 = √ 2 µk

Z

r2

r02

ρ

s

dρ

2E l2 −ρ2 + ρ− k µk

(5.68)

138 / Mec´ anica cl´ asica avanzada La integral se halla en tablas de integrales. El resultado es:   r2 2 2Eρ 2l   −  1 l k µk    φ − φ0 = √ sen−1 s   2 µk  l 4E 2 4l2  √ ρ − µk k2 µk 2

(5.69)

r0

Entonces llegamos a: r2 =

B2 1 − e sen2(φ − φ0 + β0 )

(5.70)

donde B, e y β0 son:

B=

s

l2 µE

;

e=

s

1−

kl2 µE 2

;

2β0 = arcsen

l2 µk r02 e

r02 −

(5.71)

La ecuaci´ on de la elipse centrada y no rotada en coordenadas polares es: r2 =

b2 1 − cos2 φ

(5.72)

ǫ2

Si se rota 45◦ toma la forma: b2

r2 =

1 − ǫ2 cos2 (φ −

φ ) 4

=

b2 /(1 − ǫ2 /2) ǫ2 1− sen2φ 2 − ǫ2

(5.73)

Las ecuaciones (5.70) y (5.73) coinciden si: β0 = φ0 ;

B2 =

b2 2

ǫ 1− 2

;

e=

ǫ2 2 − ǫ2

(5.74)

Las ecuaciones (5.71) y (5.74) conducen a los valores hallados en (5.66) para los par´ ametros de la elipse en funci´ on de las constantes de movimiento. La órbita es una elipse y el centro de la misma coincide con el centro de fuerza. C´ alculo de la variaci´ on temporal del radio. Para hacer este c´ alculo usamos la ecuaci´ on (5.33): Z r dr s (5.75) t − t0 = r0 1 2 l2 2 E − kr − 2 2 µ 2 µ r Los puntos de retorno se hallan resolviendo la ecuaci´ on (5.39): s ! kl2 E E 2 1± 1− = (1 ± e) rmax, min = k µE 2 k

(5.76)

Movimiento de dos part´ıculas que interact´ uan ... / 139 Vemos que: l rmax = a = p ; µE(1 − e)

l rmin = b = p µE(1 + e)

(5.77)

Esto nos permite escribir la expresión bajo el signo de ra´ız cuadrada en (5.75) como: r Z r µ rdr p t − t0 = (5.78) 2 k r0 (a − r2 )(r2 − b2 ) Haciendo el cambio de variable p = r−2 , llegamos a: 1 t − t0 = 2

r

µ k

Z

r −2

r0−2

dρ p 2 ρ (a ρ − 1)(1 − b2 ρ)

(5.79)

La solución a esta integral se encuentra en tablas. El resultado es: 1 t = t0 = 2

r

r−2 (a2 + b2 )ρ − 2 0 µ arcsen k ρ(a2 − b2 ) r−2

(5.80)

Incluyendo en t0 la parte que depende de r0 llegamos a: r2 =

a2 + b 2 a2 − b 2 E + sen2ω(t − t0 ) = [1 + e sen2ω(t − t0 )] 2 2 k

(5.81)

l no puede ser arbitrario, est´ a restringido al rango: 0≤l≤

E ω

(5.82)

La ecuaci´ on (5.82) corresponde al comportamiento cuántico, haciendo la correspondencia con los n´ umeros cuánticos l → l¯h y E = n¯hω, donde los valores permitidos del n´ umero cuántico orbital l son: 0 ≤ l ≤ n; o sea l = 0, 1, 2, ...n. Cuando l = E/ω, e =p 0 y ǫ = 0, la órbita es circular pues seg´ un (5.81) el radio de la órbita es constante: r = E/k. Cuando l = 0, e = 1 y ǫ = 1, la órbita es rectil´ınea. Seg´ un (5.81) la variación temporal del radio será de forma pendular, con frecuencia ω y no 2ω como cuando e 6= 1: r=

r

π 2E cos ω(t − t0 − ) k 4ω

(5.83)

Para hallar a r(t) a partir de (5.81) se requiere realizar una expansi´ on en serie infinita. Para l 6= 0 y diferente de un máximo valor, r(t) contiene la frecuencia fundamental 2ω y todos sus armónicos.


5.3.

El potencial 1/r

Se trata de estudiar el movimiento de la part´ıcula de masa reducida bajo la fuerza: k f~(r) = − 2 eˆr r

(5.84)

Este problema es separable en coordenadas esféricas, en coordenadas parabólicas y tal vez en otras coordenadas. La solución en coordenadas parabólicas la hallaremos posteriormente con el formalismo de Hamilton-Jacobi. Aqu´ı resolveremos el problema en coordenadas esféricas. La ecuaci´ on de la ´ orbita. Es c´ omodo usar la ecuaci´ on diferencial de la órbita (5.38). La solución es simple; el resultado es: l2 /µk = 1 + ǫ cos(φ − φ0 ) r

(5.85)

donde ǫ y φ0 son las dos constantes de integraci´ on. Vemos que rmin ocurre cuando φ = φ0 si k es positiva, o sea que en ese caso φ0 determina la direcci´ on del vector rmin . La ´ orbita será simétrica respecto a la l´ınea φ = φ0 . Relacionemos a ǫ con las constantes de movimiento E y l. Los puntos de retorno rmin y rmax ocurren cuando r˙ = 0 en: E=

1 2 k l2 − µr˙ + 2 2µr2 r

(5.86)

O sea que: rmin, max

k =− 2E

1±

s

2El2 1+ µk 2

!

(5.87)

Cu´ al de los signos corresponde a rmin o rmax depende del signo de k y del signo de E.3 Si rmax es finito, el movimiento será ligado. Por otra parte, de (5.85) vemos que: rmin, max =

l2 /µk 1±ǫ

Comparando a (5.88) con (5.87) hallamos que: s 2El2 ǫ= 1+ µk 2

(5.88)

(5.89)

El signo de ǫ lo hemos tomado positivo. La ecuaci´ on (5.85) representa una secci´ on c´ onica. Las secciones c´ onicas. Son las curvas que definen la intersección de un cono con un plano. Sobre el plano una curva c´ onica es el lugar geométrico de los puntos cuya 3 En

estos puntos cambia el signo de la velocidad radial. Adem´ as, para E ≥ 0, seg´ un veremos, s´ olo existe un punto de retorno.

Movimiento de dos part´ıculas que interact´ uan ... / 141 distancia a un punto dado llamado foco es proporcional a la distancia a una l´ınea dada, la directriz. Si tomamos el origen del sistema de coordenadas polares en el foco y S es la distancia del foco a la directriz (véase figura 5.6), se sigue de la definición, llamando ǫ a la constante de proporcionalidad: r = ǫ [S − r cos (φ − φ0 )]

(5.90)

y

•

Directriz

r S φ φ0 x Foco

Figura 5.6 Elementos de las secciones c´ onicas ǫ debe ser positivo por ser la relación entre dos distancias. Se sigue de (5.90): ǫS = 1 + ǫ cos (φ − φ0 ) , ǫ>0 (5.91) r La curva es simétrica respecto a la l´ınea φ = φ0 . La longitud ǫS se llama par´ ametro de la secci´ on c´ onica y ǫ se llama excentricidad. Hay distintos tipos de secciones c´ onicas dependiendo del valor de ǫ. Si ǫ = 1, se obtiene la par´ abola, es decir, el lugar geométrico de los puntos equidistantes del foco y de la directriz. El punto de máximo acercamiento al foco se llama vértice y est´ a situado a una distancia S/2, en tanto que la máxima distancia es infinita: 1 S; rmax = ∞; ǫ = 1 (5.92) 2 Si ǫ < 1, se obtiene una elipse: curva con dos directrices y dos focos. Hay en este caso dos distancias absidales finitas: ǫS ǫS ; rmax = ; ǫ<1 (5.93) rmin = 1+ǫ 1−ǫ El promedio entre rmax y rmin lo llamaremos a, de modo que: rmin =

S=a

1 − ǫ2 ; ǫ

ǫS = a(1 − ǫ2 )

(5.94)

142 / Mec´ anica cl´ asica avanzada La ecuaci´ on de una elipse en coordenadas polares con foco en el origen es: r=

a(1 − ǫ2 ) 1 + ǫ cos (φ − φ0 )

(5.95)

La ecuaci´ on de una elipse en coordenadas polares con centro en el origen es (5.72). Las directrices est´ an a distancias a/ǫ del centro (véase figura 5.8). Los semiejes son a y √ b = a 1 − ǫ2 . D ε=1 S/2

)φ0

S F

Figura 5.7 Secci´ on c´ onica: la parábola

D2 S ε<1 εS

D1

εa

F2

•

) φ0

S F1 a /ε

Figura 5.8 Secci´ on c´ onica: la elipse

Si ǫ > 1, la c´ onica es una hipérbola: curva de dos ramas con sus correspondientes focos, directrices y as´ıntotas. De la definición (5.90) se sigue la siguiente ecuaci´ on para la rama 2, respecto al origen de coordenadas mostrado, la cual es consistente con (5.85)


ε<1

2 D2 εS )φ0

D1

F2 S

a aε 1

a/ε

F1

Figura 5.9 Secci´ on c´ onica: la hipérbola

cuando k > 0 y φ0 se sustituye por φ0 + π: ǫ = −1 − ǫ cos (φ − φ0 ) ; rama 1 (k < 0) r

(5.96)

ǫ = 1 − ǫ cos (φ − φ0 ) ; rama 2 (k > 0) r Cuando φ − φ0 = π, r toma el valor rmin : (1)

rmin =

ǫS ; ǫ−1

(2)

rmin =

ǫS ; 1+ǫ

(2)

(1)

rmin = rmin − 2a

(2)

(5.97) (1)

cuando cos(φ − φ0 ) = 1/ǫ, r = rmax = ∞ y cuando cos(φ − φ0 ) = −1/ǫ, r = rmax = ∞. Si llamamos la distancia entre los vértices 2a, también se cumple que rmin = a(ǫ − 1). Las directrices est´ an a distancias a/ǫ del centro. El par´ ametro S en funci´ on de a vale: S=

ǫ2 − 1 a ǫ

(5.98)

r → ∞ cuando 1 − ǫ cos (φ − φ0 ) = 0, sobre la rama 2. Entonces el ángulo entre las dos as´ıntotas vale: 2 cos−1 ǫ−1 ;

cos−1 ǫ−1 ≤ φ − φ0 ≤ π − cos−1 ǫ−1

(5.99)

Relaci´ on entre el signo de k y E, y el tipo de c´ onica. La excentricidad y el par´ ametro est´ an relacionados con la energ´ıa y el momento angular: s l2 2El2 (5.100) ; ǫ= 1+ ǫS = µ|k| µk 2 Si el potencial es repulsivo, k es negativo. En este caso, sólo es posible que la energ´ıa sea positiva, pues de lo contrario rmin ser´ıa negativo. Entonces ǫ es mayor que

144 / Mec´ anica cl´ asica avanzada la unidad y la trayectoria de la part´ıcula es hiperb´ olica, o sea que el movimiento es no ligado. Esto es consistente con el análisis de la curva de energ´ıa potencial efectiva cuando k es negativo: la energ´ıa potencial no tiene un m´ınimo y el movimiento resulta no acotado, con sólo un punto de retorno. Es el caso cuando la part´ıcula llega desde el infinito y “rebota” en la barrera de potencial. Este comportamiento incluye también el caso l´ımite en que la energ´ıa es cero. Si el potencial es atractivo, k es positiva. En este caso se presentan tres posibilidades. Si E > 0, entonces ǫ > 1 y el movimiento es hiperb´ olico. No hay l´ımite al valor máximo que puede tomar l: 0≤l<∞

si

E>0

(5.101)

A este caso, y al caso en que k es negativo, corresponden las dos ramas de la hipérbola: si k es negativo, la part´ıcula se mueve sobre la hipérbola correspondiente a D1 ; si k es positivo y E > 0, se mueve sobre la hipérbola correspondiente a D2 . Si E = 0 entonces ǫ = 1. l se conserva pero no es cero porque el par´ ametro de impacto es infinito y en r → ∞ la velocidad es cero: 0≤l<∞

si

E=0

(5.102)

El movimiento es no ligado y r → ∞ para dos valores de φ: φ = φ0 ± π. La trayectoria es parabólica y no tiene as´ıntotas (ser´ıan las rectas y = ±∞). De (5.92) se sigue que: rmin =

1 l2 S= ⇒ l 6= 0 2 2µk

(5.103)

Este caso se presenta cuando la part´ıcula parte del reposo desde el infinito. Si E < 0, entonces ǫ < 1. En este caso: s 2|E|l2 <1 ǫ= 1− µk 2 Es claro que el rango de valores posibles de l es finito: r µ 0≤l≤ k 2|E|

(5.104)

(5.105)

Esto es análogo al comportamiento del n´ umero cuántico orbital en el átomo de hidrógeno: l = 0, 1, ...n − 1. ǫ cos (φ − φ0 ) nunca vale uno y por eso r nunca es infinito: el movimiento es ligado. En este caso: rmin, max =

k (1 ∓ ǫ) ; 2|E|

a=

k 2|E|

(5.106)

Si ǫ = 0 siendo E < 0 entonces la trayectoria es circular con radio: r=

l2 k = =a µk 2|E|

(5.107)

Movimiento de dos part´ıculas que interact´ uan ... / 145 Como r es constante, se sigue de (5.31) que φ˙ también es constante. Si ǫ = 1, entonces l = 0 y la trayectoria es la l´ınea recta φ = φ0 . En este caso: rmin = 0 ;

rmax = a

(5.108)

Para ǫ < 1 la trayectoria es una elipse rotada en un ángulo φ0 y con semiejes mayor y menor dados por: a=

k ; 2|E|

b=a

p l 1 − ǫ2 = p 2µ|E|

(5.109)

respectivamente. Vemos que b est´ a comprendido, dependiendo de l, entre: 0≤b≤a

(5.110)

El hecho de que las trayectorias sean el´ıpticas es consecuencia de la primera ley de Kepler (cuando k = GM m). Las figuras desde 5.10 hasta 5.13 muestran las curvas de energ´ıa potencial efectiva para cada uno de los casos. Del análisis de las mismas se obtiene cualitativamente el comportamiento descrito. Vef

E

r mín

k<0

r

Figura 5.10 Energ´ıa potencial efectiva. Trayectoria hiperbólica.

La tercera ley de Kepler. El área de la elipse es: s p l 2 kl 2 = πa2 A = πab = πa 1 − ǫ2 = π 4|E| µ|E| lmax

(5.111)

Recordando la ecuaci´ on (5.31) para la velocidad areolar, obtenemos que: r πk p µ 3/2 A −2µE = 2π a (5.112) = τ= 2 ˙ 2E k A

146 / Mec´ anica cl´ asica avanzada Vef

E

r mín

r k > 0, E > 0

Figura 5.11 Energ´ıa potencial efectiva. Trayectoria hiperbólica.

Vef ·

E r

rmín k > 0, E = 0

Figura 5.12 Energ´ıa potencial. Trayectoria parab´ olica.

Vemos que el per´ıodo del movimiento no depende del valor de l. Para la interacci´ on gravitacional entre un planeta (masa m) y el Sol (masa M ), (5.112) toma la forma: s 1 a3/2 (5.113) τ = 2π G(m + M ) Como para los planetas del sistema solar m ≪ M , se sigue que τ ∝ a3/2 , que es el contenido de la tercera ley de Kepler, la cual como se ve, es un resultado aproximado.

Movimiento de dos part´ıculas que interact´ uan ... / 147 Vef

l = l máx

l

l=0

·

r

r mín

r máx

k > 0, E < 0

E

Figura 5.13 Energ´ıa potencial efectiva. Trayectoria el´ıptica.

La ecuaci´ on de Kepler. Encontrar a r(t) es interesante en muchos casos, por ejemplo para predecir el movimiento de un satélite. Para hallar a r(t) debemos usar la ecuaci´ on (5.33). Por simplicidad, consideraremos sólo el caso k > 0, E < 0. Es conveniente expresar a E y l en términos de a y ǫ: p p k (5.114) E=− ; l = µka 1 − ǫ2 2a Entonces (5.33) toma la forma: r Z µa r rdr p t − t0 = 2 k r0 −r + 2ar − (1 − ǫ2 )a2

Usando la expresión para τ , ecuaci´ on (5.112), obtenemos: Z r r dr τ p t − t0 = 2πa r0 −r2 + 2ar − (1 − ǫ2 )a2

La solución a esta integral se encuentra en tablas. El resultado es: r−a 1p 2 2πa −r + 2ar − (1 − ǫ2 )a2 + arcsen (t + δ) = − τ a ǫa donde δ es una constante arbitraria. Definamos las siguientes variables:

(5.115)

(5.116)

(5.117)

2π a−r (t + δ) ; ψ = cos−1 (5.118) τ ǫa Las cantidades M , ψ y φ reciben los siguientes nombres en astronom´ıa: M , anomal´ıa media; ψ, anomal´ıa excéntrica y φ, anomal´ıa verdadera (véase figura 5.14). De simples argumentos geométricos se sigue a partir de las fórmulas de la elipse que ψ y M tienen la siguiente interpretaci´ on geométrica: M=

148 / Mec´ anica cl´ asica avanzada y R Q P M ψ

r φ

x

Figura 5.14 Variables de la ecuación de Kepler.

ψ es el ´ angulo del vector de posición del punto Q, tomando como origen el centro de la elipse. R es un punto que gira uniformemente sobre una circunferencia de radio a, con velocidad angular 2π/τ . φ y M sirven para describir la posición del punto p (véase el texto de Marion, Classical dynamics of particles and systems, segunda edici´ on, secci´ on 8,8). Expresando a (5.117) en funci´ on de (5.118) obtenemos: r = (1 − ǫ cos ψ)a ;

M = ψ − ǫsenψ

(5.119)

En (5.119) hemos adicionado a M la constante π/2. La ecuaci´ on que relaciona a ψ con M se denomina la ecuaci´ on de Kepler, y permite expresar a r en funci´ on del tiempo. ψ es una funci´ on trascendental de M . Bessel halló en 1830 la solución exacta de la ecuaci´ on de Kepler en forma de serie de Fourier. El resultado es: ψ =M +2

∞ X

Jn (nǫ)

n=1

sen(nM ) n

(5.120)

donde Jn son las funciones de Bessel de orden entero. Entonces la expresión para r(t) es: ( " r(t) = a 1 − ǫ cos 2πν(t + δ)+ ∞ X

sen{2πnν(t + δ)} 2 Jn (nǫ) n n=1

#)

Ejemplo 5.3.1 Demostrar la solución (5.120) de la ecuaci´ on de Kepler.

(5.121)

Movimiento de dos part´ıculas que interact´ uan ... / 149 ψ es una funci´ on impar de M , luego su expansi´ on de Fourier contendrá sólo funciones seno y además contiene una componente no oscilante que será M misma. Entonces busquemos soluciones de la forma: ψ=M+

∞ X

Cn sen(nM )

(5.122)

n=1

La expansi´ on de Fourier de la funci´ on ǫ senψ = f (M ) tiene coeficientes dados por: Z π 2 Cn = f (M ) sen(nM ) dM (5.123) π 0 Utilizando la ecuaci´ on de Kepler, el integrando en (5.123) será: Z π 2ǫ senψ sen[n(ψ − ǫ senψ)](1 − ǫ cos ψ)dψ Cn = π 0

(5.124)

Efectuando los productos y expresando los productos de funciones seno como suma de funciones coseno llegamos a: Z ǫ πn cos[(n − 1)ψ − nǫsenψ] dψ − cos[(n + 1)ψ Cn = π 0 1 (5.125) −nǫsenψ] dψ − ǫ cos[(n − 2)ψ 2 o 1 −nǫ senψ]dψ + ǫ cos[(n + 2)ψ − nǫsenψ] dψ 2 La funci´ on de Bessel entera tiene la siguiente representación integral: Z 1 π Jκ (x) = cos (κθ − xsenθ)dθ ; κ : entero π 0

Con lo cual Cn toma la forma: h Cn = ǫ Jn−1 (nǫ) − Jn+1 (nǫ)

i ǫ ǫ − Jn−2 (nǫ) + Jn+2 (nǫ) 2 2

(5.126)

(5.127)

Las funciones Jκ tienen la siguiente relación de recurrencia: Jκ+1 (x) =

2κ Jκ (x) − Jκ−1 (x) x

(5.128)

El uso de (5.128) nos permite llegar finalmente a: Cn =

2 Jn (nǫ) n

(5.129)

Con lo cual queda demostrada la expresión (5.120). Precesi´ on de las ´ orbitas el´ıpticas. Vimos que, bajo fuerzas centrales, las órbitas son simétricas respecto a cualquier ábside, por lo tanto el ángulo entre cualquier par de l´ıneas absidales consecutivas es el mismo. En el problema de Kepler (k > 0, E < 0),

150 / Mec´ anica cl´ asica avanzada las ´ orbitas son cerradas, o sea que el ángulo de precesi´ on de los ábsides es cero. En el movimiento planetario, por ejemplo, hay efectos “perturbadores”, que hacen que el potencial no sea exactamente de la forma −k/r, aunque lo sea aproximadamente. Para el movimiento de la luna alrededor de la tierra, además de la interacci´ on gravitacional entre estos dos cuerpos tomados como masas puntuales, hay efectos adicionales como una fuerza externa no central debida al campo gravitacional homogéneo producido por el sol sobre la órbita de la luna; esto se traduce en peque˜ nas oscilaciones del plano de la ´ orbita. La tierra y la luna no son masas puntuales y por ello la interacci´ on del tipo −k/r es sólo el primer término en una expansi´ on multipolar, que dependerá de la distribuci´ on de masa de los cuerpos; la parte central de esta interacci´ on dar´ a lugar a la precesi´ on de la ´ orbita, o sea al giro del semieje mayor de la elipse, y la parte no central da lugar a movimientos giroscópicos de la tierra y la luna. En el caso de Mercurio hay efectos de precesi´ on de su órbita debidos al efecto combinado de todos los dem´ as cuerpos del sistema solar y efectos residuales que sólo son explicados por la teor´ıa general de la relatividad. Ejemplo 5.3.2 Analizar la precesi´ on de la órbita de una part´ıcula que se mueve en presencia del potencial: V =−

C k + 2; r 2r

C ≪1 ka

(5.130)

γ =2 Figura 5.15 Trayectoria para γ = 2 Tenemos que la fuerza sobre la part´ıcula es central, as´ı que ~l es constante. La ecuaci´ on diferencial de la órbita es: µ d2 υ + υ = − 2 2 (−kυ 2 + Cυ 3 ) ; dφ2 l υ

υ=

1 r

(5.131)


γ =3

Figura 5.16 Trayectoria para γ = 3

La solución de (5.131) es: α = 1 + ǫ cos γ(φ − φ0 ) ; r

γ 2 l2 α= ; µk

γ=

r

1+

µC l2

(5.132)

donde ǫ y φ0 son constantes de integraci´ on. φ0 es la direcci´ on del vector absidal rmin y ǫ se puede expresar en términos de las constantes de movimiento comparando las dos expresiones para las distancias de retorno. s ! k α 2El2 2 rmax, min = − = 1± 1+ γ (5.133) 2E µk 2 1±ǫ Se sigue entonces que: rmax − rmin E= = rmax + rmin

s

1+

2El2 2 γ ; µk 2

a=−

k 2E

(5.134)

El efecto del término adicional es variar ligeramente la excentricidad de la órbita e introducir el factor de γ a φ − φ0 . Cuando r = rmin , φ = φ0 y cuando r = rmax , φ = φ0 + φ/γ. Entonces el ángulo entre los vectores absidades γmin y rmax es: φmax − φmin =

π γ

(5.135)


γ=5

Figura 5.17 Trayectoria para γ = 5

y no π como cuando C = 0. De esta forma, al cumplir un per´ıodo, el vector rmin sufre un desplazamiento angular dado por: 1 (5.136) ∆φ = 2π 1 − γ Si la part´ıcula tarda un tiempo Tr en ir de un valor de rmin al consecutivo, tardar´ a un tiempo mayor en φ dar una vuelta completa. La trayectoria será cerrada solamente si ∆φ es un subm´ ultiplo racional de 2π, o sea, si γ es un n´ umero racional, lo cual ocurrir´ a sólo accidentalmente. Si r ≥ 1 la órbita es esencialmente una elipse que precesa; el semieje menor rmin rota 2π(1 − γ −1) por cada ciclo de variación de r. Ver figuras 5.15 a 5.18. Un ejemplo de aplicaci´ on del m´ etodo variacional. Muchas veces no es posible resolver exactamente un problema mecánico, pero es deseable obtener información aproximada sobre el mismo. Supongamos que hay un sistema cuya solución conocemos exactamente y que tiene aspectos similares al sistema original para el cual no conocemos la solución; la solución para el sistema aproximado contendrá una serie de par´ ametros. El principio variacional de Rayleigh expresa que la energ´ıa del sistema es menor que el valor medio del hamiltoniano tomado sobre la trayectoria del sistema aproximado, de modo que del sistema aproximado se puede obtener una aproximación óptima al problema original buscando cuáles son los valores de los par´ ametros que minimizan al valor medio del hamiltoniano. En otras palabras: el sistema original posee un hamiltoniano


γ = 1,33

Figura 5.18 Trayectoria para γ ≈ 1

que es funci´ on de las variables de estado, H(q, p); para cada estado de movimiento (q, p), H tendrá un valor definido. Si se toman q(t) y p(t) no de la solución exacta sino de una aproximada, el valor de H siempre será en promedio mayor que el que tendr´ıa tomando para q(t), p(t), sus valores exactos. Este método est´ a relacionado con el método variacional usado en mecánica cuántica para hallar la energ´ıa del estado base de un sistema usando funciones de onda de ensayo. Veamos c´ omo trabaja por medio de un ejemplo. Consideremos un ´ atomo de litio y tratemos de hallar las energ´ıas del electrón externo usando la vieja mecánica cuántica. De acuerdo con el modelo de capas del átomo, el Li consta de dos electrones internos y uno externo. E. Schrödinger en 1921 propuso el siguiente modelo.4 El resto del ´ atomo –los electrones internos– es reemplazado por una capa esférica de distribuci´ on uniforme de carga negativa, externa a la cual hay entonces un campo de fuerza coulombiano, correspondiente a una carga positiva +e del n´ ucleo “apantallado” por dos electrones, y en el interior hay un campo coulombiano, correspondiente a una carga positiva +3e, la del n´ ucleo. Llamemos ρ al radio del cascarón. Entonces la energ´ıa potencial en este modelo será:  2e2 3e2   − + r<ρ r ρ (5.137) V = 2   −e r>ρ r 4 V´ ease

el texto The mechanics of the atom de Max Born, secci´ on 28.

154 / Mec´ anica cl´ asica avanzada donde la constante 2e2 /ρ asegura la continuidad de V en r = ρ. Para el caso en que la energ´ıa sea lo suficientemente alta, la órbita permanecer´ a a distancias del n´ ucleo mayores que ρ, con lo cual la solución será, para el electrón externo, una trayectoria el´ıptica como en la figura 5.13. Pero cuando el perihelio de la órbita resulta menor que ρ, la orbita penetra al interior y no será más de forma el´ıptica pues será la correspondiente al ´ potencial (5.137) que no es coulombiano. Si el electrón externo sólo permanece dentro de la esfera de radio ρ una fracci´ on peque˜ na de tiempo es de esperarse que la órbita sea una elipse que precesa, como en la figura 5.18. Durante un per´ıodo la órbita exacta correspondiente al potencial (5.137) diferirá poco de la órbita correspondiente al potencial coulombiano. Tomaremos entonces como soluciones de ensayo las órbitas el´ıpticas en un potencial: V =−

ze2 r

(5.138)

donde z será un par´ ametro variacional que se determina por la condición de que hHi sea un m´ınimo. Por simplicidad supondremos que el electrón externo est´ a en un estado s, o sea que tiene l = 0. Para este caso, seg´ un (5.104) la excentricidad será ǫ = 1. Como V es central, el hamiltoniano es de la forma (5.28), o sea que interviene sólo la coordenada radial. Usando (5.119) y (5.118) obtenemos, tomando δ = 0: r = (1 − cos ψ)a ;

2πνt = ψ − senψ

(5.139)

La ecuaci´ on (5.139) permite escribir a r y r˙ en la forma: r = 2a sen2

ψ ; 2

r˙ = 2πνa cot

ψ 2

(5.140)

La ecuaci´ on (5.140) permite ahora expresar a H en términos de la solución de ensayo as´ı:

H=

 3e2 2e2 2 ψ  2 ψ 2 2 2  − csc + 2π mν a cot   2 2a 2 ρ  2    2π 2 mν 2 a2 cot2 ψ − e csc2 ψ 2 2a 2

r<ρ (5.141) r>ρ

El valor medio de H en un per´ıodo será, usando la ecuaci´ on de Kepler: hHi = 2ν

Z

1/(2ν) 0

2 Hdt = π

Z

π 0

ψ Hsen2 dψ 2

(5.142)

Llamando ψ1 al valor de ψ cuando r = ρ obtenemos de (5.140): ψ1 = sen 2

r

ρ 2a

(5.143)

Movimiento de dos part´ıculas que interact´ uan ... / 155 Podemos separar la integral (5.142) en dos, de 0 a ψ1 y de ψ a π, con lo cual obtenemos después de manipulaciones simples: Z 2 ψ1 3e2 2e2 2 2 2 2 ψ 2ψ hHi = 2π mν a cos dψ − + sen π 0 2 2a ρ 2 (5.144) Z 2 e ψ 2 π dψ 2π 2 mν 2 a2 cos2 − + π ψ1 2 2a Efectuando las integraciones llegamos a: 2 2 e e2 e2 e2 hHi = − ψ1 + ψ1 − senψ1 + π 3 mν 2 a2 − π π a ρ ρ 2a

(5.145)

Es conveniente expresar a e2 /a en términos del n´ umero cuántico principal n, la energ´ıa de Rydberg y el par´ ametro z, as´ı: z z e2 = e 2 = 2R a n a0 n

(5.146)

donde a0 es el radio de Bohr y R = e2 /a0 . Como a = n2 a0 /z, notamos por analog´ıa que ρ será el radio de la ´ orbita de los electrones internos, que se mueven en presencia del n´ ucleo que tiene carga 3e, y est´ an en la primera órbita que tiene n = 1; entonces ρ = a0 /3. De esta forma (5.143) es: r 1 z ψ1 = (5.147) sen 2 n 6 Usando (5.112) con k = ze2 obtenemos: π 2 mν 2 a2 =

π z2 R 4 n2

de modo que (5.145) tomará la forma: " r 2z 1 z 2R 6 − 2 arcsen hHi = π n n 6 r # 1 z2 π z2 − 6z − 2 + −z n n 2n 2

(5.148)

(5.149)

z es un par´ ametro que se determina por la condición de que minimice a hHi, es decir, por la condición: ∂hHi =0 ∂z

(5.150)

Efectuando las manipulaciones algebraicas llegamos a que z satisface la siguiente ecuaci´ on trascendental: r π 1 z = sen (z − 1) (5.151) n 6 4

156 / Mec´ anica cl´ asica avanzada de (5.151) se sigue que z debe ser positiva. Una vez hallada z de (5.151) se reemplaza en (5.149) para obtener la energ´ıa: " R n E= 2z(z − 1) 1 − 2 2n 2 # r 4n z2 +zn(1 − 6n) + 6n + 6z − 2 (5.152) π n De acuerdo con el principio variacional, la aproximación óptima por medio de órbitas de Kepler al movimiento bajo el potencial (5.137) se halla por medio del potencial coulombiano −ze2/r, donde z es el n´ umero que se obtiene de (5.151) para cada n. Los resultados que se obtienen al resolver numéricamente a (5.151) son aproximados, dando errores grandes para n = 2 y errores que van disminuyendo a medida que n aumenta; las energ´ıas variacionales siempre serán mayores que las experimentales. As´ı, por ejemplo, algunos resultados son: (n, Evar , Eexp )= (2; −0, 29; −0, 58); (8; −0, 06; -0, 12); (15; −0, 03; −0, 06); (40; -0, 01; −0, 03). Los resultados no son muy buenos pero ilustran el método variacional que es usado extensivamente en muchas ramas de la f´ısica; las discrepancias se deben en parte al modelo –suponer que el potencial es central y dado por (5.137)–, en parte al método variacional en s´ı, y en parte al uso de la aproximación clásica.

5.4.

El problema de la dispersi´ on bajo fuerzas centrales

Esta secci´ on trata con las soluciones que describen estados no ligados; tales son los casos k < 0, k > 0 y E > 0 en el movimiento bajo el potencial −k/r. Cuando el problema es causal, es decir se conocen exactamente las constantes de movimiento y φ0 , las ecuaciones de la órbita nos dan la evoluci´ on de la part´ıcula; este problema es estrictamente mecánico. En f´ısica microscópica, cuando se trabaja con átomos, moléculas o electrones, entre otros, una descripción mecánica es muy dif´ıcil; entonces se acude a conceptos estad´ısticos. En esta secci´ on en gran parte trabajaremos con los conceptos estad´ısticos de la secci´ on eficaz, aptos para sistemas microf´ısicos, aunque también se aplican por ejemplo en cosmolog´ıa. La secci´ on eficaz de dispersi´ on. Un experimento t´ıpico de dispersi´ on consiste en estudiar el efecto de un centro dirpersor sobre un haz de part´ıculas. Se entiende por dispersi´ on el proceso de colisi´ on en el cual la direcci´ on del movimiento de las part´ıculas incidentes cambia al azar, como resultado de la interacci´ on con el centro dispersor. En el estudio estad´ıstico se hacen las siguientes suposiciones: todas las part´ıculas del haz incidente son de la misma naturaleza y tienen la misma energ´ıa y direcci´ on de la velocidad inicialmente. La interacci´ on es de corto rango, de modo que a partir de distancias mayores que cierta cantidad α es esencialmente cero. El haz de part´ıculas

Movimiento de dos part´ıculas que interact´ uan ... / 157 incidentes tiene una secci´ on transversal A que es mucho mayor que el área efectiva de interacci´ on σ = πα2 , las part´ıculas se distribuyen al azar sobre el área de la secci´ on transversal del haz. El haz tiene un n´ umero muy grande de part´ıculas para permitir un tratamiento estad´ıstico, pero no tan grande como para que una part´ıcula del haz interfiera con otra. Toda part´ıcula que se acerque al centro dispersor a una distancia menor que α es dispersada; la probabilidad a priori de una part´ıcula ser dispersada es: p=

σ ; A

σ = πα2

(5.153)

donde σ se llama secci´ on eficaz total de dispersi´ on y es una medida de la dispersi´ on en cualquier ´ angulo. Llamaremos θ al ángulo entre la direcci´ on del haz incidente y la del movimiento final de una part´ıcula dispersada. Las part´ıculas que incidan sobre el blanco con un par´ ametro de impacto s serán dispersadas en un ´ angulo θ; las que incidan con un par´ ametro de impacto s + ds serán dispersadas en un ´ angulo θ + dθ donde dθ es negativo. Todas las part´ıculas que incidan sobre una corona circular de radios s y s + ds serán dispersadas dentro del rango angular θ y θ + dθ. Todas las part´ıculas que incidan sobre el área dσ (´ area rayada en la figura 5.19) se dispersarán con ´ angulos entre θ y θ + dθ y φ + dφ. Como suponemos que r ≫ α, rd θ A dσ

r

dϕ θ

θ + dθ

dϕ

ds

Figura 5.19 Secci´ on eficaz de dispersi´ on entonces hemos notado que no hay diferencia esencial en suponer que las part´ıculas emergen del centro dispersor en vez del centro del área rayada dσ. Estas part´ıculas serán dispersadas dentro de un ´ angulo sólido dΩ dado por: dΩ = senθ dθ dφ

(5.154)

La probabilidad de dispersi´ on dentro del ángulo dΩ se expresa en funci´ on de la llamada secci´ on eficaz dσ. dp =

dσ s ds dφ = A A

(5.155)

Supongamos que la intensidad del haz incidente es I: I=

∆N A ∆t

(5.156)

158 / Mec´ anica cl´ asica avanzada donde ∆N es el n´ umero de part´ıculas incidentes que pasan por el área A durante el tiempo ∆t. De las ∆N que en ∆t pasan a través de A, solamente dN (θ) incidir´ an sobre el ´ area dσ y serán dispersadas dentro de dΩ en el tiempo ∆t. Entonces la probabilidad de dispersi´ on dentro de dΩ durante el tiempo ∆t será: dp =

dN (θ) dσ = ∆N A

(5.157)

Se sigue entonces de (5.156) y (5.157) que: dN (θ) = Idσ ∆t

(5.158)

Definimos la secci´ on eficaz diferencial σ(θ), como: σ(θ) =

dσ dΩ

(5.159)

Se sigue entonces que: σ(θ) =

1 dN (θ) I(θ) = I I ∆t dΩ

(5.160)

Es decir, σ(θ) es igual al n´ umero total de las part´ıculas dispersadas dentro de dΩ por unidad de tiempo y unidad de ángulo sólido, dividido por el n´ umero de part´ıculas incidentes por unidad de área por unidad de tiempo. Como esta definición de σ(θ) incluye sólo conceptos macroscópicos, o sea conceptos de cantidades observables experimentalmente, entonces es válido también en mecánica cuántica. La siguiente expresión mecánica que resulta de (5.159) al reemplazar a dσ y dΩ en funci´ on de θ, φ y s sólo es válida en mecánica cl´ asica, σ(θ) =

dσ −s ds = dΩ senθ dθ

(5.161)

La ecuaci´ on (5.161) est´ a expresada en funci´ on de s, que en microf´ısica no es accesible directamente al experimento. La relaci´ on entre las tres definiciones de secci´ on eficaz (sección eficaz, secci´ on eficaz total y secci´ on eficaz diferencial) es: Z Z σ = dσ = σ(θ) dΩ (5.162) Ejemplo 5.4.1 Sea una esfera dura de radio a y masa infinita. Sobre ella incide un haz de part´ıculas de masa m y radio b también duras, que se dispersan elásticamente al chocar. Hallar la secci´ on eficaz diferencial (véase figura 5.20). El par´ ametro de impacto est´ a dado por: s = (a + b) senα = (a + b) cos

θ 2

(5.163)


a

z S

b

α α

θ

Figura 5.20 El haz part´ıculas de masa m y radio b incide sobre una esfera de masa infinita y radio a

Entonces: σ(θ) =

1 (a + b)2 ; 2

σ = π(a + b)2

(5.164)

σ(θ) no depende de θ ni de la energ´ıa. Cu´ anticamente se halla que σ es cuatro veces mayor debido a efectos de difracci´ on. Secci´ on eficaz diferencial de Rutherford. Es la secci´ on eficaz diferencial de dispersi´ on coulombiana, cuando inciden part´ıculas cargadas sobre un blanco de masa infinita y cargado eléctricamente. Asumamos que las cargas son positivas, ze y z ′ e, de modo que k es negativo, igual a −zz ′e2 . La figura 5.21 muestra la trayectoria de una de las part´ıculas, que es hiperb´ olica. Tomamos por simplicidad a φ0 = 0 con lo cual obtenemos de acuerdo con la figura 5.9, la figura 5.21. De acuerdo con la definición de secci´ on c´ onica, la ecuaci´ on de la hipérbola (rama 1 en la figura 5.9) es: QF2 = ǫQD2

(5.165)

donde Q es el punto cuyo vector de posición es ~r, F2 es el foco de la derecha y D2 la directriz de la derecha. Entonces la ecuaci´ on de la trayectoria es: ǫs ǫs l2 /mk = −1 − ǫ cos φ ⇒ φ = π → rmin = = r ǫ−1 1−ǫ

(5.166)

Que también se obtiene directamente de (5.85) cuando k < 0 y φ0 se sustituye por φ0 + π. r → ∞ cuando −1 − ǫ cos φ = 0, o sea cuando φ toma el valor: 1 (5.167) φmin = cos−1 − ǫ φmin est´ a relacionado con el ´ angulo de dispersi´ on θ: φ π θ + θ = φmin ; θ + φ = π ⇒ φmin = + 2 2 2

(5.168)

160 / Mec´ anica cl´ asica avanzada y

•

z′e

Q

 θ / 2   

r Θ

O

ϕ

•ze

x

v∞

•u

S

Figura 5.21 Dispersi´ on de Rutherford. La trayectoria de las part´ıculas es hiperbólica.

Entonces: 1 θ θ cos φmin = −sen = − ⇒ ǫ = csc 2 ǫ 2

(5.169)

Por otra parte ǫ est´ a relacionado con E y l, o sea con υ∞ y con s: l = mυ∞ s ; E =

1 mυ∞ 2 2

(5.170)

Como, seg´ un (5.89), ǫ2 = 1 + 2El2 /(mk 2 ), vemos que: s2 =

k2 2 (ǫ − 1) 4E 2

(5.171)

De (5.169) y (5.171) se sigue que: s=

k θ cot 2E 2

Reemplazando a (5.172) en (5.161) obtenemos para σ(θ): 2 θ k csc4 σ(θ) = 4E 2

(5.172)

(5.173)

que es la f´ ormula de Rutherford.5 Como el resultado no depende del signo de k, la f´ ormula también es válida cuando el potencial es atractivo. 5 Hallada

en 1911. En el tomo I del Berkeley physics course, al final del cap´ıtulo 15, puede verse el trabajo original de Rutherford.

Movimiento de dos part´ıculas que interact´ uan ... / 161 La f´ ormula (5.173) coincide exactamente con la formula cuántica no relativ´ıstica; es uno de los varios resultados en que para potenciales del tipo 1/r hay una identidad con los resultados cuánticos. La secci´ on eficaz total que se calcula de (5.173) resulta infinita. Como σ es una medida de la dispersi´ on, el ´ area efectiva para la dispersi´ on de Coulomb es infinita por ser un potencial de rango largo α = ∞. No importa a que distancia pase el proyectil del blanco siempre habr´ a dispersi´ on en alguna direcci´ on. Sistemas de referencia de centro de masa y de laboratorio. Hasta aqu´ı las consideraciones de las ´ orbitas se han hecho suponiendo que el centro de fuerzas es inmóvil, lo que equivale a decir que trabajamos en un sistema de referencia donde se mueve una part´ıcula de masa reducida µ, que puede asumirse que est´ a colocada en vez de la part´ıcula 2, en tanto que el centro de fuerzas, inmóvil, est´ a donde estaba la part´ıcula 1. El radio vector ~r describe el movimiento de la part´ıcula µ, as´ı como el movimiento relativo de las dos part´ıculas originales [ecuaciones (5.9) a (5.13)]. Aqu´ı analizaremos más en detalle la transformaci´ on de coordenadas, de manera adecuada a los procesos de dispersi´ on bajo fuerzas centrales. Experimentalmente los procesos de dispersi´ on se trabajan en el sistema de referencia de laboratorio. Los c´ alculos teóricos se hacen en el sistema de centro de masa, donde la din´ amica de los problemas consiste en el movimiento de la part´ıcula de masa µ. Es necesario encontrar la conexión entre los resultados teóricos y los experimentales. Todas las f´ ormulas anteriores de (5.153) a (5.173) han sido obtenidas suponiendo que el centro dispersor es fijo (véase figura 5.22). En el laboratorio usualmente una de las dos part´ıculas, que llamaremos el blanco, est´ a inicialmente en reposo y sobre ella incide el proyectil con cierta velocidad. La velocidad inicial del proyectil, cuando la separación de las dos part´ıculas es mucho mayor que el rango de la interacci´ on α, es ~υ y la del blanco ~ = 0. En el centro de masa estas dos velocidades son ~υc y V ~c respectivamente. La es V m

-v

v

m

m

c.m. Laboratorio: inicial

M1

vc

x

x c.m.

v=0

vc

Laboratorio: final

Figura 5.22 Sistemas de referencia de centro de masa y de laboratorio velocidad del centro de masa respecto al laboratorio es constante, la llamaremos ~υ . m ~υ = ~υ (5.174) m+M Los momentos lineales de las part´ıculas inicialmente, cuando su separación es muy grande de modo que no interact´ uan, son en el laboratorio: p~P L = m~υ ;

pBL = 0

y en el centro de masa son: p~P C = m(~υ − ~υ) = µ~υ ;

(5.175) ~pBC = M (0 − ~υ) = −µ~υ

(5.176)

162 / Mec´ anica cl´ asica avanzada Las energ´ıas cinéticas totales de acuerdo con lo hallado en (5.11) a (5.13) son: TL =

1 mυ 2 ; 2

TC =

1 2 µυ 2

(5.177)

La energ´ıa cinética del centro de masa, que es constante, es: TC.M =

1 (M + m)υ 2 2

(5.178)

De modo que si p ~ es el momento lineal relativo, las energ´ıas cinéticas est´ an conectadas por: TL =

p~2 P~ 2 + = TC.M + Tc 2(M + m) 2µ

(5.179)

o sea que en la regi´ on asint´ otica (r → ∞): TL = EL ;

EC.M = TC.M =

µ EL ; M

EL =

m EC µ

(5.180)

El momento lineal total anterior a la colisi´ on (r → ∞), es igual al momento lineal total después de la colisi´ on (r → ∞). Usaremos primas para denotar las cantidades en la regi´ on asint´ otica después de la colisi´ on. En el centro de masa el momento lineal total es cero, de modo que: ~C = 0 ; m~υC + M V

′ ~′ =0 m~υC + MV C

(5.181)

La ecuaci´ on de la conservaci´ on de la energ´ıa total en el centro de masa es: 1 1 ~2 1 1 ~ ′2 2 ′2 m~υC + MV υC + MV C = m~ C 2 2 2 2 La f´ ormula (5.182) se puede escribir, usando (5.181), en la forma: m ′ m ′ ′ · ~υC + ~υC = ~υC ~υ ~υC · ~υC + M M C

(5.182)

(5.183)

Se sigue entonces que: 2 ′2 υC = υC ;

VC2 = VC′2 ;

′ mυC = mυC = M VC = M VC′

(5.184)

es decir, las magnitudes de los cuatro momentos lineales, incidentes y emergentes, son iguales, de modo que en el centro de masa cada part´ıcula queda después de la colisi´ on con la misma energ´ıa inicial.6 En el proceso de colisi´ on no interviene el ángulo φ, porque con fuerzas centrales el movimiento ocurre en un plano (véase figura 5.23). Analicemos ahora la relaci´ on entre los ´ angulos de dispersi´ on θL y θC . La relación de las velocidades de centro de masa y laboratorio es: ′ ′ ~υL = ~υC + ~υ ; 6 Se

V~L′ = V~C′ + ~υ

(5.185)

ve que la part´ıcula µ no coincide con m cuando se toma el origen de ~ r en el centro de masa. Como s´ olo interesa θC , es irrelevante saber d´ onde est´ a el origen de ~ r.


v2′

m

Vc′ m

r Θc

Θ2

v

vc

v

r

C.M.

Centro de mesa

M

C.M.

vc

v=0 Laboratorio

v2′

vc′

Figura 5.23 Sistemas laboratorio y centro de masa

Sabemos que: υC = ~

M~ ~BC p = υ; m m

~C ′ = p~BC = −~υ V M

(5.186)

′ Como υC = υC y VC′ = VC , la ecuaci´ on (5.186) nos dice que: ′ υC =

M υ; m

VC′ = −υ

(5.187)

′ ′ O sea que si M > m entonces υC > υ = VC′ y si M < m, entonces υC < υ = VC′ . Podemos distinguir dos casos, M > m y M < m. Si m > M , de acuerdo con las figuras 5.24 y 5.25, θL es máximo cuando ~υC ′ es perpendicular a ~υL ′ , luego:

senθLmax =

′ M υC = υ m

(5.188)

o sea que hay una regi´ on angular en el laboratorio que est´ a prohibida cuando m > M . Si m < M , todos los valores de θL son posibles. La relación entre θC y θL es com´ un para los casos m > M y m < M . Dicha relación se obtiene a partir de: υL senθL = υC senθC ;

υL cos θL = υ + υC cos θC

(5.189)

Se sigue entonces que: tan θL =

senθC ; cos θC + γ

γ=

m M

(5.190)

Vemos que si m ≪ M , entonces θL ≃ θC . Si m ≃ M y γ ≃ 1, entonces θL ≃ (1/2)θC . Hallemos ahora la relaci´ on entre las secciones eficaces diferenciales σL (θL ) y σc (θc ). La secci´ on eficaz dσ es invariante por ser perpendicular a la direcci´ on del movimiento del proyectil en los dos sistemas de referencia: dσC = dσL

(5.191)


v ′L

vi′C

ΘL

ΘC

v

γ>1 Figura 5.24 Relación entre los ángulos de dispersi´ on θC y θL con γ > 1

v ′L ΘL

vi′C ΘC

v

γ<1 Figura 5.25 Relación entre los ángulos de dispersi´ on θC y θL con γ < 1

de (5.159) se sigue entonces que: σC (θC )dΩC = σL (θC )dΩL ;

σL (θL ) = σC (θC )

d(cos θC ) d(cos θL )

(5.192)

Movimiento de dos part´ıculas que interact´ uan ... / 165 Para hallar el factor en (5.192), notemos que de (5.190) se sigue: tan θC =

senθL cos θL −

γ 1+γ

(5.193)

Entonces usamos: d(cos θC ) d(cos θC ) d(tan θC ) = = d(cos θL ) d(tan θC ) d(cos θL ) Para obtener finalmente:7 2 p 2 sen2 θ + γ cos θ 1 − γ L L d(cos θC ) p = fγ (θL ) = d(cos θL ) 1 − γ 2 sen2 θL

(5.194)

(5.195)

La f´ ormula σL (θL ) = fγ (θL )σC (θC ) da la conexión entre los c´ alculos teóricos, centro de masa, y las medidas experimentales, laboratorio. Si γ = 1, vemos que f1 (θL ) = 4 cos θL , y si γ = 0, f0 (θL ) = 1. Ejemplo 5.4.2 Hallar la secci´ on eficaz diferencial de dispersi´ on en el laboratorio para la colisi´ on de dos esferas duras de masas m y M , y radios b y a respectivamente. En el centro de masa la dispersi´ on es como en la figura 5.20, de modo que: σC (θC ) =

1 (a + b)2 4

(5.196)

El resultado se obtiene usando la siguiente consideración: el problema es como si reemplazáramos la esfera de masa m por una de masa µ, y la esfera de masa M por una de masa infinita. Como la interacci´ on es la misma, entonces el radio de la esfera de masa µ debe ser b y el de la esfera de masa infinita debe ser a. Como la ecuaci´ on (5.164) no depende del valor de la masa, se sigue el resultado (5.196). En el sistema de referencia de laboratorio la secci´ on eficaz diferencial es: σL (θL ) =

1 (a + b)2 fγ (θL ) 4

(5.197)

La secci´ on eficaz diferencial en el centro de masa es isotrópica, en tanto que en el laboratorio s´ı habr´ a una dependencia angular. En virtud del resultado (5.188), la funci´ on fγ (θL ) debe definirse idénticamente igual a cero para ángulos θL mayores que θL máximo, cuando γ > 1. Ejemplo 5.4.3 Hallar la secci´ on eficaz diferencial de Rutherford en el laboratorio cuando la masa de la carga ze es finita. 7 Ver

la demostraci´ on en el texto Classical dynamics of particles and systems de Marion, 2a ed., ¯ secci´ on 9.4.

166 / Mec´ anica cl´ asica avanzada En el centro de masa σC (θC ) est´ a dada por (5.173): 2 k θC σC (θC ) = csc4 ; k = −zz ′ e2 4E 2 En el laboratorio será:  σL (θL ) =

k 4E

2   1 + 

cos θL −

γ 1+γ sen2 θL

2 −2    

fγ (θL )

(5.198)

(5.199)

o sea que la dependencia angular en el laboratorio es mucho más complicada que en el centro de masa. Cuando γ = 1 sin embargo, los resultados son simples debido a que θC = 2θL y f1 (θL ) = 4 cos θL : 2 cos θL k ; γ=1 (5.200) σL (θL ) = 2E sen4 θL

6 Peque˜ nas oscilaciones de sistemas de varios grados de libertad En vez de exponer el formalismo general, resolveremos en detalle algunos problemas que ilustran los aspectos principales del mismo. Veremos que las fórmulas que se obtienen en forma de matrices se generalizan fácilmente. Al respecto, el lector puede ver los correspondientes cap´ıtulos en los textos de Goldstein, Hauser, Marion, Gantmacher, entre otros, donde además se explica en qué consiste la “peque˜ nez” de las oscilaciones.

6.1.

Modos normales de oscilaci´ on. Caso no degenerado

La mol´ ecula triat´ omica lineal. Oscilaciones longitudinales. La molécula triat´ omica lineal consta de dos ´ atomos de masa m y uno de masa M , ligados entre s´ı por fuerzas interat´ omicas de modo que en la configuración de equilibrio la molécula es lineal, y al oscilar se conserva la forma lineal (véase figura 6.1). Supondremos que las interacciones más importantes se presentan entre los átomos 1 y 2, y 2 y 3; más adelante incluiremos una interacci´ on un poco más general. La energ´ıa potencial de interacci´ on entre dos ´ atomos puede variar como un pozo de potencial, a grandes distancias es atractiva y a peque˜ nas distancias es repulsiva, con un m´ınimo en una distancia dada. Nos interesaremos en los movimientos que consisten en peque˜ nas oscilaciones alrededor de la posición en que la energ´ıa potencial tiene un m´ınimo, que es una posición de equilibrio estable. m

M

m

x1

x2

x3

Figura 6.1 Molécula triatómica lineal

167

168 / Mec´ anica cl´ asica avanzada Para estos movimientos se cumple: (a) La energ´ıa potencial es del tipo de un “resorte” con peque˜ nas elongaciones; (b) La energ´ıa cinética no depende de la posición, o sea, es funci´ on cuadrática homogénea de las velocidades, con coeficientes que no dependen de la posición. Ver la discusi´ on detallada de lo anterior, por ejemplo en Gantmacher, numeral 40. El n´ umero de grados de libertad necesarios para especificar las oscilaciones longitudinales es 3 − 1 = 2 descontando la traslación del centro de masa. La longitud del “resorte” que une los ´ atomos 1 y 2 es x2 − x1 . Supondremos que en la posición de equilibrio la longitud de este “resorte” es b, o sea que x20 − x10 = b, siendo xi0 la coordenada de la part´ıcula i en la configuración de equilibrio. La elongaci´ on del resorte 1−2 será entonces: (x2 − x1 ) − b = (x2 − x20 ) − (x1 − x10 )

(6.1)

ηi = xi − xi0

(6.2)

Si llamamos a η1 , η2 y η3 la cantidad en que se separa cada átomo de su posición de equilibrio: podemos escribir las elongaciones de los resortes 1 − 2 y 2 − 3 como: η2 − η1

y

η3 − η2

(6.3)

de modo que la energ´ıa potencial para peque˜ nas oscilaciones será: 1 1 k(η2 − η1 )2 + (η3 − η2 )2 V = 2 2

(6.4) 1 2 2 2 k(η1 + 2η2 + η3 − 2η1 η2 − 2η2 η3 ) 2 donde k es la “constante de resorte”, cuyo valor depende de factores que no entraremos a considerar aqu´ı, pero que supondremos conocido. En (6.4) no se incluye interacci´ on entre los ´ atomos 1 y 3. Las coordenadas η1 , η2 , η3 , no son todas vibracionales pues sabemos que las vibraciones longitudinales requieren sólo dos coordenadas. V puede escribirse en la forma: 3 1 X kij ηi ηj (6.5) V = 2 i,j=1 ˜ donde kij son los elementos de la matriz 3 × 3, k:   1 −1 0      −1 2 −1 k˜ = k      0 −1 1

(6.6)

k˜ es una matriz simétrica, kij = kji . La energ´ıa cinética es: 1 1 1 mx˙ 21 + M x˙ 22 + mx˙ 23 T = 2 2 2 =

3 1 X mij η˙ i η˙ j 2 i,j=1

(6.7)

Peque˜ nas oscilaciones de sistemas de varios grados de libertad / 169 donde mij son los elementos de la matriz 3 × 3, m, ˜ que es diagonal y por lo tanto simétrica:   m 0 0      m ˜ = 0 M 0  (6.8)    0 0 m El lagrangiano del problema es: L=

3 1 X (mij η˙ i η˙ j − kij ηi ηj ) 2 i,j=1

(6.9)

Para hallar las ecuaciones de Lagrange se requiere conocer las derivadas parciales de L respecto a ηi y η˙ i . Para ello evaluemos a dL: dL =

3 1 X (mij dη˙ i η˙ j + mij η˙ i dη˙ j − kij dηi ηj + kij ηi dηj ) 2 i,j=1

(6.10)

usando la simetr´ıa de k˜ y m, ˜ un cambio adecuado de los ´ındices mudos de la suma permite escribir,      3 3 3 X X X  mij η˙ j  dη˙i −  kij ηj  dηi  (6.11) dL = i=1

j=1

j=1

con lo cual obtenemos:

3 3 X X ∂L ∂L kij ηj ; mij η˙ j ; i = 1, 2, 3 =− = ∂ηi ∂ η˙ i j=1 j=1

(6.12)

Teniendo en cuenta que las mij son constantes, las ecuaciones de Lagrange son: 3 X

(mij η¨j + kij nj ) = 0; i = 1, 2, 3

(6.13)

j=1

Si definimos los vectores en el espacio de configuración del sistema,       0 η¨1 η1             ¨    ~   η= ~  η2  ; ~η =  η¨2  ; 0 =  0        0 η¨3 η3

(6.14)

las ecuaciones de Lagrange (6.13) toman la forma condensada: ˜η = ~0 m ˜~ η¨ + k~

(6.15)

170 / Mec´ anica cl´ asica avanzada Veremos que (6.15) es la forma de la ecuaci´ on de movimiento para cualquier sistema de muchos grados de libertad con peque˜ nas oscilaciones. El sistema que consideramos tiene sólo oscilaciones en una dimensi´ on; sin embargo, por tener tres grados de libertad para los movimientos longitudinales, el espacio de configuración de tales movimientos es tridimensional. El problema que sigue es buscar las soluciones de (6.15) que describir´ an el movimiento del punto del espacio de configuración. La ecuaci´ on para el vector ~η , (6.15), es lineal, luego la solución general puede expresarse como una combinaci´ on lineal de las soluciones linealmente independientes. Como el vector ~ η es tridimensional, existirán tres soluciones linealmente independientes, en términos de las cuales puede expandirse a ~η ; tales soluciones las llamaremos ~ηα con α = 1, 2, 3, de modo que la solución general de (6.15) será de la forma: ~η = C1 ~ η1 + C2 ~η2 + C3 ~η3

(6.16)

Como la ecuaci´ on de movimiento es de segundo orden, la solución contendrá dos constantes de integraci´ on arbitrarias por cada grado de libertad. En total hay seis constantes de integraci´ on que son C1 , C2 , C3 , φ1 , φ2 , φ3 . Busquemos soluciones de la forma: ~ηα = ~ µα sen(ωα t + φα ); α = 1, 2, 3

(6.17)

~ α es un vector tridimensional constante y φα es una constante de integraci´ µ on. Las componentes de ~ µα son µα1 , µα2 , µα3 . En términos de las componentes, (6.17) será: ηαi = µαi sen(ωα t + φα ) ;

i, α = 1, 2, 3

(6.18)

En (6.18) el ´ındice i se refiere a los grados de libertad, en tanto que α numera las soluciones diferentes. ωα es una constante que no debe depender de las constantes de integraci´ on. Debido a que sen(ωα t + φα ) y sen(ωβ t + φβ ) son linealmente independientes cuando ωα 6= ωβ , las ~ηα serán linealmente independientes cuando ωα 6= ωβ . Las soluciones de la forma (6.17) y (6.18) representan los movimientos en los cuales todas las part´ıculas oscilan con la misma frecuencia y tienen una definida relación entre sus amplitudes de oscilación. La pregunta que sigue es: ¿cu´ anto valen las ωα y cuáles son las relaciones que deben existir entre las µαi ?. Para responderla, reemplacemos a (6.18) en (6.15): ˜ µα = ~0 , (−ωα2 m ˜ + k)~

3 X

(ωα2 mij + kij )µαj = 0;

i, α = 1, 2 , 3

(6.19)

j=1

La ecuaci´ on (6.19) es un sistema de tres ecuaciones lineales algebraicas homogéneo, con las tres inc´ ognitas µα1 , µα2 , µα3 , que tendrá solución para ciertos valores de ωα . Hallar a ~ µα equivale a realizar la siguiente operaci´ on con matrices: ˜ −1~0 µα = (−ωα2 m ~ ˜ + k)

(6.20)

Vemos que ~ µα será no trivial, es decir, diferente del vector ~0 solamente si la matriz k) es singular, o sea si su determinante es cero. Esto introduce una condición que permite determinar las ωα : (−ωα2 m +

˜ =0 det(ωα2 m ˜ − k)

(6.21)

Peque˜ nas oscilaciones de sistemas de varios grados de libertad / 171 La ecuaci´ on (6.21) se llama ecuaci´ on secular o determinante secular. El término secular proviene del latin seculum, o sea, referente a los siglos; se usa a partir de una ecuaci´ on análoga en astronom´ıa que aparece al realizar c´ alculos perturbativos que predicen efectos sobre las ´ orbitas apreciables sólo en tiempos muy largos. De acuerdo con las ecuaciones (6.6) y (6.8) se tiene que:

ωα2 m ˜



mωα2 − k

  ˜ −k =  

k

0

k

M ωα2

k

0

k

− 2k

mωα2 − k

     

(6.22)

El determinante de la matriz (6.22) es:

det ωα2 m ˜ − k˜ = mωα2 − k (M ωα2 − 2k)(mωα2 − k) − k 2 −k

k(mωα2

− k)

(6.23)

Por tanto la ecuaci´ on (6.21) es una ecuaci´ on algebraica de tercer grado en ωα2 , que 2 2 2 tendrá tres ra´ıces que serán ω1 , ω2 y ω3 :

M + 2m k (ω 2 − 0) ω 2 − k det ωα2 m ˜ − k˜ = m2 M ω 2 − m Mm

(6.24)

= m2 M (ω 2 − ω22 )(ω 2 − ω12 )(ω 2 − ω32 ) En conclusi´ on, las frecuencias con las cuales puede ocurrir la oscilación simult´ anea de las tres coordenadas son:

ω12 = 0; ω22 =

k m k 1+2 ; ω32 = m m M

(6.25)

Si m ≪ M entonces ω2 ≈ ω3 present´ andose una cuasidegeneraci´ on. Hay una matriz

172 / Mec´ anica cl´ asica avanzada de la forma (6.22) por cada una de las frecuencias (6.25):

ω12 m ˜ − k˜ =

ω22 m ˜

− k˜ =



−k

k

   k   0



    k  

k k

ω32 m ˜ − k˜ =

       

2

0

k m k M k

k

0



   k   

M − 2m k m

0



  k    −k

−2k

0



0

(6.26)

0

k

0

M m

k

k

2

m k M

        

Entonces las ecuaciones (6.19), que nos dan las relaciones entre las componentes de los vectores ~ µ1 , µ ~ 2 y ~µ3 , son: 

−k    k   0 

0

    k  

       

2

0

µ11    k    µ12  µ13 −k

−2k k

0

k k k

0

M m k

k 2



µ21



µ31

   µ22 k     µ23 0

M − 2m k m

m k M k

0

k

0



k



m k M



      µ32    µ33



  =   

  =   

  =  



0



     0         0  

0



     0         0 



0



     0         0 

(6.27)

Peque˜ nas oscilaciones de sistemas de varios grados de libertad / 173 Siendo más expl´ıcitos, respectivamente estas ecuaciones toman la forma: µ11 = µ12 ; µ11 − 2µ12 + µ13 = 0; µ12 = µ13 µ22 = 0; µ21 + µ23 = 0; µ22 = 0 2

(6.28)

m M 2m µ31 + µ32 = 0; µ31 + µ32 + µ33 = 0; µ32 + µ33 = 0 M m M

Las relaciones buscadas entre los componentes de los vectores ~µα para los movimientos en que las tres part´ıculas oscilan con la misma frecuencia son: ω1 : µ11 = µ12 = µ13 ω2 : µ21 = −µ23 ; µ22 = 0 ω3 : µ31 = µ33 ; µ32 = −

(6.29)

2m µ31 M

Cada vector µα resulta indeterminado por una constante arbitraria, aunque las relaciones entre sus componentes est´ an bien definidas:1       1 1 1              2m      (6.30) µ1 = µ11  1  ; ~ ~ µ2 = µ21  0  ; ~µ3 = µ31  −   M        1 −1 1

Notamos que ~ µ1 , ~ µ2 y ~ µ3 no son ortogonales, puesto que: ~µ1 · ~µ2 = 0; ~µ1 · ~µ3 = 2µ11 µ31 (1 − m/M ); ~ µ2 · ~ µ3 = 0. Es deseable, sin embargo, trabajar con vectores ortogonales. Los vectores siguientes son ortogonales:  √    √ m m      √    1/2 1/2    m ˜ ~ µ1 = µ11  M  ; m ˜ ~µ2 = µ21  0       √ √ − m m  √ m   −2m  m ˜ 1/2 µ ~ 3 = µ31  √  M  √ m



(6.31)

     

1 Las trayectorias descritas en el espacio de configuraci´ on son rectil´ıneas. ~ η1 corresponde a una l´ınea infinita, describe una translaci´ on no acotada a lo largo del vector ~ µ1 . ~ η2 y ~ η3 describen oscilaciones sobre segmentos rectos finitos a lo largo de los vectores ~ µ2 y ~ µ3 respectivamente.

174 / Mec´ anica cl´ asica avanzada En vez de trabajar con estos vectores, es c´ omodo quedarse con los vectores (6.30), pero cambiando la definición del producto escalar. Definiremos el producto escalar de dos vectores ~ µ y ~ν as´ı: (~ µ, ~ν ) = (m ˜ 1/2 ~µ).(m ˜ 1/2 ~ν ) = ~µ.(m~ ˜ ν) =

3 X

mij µi νj

(6.32)

i,j=1

Podemos ahora escoger las constantes arbitrarias µ11 , µ21 y µ31 de modo que los vectores ~ µα formen una tr´ıada ortonormal bajo el producto escalar (6.32), es decir, normalizar los vectores a la unidad: (~µα , ~να ) = 1; α = 1, 2, 3. Este procedimiento nos conduce inmediatamente a:     1 1        1 1     0  1 ; µ1 = √ ~ ~µ2 = √    2m + M   2m   −1 1 

1



     −2m  µ3 = r ~   m  M   2m(1 + 2 )  M 1 1

(6.33)

La definición (6.32) se hace por comodidad matemática, pero nos aleja un poco del sentido f´ısico original. La exigencia de ortonormalidad nos conduce a vectores que no tienen dimensiones de desplazamiento y a soluciones que no dependen de las condiciones iniciales: contienen información sobre la relación de amplitudes pero no de su valor absoluto. Por esto se les llama “modos normales de oscilación”. Se dice que los movimientos longitudinales de la molécula triat´ omica lineal son no degenerados porque las frecuencias de los tres modos normales son diferentes; en otras palabras, no hay dos modos normales diferentes con la misma frecuencia. La frecuencia w1 , que es nula, no corresponde a una oscilación. Esto es consistente con la forma del vector propio correspondiente: las tres part´ıculas se desplazan la misma cantidad en todo momento, o sea que la molécula se traslada. En sentido estricto sólo µ2,3 son modos normales de oscilación, de acuerdo con lo dicho anteriormente acerca de ~ que sólo hay dos coordenadas vibracionales longitudinales. En el modo ~µ2 la part´ıcula 2 se queda quieta y las part´ıculas 1 y 3 oscilan en contrafase. En el modo ~µ3 las part´ıculas 1 y 3 oscilan en fase, pero la part´ıcula 2 se desplaza respecto a 1 − 3 una cantidad que depende de las masas y es en sentido opuesto. En el modo ~µ2 cada “resorte” act´ up a independientemente sobre una masa m; por esto la frecuencia correspondiente vale k/m. Si se quiere indicar la magnitud de las oscilaciones es conveniente definir otras soluciones, llamadas “coordenadas normales”, que, veremos, representan otro conjunto de coordenadas generalizadas independientes para describir el estado del sistema y contienen informaci´ on sobre las condiciones iniciales.

Peque˜ nas oscilaciones de sistemas de varios grados de libertad / 175 Coordenadas normales para la mol´ ecula triat´ omica lineal. Las ecuaciones de movimiento (6.13) son tres ecuaciones diferenciales de segundo orden acopladas. La solución (6.18) fue obtenida por “tanteo”. Un método directo de solución consiste en realizar una transformaci´ on de coordenadas donde las nuevas ecuaciones de movimiento resulten desacopladas. El lagrangiano (6.9) puede escribirse en forma compacta usando la notaci´ on matricial. Si ~η es un vector columna, ~η T es un vector fila: L=

1 ˙T ˙ 1 T ˜ η η m ~ ˜~ η − ~η k~ 2 2

(6.34)

L es una forma cuadrática no diagonal en η˙ i y en ηi pues la matriz k˜ es no diagonal. Esto conduce a que las ecuaciones de movimiento sean acopladas. Si se realiza una transformaci´ on lineal de coordenadas que diagonalice a L, las correspondientes ecuaciones de movimiento serán no acopladas, pues en ese caso L consta de una suma de términos que dependen de sólo una de las coordenadas. Llamemos ~θ a las nuevas coordenadas generalizadas y A˜T la matriz de la transformaci´ on: η = A˜T ~ ~ θ

(6.35)

˜ En las nuevas variables L toma la forma: donde A˜T es la matriz transpuesta de A. L=

1 ~˙ T ˜ ˜T ~˙ θ Am Ã θ − 2

1 ~T ˜˜ ˜T ~ θ Ak A θ 2

(6.36)

Ahora exigimos que A˜ sea tal que m ˜ ′ = A˜kÃ˜T y k˜′ = A˜m ˜ A˜T sean ambas diagona′ ′ ′ ′ les, es decir, tales que mij = mi δij y kij = ki δij para i, j = 1, 2, 3 de modo que (6.36) queda as´ı: 3 1 X ′ ˙2 (m θ − kα′ θα2 ) L= 2 α=1 α α

(6.37)

La ecuaci´ on de movimiento (6.37), será ahora: m′α θ˙α2 − kα′ θα2 = 0

(6.38)

Las soluciones para las nuevas coordenadas, en funci´ on de las constantes de integraci´ on Cα y φα , serán: s ! kα′ (6.39) t + φα kα′ θα2 = 0; α = 1, 2, 3 θα = Cα sen m′α De (6.35) y (6.39) se sigue que: s ! 3 X kα′ ηi = Aαi Cα sen t + φα ; i = 1, 2, 3 m′α α=1

(6.40)

Las coordenadas θα con α = 1, 2, 3, se llaman las coordenadas normales del sistema. El problema matemático ahora consiste en hallar las nueve componentes de la

176 / Mec´ anica cl´ asica avanzada ˜ que se obtienen resolviendo para las Aαi las ecuaciones que resultan de las matriz A, condiciones: (A˜m ˜ A˜T )ij = m′i δij ; (A˜kÃ˜T )ij = ki′ δij (6.41) A partir de (6.16) y (6.17) vemos que ~ηi toma la forma: ηi =

3 X

Cα µαi sen(ωα + φα )

(6.42)

α=1

Las expresiones (6.40) y (6.42) coinciden si se cumple que: kα′ ; i, α = 1, 2, 3 (6.43) m′α Llegamos a la conclusi´ on de que los vectores propios, o modos normales de oscila˜ o sea las columnas de la matriz A˜T que realiza la cion ~ µα , son las filas de la matriz A, ~ transformaci´ on de ~η a θ seg´ un (6.35). Como los vectores ~µα son ortogonales y ortonormales seg´ un el producto escalar (6.32): Aαi = µαi

y

(µα , µβ ) = δαβ ;

ωα2 =

α, β = 1, 2, 3

(6.44)

Podemos escribir (6.44) también en la forma: ~ Tα m~ µ ˜ µβ = δαβ ;

α, β = 1, 2, 3

(6.45)

Expl´ıcitamente (6.45) es: 3 X

mij µαi µβj = δαβ ;

α, β = 1, 2, 3

(6.46)

i,j=1

Notamos la identidad entre las filas de A˜ y los vectores ~µTα , y por lo tanto podemos escribir a (6.46) como: A˜m ˜ A˜T = I˜ (6.47) donde I˜ es la matriz unidad 3 × 3, o sea que m′i = 1 para i = 1, 2, 3. Entonces las condiciones que nos definen las frecuencias ωα2 y la matriz A˜ son de (6.41), (6.43) y (6.47): (A˜m ˜ A˜T )ij = δij ; (A˜kÃ˜T )ij = ωi2 δij ; i, j = 1, 2, 3 (6.48) Las columnas de A˜T son los vectores ~µα y las ωα2 son los elementos diagonales de la matriz k˜′ = A˜kÃ˜T . La ecuaci´ on (6.47) es la condición de que la matriz A˜ sea ortogonal, o sea que preserve el producto escalar (6.32) en una transformaci´ on de coordenadas generalizadas. Expl´ıcitamente la matriz A˜T es:   −1/2 −1/2 M 2m 1 1+   1 + 2m M      −1/2 −1/2    1   M 2m 2m (6.49) A˜T = √   1+ 1+ 0 −  2m  2m M 2M       −1/2 −1/2   2m M −1 1+ 1+ 2m M

Peque˜ nas oscilaciones de sistemas de varios grados de libertad / 177 y la matriz k˜′ es: 

0

    0 ′ k˜ =     0

0

0



    0    k 2m  1+ m M

k m 0

(6.50)

No es exacto que la coordenada normal correspondiente a ω1 = 0 sea de la forma (6.39). En efecto, para esta frecuencia la ecuaci´ on de movimiento es: θ¨1 = 0

(6.51)

cuya solución es: θ1 = At + B

(6.52)

donde A y B son constantes de integraci´ on, aunque podr´ıa llegarse a (6.52) de (6.39) mediante una expansi´ on en serie de Maclaurin alrededor de ω1 = 0. Las otras dos coordenadas normales son: θα = Cα sen(ωα t + φα ) ; α = 2, 3

(6.53)

donde Cα y φα se determinan de las condiciones iniciales. Las ecuaciones (6.52) y (6.53) nos permiten expresar los desplazamientos generales de las part´ıculas, usando (6.35) y (6.49): 



η2 =

t + φ3 )  1    rAt + B + C2 sen(ω2 t + φ2 ) + C3 sen(ω √ r 3   2m 2m M 1+ 1+ M 2m  

η3 =



η1 =

t + φ3 )  1   rAt + B − 2m C3 sen(ω  √ r 3   M 2m 2m M 1+ 1+ M 2m 

(6.54)

1  t + φ3 )   rAt + B − C2 sen(ω2 t + φ2 ) + C3 sen(ω  √ r 3   2m 2m M 1+ 1+ M 2m

Esto nos dice que el movimiento más general de las part´ıculas consiste en una traslaci´ on uniforme y en una superposición de oscilaciones de frecuencias ω2 y ω3 . La oscilaci´ on de la part´ıcula 2 es de frecuencia ω2 en tanto que las oscilaciones de las

178 / Mec´ anica cl´ asica avanzada part´ıculas 1 y 3 se caracterizan por una diferencia de fase de π en la componente de frecuencia ω2 .2 Las constantes A, B, C2 , C3 , φ2 y φ3 se pueden expresar en términos de los valores en t = 0 de η1 , η2 , η3 , η˙ 1 , η˙ 2 y η˙ 3 a través de las fórmulas: ˙ ~ θ = (AT )−1 ~ η ; θ~ = A˜m~ ˜ η ; ~θ = A˜m ˜ ~η˙

(6.55)

La matriz A˜m ˜ expl´ıcitamente es:  −1/2 −1/2 M m −1/2 M M 1+ m 1+  m 1+  2m 2m 2M   1  m 0 −m A˜m ˜ = √  2m    −1/2 −1/2 −1/2  2m 2m 2m m 1+ −2m 1+ m 1+ M M M ˙ En tanto que θ~ y θ~ en t = 0 son:    B A      ˙   ~  θ~ =   C2 senφ2  θ =  ω2 C2 cos φ2    C3 senφ3 ω3 C3 cos φ3

          

     

(6.56)

(6.57)

Los modos normales de oscilación no son entonces más que casos particulares de la solución general (6.54) en que sólo contribuye una de las componentes normales. As´ı por ejemplo, el “modo 1” se obtiene haciendo C1 = C3 = 0. La transformaci´ on a coordenadas normales puede interpretarse como la correspondencia con un sistema equivalente que consiste en un conjunto de osciladores armónicos lineales no acoplados. La descomposición en modos normales es muy u ´til en otras ramas de la f´ısica como la teor´ıa de campos, la cual tendremos ocasión de estudiar con un campo mecánico unidimensional. Los modos normales para la molécula triat´ omica lineal en oscilaciones longitudinales los podemos representar gráficamente (véase figura 6.2). Generalizaci´ on del formalismo anterior. Si se tiene un conjunto de osciladores acoplados con peque˜ nas oscilaciones, de l grados de libertad oscilatorios, con frecuencias no degeneradas, podemos fácilmente generalizar el anterior formalismo. No es dif´ıcil ver que en general la matriz m ˜ es simétrica, aunque no necesariamente diagonal. k˜ también es simétrica. De esto se deducen importantes propiedades de los vectores propios y frecuencias propias. Las matrices m ˜ y k˜ son de dimensi´ on l × l y los vectores del espacio de configuración son de l componentes. La ecuaci´ on (6.19) puede escribirse en cualquiera de las formas siguientes: ˜ µα = ω 2 ~µα (m ˜ −1 k)~ α

˜ −1/2 )(m ˜ 1/2 µ ~ α ) = ωα2 (m ˜ 1/2 ~µα ) ó (m ˜ 1/2 k˜m

(6.58)

2 El vector η ~ con componentes (6.54) describe el movimiento de un punto del espacio de configuraci´ on. En el plano formado por µ ~2 y ~ µ3 , la proyecci´ on del movimiento da una figura de Lissajous. O sea que la trayectoria de configuraci´ on se obtiene al desplazar dicha proyecci´ on a lo largo de ~ µ1 . Por ejemplo, si m ≪ M , la trayectoria ser´ a una h´ elice el´ıptica alrededor de µ1 .

Peque˜ nas oscilaciones de sistemas de varios grados de libertad / 179 1

2

3

ω1 = 0

x Traslación: η1 = η2 = η3

ω2 =

ω3 =

m

√m ( 1 + M ( k

ns

√k

x Vibración simétrica: η1= –η3 , η2 = 0

2m

x Vibración asimétrica: η1 = η3 , η2 = –2m/M η1

Figura 6.2 Modos normales para la molécula triatómica lineal en oscilaciones longitudinales

Con la primera forma podemos definir el producto escalar en términos del “tensor métrico” de cierto espacio Riemanniano, mij :

~ ~η ) = (ζ,

l X

mij ζi ηj

(6.59)

i,j=1

La ecuaci´ on (6.58) tiene la forma de una ecuaci´ on de valores propios y vectores propios de una matriz simétrica. En efecto, m ˜ −1 k˜ es el producto de matrices simétricas que, seg´ un es f´ acil mostrar, da una matriz simétrica. Entonces se cumplen los siguientes teoremas del algebra lineal: (a) los valores propios, ωα2 , de m ˜ −1 k˜ son reales y (b) los vectores propios, ~ µα , correspondientes a valores propios diferentes son ortogonales y linealmente independientes. La ecuaci´ on correspondiente a la (6.16) representa la expansi´ on de un estado arbitrario de oscilación en un conjunto completo de vectores propios ˜ La prueba de la ortogonalidad de los vectores propios es simple. de la matriz m ˜ −1 k. Escribamos las ecuaciones de valores propios para ωα2 y ωβ2 :

˜ µα = ω 2 ~ (m ˜ −1 k)~ α µα ;

˜ µβ = ω 2 ~µβ (m ˜ −1 k)~ β

(6.60)

Tomemos el producto escalar de la primera por ~µβ y de la segunda por µ ~ α:

˜µα ) = ω 2 (~ (~ µβ , m−1 k~ µα ) α µβ , ~ ˜ µβ , ~ µβ , ~µα ) µα ) = ωβ2 (~ (m−1 k~

(6.61)

180 / Mec´ anica cl´ asica avanzada Como m ˜ −1 k˜ es simétrica, los lados izquierdos en (6.61) son iguales. En efecto: l l X X

˜ µα ) = (~ µβ , m ˜ −1 k~

µβi mij krs µαs (m) ˜ −1 jr

i,j=1 r,s=1 l X

=

µβr krs µαs =

r,s=1

krs µβr µαs

r,s=1

l l X X

˜ µβ , ~ (m ˜ −1 k~ µα ) =

l X

(6.62)

(m) ˜ −1 ir krs µβs mij µαj

i,j=r r,s=1 l X

=

krs µβs µαr =

r,s=1

l X

ksr µβr µαs

r,s=1

Entonces se sigue que: (ωα2 − ωβ2 )(~ µβ , ~µα ) = 0

(6.63)

Si ωα2 6= ωβ2 entonces ~µα y ~µβ son ortogonales. Si α = β, (~µα , ~µα ) tiene alg´ un valor que tomamos igual a 1, entonces, (~ µα , ~ µβ ) = δα,β

α , β = 1, 2, l

(6.64)

Ahora, si definimos con las componentes de las µα una matriz A˜ de dimensi´ on l × l: Aαi = µαi ; α, i = 1, 2, ...l

(6.65)

Entonces la ecuaci´ on (6.64) no es más que la condición de ortogonalidad de A˜ en el espacio riemanniano de configuración: A˜m ˜ A˜T = I˜

(6.66)

La ortogonalidad ordinaria de una matriz es AÃ˜T o A˜−1 = A˜T . La ecuaci´ on de ˜µα = ω 2 m~ valores propios k~ erminos de la matriz diagonal ω ˜ , con α ˜ µα puede escribirse en t´ elementos ωα2 , ωαβ = ωα2 δαβ de la siguiente forma: A˜k˜ = ω ˜ A˜m ˜

(6.67)

˜ (6.67) toma la forma: Si multiplicamos por A˜T y usamos la ortogonalidad de A, A˜kÃ˜T = ω ˜

(6.68)

vemos que la matriz A˜ realiza sobre k˜ una transformaci´ on que la diagonaliza, siendo las frecuencias propias los elementos diagonales. Las expresiones (6.66) y (6.68) nos dicen ˜ m que A˜ diagonaliza simult´ aneamente a m ˜ y a k. ˜ es el tensor métrico en el espacio de configuración. Podemos entonces interpretar a A˜ como la matriz de una transformaci´ on lineal en el espacio de configuración que nos hace pasar de unos ejes oblicuos, ηi , (con m ˜

Peque˜ nas oscilaciones de sistemas de varios grados de libertad / 181 no diagonal; el producto escalar, en particular el lagrangiano, contiene productos cruza˜ dos de las componentes de los vectores) a unos ejes cartesianos ortogonales, θα (m ˜ = I, de ah´ı que el lagrangiano en coordenadas normales tenga términos independientes entre ˜ k˜ se transforma s´ı). Estos nuevos ejes son los ejes principales de k˜ porque mediante A, en ω ˜ que es diagonal. Las coordenadas normales son un sistema de “ejes principales” en el espacio de configuración donde m ˜ y k˜ son ambas diagonales.3 Esto tiene como consecuencia que las ecuaciones de movimiento de las coordenadas normales sean desacopladas: θ¨α +ωα2 θα = 0; α = 1, 2, ...l.

6.2.

Modos normales de oscilaci´ on. Caso degenerado

Las oscilaciones transversales de la molécula del tipo “CO2 ” no se pueden considerar con un modelo de “resortes”, pues con tal modelo estas oscilaciones son intr´ınsecamente no lineales. La demostración de esto se propone como ejercicio. Como el potencial tiene un m´ınimo en la posición de equilibrio aun para desplazamientos transversales, es válida una aproximación por un potencial parabólico, aunque la constante k no será la misma que en las oscilaciones longitudinales. Otro aspecto de las oscilaciones transversales es la degeneraci´ on de los modos normales que a continuación analizamos cualitativamente. Para especificar completamente la molécula, constituida a partir de tres part´ıculas puntuales, se requieren nueve coordenadas. Hay un grado de libertad correspondiente a traslaciones a lo largo de la molécula (el modo ~µ1 analizado anteriormente) y dos grados de libertad traslacionales en direcciones perpendiculares al eje de la molécula. Además, para una posición dada del centro de masa, hay dos rotaciones alrededor de él, pues no tiene sentido una rotación alrededor del eje de la molécula. En total, pues, hay tres grados de libertad traslacionales y dos rotacionales, quedando cuatro grados de libertad vibracionales (dos longitudinales y dos transversales). La simetr´ıa de rotación alrededor de la molécula implica que la constante k es la misma para cualquier desplazamiento transversal y como hay dos modos de oscilación transversales, éstos tendrán la misma frecuencia, es decir, la frecuencia de las oscilaciones transversales es degenerada. Los dos modos los podemos llamar modo “z” y modo “y”, como se representan en la figura 6.3. y

y x z

Modo y

x z

Modo z

Figura 6.3 Modos de oscilación transversales. 3 En

˜ determinan los vectores unitarios de los “ejes principales”, o sea los ~ efecto, las filas de A µα .

182 / Mec´ anica cl´ asica avanzada Un movimiento transversal arbitrario será una combinaci´ on de los modos “y” y “z”. Si las dos oscilaciones est´ an en fase, el movimiento será lineal; si no, el movimiento será el´ıptico. Si la diferencia de fase es de 900 las part´ıculas se moverán en trayectorias circulares, como se ve en la figura 6.4. Al aplicar el formalismo general al problema completo de la molécula del tipo “CO2 ”, se encuentra una ecuaci´ on secular de grado nueve en ω 2 pero a priori esperamos que los cinco grados de libertad no vibracionales den lugar a modos normales con frecuencia ω 2 = 0, que los dos grados de libertad oscilatorios longitudinales tengan dos frecuencias diferentes, y que los dos grados de libertad oscilatorios transversales den lugar a modos normales con frecuencia doble. Es decir, el problema completo tedrá una frecuencia qu´ıntuple nula, dos frecuencias simples y una frecuencia doble; en total cuatro ra´ıces diferentes. y

En fase: oscilaciones lineales

y

En desfase: rotaciones

x z

x z

Figura 6.4 Modos normales de oscilación: dos frecuencias simples y una frecuancia doble.

La mol´ ecula triat´ omica lineal. Oscilaciones longitudinales y transversales. Consideraremos sólo el problema de hallar los modos normales de oscilación, ya que los modos traslacionales y rotacionales permiten un tratamiento trivial. Las coordenadas vibracionales se llaman coordenadas internas. Si imponemos la condición de que el centro de masa esté fijo y no haya rotaciones netas de la molécula, quedarán solamente las coordenadas internas. El c´ alculo lo realizaremos en tres dimensiones. ~ri es el vector de posición de la part´ıcula i = 1, 2, 3 y ~ri0 el de la posición de equilibrio. La separación de la posición de equilibrio es para la part´ıcula i es: d~i = ~ri − ~ri0 ; i = 1, 2, 3

(6.69)

~ 0 = m~r10 + M~r20 + m~r30 ~ = m~r1 + M~r2 + m~r3 = R R 2m + M 2m + M

(6.70)

d~i y ~ri son vectores ordinarios tridimensionales; no son vectores del espacio de configu~ y la consideraremos fija, es decir: raci´ on. La coordenada del centro de masa es R

Se sigue entonces que las componentes de los d~i no son independientes sino que est´ an sometidos a las condiciones: md~1 + M d~2 + md~3 = 0

(6.71)

La condición sobre la no rotación de la molécula alrededor del centro de masa es que el momento angular total sea cero: ~ = m~r1 × ~r˙ 1 + M~r2 × ~r˙ 2 + m~r3 × ~r˙ 3 L ˙ ˙ ˙ = m(~r10 + d~1 ) × d~1 + M (~r20 + d~2 ) × d~2 + m(~r30 + d~3 ) × d~3 = 0

(6.72)

Peque˜ nas oscilaciones de sistemas de varios grados de libertad / 183 Las coordenadas de la posición de equilibrio son, tomando el origen de coordenadas en la posición de la part´ıcula 2: ~r10 = −bî; ~r20 = 0; ~r30 = bî. Por lo tanto la ecuaci´ on (6.72) es: ~ = mbî × (d~˙ 3 − d~˙ 1 ) + m(d~1 × d~˙ 1 + d~3 × d~˙ 3 ) + M d~2 × d~˙ 2 = 0 L

(6.73)

para peque˜ nas oscilaciones se cumple que di ≪ b, lo cual nos permite escribir en vez de (6.73): î × (d~˙ 3 − d~˙ 1 ) = 0

(6.74)

o más expl´ıcitamente: d˙3y = d˙1y ; d˙3z = d˙1z

(6.75)

Integrando (6.75) obtenemos: d3y = d1y + Constante; d3z = d1z + Constante; las constantes deben anularse porque estas ecuaciones se deben cumplir aun en la posición de equilibrio: d3y = d1y ; d3z = d1z

(6.76)

La condición (6.71) vale también para las velocidades, de donde: m m ˙ ˙ ˙ d~2 = − (d~1 + d~3 ) ; d~2 = − (d~1 + d~3 ) M M

(6.77)

En conclusi´ on, existen las siguientes cinco relaciones entre los nueve desplazamientos, lo cual nos deja con 9 − 5 = 4 grados de libertad internos: d1y = d3y ; d2y = −

2m d1y ; M

d2x = −

m (d1x + d3x ) M

d1z = d3z d2z = −

2m d1z M

(6.78)

Existen además cinco relaciones similares a (6.78) para las velocidades de los desplazamientos. Tomaremos como coordenadas generalizadas independientes vibracionales a d1x , d3x , d1y , d1z , y las llamaremos η1 , η2 , η3 y η4 : η1 = d1x , η2 = d3x , η3 = d1y , η4 = d1z

(6.79)

Los otros cinco desplazamientos pueden expresarse en términos de los desplazamientos internos por medio de las relaciones (6.78). El espacio de configuración del sistema completo es 9-dimensional. El subespacio correspondiente a las oscilaciones puras es 4-dimensional. El vector del espacio de configuración que describe los movimientos de la molécula en que el centro de masa permanece fijo y no hay rotación de la misma es ~η . También: η~T = (η1 , η2 , η3 , η4 )

(6.80)

184 / Mec´ anica cl´ asica avanzada Ahora debemos expresar el lagrangiano en funci´ on de ~η y ~η˙ . La energ´ıa cinética es: 2 1 1 ˙2 ˙2 ˙ T = m d~1 + d~3 + M d~2 2 2 (6.81) m2 2 1 ˙2 ˙ ~˙ ˙2 ˙ 2 2 2 ~ ~ ~ ˙ ˙ ˙ d1 + d3 + 2d1 · d3 m d1x + d3x + 2d1y + 2d1z + = 2 2M

Si usamos (6.78) y (6.79) para expresar todos los d~i en funci´ on de los η˙ ν , ν = 1, 2, 3, 4 obtenemos para T (~η˙ ): m2 1 2m m 2 T = m 1+ η˙ 1 + η˙ 22 + m 1 + η˙ 32 + η˙ 42 + η˙ 1 η˙ 2 (6.82) 2 M M M puede escribirse as´ı con notaci´ on matricial: 1 ˙T ˙ η m ~ ˜~ η 2 o usando la notaci´ on de producto escalar: T =

1 ˙ ˙ (~ η , ~η ) 2 donde m ˜ es la matriz simétrica no diagonal siguiente:  m m2 m 1 + 0 0  M M    m m2  0 0 m 1+   M M  m ˜ =  2m  0 0 2m 1 + 0  M     2m 0 0 0 2m 1 + M

(6.83)

(6.84)

T =

                

(6.85)

En el c´ alculo de la energ´ıa potencial vamos a considerar un modelo más realista. Llamaremos k la constante de fuerza para los desplazamientos longitudinales relativos a la part´ıcula 2; k ′ la constante de fuerza para los desplazamientos longitudinales de la part´ıcula 1 relativos a la part´ıcula 3, y a K a la constante de fuerza para los desplazamientos transversales. La constante K no se puede expresar en funci´ on de k y k ′ mediante un modelo de resortes. La energ´ıa potencial de interacci´ on entre las part´ıculas para peque˜ nas oscilaciones es: 1 1 V = k (d1x − d2x )2 + (d3x − d2x )2 + k ′ (d1x − d3x )2 2 2 1 + K (d1y − d2y )2 + (d3y − d2y )2 2 +(d1z − d2z )2 + (d3z − d2z )2

(6.86)

Peque˜ nas oscilaciones de sistemas de varios grados de libertad / 185 Si usamos a (6.78) y (6.79) para expresar todos los d~i en funci´ on de los ην , ν = 1, 2, 3, 4 obtenemos para V (~ η ): 1 2m2 2m ′ V = k 1+ + k (η12 + η22 ) + 2 M2 M i 1h m m 4k 1+ − 2k ′ η1 η2 2 M M " 2 # 2m 1 (η32 + η42 ) + 2K 1 + 2 M +

(6.87)

En notaci´ on matricial V puede escribirse as´ı: V =

1 T˜ η k~η ~ 2

(6.88)

o usando la notaci´ on de producto escalar: V =

1 ˜η) (~ η, m ˜ −1 k~ 2

donde k˜ es la siguiente matriz simétrica no diagonal 4 × 4:  2m 2m2 m m ′ 2k (1+ )−k ′ 0 0  k(1+ M + M 2 )+k M M    m 2m 2m2 m   2k (1+ )−k ′ k(1+ 0 0 + 2 )+k ′  M M M M ˜  k=  2m 2  0 0 2K(1+ ) 0  M    2m 2 0 0 0 2K(1+ ) M El lagrangiano será: L=

1 1 ˙ ˙ ˜η) (~ η , ~η ) − (~ η, m ˜ −1 k~ 2 2

(6.89)



        (6.90)        (6.91)

La ecuaci´ on de movimiento para ~η es: m ˜~ η¨ + k˜~η¨ = 0

(6.92)

Buscamos soluciones propias de la forma: ηα = ~ ~ µα sen(ωα t + φα ); α = 1, 2, 3, 4

(6.93)

Al reemplazar (6.93) en (6.92) obtenemos: ˜ µα = ~0 (mω ˜ α2 − k)~

(6.94)

186 / Mec´ anica cl´ asica avanzada La ecuaci´ on (6.94) admite soluciones no triviales para los ~µα sólo si las ωα son tales que satisfacen la ecuaci´ on secular: ˜ = 0; det(mω ˜ α2 − k)

α = 1, 2, 3, 4

(6.95)

Si usamos la siguiente notaci´ on (Classical mechanics, Corben-Stehle, cap´ıtulo 8): 2 2m m α = 2K 1 + ; α′ = 2m 1 + M M (6.96) m m2 2m β′ = + 2 2; β= M M M Podemos escribir: mω ˜ 2 − k˜ =

         

m(1+β ′ )ω 2 −k(1+β)−k ′ ′

2

mβ ω −kβ +k

′

mβ ′ ω 2 −kβ +k ′ ′

2

m(1 +β )ω −k(1+β)−k

′

0

0

0

0

0

0

α′ ω 2 − α

0

0

0

0

α′ ω 2 −α

˜: Usando la regla para el c´ alculo del determinante de una matriz M ˜ = detM

n X

         

Mij Cij

(6.97)

(6.98)

i=1

donde Cij es el determinante de la matriz de los cofactores del elemento Mij : Cij = (−1)i+j Dij

(6.99)

donde Dij es el determinante menor complementario del elemento, entonces la ecuaci´ on secular es: n 2 o 2 m(1 + β ′ )ω 2 − k(1 + β) − k ′ − mβ ′ ω 2 − kβ + k ′ (α′ ω 2 − α)2 = 0

(6.100)

Entonces el determinante consta de tres factores, dos de ellos lineales en ω 2 y uno cuadrático en ω 2 . Hay dos ra´ıces dobles que son: α 2m K ω32 = ω42 = ′ = 1+ (6.101) α m M Las otras dos ra´ıces son: ω12 =

k + 2k ′ k ; ω22 = m m

2m 1+ M

(6.102)

Peque˜ nas oscilaciones de sistemas de varios grados de libertad / 187 ω1 y ω2 coinciden con las halladas cuando consideramos las oscilaciones longitudinales por separado, cuando k ′ = 0. La ecuaci´ on de valores propios (6.94) es de la forma:      0 Aα Bα 0 0 µα1               Bα Aα 0  0     µα2   0  =    (6.103)       0   µα3   0  0 C 0 α           0 µα4 0 0 0 Cα Los valores de las Aα , Bα y Cα son: 2m ′ m m A1 = 1+ k −k ; A2 = − k ′ − k M M M A3 =

m 2m 2m 2m2 K 1+ 1+ −k 1+ − k′ + M M M M2

C1 =

2m 2m ′ k + 2k − K 1 + 2 1+ M M

C2 =

2 2m 2 1+ (k − K) ; C3 = 0 M

B1 =

m m 2m ′ k −k ; B2 = −k ′ − k 1+ M M M

B3 =

K

m M

(6.104)

2m m m 1+ − 2k 1+ + k′ M M M

La ecuaci´ on (6.103) da lugar a los cuatro siguientes sistemas de ecuaciones algebraicas: Aα µα1 + Bα µα2 = 0 ; Bα µα1 + Aα µα2 = 0 (6.105) Cα µα3 = 0 ; Cα µα4 = 0 ; α = 1, 2, 3, 4 Las primeras ecuaciones (6.105), dado que Aα y Bα no son cero, son: Aα µα2 µα1 =− =− ⇒ µα1 = ±µα2 Bα µα1 µα2

(6.106)

Como se cumple que: A1 = B1 ; A2 = −B2 y A3 6= ±B3

(6.107)

Entonces µα2 y µα1 deben necesariamente tener las relaciones: µ11 = −µ12 ; µ21 = µ22 ; µ31 = µ41 = µ32 = µ42 = 0

(6.108)

188 / Mec´ anica cl´ asica avanzada Como C1 y C2 no son cero, en tanto que C3 es cero, se cumple: µ13 = µ23 = µ14 = µ24 = 0 (6.109) µ33 , µ43 , µ34 , µ44 : Arbitrarias Tenemos en este problema seis cantidades indeterminadas. O sea que aqu´ı no hay simplemente una indeterminación por un factor arbitrario en los vectores ~µ3 y ~µ4 . Los vectores propios para este problema son de la forma siguiente:     1 1  1   −1     µ1 = µ11  ~  0  ; ~µ2 = µ21  0  0 0 

  µ3 = µ33  ~ 





0 0 1 µ34 µ33

    ~ 4 = µ43  ; µ  

0 0 1 µ44 µ43



(6.110)

   

Como en las ecuaciones (6.30), µ11 , µ21 , µ33 y µ43 pueden definirse por la condición de normalizaci´ on, sin embargo µ43 y µ44 quedan a´ un indeterminadas. Hay un n´ umero infinito de vectores propios normalizados correspondientes a la frecuencia propia degenerada ω3 = ω4 . La condición de normalizaci´ on es: ~ Tα m~ µ ˜ µα = 1 ; α = 1, 2, 3, 4

(6.111)

donde m ˜ es la matriz (6.85). Esto nos conduce a los siguientes valores para µ11 , µ21 , µ33 y µ43 : 1 ; µ11 = √ 2m

µα3

v u =u u t

1 2m 2m 1 + M

µ21 = s 1

− µ2α4 ; 2m 2m 1 + M

(6.112)

α = 3, 4

Debido a que µ34 y µ44 son arbitrarios, µ ~ 3 y ~µ4 son linealmente independientes. ~3 y µ µ ~ 4 generan entonces un espacio de dimensi´ on dos, siendo cualquier vector de este espacio un vector propio correspondiente al valor propio ω3 = ω4 . Podemos decir que a la frecuencia propia doblemente degenerada, ω3 = ω4 , le corresponde un conjunto infinito de vectores propios normalizados en un espacio bidimensional. Cualquier par de vectores linealmente independientes genera el espacio; por esto podemos sin perder generalidad escoger los vectores ~ µ3 y ~µ4 de modo que sean ortogonales entre s´ı, bajo el producto escalar (6.59): µ33 µ43 + µ34 µ44 = 0

(6.113)

Peque˜ nas oscilaciones de sistemas de varios grados de libertad / 189 Como definimos a µ33 y µ43 positivos en (6.113), entonces µ34 y µ44 deben tener signos opuestos; (6.112) y (6.113) conducen a: µ234 + µ244 =

1 2m 2m 1 + M

(6.114)

Todav´ıa los vectores no est´ an bien definidos pues a´ un hay infinitos pares de vectores ortonormales en el mencionado espacio bidimensional. ~µT3 y ~µT4 pueden escribirse en la forma: µ ~ T3

=

µ ~ T4

=

r

1

(0, 0, cos δ, senδ) 2m 2m(1 + ) M 1 r (0, 0, senδ, − cos δ) 2m 2m(1 + ) M

(6.115)

donde δ est´ a comprendido entre 0 y π/2 de acuerdo con la elección del signo de µ33 y µ43 . Los vectores ~ µ3 y µ ~ 4 generan todas las posibles oscilaciones transversales con la frecuencia degenerada ω3 = ω4 . Los modos normales de oscilación transversales son: η~3T = µ ~ T3 sen(ω3 t + φ3 ) → (0, 0, d1y , d1z )

(6.116)

η~4T = η~4T sen(ω3 t + φ4 ) Vemos que δ es esencialmente el ángulo de los vectores de desplazamientos en el plano y − z donde las oscilaciones normales tienen diferencia de fase arbitraria. z

d1 (Modo µ3) δ y

δ d1 (Modo µ4)

Figura 6.5 Modos de oscilación transversales en el espacio de configuraci´ on

190 / Mec´ anica cl´ asica avanzada Podemos tomar δ = 0, con lo cual ~µ3 corresponde a las oscilaciones en “y” y ~µ4 a las oscilaciones en “z”. Una oscilación transversal general será de la forma: ~η = C3 ~ η3 + C4 ~η4

(6.117)

Sin perder generalidad η~T puede escribirse en la forma: ~η T = C [0, 0, senγ sen(ω3 t + φ3 ), cos γ sen(ω3 t + φ4 )]

(6.118)

φ3 y φ4 son arbitrarias. Si tomamos φ3 = φ4 obtenemos oscilaciones longitudinales en una direcci´ on que hace un ángulo γ con el eje z. Si tomamos φ3 = 0 y φ4 = π/2, el movimiento será una circunferencia y en general será una elipse, donde γ será la direcci´ on del eje mayor de la elipse. Recordando las fórmulas (6.78), d2y = −

2m 2m d1y ; d2z = − d1z M M

(6.119)

d3y = d1y ; d3z = d1z Vemos que el desplazamiento del átomo central es siempre contrario al de los laterales. En general, el átomo central gira en sentido contrario a los laterales, en una trayectoria el´ıptica, con una amplitud tal que el momento angular es cero. El movimiento transversal general es pues una rotación de cada átomo. Véase figuras 6.3 y 6.4. Si quisiéramos describir las nueve coordenadas del sistema, deber´ıamos usar vectores 9dimensionales y matrices 9 × 9. As´ı por ejemplo, en vez de ~µ3 y µ ~ 4 tendr´ıamos, usando las f´ ormulas (6.78): ~eT3 =

~eT4

=

2m 1 (0, 1, 0; 0, − M , 0; 0, 1, 0) 2m 2m 1 + M

s

1

2m s (0, 0, 1; 0, 0, − M ; 0, 0, 1) 2m 2m 1 + M

(6.120)

En el tratamiento completo aparecer´ an además los cinco vectores propios de frecuencia cero correspondientes a las tres traslaciones y las dos rotaciones. La degeneración puede ser removida por ejemplo introduciendo alg´ un efecto que rompe la simetr´ıa de rotación de la interacci´ on alrededor del eje de la molécula (de la cual se derivó que K no depende de la direcci´ on del desplazamiento). Si existiera alg´ un efecto direccional (como una interacci´ on entre espines), ya no habr´ıa la simetr´ıa rotacional en la interacci´ on y desaparecer´ıa la degeneración. Este tema es susceptible de un estudio más completo usando la teor´ıa de grupos de simetr´ıas. Los vectores propios constituyen representaciones del grupo de simetr´ıas. El subespacio generado por ~µ3 y µ ~ 4 es una representación irreductible bidimensional del grupo de simetr´ıas (rotaciones alrededor del eje de la molécula). En otros sistemas de osciladores acoplados las ligaduras pueden dar lugar a cambio de frecuencia y a supresi´ on

Peque˜ nas oscilaciones de sistemas de varios grados de libertad / 191 de la degeneraci´ on. Tratamiento usando el m´ etodo de diagonalizaci´ on. Buscaremos una matriz ˜ de acuerdo con las fórmulas (6.66) y (6.68). que diagonalice simult´ aneamente a m ˜ y a k, Tanto m ˜ como k˜ son diagonales en bloques de matrices 2 × 2; es razonable suponer que ˜ A sea de la misma forma:   D E 0 0      F G 0 0     A˜ =  (6.121)    0 0 H K      0 0 L J ˜ Se requiere Llamaremos A, B y C a los elementos de la matriz m ˜ o de la matriz k. entonces que mediante el siguiente producto se obtenga una matriz diagonal, con unos en la diagonal si A, B y C son los elementos de m, ˜ y con las ω 2 si son los elementos de ˜ k:     D F 0 0 A B 0 0 D E 0 0          F G 0 0  B A 0 0  E G 0 0               0 0 H K  0 0 C 0  0 0 H L          0 0 K J 0 0 0 C 0 0 L J (6.122)   d e 0 0      f g 0 0     =    0 0 h l      0 0 k j

donde hemos llamado las variables d = A(E 2 +D2 )+2BDE, e = A(AD+EG)+B(DG+ EF ), f = A(F D + EG) + B(EF + GD), g = A(F 2 + G2 ) + 2BF G, h = C(H 2 + K 2 ), l = C(HL + JK), k = C(HL + JK) y j = C(J 2 + L2 ). Asumimos que los elementos de A˜ no dependen de las constantes k, k ′ y K entonces, como los elementos de la matriz k˜ son combinaciones de las constantes, A˜kÃ˜T será diagonal sólo si: DF + EG = 0 ; DG + EF = 0 ; HL + JK = 0

(6.123)

Esto implica las relaciones siguientes entre los elementos de A: G = F , D = −E

o

G = −F , D = E

(6.124)

192 / Mec´ anica cl´ asica avanzada ˜ Por Cuando A, B y C son los elementos de m, ˜ entonces (6.122) debe ser igual a I. tanto se cumple, usando las relaciones de la izquierda en (6.124), que: 2D2 A − 2BD2 = 1 ; 2F 2 A + 2F 2 B = 1

(6.125)

C(H 2 + K 2 ) = C(J 2 + L2 ) = 1 Recordando la expresión para A y B en m, ˜ ecuaci´ on (6.85), obtenemos para D y F: D=√

1 1 = −E ; F = s =G 2m 2m 2m 1 + M

(6.126)

En (6.126) por convención tomamos las ra´ıces cuadradas positivas. Por otra parte, para H, K, L, J, obtenemos las relaciones: K = L , H = −J o K = −L , H = J

(6.127)

Como hay sólo tres ecuaciones para determinar las cuatro inc´ ognitas H, K, J, L, podemos asignar el valor a una de ellas arbitrariamente. Sea que: cos δ π ; ≤δ≤ 2 2m 2m 1 + M

H=s

(6.128)

Con ello obtenemos las siguientes expresiones para J, K, L: sen δ =L 2m 2m 1 + M

J = −H ; K = s

Entonces la matriz A˜ tiene la siguente expresión expl´ıcita:  r r 2m 2m 1+ 0 0  1+ M M     1 1 1 0 0  A˜ = r 2m   ) 2m(1 + 0 0 cos δ senδ M   0 0 senδ cosδ

(6.129)

           

(6.130)

Vemos que las filas de A˜ coinciden con los vectores propios ~µα hallados anteriormente. Cuando tomamos como A, B y C los elementos de k˜ de la ecuaci´ on (6.96), encontramos: A(E 2 + D) + 2BDE = ω12 ; A(F 2 + G2 ) + 2BF G = ω22 (6.131) C(H 2 + K 2 ) = C(J 2 + L2 ) = ω32

Peque˜ nas oscilaciones de sistemas de varios grados de libertad / 193 donde ω12 , ω22 y ω32 est´ an dados en las ecuaciones (6.101) y (6.102). En este problema el procedimiento de diagonalización se simplificó debido a la forma de m ˜ y k˜ que nos ˜ permiti´ o partir de la forma (6.121) para la matriz A. Para sistemas más complicados no es ˜ A pesar de esto, muchas veces la ecuaci´ tan simple la elección de la forma de A. on secular resulta mucho más complicada, por requerir primero la evaluación de un determinante y luego el c´ alculo de las ra´ıces de una ecuaci´ on algebraica de grado l. En estos casos, donde l es grande y m ˜ y k˜ complicadas, es más conveniente el método de la diagonalización, que se realiza usualmente en forma numérica, por ejemplo mediante el método numérico de diagonalización de Jacobi. Ejemplo 6.2.1 Una part´ıcula se mueve en presencia de un potencial central de la forma: V (r) = −

A

(6.132)

rn−1

suponiendo que la ´ orbita es circular, hallar los valores de n para los cuales hay peque˜ nas oscilaciones estables. Este es un ejemplo de peque˜ nas oscilaciones alrededor de un movimiento estable. Se entiende por estabilidad el hecho de tender al estado de equilibrio al ser sometido el sistema a una distorsi´ on. En fuerzas centrales la órbita es plana, con lo cual podemos describir la part´ıcula con las coordenadas polares r, θ. El lagrangiano es: L=

1 ˙ + A m(r˙ 2 + r2 θ) 2 rn−1

(6.133)

Las ecuaciones de movimiento de Lagrange son: m¨ r − mrθ˙2 + (n − 1)Ar−n =

0

mr2 θ¨ + 2mrr˙ θ˙ =

0

(6.134)

El movimiento de “equilibrio” es circular uniforme, o sea que son constantes: r = r0

y

θ˙ = ω0

(6.135)

Si se hacen peque˜ nas alteraciones a este movimiento estable, ρ al radio y φ˙ a la velocidad angular, habr´ a oscilaciones si el movimiento es estable, r = r0 + ρ

y

θ˙ = ω0 + φ˙

(6.136)

En el movimiento de equilibrio se cumple que: mr0 ω02 = (n − 1)Ar0−n

(6.137)

˙ Entonces las ecuaciones de movimiento para los peque˜ nos desplazamientos ρ y φ, al primer orden en los mismos, son: m¨ ρ − mω02 ρ − 2mr0 ω0 φ˙ − n(n − 1)Ar0−n−1 ρ = 0 mr02 φ¨ + 2mr0 ω0 ρ˙ = 0

(6.138)

194 / Mec´ anica cl´ asica avanzada ˙ Buscamos ahora los “modos normales estas son ecuaciones lineales acopladas para ρ y φ. ˙ de oscilaci´ on” de ρ y φ: ρ = ρ0 sen(ωt + α) ;

φ˙ = φ˙ 0 sen(ωt + α)

(6.139)

donde ω es la frecuencia propia del modo normal (esperamos que haya dos frecuencias), y α la fase, como en la ecuaci´ on (6.93). ρ0 y φ˙ 0 son las componentes de los vectores propios ~ µ, que satisfacen las ecuaciones algebraicas:   −m(ω 2 + ω02 ) − n(n − 1)Ar0−n−1 −2mω0 ωr0   2mω0 ωr0 mr02 ω     ρ0 0 =  × (6.140) ˙ 0 φ0 El sistema (6.140) tiene soluciones no triviales sólo si:

mωr02 [−m(ω 2 + ω02 ) − n(n − 1)Ar0−n−1 + 4mω02 ω] = 0

(6.141)

Las ra´ıces de (6.141) son: ω2 = 0

y

ω 2 = (3 − n)ω02

(6.142)

La segunda ra´ız si n < 3 conduce a una ω real, y si n > 3 es imaginaria. Si n=3 el movimiento es degenerado con dos ra´ıces ω = 0. El movimiento será, pues, estable solamente si n < 3. Para una órbita de Kepler, por ejemplo n = 2. Entonces: ω02 = ω 2

(6.143)

ω0 es la frecuencia de rotación de la part´ıcula. ω es la frecuencia de las oscilaciones en el radio de la ´ orbita y en la velocidad angular que coinciden con ω0 . Para un potencial central armónico, V = Ar2 , n = −1, entonces: ω = 2ω0

(6.144)

La frecuencia ω 2 = 0 corresponde a un desplazamiento de una órbita circular a otra, o sea, a otro movimiento estable; no hay oscilaciones sino simplemente un cambio constante en el radio de la órbita y en la velocidad angular. Hay una forma simple de calcular directamente la frecuencia de las peque˜ nas oscilaciones. La part´ıcula se mueve radialmente dentro un “pozo” que consta del potencial centr´ıfugo y el potencial externo: Vef (r) = −

A rn−1

1 A l2 + mr2 θ˙2 = − n−1 + 2 r 2mr2

(6.145)

En el movimiento estable el potencial tiene un m´ınimo. Para peque˜ nos desplazamientos del movimiento estable, el “pozo” de potencial puede aproximarse a un pozo

Peque˜ nas oscilaciones de sistemas de varios grados de libertad / 195 par´ abolico. El problema consiste en determinar para qué valores de n es posible la formaci´ on del potencial par´ abolico. Vef (r) puede expandirse alrededor de r0 para peque˜ nos desplazamientos: dVef (r) 1 d2 Vef (r) Vef (r) ≈ Vef (r0 ) + ρ2 = ρ + dr r=r0 2 dr2 r=r0 (6.146) 1 2 Vef (r0 ) + kρ 2 donde el término lineal en ρ se anula en el equilibrio y k es la “constante de resorte”: d2 Vef (r) (6.147) k= dr2 r=r0 La frecuencia de las peque˜ nas oscilaciones en r será: 1 d2 Vef (r) ω2 = m dr2 r=r0

(6.148)

Efectuando las operaciones indicadas en (6.148), usando la relación (6.137) que se cumple en la posición de equilibrio, y notando que la magnitud del momento angular es l = mω0 r02 , llegamos finalmente al resultado ω 2 = (3 − n)ω02 , que nos da directamente la frecuencia de las peque˜ nas oscilaciones alrededor de la órbita circular estable.

6.3.

Un campo mec´ anico unidimensional: la cuerda uniforme

Primero estudiaremos el sistema de n part´ıculas de masa m unidas entre s´ı por cuerdas el´ asticas sin masa. La cuerda uniforme se obtendr´ a del problema anterior como un caso l´ımite en que las masas se distribuyen uniformemente formando un continuo. La cuerda estirada sin masa con un conjunto discreto de masas. Sea una cuerda de longitud L a la cual se adhieren n masas iguales equidistantemente. La cuerda est´ a estirada y fija en sus extremos. Estudiaremos las oscilaciones transversales. La longitud de cada segmento de cuerda en la posición de equilibrio es d = xi − xi−1 ; i = 1, 2, ...n + 1. Entonces L = (n + 1)d. Para los desplazamientos longitudinales, la energ´ıa potencial resulta de la elasticidad de la cuerda k. Para los desplazamientos transversales, la contribución de la elasticidad de la cuerda es de cuarto orden en la elongaci´ on, la demostración se propone como un ejercicio; as´ı que la contribución cuadrática viene directamente de la tensi´ on de la cuerda τ . La tensi´ on es independiente de los desplazamientos transversales si estos son infinitesimales. El trabajo realizado para estirar un segmento es igual a la tensi´ on (constante) por la elongaci´ on. De modo que la energ´ıa potencial del segmento i cuando la part´ıcula i − 1 se desplaza transversalmente ηi−1 , y la part´ıcula i en ηi , es: i hp d2 + (ηi − ηi−1 )2 − d (6.149) Vi = τ


η1

η2

x1 x0 = 0

x2

ηi – 1 xi – 1

ηi xi

ηi + 1 xi + 1

ηi + 1 xi + 2

d

ηn – 1 xn – 1

ηn xn

x xn – 1 = L

Figura 6.6 Cuerda estirada sin masa con un conjunto discreto de masas

de modo que para peque˜ nos desplazamientos la energ´ıa potencial total es: V =

n+1 1τ X (ηi − ηi−1 )2 2d

(6.150)

i=1

El espacio de configuración es n-dimensional y las matrices m ˜ y k˜ son de dimensi´ on n × n. En notaci´ on matricial: 1 V = ~η T k~η (6.151) 2 donde ~ η T = (η1 , η2 , ...ηn ) y la matriz k˜ es:   2 −1 0 0 ··· 0 0      −1 2 −1 0 · · · 0 0         0 −1 2 −1 · · · 0 0        τ  0 −1 2 · · · 0 0  (6.152) k˜ =  0   d    .. ..  .. .. .. .. ..  . .  . . . . .         0 0 0 0 · · · 2 −1     0 0 0 0 · · · −1 2 La energ´ıa potencial es: T T = ~η˙ m ˜ ~η˙

(6.153)

donde la matriz m ˜ es un m´ ultiplo de la matriz unidad: m ˜ = mI˜

(6.154)

La ecuaci´ on de valores propios es: ˜ µα = ~0; α = 1, 2, ...n (−ωα2 m ˜ + k)~

(6.155)

Peque˜ nas oscilaciones de sistemas de varios grados de libertad / 197 Expl´ıcitamente las ecuaciones de valores propios son: τ τ τ − µαi−1 + 2 − mωα2 µαi − µαi+1 = 0; i = 1, 2, ...n d d d

(6.156)

En (6.156) se debe cumplir µα0 = µα n+1 = 0. La matriz n × n en (6.155) es: 

         τ  2 ˜ −mω ˜ α+k =  d         

λ

−1

0

0

···

−1

λ

−1

0

···

0

−1

λ

0

0

−1

λ

···

.. .

.. .

.. .

.. .

.. .

0

0

0

0

···

0

0

0

0

···

−1 · · ·

donde λ depende de ωα : λ = 2 − mωα2

0

0



  0     0 0     0 0  ˜τ =D  d  .. ..  . .     λ −1    −1 λ 0

d τ

(6.157)

(6.158)

˜ que es un polinomio de grado n Llamemos Dn al determinante de la matriz D, en λ. Haciendo tomar a n los valores 1, 2, 3, ..., obtenemos la siguiente secuencia de polinomios: D1 =

λ

D2 =

λ2 − 1

D3 =

λ3 − 2λ = λD2 − D1

D4 =

λ4 − 3λ2 + 1 = λD3 − D2

D5 =

λ5 − 4λ3 + 3λ = λD4 − D3

D6 = .. .

λ6 − 5λ4 + 6λ2 − 1 = λD5 − D4 .. .

(6.159)

Notamos la siguiente relaci´ on de recurrencia entre los polinomios: Dk = λDk−1 − Dk−2 ;

k = 1, 2, ...n

(6.160)

198 / Mec´ anica cl´ asica avanzada Los coeficientes de las potencias de λ pueden escribirse en términos de los n´ umeros combinatorios. As´ı por ejemplo: 9 8 7 D9 = λ9 − λ7 + λ5 9 7 5 − D10 =

−

6 3

10 10

7 4

λ3 + 10

λ

4

−

λ +

5 1 9 8 6 2

λ 8

λ +

2

λ −

8 6 5 0

(6.161) 6

λ

De (6.161) se puede obtener fácilmente una generalizaci´ on. Las fórmulas resultantes se demuestran f´ acilmente por el método matemático de inducción,   n n/2 +k X   2 k+1 2k Dn =  (−1) λ si n es par  k=0 2k (6.162)   n + 1 (n−1)/2 +k X   2 k 2k+1 Dn = si n es impar   (−1) λ k=0

2k + 1

Es conveniente el siguiente cambio de variable: λ = 2 cos β

(6.163)

En términos de β obtenemos la secuencia siguiente de los Dk : D1 =

2 cos β

D2 =

2 cos 2β + 1

D3 =

2(cos 3β + cos β)

D4 =

2(cos 4β + cos 2β) + 1

D5 =

2(cos β + cos 3β + cos 5β)

D6 =

2(cos 6β + cos 4β + cos 2β) + 1

(6.164)

Se pasa de (6.159) a (6.164) usando identidades trigonométricas (f´ ormulas 5.53 a 5.67 del manual de f´ ormulas matemáticas de Spiegel). La generalizaci´ on de (6.164) es

Peque˜ nas oscilaciones de sistemas de varios grados de libertad / 199 simple; el resultado es: Dn =

2

n/2 X

cos 2kβ + 1 ;

si n es par

k=1

(6.165)

(n−1)/2

Dn =

2

X

cos(2k + 1)β ;

si n es impar

k=0

Las f´ ormulas (6.165) se pueden simplificar usando cos 2kβ =

(ei2β )k + (e−i2β )k 2

(6.166)

y similarmente para (2n + 1)β. Notamos luego que se obtienen series geométricas de potencias. La expresión para la suma cerrada de una serie geométrica es conocida. En este caso la raz´ on de la serie es e±2β : 1 + ei2β + (ei2β )2 + ...(ei2β )r =

1 − (ei2β )r+1 1 − ei2β

(6.167)

que vale si ei2β 6= 1. As´ı, si n es par: Dn = 2Re

1 − (ei2β )(n/2+1) −1 1 − ei2β

(6.168)

El resto es un c´ alculo trigonométrico. Para n impar el procedimiento es similar. El resultado final es que, para todo n: Dn =

sen(n + 1)β ; senβ

n par o impar

(6.169)

Se sigue entonces que la ecuaci´ on secular correspondiente a (6.156) es: sen(n + 1)βα = 0; α = 1, 2, ...n

(6.170)

Esta ecuaci´ on tiene n ra´ıces, (n + 1)βα = απ, o sea: βα = α

π ; α = 1, 2, ...n n+1

(6.171)

Entonces los λ serán, usando (6.163): λα = 2 cos

απ ; α = 1, 2, ...n n+1

(6.172)

Recordando la relaci´ on entre las λα y las ωα , ecuaci´ on (6.158), obtenemos para las frecuencias propias: r απ τ ωα = 2 sen ; α = 1, 2, ...n (6.173) md 2(n + 1)

200 / Mec´ anica cl´ asica avanzada Para hallar los  λα −1  −1 λα   0 −1   0 0   .. ..  . .   0 0 0 0

vectores propios, reemplazamos a (6.157) en (6.155):     0 0 ··· 0 0 µα1 0  µα2   0  −1 0 · · · 0 0          λα −1 · · · 0 0    µα3   0      −1 λα · · · 0 0   =    ..  .. .. .. ..   .. ..     .  . . . . .  .      0 0 · · · λα −1 µαn−1   0  0 0 · · · −1 λα µαn 0

(6.174)

La ecuaci´ on (6.174) representa el siguiente sistema de ecuaciones lineales: µα2 µα3 µα4 µα5

= = = = .. .

µαk =

λα µα1 (λ2α − 1)µα1 (λ3α − 2λα )µα1 (λ4α − 3λ2α + 1)µα1 (6.175) Dk−1 (λα )µα1

.. .

senkβα µα1 = senβα

α, k = 1, 2, ...n La u ´ltima l´ınea de (6.175) también puede obtenerse comparando a (6.160) con la relaci´ on de recurrencia para los µαk , (6.156): µα,k+1 = λα µα,k − µα,k−1 ; α, k = 1, 2, ...n

(6.176)

Entonces los vectores propios son: ~ Tα = µ

µα1 (senβα , sen2βα , ...sennβα ); α = 1, 2, ...n senβα

(6.177)

µα1 es una constante que se determina por normalizaci´ on: (~ µα , ~ µα ) = m~µTα · ~µα = m

n µ2α1 X sen2 kβα = 1 sen2 βα

(6.178)

k=1

La sumatoria en (6.178) se puede tratar como una serie geométrica: n X

n

sen2 kβα =

1X (1 − cos 2kβα ) 2 k=0

k=1

n

=

n + 1 1 X i2βα k ) − Re (e 2 2 k=1

=

n + 1 sen(n + 1) βα cos 2nβα − 2 2senβα

(6.179)

Peque˜ nas oscilaciones de sistemas de varios grados de libertad / 201 como, seg´ un (6.170), sen(n + 1)βα = 0, se sigue que: µ2α1 =

2 sen2 βα (n + 1)m

(6.180)

llamando M a la masa total, M = nm, (6.180) y (6.175) nos dan: r 2 αk π µαk = sen = µkα ; α, k = 1, 2, ...n M +m n+1

(6.181)

Como debe ser, las ~ µα son ortogonales pues todas las frecuencias propias ωα son no degeneradas: n

(~ µα , ~ µα ) = m~µα · µ ~β =

2 X senkβα senkββ = δαβ n+1

(6.182)

k=1

Las coordenadas normales para este problema son: r τ απ θα = Cα sen 2 sen t + φα ; α = 1, 2, ...n md 2(n + 1) ˜ on p La matriz A que realiza la transformaci´ 2/(M + m) sen[αβπ/(n + 1)]:  2π π  sen n + 1 sen n + 1    4π  sen 2π sen r  n+1 n+1  2  A˜ =  M +m  .. ..  . .     nπ 2nπ sen sen n+1 n+1

(6.183)

de ~η a ~θ, η~ = A˜θ~ es simétrica, Aαβ =  nπ n+1    2nπ   · · · sen  n+1     .. ..  . .    2 n π  · · · sen n+1 · · · sen

(6.184)

Una oscilaci´ on arbitraria del sistema est´ a descrita por una superposición de las oscilaciones propias: r τ αiπ απ ηi (t) = Cα sen sen 2t sen + φα n+1 md 2(n + 1) α=1 n X

(6.185)

En los modos normales de oscilación todas las part´ıculas est´ an sobre una curva sinusoidal cuya longitud de onda depende del orden del modo, o sea de la frecuencia ωα . Es una solución del tipo “onda estacionaria”, determinada por las condiciones de frontera µα0 = µαn+1 . Corben y Stehle obtienen a partir de esta solución la solución para una onda viajera, imponiendo las condiciones de frontera periódicas, µα0 = µαn y µα1 = µαn+1 .

202 / Mec´ anica cl´ asica avanzada La cuerda uniforme. Lagrange demostr´ o que mediante un procedimiento de paso al l´ımite las oscilaciones de la cuerda uniforme pueden obtenerse a partir de las de la cuerda cargada. La densidad lineal de masa ρ es: M nm n m ρ= = = (6.186) L L n+1 d en (6.173) puede obtenerse en el l´ımite en que n → ∞, m → 0, d → 0 manteniendo m/d constante: m (6.187) l´ım ρ = n→∞ d Entonces el l´ımite de ωα cuando n → ∞ es: r απ τ (n + 1)n sen ωα = 2 ρ L2 2(n + 1) (6.188) r r 2 τ απ π τ → =α ; α = 1, 2, ...∞ L ρ 2 L ρ p Esto expresa la Ley de Mersenne. ω1 = (π/L) τ /ρ es la frecuencia del tono fundamental de una cuerda y ωα es el armónico de orden α. Cuando n → ∞, el n´ umero de modos normales de oscilación es infinito aunque es contable. En cambio el ´ındice que numera las part´ıculas se convierte en una variable continua: x → kd ;

k = 0, 1, 2, ...∞ ;

d→0

(6.189)

x es una variable que define la posición de la part´ıcula k. Entonces la fórmula (6.181) se convierte en: r πx 2 µα,k → µα (x) = ; α = 1, 2, ...∞ (6.190) sen α M L Una oscilaci´ on general de la cuerda estar´ a dada por: r ∞ X απx απ τ η(x, t) = Cα sen (6.191) sen t + φα L L ρ α=1

donde Cα y φα es un conjunto contable infinito de constantes arbitrarias. A˜ ya no será una matriz, pues si bien las filas siguen siendo contables, las columnas forman un continuo. Las f´ ormulas de transformaci´ on entre las coordenadas ~η y las coordenadas ~θ son: ∞ X η(x, t) = µα (x)θα (t) (6.192) α=1

En vez de la matriz m ˜ con elementos mij = mδij debemos tener una funci´ on delta de Dirac, de modo que A˜m ˜ A˜T = I˜ se convierte en: Z L Z L Z L ρ dx dy µα (x)δ(x − y)µβ (y) = ρµα (x)µβ (x)dx = 0

0

0

2 L

Z

o

L

βπx απx sen = δαβ dx sen L L

(6.193)

Peque˜ nas oscilaciones de sistemas de varios grados de libertad / 203 ˜ debemos tener: En vez de los elementos de m ˜ y k, m(x, x′ ) = k(x, x′ ) = =

ρδ(x − x′ ) τ [2δ(x − x′ ) − δ(x − x′ − d) − δ(x − x′ + d)] d2 d2 −τ 2 δ(x − x′ ) dx

(6.194)

A˜kÃ˜T = ω ˜ se convierte en: Z L Z L τ dx dx′ µα (x) 2δ(x − x′ ) − δ(x − x′ + d)− 2 d 0 0 δ(x − x′ − d) µβ (x) τ = 2 d

(

τ d2

(

=

2 τ = ρ d2

1 2 δαβ − ρ

Z

)

L

µα (x) [µβ (x − d) + µβ (x + d)] dx

0

2 2 δαβ − ρ M

Z

0

L

sen

(6.195)

)

βπx βπd απx 2sen cos dx L L L

4τ πβd βπd δαβ = 2 sen2 1 − cos δαβ L ρd 2L

Entonces, los elementos diagonales de A˜kÃ˜T son, tomando d → 0: ωβ2 = β 2

π2 τ L2 ρ

(6.196)

como debe ser. En vez de las ecuaciones algebraicas (6.156) tendremos ahora una ecuación diferencial. En efecto, (6.156) se convierte en: τ τ 2τ − µα (x − d) + − ρdωα2 µα (x) − µα (x + d) = 0 (6.197) d d d Podemos escribir a (6.197) en la forma: τ τ [µα (x) − µα (x − d)] − [µα (x + d) − µα (x)] = ρdωα2 µα (x) d d

(6.198)

En el l´ımite cuando d → 0, en el lado izquierdo obtenemos: −τ [µ′α (x) − µ′α (x + d)] = ρ dωα2 µα (x)

(6.199)

Tomando una vez más el l´ımite cuando d tiende a cero obtenemos: d2 µα (x) ρ 2 + ωα µα (x) = 0; α = 1, 2, ...∞ dx2 τ

(6.200)

204 / Mec´ anica cl´ asica avanzada Reemplazando a (6.196) en (6.200) vemos que efectivamente (6.190) es la solución de (6.200). De (6.188) podemos obtener la ecuaci´ on diferencial que obedece la amplitud dependiente del tiempo. En efecto: r ∞ απ 2 X ∂2η απx απ τ sen = − Cα sen t + φα ∂x2 L L L ρ α=1 (6.201) r ∞ απ 2 τ X ∂2η απx απ τ = − C sen sen t + φα ∂t2 L ρ L L ρ α=1 De donde: ρ ∂2η ∂2η − =0 2 ∂x τ ∂t2

(6.202)

Esta ecuaci´ on se obtiene también directamente de (6.15) y (6.195). Es la ecuaci´ on de onda en una dimensi´ on. Hemos llegado a la teor´ıa de las ondas mecánicas. No seguiremos con el tema, que nos aleja del prop´ osito del presente cap´ıtulo.

7 Cinem´ atica del cuerpo r´ıgido

7.1.

Definici´ on de cuerpo r´ıgido

Es un sistema de part´ıculas sometidas a las siguientes ligaduras hol´ onomas: |~ri − ~rj | = lij = Constante; i, j = 1, 2, ...N

(7.1)

El n´ umero de relaciones de este tipo es:

N 2

=

1 N (N − 1) 2

(7.2)

Para N > 7 el n´ umero de ligaduras excede el n´ umero de coordenadas 3N . En realidad, para N ≥ 4 el n´ umero de ligaduras independientes es menor que el n´ umero dado por (7.2). Sea un cuerpo r´ıgido formado por más de tres part´ıculas no colineales. Dados tres puntos no colineales del cuerpo r´ıgido, las ligaduras fijan las posiciones de todos los dem´ as puntos, pues para ubicar un punto en el espacio bastan sólo las distancias a tres puntos no colineales (véase figura 7.1). Luego, para especificar los grados de libertad de un cuerpo r´ıgido, basta determinar el n´ umero de coordenadas independientes necesarias para ubicar la posición de tres puntos del cuerpo r´ıgido. Como entre los tres puntos dados, no colineales, hay tres condiciones de ligadura, r12 = l12 , r23 = l23 , r13 = l13 , se necesitan 9 − 3 = 6 coordenadas independientes para especificar la posición de tres puntos no colineales del cuerpo r´ıgido. En consecuencia el n´ umero de grados de libertad de un cuerpo r´ıgido es seis. Otra manera de hallar lo anterior es la siguiente. Para especificar la posición del punto 1 se requieren tres coordenadas. Para especificar la posición del punto 2, dado el punto 1 y la distancia r12 se requieren dos coordenadas. Para especificar la posición del punto 3, dados los puntos 1 y 2 y las distancias r23 y r13 , se requiere sólo una coordenada. O sea que en total se requieren seis coordenadas para ubicar los tres puntos.

205


i

2

l12 1

l23 l13

3

Figura 7.1 Posici´ on de un punto respecto de tres puntos no colineales del cuerpo r´ıgido

7.2.

Sistemas de coordenadas espacial y del cuerpo r´ıgido

Para especificar la posición de un cuerpo r´ıgido es suficiente: (a) Especificar la posición en el espacio de un punto cualquiera del cuerpo, para ello se requieren tres coordenadas; (b) Especificar la orientación del cuerpo respecto a unas coordenadas fijas en el punto mencionado, para ello se requieren tres coordenadas dado que seis es el n´ umero total de grados de libertad. El sistema de coordenadas η, ξ, ζ, est´ a fijado al cuerpo r´ıgido (véase figura 7.2). El sistema de coordenadas x′ , y ′ , z ′ , se obtiene del sistema x, y, z, sólo por translaci´ on al origen de coordenadas fijado al cuerpo r´ıgido. z′ ζ z

r′

r

y′

a η y x′

ξ

x

Figura 7.2 Sistemas de coordenadas espacial y del cuerpo r´ıgido

Cinemática del cuerpo r´ıgido / 207 Para una part´ıcula del cuerpo r´ıgido se tiene: ~r = ~r′ + ~a

(7.3)

En el sistema de coordenadas del cuerpo r´ıgido la part´ıcula tiene coordenadas η, ξ, ζ y en el sistema de coordenadas trasladado tiene coordenadas x′ , y ′ , z ′ . Estas coordenadas difieren por una rotación, o sea que est´ an relacionadas entre s´ı mediante una transformaci´ on lineal:   ′   x η          ξ  = A˜  y ′  (7.4)         z′ ζ donde A˜ es la matriz de la transformaci´ on. Llamemos las coordenadas as´ı: x1 = x x′1 = x′ x1 = η a1 = ax x2 = y

x′2 = y ′

x2 = ξ

a2 = ay

x3 = z

x′3 = z ′

x3 = ζ

a3 = az

(7.5)

Con lo cual podemos describir: xi =

x′i

+ ai ;

xi =

3 X

aij x′j ;

i = 1, 2, 3

(7.6)

j=1

˜ La transformaci´ donde aij son los elementos de la matriz A. on de las coordenadas espaciales (x) a las coordenadas del cuerpo r´ıgido (x) son: xi =

3 X

a−1 ij xj + ai

i = 1, 2, 3

(7.7)

j=1

−1 donde a−1 ˜−1 . Obviamente aij no es l/aij ·. a−1 ij son los elementos de la matriz inversa a ij son un conjunto de nueve n´ umeros que especifican la direcci´ on de los ejes de coordenadas fijos al cuerpo respecto a los ejes de coordenadas situados en el mismo punto de los anteriores pero no rotados respecto a los espaciales. Como la descripci´ on del movimiento translacional del cuerpo r´ıgido es posible usando los métodos de la cinem´ atica de part´ıculas, podemos sin perder generalidad hacer coincidir los sistemas de coordenadas (x) y (x′ ). Nos interesaremos pues, en la relación entre las coordenadas (x) y (x). La longitud del vector ~r es la misma en los dos sistemas de coordenadas con origen com´ un: r2 = r 2 . Por tanto:   ! 3 3 3 3 X X X X −1  −1 2  aij xj a xk xi xi = r = ik

i=1

i=1

j=1

3 X

3 X 3 X

k=1

(7.8)

r2 =

i=1

xi xi =

j=1 k=1

δjk xj xk

208 / Mec´ anica cl´ asica avanzada Igualando las ecuaciones (7.8) obtenemos: ! 3 X 3 3 X 3 3 X X X −1 −1 δjk xj xk = aij aik xj xk j=1 k=1

j=1 k=1

(7.9)

i=1

Como las x son independientes por definición, se sigue que: 3 X

−1 a−1 ij aik = δjk

(7.10)

i=1

En términos de los elementos (A˜−1 T )lm de la matriz traspuesta de la matriz A˜−1 , que se obtiene por intercambio de filas y columnas, podemos escribir (7.10) como: 3 X

˜ jk (A˜−1 T )ij (A˜−1 )ik = (I)

(7.11)

i=1

donde I˜ es la matriz identidad 3 × 3. En forma de matriz (7.11) es: A˜−1 T A˜−1 = I˜ ⇒ A˜−1 = A˜T

(7.12)

donde hemos usado el hecho de que: A˜−1 A˜ = I˜ y (A˜−1 T )T = A˜−1 . Llegamos a la conclusi´ on que: A˜−1 = A˜T . Una matriz para la cual su inversa coincide con su transpuesta se llama ortogonal. La matriz de rotación A˜ contiene nueve par´ ametros, pero entre ellos hay las relaciones: 3 X i=1

aji aTik = δjk ⇒

3 X

aji aki = δjk

(7.13)

i=1

Tres relaciones se obtienen cuando j = k: 3 X

(aji )2 = 1;

j = 1, 2, 3

(7.14)

i=1

Hay seis relaciones cuando j 6= k: 3 X i=1

aji aki = 0 j 6= k;

j, k = 1, 2, 3

(7.15)

Pero de (7.15) también se sigue que: 3 X i=1

aki aji = 0 j 6= k;

j, k = 1, 2, 3

(7.16)

O sea que sólo hay tres relaciones independientes para j 6= k. En total hay seis ˜ Como era de esperarse, A˜ contiene sólo relaciones entre los elementos de la matriz A. tres par´ ametros independientes.

Cinemática del cuerpo r´ıgido / 209 x2

x2

r,r x1 θ θ φ

x1

Figura 7.3 Rotación de los ejes (x) alrededor del eje x3 = x3 .

Ejemplo 7.2.1 Supongamos que los ejes (x) y (x) difieren simplemente por una rotación por un ´ angulo φ alrededor del eje x3 = x3 (véase figura 7.3). Encontrar las fórmulas de transformaci´ on. Las f´ ormulas de transformaci´ on se obtienen fácilmente de la figura 7.3, que representa el plano x1 − x2 : x=

r cos θ

x=

r senθ

(7.17) donde hemos usado que r = r. Como θ = θ − φ podemos escribir: cos θ =

cos θ cos φ + senθ senφ (7.18)

senθ =

senθ cos φ − cos θ senφ

Teniendo en cuenta que: x1 = r cos θ ; x2 = r senθ

(7.19)

Se sigue inmediatamente que las fórmulas de transformaci´ on son: x1 = x1 cos φ + x2 senφ x2 = −x1 senφ + x2 cos φ x3 = x3

(7.20)

210 / Mec´ anica cl´ asica avanzada O en forma de matriz:    cos θ senφ x1        x2  =  −senφ cos φ       x3 0 0

0



x1



      0   x2     x3 1

(7.21)

Esta matriz satisface idénticamente las relaciones de ortogonalidad (7.13). Para j = k: j=

primera fila ,

cos2 φ + sen2 φ + 02 =

1

j=

segunda fila , sen2 φ + cos2 φ + 02 =

1

j=

tercera fila ,

02 + 02 + 12 =

1

(7.22)

satisface también las relaciones para j 6= k (ortogonalidad de las filas entre s´ı o de las columnas entre s´ı): j = 1, k = 2 ( 1a y 2a filas) : − cos φ senφ + senφ cosφ + 0 = 0 j = 1, k = 3 ( 1a y 3a filas) :

0

+0

+0 =0

j = 1, k = 2 ( 2a y 3a filas) :

0

+0

+0 =0

(7.23)

y similarmente para la ortogonalidad entre columnas. En general, las relaciones (7.13) pueden expresarse en la siguiente manera. Para una matriz ortogonal A˜ se cumple que el producto escalar de una fila por s´ı misma, o de una columna por s´ı misma, es igual a la unidad. Dos filas diferentes o dos columnas diferentes son ortogonales entre s´ı. No es cierto sin embargo que una fila sea ortogonal a una columna. Es claro en el ejemplo anterior que A˜−1 = A˜T .

7.3.

Los cosenos directores

Sean dos sistemas de ejes cartesianos con origen com´ un (x) y (x). Los ejes (x) est´ an rotados respecto a los ejes (x). Sean ~e1 , ~e2 y ~e3 tres vectores unitarios a lo largo de los ejes x1 , x2 y x3 respectivamente. Sean ~e′1 , ~e′2 y ~e′3 los tres vectores unitarios a lo largo de los ejes x1 , x2 y x3 respectivamente. Se definen los cosenos directores de los ejes (x) respecto a los ejes (x) como los cosenos de los ángulos que hacen cada uno de los ejes (x) con cada uno de los ejes (x). Los denotaremos αij . De su definición se sigue que: αij = ~e′i · ~ej ;

i, j = 1, 2, 3

(7.24)

Es claro que αij es el coseno del ángulo entre el eje xi y el eje xj . En total hay nueve cosenos directores, que no son independientes. Es claro que la transformaci´ on de los vectores ~ei a los vectores ~e′i es: ~e′i =

3 X j=1

αij ~ej =

3 X j=1

(~e′i · ~ej )~ej

(7.25)

Cinemática del cuerpo r´ıgido / 211 en efecto: ~e′i · ~ek =

3 X j=1

(~e′i · ~ej )(~ej · ~ek ) =

3 X j=1

(~e′i · ~ej )δjk = ~e′i · ~ek

(7.26)

Un vector cualquiera V~ puede expresarse de dos maneras equivalentes: 3 X

V~ =

Vi~ei =

3 X

Vi′~e′i

(7.27)

i=1

i=1

Multiplicando escalarmente (7.27) a ambos lados por ~e′k : 3 X i=1

3 X

Vi~ek · ~ei =

i=1

Vi′~e′k · ~e′i = Vk′

(7.28)

~ se transforman de la siguiente manera: Por tanto se tiene que las componentes de V Vk′ =

3 X

αkj Vj

(7.29)

j=1

En tanto que: ~e′k

=

3 X

αkj ~ej

(7.30)

j=1

Es decir, las componentes de los vectores se transforman de la misma manera que los vectores unitarios. Notamos que las componentes Vi y Vi′ de V~ se pueden escribir como: Vi = ~ei · V~ ;

Vi′ = ~e′i · V~

(7.31)

De acuerdo con (7.29): ~ = Vi′ = ~e′i · V

3 X j=1

(~e′i · ~ej )(~ej · V~ )

(7.32)

~ como ~e′ , seg´ Tomando V un (7.32): i 1=

3 X j=1

(~e′i · ~ej ) →

3 X

α2kj = 1 ;

i = 1, 2, 3

(7.33)

j=1

~ como ~e′ con k 6= i, seg´ un (7.32): Tomando V k 0=

3 X j=1

(~ei · ~ej )(~ej · ~e′k ) →

3 X j=1

αij αkj = 0 ;

i, k = 1, 2, 3

(7.34)

212 / Mec´ anica cl´ asica avanzada Vemos que la f´ ormula de transformaci´ on de los vectores ~e′i a los vectores ~ei es: ~ei =

3 X

αij ~e′j =

j=1

puesto que:

~ei · ~e′k =

3 X j=1

3 X j=1

(~e′j · ~ei )~e′j

(~e′j · ~ei )δjk = (~e′k · ~ei )

(7.35)

(7.36)

Esto nos dice que la matriz traspuesta de (αij ) produce la rotación de los ejes (x) a los ejes (x). Las componentes de un vector se transforman seg´ un: Vk =

3 X

αjk Vj′ =

3 X

αTkj Vj′

(7.37)

j=1

j=1

Las relaciones (7.33) y (7.34) entre los cosenos directores pueden escribirse como: 3 X

αij αkj =

j=1

3 X

αij αTjk = δik

(7.38)

j=1

En s´ıntesis, vemos que la matriz de los (αij ) es ortogonal y cumple todas las propie˜ Los cosenos directores son los elementos de la matriz A. ˜ dades de la matriz de rotación A. D´ıadas y di´ adicos. Se define un diádico como una entidad algebraica que se representa por una matriz 3 × 3, de la misma manera que un vector es una entidad algebraica que se representa por una matriz columna 3 × 1. De acuerdo con (7.27) un vector unitario se puede expresar como: ~e1 =

1 · ~e1 + 0 · ~e2 + 0 · ~e3

~e2 =

0 · ~e1 + 1 · ~e2 + 0 · ~e3

~e3 =

0 · ~e1 + 0 · ~e2 + 1 · ~e3

(7.39)

Entonces los vectores unitarios se pueden representar por las tres matrices columna siguientes:       0 0 1                  (7.40) ~e1 →   0  ; ~e2 →  1  ; ~e3 →  0        1 0 0 ~ se puede representar mediante una matriz columna: Un vector arbitrario V         0 0 1 V1                 ~ →  V2  = V1  0  + V2  1  V3  0  (7.41) V                 1 0 V3 0

Cinemática del cuerpo r´ıgido / 213 Análogamente podemos suponer que una matriz 3 × 3 es la representación de cierta entidad que llamaremos diádico. Una d´ıada unitaria es el análogo de un vector unitario y un diádico es el análogo de un vector cualquiera. Definimos la d´ıada unitaria como una entidad algebraica ~ei~ej que se puede representar por una matriz 3 × 3 que tiene un 1 en la fila i columna j, y cero en todos los otros lugares. Podemos formar nueve d´ıadas unitarias. As´ı por ejemplo:     1 0 0 0 0 0            ~e1~e1 →  0 0 0  ~e2~e3 →  0 0 1  (7.42)      0 0 0 0 0 0 Notamos que ~ei~ej se puede representar por el producto de una matriz columna por una matriz fila:     1 0 0 1          (1 0 0) =  0 0 0  0 ~e1~e1 →          0 0 0 0 (7.43)     0 0 0 0          (0 0 1) =  0 0 1  1 ~e2~e3 →          0 0 0 0

~B ~ como un poliEs de notarse que en general ~ei~ej 6= ~ej ~ei . Definimos una d´ıada A nomio de d´ıadas unitarias as´ı: 3 X 3 X ~B ~ = Ai Bj ~ei~ej A i=1 j=1

(7.44)

~A ~= B

3 X 3 X

Bi Aj ~ei~ej

i=1 j=1

Un diádico en general es un polinomio de d´ıadas unitarias, pero no necesariamente ~ B: ~ de la forma A 3 3 X X ~~ Dij ~ei~ej (7.45) D = i=1 j=1

~~ Es claro que la representación de D es:   D11 D12 D13     ~~  D →  D21 D22 D23     D31 D32 D33

(7.46)

214 / Mec´ anica cl´ asica avanzada As´ı como el producto de un vector fila por una matriz da un vector fila y el producto de una matriz por un vector columna da un vector columna, definimos por analog´ıa el producto de un vector por un diádico y de un diádico por un vector para obtener vectores. Definimos los productos entre d´ıadas unitarias y vectores as´ı: ~ = ~ei (~ej · V ~ ) = ~ei Vj ~ei~ej · V V~ · ~ei~ej =

(7.47)

~ · ~ei )~ej = ~ej Vi (V

y el producto entre diádicos y vectores as´ı: ~~ ~ D ·V =

3 X 3 X

~~ V~ · D =

3 3 X X

i=1 j=1

i=1 j=1

  3 3 X X ~ =  Dij Vj  ~ei Dij ~ei ~ej · V i=1

j=1

! 3 3 X X ~ · ~ei ~ej = Dij Vi ~ej Dij V j=1

i=1

Se define el diádico unidad como: ~ ~1 = ~e ~e + ~e ~e + ~e ~e 1 1

2 2

(7.48)

3 3

(7.49)

~ ~1 claramente tiene las propiedades: ~ ~= ~1 · A

3 3 X X ~ ~= ~ei Ai = A ~ei~ei · A i=1

i=1

~ ·~ ~1 = A

3 X

3 X

i=1

~ · ~ei~ei = A

(7.50)

~ Ai~ei = A

i=1

La d´ıada ~ei~ej tiene la propiedad de proyecci´ on. Al multiplicarla por un vector se obtiene la componente del vector en la direcci´ on ~ei : ~=A ~ · ~ei~ei = ~ei~ei · A

3 X j=1

Aj (~ei · ~ej )~ei = Ai~ei

(7.51)

Se define el producto escalar de dos matrices as´ı: ˜= A˜ : B

3 X 3 X

Aij Bij

(7.52)

i=1 j=1

que corresponde al producto escalar de dos diádicos: ~~ ~~ ˜ A : B = A˜ : B

(7.53)

Para el diádico (7.44) y uno similar tenemos: ~B ~ :C ~D ~ = A

3 X i=1

~ · C)( ~ B ~ · D) ~ Ai Bj Ci Dj = (A

(7.54)

Cinemática del cuerpo r´ıgido / 215 Vemos que esto es lo mismo que: ~ ·A ~B ~ ·D ~ = C

=

3 3 X X

~ · ~ei )(~ej · D) ~ Ai Bj (C

3 X 3 X

~ · A)( ~ B ~ D) ~ Aj Bj Ci Dj = (C

i=1 j=1

i=1 j=1

(7.55)

Por tanto: ~B ~ :C ~D ~ =C ~ ·A ~B ~ ·D ~ A

(7.56)

Veremos que existe completa correspondencia entre los diádicos y los tensores. Un tensor es una entidad algebraica, con componentes Tij tales que bajo rotaciones se transforma as´ı: Tij′ =

3 X 3 X

αik αjl Tkl

(7.57)

k=1 l=1

donde (αij ) son los elementos de la matriz de rotación. En efecto, Tij son los elementos ~ de la matriz que representa a cierto diádico T~ : ~ ~ Tij′ = T~ · ~e′i~e′j = ~e′i · T~ · ~e′j

(7.58)

~ T~ se puede expresar bien en términos de ~ei~ej o de ~e′i~e′j : 3

3

3

3

XX XX ~ Tij′ ~e′i~e′j Tij ~ei~ej = T~ =

(7.59)

i=1 j=1

i=1 j=1

Por tanto (7.57) se puede escribir como: Tij′ =

3 X 3 X

k=1 l=1

Tlk ~ei · ~ek ~el · ~ej =

3 X 3 X

αik αjl Tkl

(7.60)

k=1 l=1

Se denomina relaci´ on de completidad de la base ~ei a: X ~ ~ei~ei = I~

(7.61)

i=1

y relaci´ on de ortonormalidad de la base ~ei a: ~ei · ~ej = δij ;

i, j = 1, 2, 3

(7.62)

En mecánica cuántica la notaci´ on de Dirac es la notaci´ on diádica en el espacio de Hilbert. Dos forma. Se define el diádico antisimétrico: ~ei ∧ ~ej = ~ei~ej − ~ej ~ei

(7.63)

216 / Mec´ anica cl´ asica avanzada se cumple que ~ei ∧ ~ei = 0 y además:

~e1 ∧ ~e2 =

~e2 ∧ ~e3 =



0

1

   −1 0   0 0



0

   0   0

0

0



  0   , ~e1 ∧ ~e3 =  0 0





0

0

   0 0   −1 0

1



  0  ,  0

(7.64)

  0 1    −1 0

Una 2-forma entre dos vectores es: ~∧B ~ = A

3 X 3 X i=1 j=1

Ai Bj ~ei ∧ ~ej =

3 X 3 X i=1 j=1

(Ai Bj − Aj Bi )~ei~ej

(7.65)

Se cumplen las propiedades: ~ ·A ~∧B ~ ·D ~ = (C ~ · A)( ~ B ~ · D) ~ − (C ~ · B)( ~ A ~ · D) ~ C

(7.66)

~∧B ~ :C ~ ∧D ~ = 2(D ~ · B)( ~ A ~ · C) ~ − 2(C ~ · B)( ~ A ~ · D) ~ A El deteminante de la matriz de rotaci´ on. Sabemos que la matriz de los cosenos directores de un sistema de ejes (x) rotado respecto a otro sistema de ejes (x) es ortogonal: A˜T A˜ = I˜

(7.67)

Tomando el determinante a cada lado de (7.67) y teniendo en cuenta el teorema matemático que dice que el determinante de un producto de matrices es igual al producto de los determinantes, tenemos que: ˜ = det A˜T · det A˜ = det I˜ det(A˜T A)

(7.68)

otro teorema matemático dice que los determinantes de una matriz y de su traspuesta son iguales, entonces: ˜ 2 = 1 ⇒ det A˜ = ±1 det(A)

(7.69)

Es f´ acil ver que det A˜ = −1 ocurre cuando la matriz A˜ contiene una inversi´ on del sistema de coordenadas. Entonces los desplazamientos de un sólido r´ıgido con un punto fijo sólo pueden ser descritos mediante una matriz de determinante +1.

Cinemática del cuerpo r´ıgido / 217

7.4.

El teorema de Euler acerca del movimiento de un cuerpo r´ıgido

El teorema dice: el desplazamiento general de un cuerpo r´ıgido con un punto fijo es un giro alrededor de cierto eje. En otras palabras: es suficiente un solo giro para pasar de los ejes (x) fijos al cuerpo, a los ejes espaciales (x). El teorema se demuestra teniendo estas dos propiedades de una rotación alrededor de un eje: (a) El eje de rotación permanece inalterado; (b) La rotación no cambia la longitud de los vectores. El teorema de Euler ˜ podemos queda demostrado si para una rotación arbitraria, descrita por la matriz A, hallar siempre un vector que no cambie, es decir, que tenga las mismas componentes en los dos sistemas: ~ =V ~ V~ ′ = A˜V

(7.70)

Esta ecuaci´ on es un caso particular de: ~ = λV ~ V~ ′ = A˜V

(7.71)

Como A˜ es unitaria (ortogonal) pero no herm´ıtica (no simétrica), sus valores propios no tienen por qué ser reales. Esto nos permite enunciar el teorema de Euler de otra manera: “la matriz real y ortogonal que determina el movimiento f´ısico de un cuerpo r´ıgido con un punto fijo siempre tiene el valor propio +1”. La ecuación de valores propios (7.71) puede escribirse: ˜V ~ = ~0 (A˜ − λI)

(7.72)

Es un sistema homogéneo de tres ecuaciones lineales, donde las incógnitas son las componentes de V~ : (a11 − λ)V1 + a12 V2 + a13 V3 =

0

a21 V1 + (a22 − λ)V2 + a23 V3 =

0

a31 V1 + a32 V2 + (a33 − λ)V3 =

0

(7.73)

Como es conocido, habr´ a solución no trivial sólo si el determinante de la matriz ˜ es igual a cero. Esto hace que exista solución solamente para ciertos valores de (A˜ − λI) λ:   a11 − λ a12 a13      a22 − λ a23  (7.74) det  a21 =0   a31 a32 a33 − λ La ecuaci´ on (7.74) es de tercer grado en λ con coeficientes reales: λ3 + bλ2 + cλ + d = 0

(7.75)

218 / Mec´ anica cl´ asica avanzada donde: b = −a11 − a22 − a23 c = a22 a11 + a33 a11 + a21 a33 − a23 a32 − a12 a21 − a13 a31

(7.76)

d = a23 a32 a11 + a12 a21 a33 + a13 a31 a22 −a22 a33 a11 − a12 a23 a31 − a13 a21 a32 cuyas principales propiedades son: ~ podr´ıa ser (a) λ puede ser complejo pero con m´ odulo 1. Si λ es complejo, V 2 ~ ~ ~ ~ complejo. En este caso escribimos el módulo de V como |V | = V · V donde V~ † es la ~ y tomando el complejo conjugado: V ~ † = (V ~ T )⋆ . matriz fila que se obtiene trasponiendo V ′ ~ es la misma de V~ : La longitud de V ~ ′ |2 = V ~ ′† · V ~ ′ = (A˜V ~ )† · (A˜V~ ) = V ~ † A˜T A˜V~ |V

(7.77)

~ ′ |2 = | V ~ |2 . Por otra parte, V ~ ′ = λV ~ , por Como A˜ es ortogonal, se sigue que |V tanto: ~ ′ |2 = V ~ ′† · V ~ ′ = (λV ~ )† · (λV ~ ) = λ⋆ λV ~†·V ~ = |λ|2 |V ~ |2 |V

(7.78)

En conclusi´ on: |λ|2 = 1

(7.79)

(b) La ecuaci´ on secular (7.75) tiene al menos una ra´ız real. Grafiquemos la ecuaci´ on real: f (x) = x3 + bx2 + cx + d

(7.80)

asumiremos x real. De la ecuaci´ on (7.76) sabemos que b, c y d son reales. Claramente: f (x) → ∞

para x → ∞

f (x) → −∞

para x → −∞

(7.81)

Como f (x) es continua debe en alguna parte cruzar el eje x. Llamemos x = λ el punto donde corta el eje, o sea el cero de f (x): λ3 + bλ2 + cλ + d = 0

(7.82)

Como por (a) sabemos que |λ| = 1, se sigue que el valor propio real debe ser λ = −1 o λ = +1 (véase figura 7.4). (c) Si λ es un valor propio compleio, λ⋆ tambi´ en es un valor propio. Como a, b, c y d son reales, si λ es complejo y satisface (7.75) entonces λ⋆ también la satisface: de (a), (b) y (c) se sigue que la matriz A˜ tendrá tres valores propios λ, λ⋆ , +1 o −1. Para cada valor propio habr´ a un vector propio: ~α = λα V~α ; A˜V

α = 1, 2, 3

con λα = λ, λ⋆ , 1 o − 1

(7.83)

Cinemática del cuerpo r´ıgido / 219 y

λ

x

Figura 7.4 Gráfico de la función real f (x) = x3 + bx2 + cx + d

En términos de las componentes podemos escribir a (7.83) como: 3 X

aij Vαj = λα Vαj =

j=1

3 X

λβ Vβi δαβ

(7.84)

β=1

Definimos las siguientes matrices formadas con las componentes de los vectores propios y con los valores propios: V˜ = (Vαi ) ,

˜ = (λβ δαβ ) λ

(7.85)

Entonces (7.84) puede reinterpretarse como productos de matrices: ˜ iα ˜T )iα = (V˜ T λ) ˜V ~ )αi = (V˜ T λ (A˜V˜ T )iα = (λ

(7.86)

O también: ˜ ⇒ (V˜ T )−1 A˜V˜ T = λ ˜ A˜V˜ T = V˜ T λ

(7.87)

Es decir, los vectores propios forman una matriz que diagonaliza a A˜ siendo los elementos de la diagonal los valores propios. (d) El producto de las ra´ıces de la ecuaci´ on secular es ±1. Tomando determinantes a ambos lados de (7.87) y teniendo en cuenta que el determinante de una matriz es igual al inverso del determinante de la matriz, obtenemos: 1 ˜ ⇒ det A˜ = det λ ˜ det A˜ det V˜ = det λ det V˜

(7.88)

De (7.69) se sigue que: ˜ = ±1 det λ

(7.89)

220 / Mec´ anica cl´ asica avanzada Hemos dicho que para rotaciones se debe cumplir que det A˜ = +1 y para inversiones det A˜ = −1. Entonces, cuando A˜ representa rotaciones: ˜ = λ1 λ2 λ3 = |λ|2 λ3 = +1 det λ (7.90) Como |λ|2 = +1 se sigue que siempre el valor propio real debe ser igual a +1. Esto es lo que afirma el teorema de Euler: existe un vector que no cambia al realizar una transformaci´ on cualquiera A˜ (corresponde al valor propio +1). ~: Los vectores propios. El vector invariante bajo rotaciones es V ~ =V ~ A˜V

(7.91)

~α formamos la matriz V˜ que diagonaliza a A: ˜ Con las componentes de V T ˜ V˜ A˜V˜ = λ

(7.92)

˜ es: La traza de λ tr λ = λ1 + λ2 + λ3 = λ + λ⋆ + 1 Como |λ| = 1, podemos escribir: λ = eiΦ

De donde: ˜ = 2 cos Φ + 1 tr λ

(7.93) (7.94) (7.95)

Como, seg´ un un teorema matemático, la traza es invariante bajo transformaciones ˜ de semejanza (V˜ A˜V˜ T es una transformaci´ on de semejanza sobre A): ˜ = 1 + 2 cos Φ tr A˜ = tr λ (7.96) Es decir, a11 + a22 + a33 = 1 + cos Φ

(7.97)

Podemos mediante una transformaci´ on de semejanza rotar los ejes de modo que ~ , de modo que la matriz de rotación tendrá la forma dada por x3 esté a lo largo de V (7.21):   cos φ senφ 0      −senφ cos φ 0 A˜ =  (7.98)     0 0 1

Vemos entonces de (7.97) y (7.98) que cos φ = cos Φ, luego Φ puede identificarse ~ . La ecuaci´ como el ´ angulo de rotación alrededor del eje determinado por V on de valores ˜ propios para la matriz A es:      V1 V1 cos Φ senΦ 0            −senΦ cos Φ 0   V2  =  V2  (7.99)           V3 V3 0 0 1

Cinemática del cuerpo r´ıgido / 221 Con lo cual obtenemos: V1 cos Φ + V2 senΦ = V1 −V1 senΦ + V2 cos Φ = V2

(7.100)

V3 = V3 Esto nos da, multiplicando la primera por V2 y la segunda por V1 y restando: (V12 + V22 ) senΦ = 0

(7.101)

Como Φ es arbitrario, los vectores propios deben cumplir V1 = V2 = 0, quedando ~ = V3~e3 . Para una elección general de los ejes, seguirá siendo V3 indeterminado, luego V ~ , pero no quedará determinado comválido que Φ representa la rotación alrededor de V ~ sino sólo su direcci´ pletamente el vector V on: su magnitud quedará indeterminada. En cualquier caso la traza de A˜ nos determina el ángulo de rotación. Teorema de Chasles. El desplazamiento más general de un cuerpo r´ıgido consiste en una translaci´ on más una rotación. Este teorema se demuestra en el texto Dynamics of a rigid body, de Routh.

7.5.

El rotador r´ıgido

Es un sólido r´ıgido que se mueve sometido a la condición de ligadura que un punto permanezca fijo. Los movimientos de un rotador r´ıgido quedarán especificados por medio de las tres componentes de la matriz A˜ que relaciona las componentes de los vectores en el sistema de ejes espacial con el sistema de ejes unido al sólido r´ıgido: ˜r ~r = A~

o xi =

3 X

aij xj

(7.102)

j=1

En efecto, es suficiente especificar las tres coordenadas de un punto arbitrario del sólido r´ıgido respecto al sistema de ejes espacial para conocer completamente la ubicación de todos los dem´ as puntos del sólido r´ıgido. Es decir, los tres par´ ametros independientes de la matriz A˜ sirven para especificar las posiciones de un rotador r´ıgido. Es claro que estos tres par´ ametros serán funciones del tiempo. El grupo de rotaciones. El conjunto de todas las infinitas rotaciones de un cuerpo r´ıgido con un punto fijo constituye un grupo. Cada rotación A˜ est´ a especificada por tres par´ ametros independientes q1 , q2 y q3 . Un grupo es la siguiente estructura algebraica: ˜ (i) Existe un conjunto de elementos g = {A(q), ∀q1 , q2 , q3 }. ˜ ˜ ˜ ˜ (ii) Si A1 y A2 ∈ g entonces A1 A2 ∈ g. ˜ (iii) Si A˜ ∈ g, ∃A˜−1 ∈ g tal que AÃ˜−1 = I. ˜ ˜ ˜ ˜ ˜ (iv) ∃I ∈ g tal que I A = A, ∀A ∈ g. ˜ B, ˜ C˜ ∈ g se cumple A( ˜B ˜ C) ˜ = (A˜B) ˜ C. ˜ (v) ∀ A,

222 / Mec´ anica cl´ asica avanzada Estas propiedades se siguen del hecho de que las matrices de rotación son ortogonales. Es sencillo demostrar a partir de lo anterior que: (a) El producto de dos matrices ortogonales es ortogonal. (b) Como para toda matriz de rotación det A˜ = 1, se sigue que toda matriz de rotación tiene inverso. (c) I˜ es ortogonal. (d) El producto de matrices obedece la ley asociativa. Las rotaciones consideradas en abstracto como simples transformaciones geométricas forman un grupo. El conjunto de matrices ortogonales 3 × 3 constituye una representación del grupo de rotaciones.

7.6.

Los ´ angulos de Euler

Los nueve cosenos directores no son independientes, sólo tres lo son. Podemos pensar que todos los cosenos directores sean expresados en términos de tres par´ ametros independientes φ, θ, ψ: αij = αij (φ, θ, ψ) ;

i, j = 1, 2, 3

(7.103)

La elección de estos tres par´ ametros independientes no es u ´ nica. Una conveniente elección de φ, θ y ψ, es la siguiente (véase figura 7.5). Se puede efectuar la transformaci´ on de (x) a la posición del cuerpo r´ıgido dada por (x) por medio de las siguientes rotaciones: una rotación por un ´ angulo φ alrededor del eje x3 , con lo cual los ejes cambian de (x) a (µ). Una rotación por un ángulo θ alrededor de µ1 , con lo cual los ejes se cambian de (µ) a (µ′ ). Finalmente una rotación por un ángulo ψ, alrededor del eje µ′3 , con lo cual los ejes se cambian de (µ′ ) a (x).1 Para expresar la matriz de rotación S˜ en términos de los ´ angulos φ, θ y ψ (´ angulos de Euler) debemos calcular los cosenos directores en términos de estos ´ angulos. x3, µ 3

x3 µ3′

µ2′

µ2 ϕ

x1

ϕ µ1

χ3, µ3′

θ

x2

x2

x3

θ x2

x1

ϕ µ1, µi

x2 x1

ϕ

ψ x1

Línea de nodos

Figura 7.5 Angulos de Euler 1 (θ,

φ − π/2) son los a ńgulos esf´ ericos de x3 respecto a los ejes x1 , x2 , x3 , y (θ, π/2 − ψ) son los angulos esf´ ´ ericos de x3 respecto a los ejes x1 , x2 , x3 .

Cinemática del cuerpo r´ıgido / 223 Para hallar α11 = ~e′1 · ~e1 tomemos los planos que se cortan en la l´ınea de nodos y que contienen los ejes x1 − x2 y x1 − x2 como en la figura 7.6. Vemos que: x3 x3

π- θ

α a

φ

ψ

x2

x2 b

l x1 θ

x1

Figura 7.6 Planos que se cortan en la l´ınea de nodos

a cos φ = b cos ψ

(7.104)

l2 = a2 + b2 − 2ab cos α

(7.105)

l2 = (a senφ)2 + (b senψ)2 − 2(a senφ)(b senψ) cos (π − θ)

(7.106)

Igualando (7.105) y (7.106) llegamos a: −b cos α = −a cos2 φ + b senφ senψ cos θ

(7.107)

Ahora, reemplazando (7.104) en (7.107) obtenemos finalmente: α11 = cos α = cos ψ cos φ − senφ senψ cos θ

(7.108)

α12 = ~e′1 · ~e2 se obtiene de α11 reemplazando a φ por φ + 3π/2: α12 = cos ψ senφ + cos φ senψ cos θ

(7.109)

α21 = ~e′2 · ~e1 se obtiene de α11 reemplazando a ψ por ψ + π/2: α21 = −senψ cos φ − senφ cos ψ cos θ

(7.110)

α22 = ~e′2 · ~e2 se obtiene de α21 reemplazando a φ por φ + 3π/2: α22 = −senψ cos φ + cos φ cos ψ cos θ

(7.111)

224 / Mec´ anica cl´ asica avanzada α33 = ~e′3 · ~e3 se obtiene directamente: α33 = ~e′3 · ~e3 = cos θ

(7.112)

α13 y α23 se obtienen de las relaciones de ortogonalidad siguientes, ecuaci´ on (7.38): α2j1 + α2j2 + α2j3 = 1

(7.113)

Con lo cual se obtiene para α13 : α213 = 1 − (α211 + α212 ) = 1 − (1 − sen2 ψ sen2 θ)

(7.114)

⇒ α13 = senψ senθ Similarmente, α221 + α222 = sen2 ψ + cos2 ψ cos2 θ, con lo cual: α23 = cos ψ senθ

(7.115)

Para calcular a α32 y a α31 usamos la ecuaci´ on (7.38) as´ı: α31 α21 + α32 α22 + α33 α23 = 0

(7.116)

α31 α11 + α32 α12 + α33 α13 = 0

(7.117)

Multiplicando a (7.116) por α11 y a (7.117) por α21 y restando: α32 =

α13 α21 − α23 α11 α33 α22 α11 − α12 α21

(7.118)

Con lo cual se obtiene: α32 = −senθ cos φ

(7.119)

Por otra parte la relación (7.38) para la fila tres: α231 + α232 + α233 = 1

(7.120)

nos permite escribir: α31 = senθ senφ

(7.121)

con lo cual la matriz de rotación es, en definitiva: A˜ = 

cos φ cos ψ − senφ cos θ senψ

senφ cos ψ + cos φ cos θ senψ

senθ senψ



 (7.122)    − cos φ senψ − senφ cos θ cos ψ −senφ senψ + cos φ cos θ cos ψ senθ cos ψ      senφ senθ − cos φ senθ cos θ

Por la forma como fue obtenida, a partir de los cosenos directores, se tiene que A˜ ˜ es una matriz ortogonal. Es decir, que A˜−1 se obtiene simplemente trasponiendo a A.

Cinemática del cuerpo r´ıgido / 225 Del teorema de Euler se sigue que de alguna manera A˜ representa una rotación u ńica alrededor de cierto eje n ˆ = c1~e1 + c2~e2 + c3~e3 bajo un ángulo Φ. El eje de rotación se halla resolviendo la ecuaci´ on de valores propios (7.91), con λ = 1: 3 X j=1

(aij − δij )Cj = 0 ;

i = 1, 2, 3

(7.123)

El resultado para los cosenos directores del eje n ˆ es: C1 =

senθ(cos ψ − cos φ) 2 senΦ

C2 =

senθ(senφ − senψ) 2senΦ

(7.124)

sen(Φ + ψ) (1 + cos θ) 2senΦ Donde Φ es el ´ angulo de rotación alrededor de n ˆ que se halla a partir de la traza ˜ ecuaci´ de A, on (7.97): C3 =

cos φ =

1 − tr A˜ 2

(7.125)

Calculando la traza de A˜ se llega finalmente a: θ ψ+φ Φ (7.126) cos = cos cos 2 2 2 Como C12 + C22 + C32 = 1, vemos que dos cosenos directores de n ˆ y Φ especifican la rotación.2 Se puede ver que A˜ se puede obtener también a partir de la definición de los ángulos de Euler, de acuerdo con la figura 7.5:      x1 cos φ senφ 0 µ1            µ2  =  −senφ cos φ 0   x2  o ~µ = A˜φ ~x (7.127)           x3 µ3 0 0 1    ′   1 0 0 µ1 µ1         ′    µ2  =  0 cos θ senθ   µ2  o µ~′ = A˜θ ~µ (7.128)           µ3 0 −senθ cos θ µ′3   ′    µ1 cos ψ senψ 0 x1            x2  =  −senψ cos ψ 0   µ′2  o ~x = A˜ψ µ ~′ (7.129)           µ′3 0 0 1 x3 2 Las

ecuaciones (7.124) y (7.126) se obtienen al comparar los elementos de (7.122) y (7.138).

226 / Mec´ anica cl´ asica avanzada De modo que ~x puede obtenerse de ~x a través de: ˜x ~x = A˜ψ A˜θ A˜φ ~x = A~

(7.130)

As´ı que: A˜ = A˜ψ A˜θ A˜φ

(7.131)

Al hacer el producto de matrices se llega al resultado para la matriz A˜ dado por (7.122). Definiciones alternas de los ´ angulos de Euler. La convención usada en mecánica cuántica en los textos de teor´ıa de grupos de Wigner, y de momentos angulares de Rose, es diferente a la presentada anteriormente. All´ı la segunda rotación es tomada no alrededor del eje intermedio µ1 sino alrededor de µ2 . Es la llamada “con˜ Es vención y” que obviamente dar´ a lugar a expresiones diferentes para la matriz A. f´ acilmente demostrable que para obtener la matriz A˜ en la convención “y” a partir de la matriz A˜ en la convención “x” bastan las sustituciones: π φ →φ+ 2 (7.132) π ψ →ψ− 2 donde se entender´ a a φ como el ángulo de la primera rotación y a ψ como el ángulo de la tercera rotación, con lo cual: senφ → cos φ cos φ → −senφ

senψ → − cos ψ

(7.133)

cos ψ → senψ

Se propone como ejercicio probar estas afirmaciones. Otra convención es la llamada convención “xyz”, usada en aeronáutica: la primera rotación es por ´ angulo φ alrededor de x3 , la segunda por ángulo θ alrededor de x2 y la tercera por ´ angulo ψ alrededor de x1 . Es la llamada secuencia 3 2 1. Por ejemplo, tomando los ejes de coordenadas fijos a un avi´ on de la siguiente manera: x3 perpendicular al avi´ on en el centro de masa, x2 paralelo a las alas y x1 a lo largo del eje principal del avi´ on, una posición arbitraria de la nave se puede obtener a partir de la posición en que los ejes (x) coinciden con los ejes (x) por medio de la siguiente secuencia de rotaciones: una alrededor de x3 por ángulo φ, otra alrededor de x2 por ángulo θ y la tercera alrededor de x1 por un ´ angulo ψ.

7.7.

Descripci´ on de las rotaciones en t´ erminos de n ˆy Φ. Par´ ametros de Euler

Hemos mostrado que los desplazamientos de un cuerpo r´ıgido con un punto fijo se pueden expresar por medio de rotaciones. Cada rotación puede especificarse por tres

Cinemática del cuerpo r´ıgido / 227 par´ ametros independientes que pueden ser por ejemplo tres cosenos directores independientes, tres ´ angulos de Euler, o un eje de rotación y un ángulo. Vimos que las rotaciones constituyen un grupo matemático que tiene una representación obvia en términos de matrices 3 × 3 ortogonales (hay un homomorfismo entre las rotaciones f´ısicas y las matrices ortogonales 3 × 3). Queremos buscar una representación de la transformaci´ on de coordenadas en términos de los par´ ametros de una rotación: dos cosenos directores del eje de rotación y el ángulo de rotación. Formas “activa” y “pasiva” de una rotaci´ on. Hasta ahora hemos considerado ˜r simplemente que la matriz A˜ rota los ejes coordenados, de modo que la ecuaci´ on ~r = A~ expresa c´ omo est´ an relacionadas las componentes de un vector vistas respecto a dos diferentes sistemas de coordenadas: A˜ act´ ua sobre el sistema de coordenadas dejando los vectores inalterados. Hay además la siguiente interpretaci´ on: A˜ puede pensarse como un operador que act´ ua sobre los vectores ~r para cambiarlos por vectores diferentes ~r′ con respecto al mismo sistema de coordenadas. Por ejemplo, en dos dimensiones, en vez de rotar en el sentido contrario a las agujas del reloj al sistema de coordenadas por un ángulo φ, se puede rotar al vector ~r en el sentido del reloj por un ángulo φ para obtener el vector ~r′ (véase figura 7.7). Las componentes del nuevo vector, ~r′ , estar´ an entonces x2

x2

Pasiva: r = Ar

r

x1

r

x2

Activa r ′ = Ar i

r′

r

i

φ φ

x1

x1

Figura 7.7 Formas activa y pasiva de una rotaci´ on ˜r . En general A˜ relacionadas con las del viejo vector ~r, por medio de la ecuaci´ on ~r′ = A~ corresponde a una rotación en sentido contrario a las agujas del reloj por un ángulo φ cuando sea aplicada al sistema de coordenadas, y como una rotación en sentido de las agujas del reloj por un ´ angulo φ cuando sea aplicada a los vectores. Rotaciones finitas. Usaremos el punto de vista activo, seg´ un el cual en un sistema de coordenadas dado realizamos una rotación de un vector por un ángulo Φ alrededor de un eje n ˆ . Se trata de encontrar la matriz A˜ que relaciona las componentes del viejo y del nuevo vector. De las figuras 7.8 y 7.9 se ve que: ~ + N~V + N~Q ~r′ = ON

(7.134)

donde los vectores tienen las siguientes expresiones en términos de ~r, n ˆ y Φ, teniendo en


N

P

V Φ Q

r′ i

r

n O Figura 7.8 Rotación de un vector alrededor de un eje n ˆ . Vista lateral.

N

V Φ

P

r ×n Q Figura 7.9 Rotación de un vector alrededor de un eje n ˆ . Vista en direcci´ on ~n.

Cinemática del cuerpo r´ıgido / 229 cuenta que N V = N Q cos Φ y V Q = N Q senΦ: ~ = ON

(ˆ n · ~r)ˆ n

N~Q =

~ ) cos Φ (~r − ON

(7.135)

V~Q = ~r × n ˆ senΦ

Con lo cual obtenemos: ~r′ = ~r cos Φ + n ˆ (ˆ n · ~r)(1 − cos Φ) + ~r × n ˆ senΦ

(7.136)

Esta f´ ormula es válida para cualquier rotación finita de un vector. Para Φ infinitesimal, dicha expresión toma la forma: ~r′ = ~r + ~r × n ˆΦ

(7.137)

en concordancia con la f´ ormula (3.148). Escrita en forma de matriz, la ecuaci´ on (7.136) es:  ′ x1    ′ x2  =     x′3 (7.138)    x1 C1 C2 c + C3 senΦ C1 C3 c−C2 senΦ cos Φ+C12 c       2 C1 C2 c−C3 senΦ x2  c C C c+C senΦ cos Φ+C 2 3 1 2       x3 C1 C3 c+C2 senΦ C2 C3 c−C1 senΦ cos Φ+C32 c

donde hemos llamado c = (1 − cos Φ). En (7.138) la matriz A˜ depende de los cuatro par´ ametros no independientes C1 , C2 , C3 y Φ. Suele expresarse esta matriz en términos de los llamados par´ ametros de Euler, no independientes, e0 , e1 , e2 , e3 , definidos as´ı: e0 =

cos

Φ 2

(7.139)

Φ ei = Ci sen ; i = 1, 2, 3 2 En términos de estos par´ ametros (7.136) toma la forma: ~r′ = ~r(e20 − e21 − e22 − e23 ) + 2~e(~e · ~r) + 2(~r × ~e)e0 y la matriz A˜ entonces será:  2 e0 + e21 − e22 − e23 2(e1 e2 + e0 e3 ) 2(e1 e3 − e0 e2 )   e20 − e21 + e22 − e23 2(e2 e3 + e0 e1 ) A˜ =   2(e1 e2 − e0 e3 )  2(e1 e3 + e0 e3 ) 2(e2 e3 − e0 e1 ) e20 − e21 − e22 + e23

(7.140)      

(7.141)

230 / Mec´ anica cl´ asica avanzada Usando las ecuaciones (7.124), (7.126) y (7.139) se obtienen las siguientes relaciones entre los par´ ametros de Euler y los ángulos de Euler: e0 =

cos

θ φ+ψ cos 2 2

e1 =

sen

φ−ψ θ cos 2 2

e2 =

θ φ−ψ sen sen 2 2

e3 =

cos

(7.142)

φ+ψ θ sen 2 2

Los par´ ametros y los ángulos de Euler fueron hallados por Euler en 1776, quien llam´ o ei a los par´ ametros simétricos.

7.8.

Representaci´ on del grupo de rotaciones por medio de matrices 2 × 2. Los par´ ametros de Cayley-Klein

Representaci´ on de un grupo. En el numeral 7.5 hemos mencionado que el conjunto de todos los desplazamientos de un cuerpo r´ıgido con un punto fijo satisface los axiomas de un grupo matemático: (i) Dos desplazamientos sucesivos cualesquiera del cuerpo equivalen a un desplazamiento; (ii) Existe el desplazamiento identidad que consiste en no desplazar el cuerpo; (iii) Para todo desplazamiento existe el desplazamiento inverso o sea aquel que retorne el cuerpo a su posición original; (iv) Los desplazamientos sucesivos del cuerpo r´ıgido satisfacen la propiedad asociativa. El conjunto de todas las matrices ortogonales 3 × 3 constituyen una representación del grupo de los desplazamientos de un rotador r´ıgido en el sentido de que a cada desplazamiento del rotador se le puede asociar una matriz ortogonal 3 × 3 y sólo una. Se dice entonces que hay un homomorfismo entre el grupo de los desplazamientos del rotador r´ıgido y el grupo de las matrices ortogonales 3×3. El grupo de matrices ortogonales 3×3 es llamado el grupo O(3). El grupo de las matrices ortogonales 3 × 3 con determinante +1, que en rigor es el que corresponde a los desplazamientos de un rotador r´ıgido, se llama el grupo SO(3). Vectores y di´ adicos en un espacio bidimensional. En un espacio bidimensional, un vector arbitrario V~ puede expresarse en términos de los vectores unitarios ~e1 , e~2 : ~ = V1~e1 + V2~e2 . V ~ y ~ei pueden representarse por matrices 2 × 1: V 

V~ → 

V1 V2





 ~e1 → 

1 0





 ~e2 → 

0 1

 

(7.143)

Cinemática del cuerpo r´ıgido / 231 Podemos definir las d´ıadas unitarias ~e1~e1 , ~e1~e2 , ~e2~e1 y ~e2~e2 , que pueden representarse por matrices 2 × 2:     1 0 0 1  ~e1~e2 →   ~e1~e1 →  0 0 0 0 (7.144)     0 0 0 0  ~e2~e2 →   ~e2~e1 →  1 0 0 1 En una d´ıada unitaria el primer vector se representa por una matriz columna y el segundo por una matriz fila. Por ejemplo:     1 0 1  ~e1~e2 →   (0 1) =  (7.145) 0 0 0 N´ otese que:



0

~e1 ∧ ~e2 = ~e1~e2 − ~e2~e1 = 



1



−1 0

~~ Un diádico D puede expresarse en términos de las d´ıadas unitarias: ~~ D = D11~e1~e1 + D12~e1~e2 + D21~e2~e1 + D22~e2~e2 y puede representarse por medio de una matriz 2 × 2:   D11 D12 ~~  D → D21 D22 ~1, es: El diádico unidad, ~



~ ~1 = ~e1~e1 + ~e2~e2 → 

1 0 0 1

Se definen los diádicos ~ ~σ x , ~ ~σ y y  0 ~ ~σ x = ~e1~e2 + ~e2~e1 →  1 

~ ~σ y = −i~e1~e2 + i~e2~e1 →  

~ ~σ z = ~e1~e1 − ~e2~e2 → 

1

 

(7.146)

(7.147)

(7.148)

(7.149)

~~σ z de la siguiente manera:  1 =σ ˜x 0

0

−i

i

0 0

0 −1



=σ ˜y



=σ ˜z

(7.150)

232 / Mec´ anica cl´ asica avanzada Las d´ıadas unitarias pueden expresarse en términos de ~~σ i y ~~1: ~e1~e1 =

1 ~ (~1 + ~~σ z ) ; 2

~e1~e2 =

1 ~e2~e1 = (~ ~σ x − i~~σ y ) ; 2

1 ~ (~σ x + i~~σ y ) 2

1 ~ ~e2~e2 = (~1 − i~~σ z ) 2

(7.151)

~ Un diádico arbitrario puede igualmente expresarse en términos de ~1 y ~~σ i : 1 ~~ ~1 + 1 (V11 − V22 )~~σ z + 1 (V12 + V21 )~~σ x + i (V12 − V21 )~~σ y D = (V11 + V22 )~ 2 2 2 2

(7.152)

O sea que cualquier diádico de traza cero puede expresarse en términos de ~~σ x , ~~σ y , ~ ~ ~ a cualquier diádico de traza cero: ~σ z . Llamaremos V ~ ~~σ y ~~σ z ~σ x ~ ~ = Vx √ V + Vy √ + Vz √ 2 2 2

(7.153)

Existe un isomorfismo entre los diádicos bidimensionales de traza cero y los vectores ~ . En efecto, el conjunto de todos los diádicos bidimensionales de traza cero ordinarios V satisface las mismas propiedades que el conjunto de todos los vectores ordinarios: (i) La suma de dos diádicos de traza cero es un diádico de traza cero, la suma es conmutativa; (ii) El producto de un n´ umero por un diádico de traza cero es un diádico de traza cero; (iii) La suma de diádicos es asociativa; (iv) Existe el diádico cero. Además, si se define el producto escalar de dos diádicos como: ~ ~ ~ = V ⋆ W11 + V ⋆ W12 + V ⋆ W21 + V ⋆ W22 ~ : W V 11 12 21 22

(7.154)

Vemos que este producto escalar satisface las mismas propiedades del producto escalar de vectores. Para ello es suficiente mostrar que: ~ ~σ i : ~ ~σ j = 2δij ;

i, j = x, y, z

(7.155)

lo cual es evidente de las ecuaciones (7.150) y (7.154). En resumen, a cada diádico de traza cero de la forma (7.153) se le puede hacer corresponder el vector ordinario: ~ = Vx~e1 + Vy ~e2 + Vz ~e3 V

(7.156)

Homomorfismo entre las rotaciones en el espacio bidimensional y las ~ es rotado para convertirse en V ~ ′: rotaciones en el espacio ordinario. Si el vector V ~ ′ = A˜V ~ V

(7.157)

donde A˜ es la matriz de rotación 3 × 3, el diádico correspondiente en el espacio bidimensional deber´ a presentar una transformaci´ on correspondiente en virtud del mencionado homomorfismo. Como: Vi′ =

3 X j=1

aij Vj

(7.158)

Cinemática del cuerpo r´ıgido / 233 ~′ entonces V~ será: 3

3

1 ~ ′ XX ~σ i aij Vj √ ~ V~ = 2 i=1 j=1

(7.159)

Por otra parte, una transformaci´ on de un diádico es de la forma: ~ ′ ~~ ~ ~~ † ~ ·Q V~ = Q ·V

(7.160)

~~ † ~~ donde Q es el adjunto de Q: †

~~ Q = Q⋆11 eˆ1 eˆ1 + Q⋆21 eˆ1 eˆ2 + Q⋆12 eˆ2 eˆ1 + Q⋆22 eˆ2 eˆ2 ′ ~ ~ es: Expl´ıcitamente V     2 2 X X ~′ =  Qij eî eˆj  ·  V Vkl eˆk eˆl  · i,j=1

2 X

k,l=1

2 X

Q⋆mn eˆn eˆm m,n=1

(7.161)

! (7.162)

˜ V˜ Q ˜ † )im eî eˆm (Q

i,m=1

~′ Por otra parte V~ est´ a dado por (7.159). Por tanto, seg´ un (7.152) y (7.153): 3

i 1 h ˜ ˜ ˜ † ˜ V˜ Q ˜† QV Q + Q 2 12 21

3

i i h ˜ ˜ ˜ † ˜ V˜ Q ˜† QV Q − Q 2 12 21

1 X √ a1j Vj = 2 j=1 1 X √ a2j Vj = 2 j=1 3

1 X √ a3j Vj = 2 j=1

(7.163)

i 1 h ˜ ˜ ˜ † ˜ V˜ Q ˜† − Q QV Q 2 22 11

~~ ˜ El diádico Q Estas ecuaciones nos permiten relacionar A˜ con Q. en (7.160) debe ser unitario: ~~ † ~~ ~~ ~~ † Q ·Q=1=Q ·Q

(7.164)

~~ Si llamamos α, β, γ y δ las componentes de Q: ~~ Q = αˆ e1 eˆ1 + βˆ e1 eˆ2 + γˆ e2 eˆ1 + δˆ e2 eˆ2

(7.165)

234 / Mec´ anica cl´ asica avanzada ~~ † ~~ Q .Q =

(α⋆ eˆ1 eˆ1 + γ ⋆ eˆ1 eˆ2 + β ⋆ eˆ2 eˆ1 + δ ⋆ eˆ2 eˆ2 )· (αˆ e1 eˆ1 + βˆ e1 eˆ2 + γˆ e2 eˆ1 + δˆ e2 eˆ2 ) (|α|2 + |γ|2 )ˆ e1 eˆ1 + (α⋆ β + γ ⋆ δ)ˆ e1 eˆ2

=

(7.166)

+(β ⋆ α + δ ⋆ γ)ˆ e2 eˆ1 + (|β|2 + |δ|2 )ˆ e2 eˆ2 eˆ1 eˆ1 + eˆ2 eˆ2 + eˆ3 eˆ3 = ~~1

=

Con lo cual obtenemos:

|α|2 + |γ|2 = 1 α⋆ β + γ ⋆ δ = 0

(7.167)

|β|2 + |δ|2 = 1 Las ecuaciones (7.167) representan cuatro condiciones sobre los elementos α, β, γ y δ, que por ser complejos contienen ocho par´ ametros. Las relaciones (7.167) dejan 8−4 = 4 par´ ametros independientes. Si además se impone la condición de que el determinante de ˜ sea +1, obtenemos: Q

αδ − βγ = 1 ⇒ β = −γ ⋆ ; δ = α⋆ ; αα⋆ + ββ ⋆ = 1

(7.168)

Con lo cual quedan sólo tres par´ ametros independientes de los ocho que contiene ˜ Entenderemos pues, que en (7.165) α, β, γ y δ satisfacen las condiciones de unitaridad Q. (7.167) y de unimodularidad (7.168). ˜ V˜ Q ˜ † . Esto es: En (7.163) se requiere conocer la matriz Q 

˜ V˜ Q ˜† =  Q =

α

β

γ

δ

 

V11

V12

V21

V22

 

α⋆

γ⋆

β⋆

δ⋆

 

|α|2 V11 +|β|2 V22 +α⋆ βV21 +αβ ⋆ V12

γ ⋆ αV11 +γ ⋆ βV21 +δ⋆ αV12 +βδ⋆ V22

α⋆ γV11 +α⋆ δV21 +β ⋆ γV12 +β ⋆ δV22

|γ|2 V11 +|δ|2 V22 +γ ⋆ δV21 +δ⋆ γV12

!

(7.169)

Cinemática del cuerpo r´ıgido / 235 De (7.163) y (7.169) obtenemos las siguientes relaciones: 3 √ X a1j Vj = (γ ⋆ α + α⋆ γ)V11 + (γ ⋆ β + α⋆ δ)V21 2 j=1

+(δ ⋆ α + β ⋆ γ)V12 + (βδ ⋆ + β ⋆ δ)V22 3 √ X a2j Vj = i(γ ⋆ α − α⋆ γ)V11 + i(γ ⋆ β − α⋆ δ)V21 2 j=1

(7.170)

+i(δ ⋆ α − β ⋆ γ)V12 + i(βδ ⋆ − β ⋆ δ)V22 3 √ X a3j Vj = (|α|2 − |γ|2 )V11 + (|β|2 − |δ|2 )V22 2 j=1

+(α⋆ β − γ ⋆ δ)V21 + (αβ ⋆ − δ ⋆ γ)V12 Como por otra parte:

V1 =

1 √ (V12 + V21 ) 2

V1 =

i √ (V12 − V21 ) 2

V1 =

1 √ (V11 + V22 ) 2

(7.171)

Obtenemos usando (7.170) y (7.171) las siguentes relaciones entre las componentes ˜ igualando coeficientes de los Vij : de A˜ y las de Q, a13 =

γ ⋆ α + α⋆ γ

(a11 + ia13 ) =

δ⋆α + β ⋆γ

a23 =

i(γ ⋆ α − α⋆ γ)

(a21 + ia22 ) =

i(δ ⋆ α − β ⋆ γ)

a33 =

|α|2 − |γ|2

(a31 + ia32 ) =

αβ ⋆ − δ ⋆ γ

(7.172)

236 / Mec´ anica cl´ asica avanzada Con lo cual la matriz A˜ toma la forma:  1 i 2 (α2 − γ 2 + δ 2 − β 2 ) (γ − α2 + δ 2 − β 2 ) γδ − αβ  2 2   1 2 i A˜ =   (α2 + γ 2 − β 2 − δ 2 ) (α + γ 2 + β 2 + δ 2 ) −i(αβ + γδ)  2 2  βδ − αγ

i(αγ + βδ)

αδ + βγ

       

(7.173)

donde hemos usado además las relaciones α⋆ = δ, γ ⋆ = −β de la ecuaci´ on (7.168). A˜ es una matriz que est´ a expresada en términos de α, β, γ, δ, o sea que los par´ ametros α, β, γ, δ, sirven para especificar las rotaciones de un cuerpo r´ıgido. Son llamados los par´ ametros de Cayley-Klein, estudiados por estos autores en los a˜ nos 1875-1879. En resumen, hemos mostrado que si al efectuar una rotación un vector V~ ′ se cambia ~ ′ = A˜V ~ , entonces el diádico V~~ en el espacio bidimensional que corresponde en el vector V

~ ′ ~~ ~~ ~~ † V ·Q . Por tanto, a cada rotación del cuerpo r´ıgido a V~ se transforma en el diádico V~ = Q· ˜ 2 × 2. La matriz Q ˜ es unitaria, Q ˜Q ˜ † = I, ˜ y le corresponde una matriz A˜ y una matriz Q ˜ = 1. El conjunto de todas las matrices unitarias y unimodulares 2 × 2 unimodular, det Q es llamado el grupo SU (2). Hay pues un homomorfismo entre los grupos SO(3) y SU (2). Si en (7.173) se hacen las siguientes sustituciones de los par´ ametros de Cayley-Klein en términos de e0 , e1 , e2 y e3 : α = e0 + ie3 ; γ = −β ⋆ β = e2 + ie1 ;

(7.174)

δ = α⋆

Se obtiene exactamente la matriz (7.141), o sea que en efecto e0 y ei son los par´ ametros de Euler definidos en (7.142). Usando (7.174) y las expresiones para e0 y ei en términos de los ´ angulos de Euler, ecuaci´ on (7.142), obtenemos para α, β, γ y δ en términos de los ´ angulos de Euler: α = ei(φ+ψ)/2 cos

θ ; 2

β = iei(ψ−φ)/2 sen

θ 2

(7.175)

θ θ γ = ie−(ψ−φ)/2 sen ; δ = e−i(φ+ψ)/2 cos 2 2 ~~ El diádico Q definido en (7.166) puede escribirse en términos de los diádicos de ~ Pauli y el diádico unidad, ~~σ i , ~1, reemplazando (7.151) en (7.165): 1 i 1 ~~ ~ 1 Q = (α + δ)~1 + (α − δ)~~σ z + (β + γ)~~σ x + (β − γ)~~σ y 2 2 2 2

(7.176)

que usando (7.174) toma la forma:3 ~~ ~1 + ie1~~σ x + ie2~~σ y + ie3~~σ z Q = e0~ 3 Los

e0 , ei , forman un sistema de cuaterniones.

(7.177)

Cinemática del cuerpo r´ıgido / 237 Para una rotación alrededor del eje x1 , de acuerdo con (7.142) se tiene que e1 = senθ/2, e2 = e3 = 0. Por tanto: θ~ ~~ ~1 + i sen θ ~ ~σ x Q θ = cos 2 2

(7.178)

donde θ es el ´ angulo de rotación. Para una rotación por φ alrededor del eje x3 : φ~ ~~ ~1 + i sen φ ~ Q ~σ z φ = cos 2 2

(7.179)

Cada diádico de Pauli ~ ~σ i est´ a asociado con una rotación alrededor de un eje particular y puede considerarse como el “rotador unitario” para dicho eje. Ejemplo 7.8.1 Mostrar que los diádicos de Pauli anticonmutan mutuamente, esto es, que: ~ ~σ i · ~ ~σ j = −~ ~σ j · ~ ~σ i

(7.180)

Hagamos los nueve productos ~~σ i · ~~σ j , usando las definiciones (7.150): ~ ~ ~σ x · ~ ~σ x = eˆ1 eˆ1 + eˆ2 eˆ2 = ~1 ;

~~σ x · ~~σ y = iˆ e1 eˆ1 − iˆ e2 eˆ2 = i~~σ z

~ ~σ x · ~ ~σ z = −ˆ e1 eˆ2 + eˆ2 eˆ1 = −i~~σy ; ~~σ y · ~~σ x = −iˆ e1 eˆ1 + iˆ e2 eˆ2 = −i~~σ z ~ ~1 ; ~σ y · ~ ~σ y = eˆ1 eˆ1 + eˆ2 eˆ2 = ~

~~σ y · ~~σ z = iˆ e1 eˆ2 + iˆ e2 eˆ1 = i~~σ x

~ ~σ z · ~ ~σ x = eˆ1 eˆ2 − eˆ2 eˆ1 = i~ ~σ y ;

~~σ z · ~~σ y = −iˆ e1 eˆ2 − iˆ e2 eˆ1 = −i~~σx

(7.181)

~ ~1 ~σ z · ~ ~σ z = eˆ1 eˆ1 + eˆ2 eˆ2 = ~ Las ecuaciones (7.181) se pueden escribir en forma compacta as´ı: ~ ~1δij + i ~σ i · ~ ~σ j = ~

3 X

ǫijk ~ ~σ k

(7.182)

k=1

donde ǫij es el tensor de Levi-Civita completamente antisimétrico. Se puede ver directamente que las ~ ~σ i obedecen las relaciones de conmutaci´ on siguientes: ~ ~σ i · ~ ~σ j − ~ ~σ j · ~ ~σ i = 2i

3 X

ǫijk ~~σ k

(7.183)

k=1

y de anticonmutaci´ on: ~ ~1δij ~σ i = 2~ ~σ j · ~ ~σ j + ~ ~σ i · ~ ~~ Ejemplo 7.8.2 Mostrar que Q olicamente como: θ puede escribirse simb´

(7.184)

238 / Mec´ anica cl´ asica avanzada ~~ i~ ~ σx (θ/2) Q θ = e

(7.185)

2 donde el exponencial denota una serie infinita de términos. Como seg´ un (7.181) ~~σ x ≡ 2n 2n+1 ~ ~ ~ ~σ x · ~ ~σ x = ~1, se sigue que ~~σ = ~1 y que ~~σ = ~~σ x para n = 0, 1, 2, ... Por lo tanto: x

x

θ ≡ cos ~ ~σ x 2

2n 1 θ ~~σ x θ (−1)n = ~~1 cos (2n)! 2 2 n=0

θ ~ sen ~σ x ≡ 2

2n+1 1 θ θ n ~ (−1) = ~~σ x sen ~σ x (2n + 1)! 2 2 n=0

∞ X ∞ X

(7.186)

~~ Con lo cual Q θ puede expresarse en la forma: θ θ θ θ ~ ~~ ~ ~ + +i~~σ x sen = cos(~~σ x ) + i sen(~~σ x ) = ei~σ x (θ/2) Q θ = 1 cos 2 2 2 2

(7.187)

† Como ~ ~σ i son herm´ıticos, ~~σ i = ~~σ i , se sigue que:

~~ † −i~ ~ σx (θ/2) Q θ = e

(7.188)

Ejemplo 7.8.3 Hallar la forma de la matriz de rotación para una rotación arbitraria, definida por los ´ angulos de Euler. ~~ Q puede escribirse como el producto de tres rotaciones sucesivas, en virtud del homomorfismo con el grupo de rotaciones: ~ ~ ~ ~~ † Q = ei~σz (ψ/2) ei~σ µ1 (θ/2) ei~σ z (φ/2)

(7.189)

~~ Las tres rotaciones que aparecen en Q son alrededor de los ejes z, µ1 y z. Es deseable expresarlas en términos de rotaciones alrededor de ejes del mismo sistema de coordenadas. Para ello hay que notar que cada uno de los diádicos que aparece en el operador de rotación est´ a asociado con el respectivo eje de rotación. Como el eje x conduce al eje µ1 por medio de la rotación Aφ , correspondientemente ~ on (7.160): ~σ µ1 será, de acuerdo con la ecuaci´ ~ ~ ~ ~σ µ1 = ei~σ z (θ/2)~~σ x · e−i~σz (θ/2)

(7.190)

Como por otra parte: ~1 cos ei~σµ1 (θ/2) = ~ ~

θ θ + i~~σ µ1 sen 2 2

(7.191)

~~ Se sigue, usando la ecuaci´ on (7.190) y la unitariedad Q φ: ~

~

~

~

ei~σµ1 (θ/2) = ei~σz (φ/2) · ei~σx (θ/2) · ei~σ z (φ/2)

(7.192)

Cinemática del cuerpo r´ıgido / 239 ~~ Por tanto Q toma la foma: ~ ~ ~ ~~ Q = ei~σz (ψ/2) ei~σ z (φ/2) ei~σ x (θ/2)

(7.193)

Por otra parte, el eje z se obtiene del eje µ′3 por medio de la rotación Aψ , y µ′1 se obtiene de µ3 = z por medio de A˜θ . Por lo tanto ~~σ z puede escribirse en términos de ~~σ z como: ~ ~ ~ ~ ~ ~σ z = ei~σ z (ψ/2) ei~σ µ1 (θ/2)~ ~σ z e−i~σµ1 (θ/2) e−i~σz (ψ/2)

(7.194)

Usando (7.192): ~ ~ ~ ~ ~ ~ ~σ z = ei~σ z (ψ/2) · ei~σ z (φ/2) · ei~σ x (θ/2) · e−i~σz (φ/2) · σz .ei~σ z (φ/2) ·

e

−i~ ~ σ x (θ/2)

·e

−i~ ~ σ z (φ/2)

·e

(7.195)

−i~ ~ σ z (ψ/2)

~~ ~~ Notando que ~ ~σ z y Q φ conmutan y que Qφ es unitario: ~ ~ ~ ~ ~ ~ ~ ~σ z = ei~σ z (ψ/2) · ei~σ z (φ/2) · ei~σx (θ/2) · σz · e−i~σ x (θ/2) · e−i~σz (φ/2) · e−i~σ z (ψ/2)

(7.196)

Se sigue entonces que: ~

~

ei~σ z (ψ/2) =

~

~

~

~

ei~σz (ψ/2) · ei~σ z (φ/2) · ei~σ x (θ/2) · ei~σ z (ψ/2) · e−i~σ x (θ/2) · ~

(7.197)

~

e−i~σz (φ/2) · e−i~σz (ψ/2) O sea: ~

~

~

~

~

~

ei~σ z (ψ/2) = ei~σ z (φ/2) · ei~σ x (θ/2) · ei~σz (ψ/2) · e−i~σx (θ/2) · e−i~σz (φ/2)

(7.198)

~~ Reemplazando (7.198) en (7.193) obtenemos para Q: ~ ~ ~ ~ ~ ~ ~ ~~ Q = ei~σz (φ/2) ·ei~σ x (θ/2) ·ei~σ z (ψ/2) ·e−i~σ x (θ/2) ·e−i~σ z (φ/2) ·ei~σ z (φ/2) ·ei~σ x (θ/2)

(7.199)

~~ Con lo cual, usando la unitaridad de los operadores, se obtiene finalmente para Q: ~ ~ ~ ~~ Q = ei~σz (φ/2) · ei~σx (θ/2) · ei~σ z (ψ/2)

(7.200)

~~ Hemos conseguido expresar a Q en términos de rotaciones alrededor de los ejes ~~ del sistema de coordenadas espacial. Es posible, de manera análoga, expresar a Q en ~~ términos de rotaciones respecto a los ejes fijos al cuerpo r´ıgido Q de donde toma la forma: ~ ~ ~ ~~ Q = ei~σz (φ/2) · ei~σx (θ/2) · ei~σ z (ψ/2)

(7.201)

Ejercicio 7.8.1 Demostrar que si (e0 , ei ) y (e′0 , e′i ) son los par´ ametros de Euler que describen dos rotaciones A y A′ , entonces los par´ ametros de la rotación A” = A′ A est´ an expresados en términos de los par´ ametros de las rotaciones A, A′ , por:

240 / Mec´ anica cl´ asica avanzada e′1 ′ = e1 e′0 + e2 e′3 − e3 e′2 + e0 e′1 e′2 ′ = −e1 e′3 + e2 e′0 + e3 e′1 + e0 e′2

(7.202)

e′3 ′ = e1 e′2 − e2 e′1 + e3 e′0 + e0 e′3 e′0 ′ = e0 e′0 − e1 e′1 − e2 e′2 − e3 e′3 Ejercicio 7.8.2 Demostrar que si (α, β, γ, δ) y (α′ , β ′ , γ ′ , δ ′ ) son los par´ ametros de CayleyKlein que describen dos rotaciones A y A′ , entonces los par´ ametros (α′′ , β ′′ , γ ′′ , δ ′′ ) de la rotación A′′ = A′ A est´ an expresados en términos de los par´ ametros de A, A′ , por: α′′ = αα′ + γ ′ β

β” = αβ ′ + βδ ′

γ ′′ = γα′ + δ ′ γ

δ” = γβ ′ + δδ ′

(7.203) Ejercicio 7.8.3 Interpretaci´ on geométrica del homomorfismo entre SO(3) y SU (2). Sea una esfera y una figura geométrica F en ella (véase figura 7.10). Se coloca la esfera sobre un plano. La normal al plano en el punto de contacto corta a la esfera en el punto T . La proyección estereogr´ afica de F en el plano es P . Al punto T se le llama vértice de la proyección. T n

F

P

Figura 7.10 Figura geométrica F dentro de una esfera Al rotar la esfera alrededor de n ˆ , en la figura, F se cambia en F ′ y su proyección ′ estereogr´ afica P se cambia en P . Entonces a cada rotación de la esfera le corresponde cierta transformaci´ on en el plano, llamada transformaci´ on homográfica. Estas transformaciones cambian c´ırculos en el plano por c´ırculos en el plano. Sea z = x + iy un punto del plano y z ′ = x′ + iy ′ el punto del plano que se obtiene de z mediante la transformaci´ on homográfica. (a) Mostrar que: z′ =

az + b cz + d

(7.204)

Cinemática del cuerpo r´ıgido / 241 donde a, b, c y d son constantes reales o complejas. (b) Mostrar que el resultado de dos homograf´ıas sucesivas: z′ =

α′ z + β ′ γ ′z + δ′

y

z ′′ =

α′′ z ′ + β ′′ γ ′′ z ′ + δ ′′

(7.205)

Es una homograf´ıa: z ′′′ =

α′′′ Z + β ′′′ γ ′′′ Z + δ ′′′

(7.206)

donde la relaci´ on entre (α′′′ , β ′′′ , γ ′′′ , δ ′′′ ) con (α′ , β ′ , γ ′ , δ ′ ) y (α′′ , β ′′ , γ ′′ , δ ′′ ) est´ a dada por expresiones análogas a (7.203). Argumentar que lo anterior muestra cone~~ xi´ on entre las rotaciones y las transformaciones homográficas, y que por tanto las Q del grupo SU (2) corresponden a transformaciones homográficas, donde los par´ ametros de Cayley-Klein son los par´ ametros que caracterizan la transformaci´ on homográfica correspondiente a una rotación de un sólido r´ıgido (véase el texto de L.V. Ahlfors, An´ alisis de variable compleja, Aguilar, 1966).

7.9.

Las rotaciones infinitesimales. Cinem´ atica de las rotaciones

Las coordenadas r´ıgidamente unidas al cuerpo r´ıgido permiten representar cualquier punto del mismo ~r = (x1 , x2 , x3 ). La rigidez del cuerpo se puede expresar diciendo que ning´ un punto se puede desplazar con relación al origen. Es decir: ~r˙ = 0

(7.207)

Los desplazamientos del cuerpo son detectables en el sistema de coordenadas espacial relacionado con el del cuerpo r´ıgido por medio de la matriz de rotación A˜T , ~r = A˜T ~r. Como el cuerpo r´ıgido se desplaza respecto al sistema de coordenadas espacial, A˜T habr´ a de ser funci´ on del tiempo, con lo cual: ~r(t) = A˜T (t)~r

(7.208)

Es posible escoger los sistemas de coordenadas de modo que ~r(0) = ~r, lo cual implica que: A˜T (0) = I˜

(7.209)

Podemos decir que el cuerpo r´ıgido en el tiempo t estar´ a descrito por la transformación A˜T (t) que evoluciona de manera continua a partir de la transformaci´ on identidad. Además es posible suponer que para un tiempo infinitesimal, A˜T (∆t) difiere de la identidad I˜ por términos del orden de ∆t.

242 / Mec´ anica cl´ asica avanzada Rotaciones infinitesimales. Al cabo de un tiempo infinitesimal ∆t, un punto del cuerpo se habr´ a desplazado una cantidad infinitesimal ∆~r = ~r(∆t) − ~r(0) = ~r(∆t) − ~r0 , respecto a los ejes espaciales. Por lo tanto: ~r(∆t) = ~r0 + ∆~r

(7.210)

Existe alguna matriz, con componentes infinitesimales, ˜ǫ(∆t), tal que: ∆~r = ǫ˜(∆t)~r0

(7.211)

Por lo cual: ~r(∆t) = (I˜ + ˜ǫ)~r0 = (I˜ + ǫ˜)~r(0)

(7.212)

La matriz I˜ + ǫ˜ describe c´ omo est´ an relacionadas las componentes del vector de posición de un punto del cuerpo r´ıgido en los sistemas de coordenadas espacial y del cuerpo r´ıgido, seg´ un la interpretaci´ on pasiva de la matriz de rotación cuando los ejes fijos al cuerpo r´ıgido han rotado alrededor de un eje n ˆ un ángulo δΦ en el sentido de la mano derecha. Desde el punto de vista activo, I˜ + ǫ˜ describe c´ omo cambia el vector de posición de un punto del cuerpo r´ıgido, en el sistema de coordenadas espacial, cuando se rota el cuerpo r´ıgido alrededor del eje n ˆ por un ángulo δΦ seg´ un la regla de la mano izquierda. De acuerdo con esta u ´ltima interpretaci´ on, para Φ infinitesimal, A˜ = I˜ + ǫ˜ estar´ a dada por la ecuaci´ on (7.138):   1 C3 δΦ −C2 δΦ      −C δΦ 1 C δΦ I˜ + ǫ˜ =  (7.213) 3 1     C2 δΦ −C1 δΦ 1 donde C1 , C2 y C3 son los cosenos directores del eje de rotación. De acuerdo con (7.210), (7.137) y (7.211), podemos escribir: ∆~r = ǫ˜~r0 = (~r0 × n ˆ )δΦ = −(ˆ nδΦ) × ~r0

(7.214)

Usando el tensor de Levi-Civita para expresar el producto vectorial: 3 X

ǫij x0j =

3 X 3 X

ǫijk x0j Ck δΦ

(7.215)

j=1 k=1

j=1

Como ~r0 es arbitrario, se debe cumplir: ǫij =

3 X

ǫijk Ck δΦ

(7.216)

k=1

Es decir, la matriz ˜ǫ es completamente antisimétrica: ǫ˜T = −˜ ǫ y proporcional a δΦ. Las rotaciones infinitesimales próximas a la identidad tienen la propiedad conmutativa: (I˜ + ǫã )(I˜ + ǫ˜b ) =

I˜ + ǫã + ˜ǫb + ǫã ǫ˜b

(I˜ + ǫ˜b )(I˜ + ǫã ) =

I˜ + ǫ˜b + ǫã + ǫ˜b ǫã

(7.217)

Cinemática del cuerpo r´ıgido / 243 Vemos que al primer orden en la cantidad infinitesimal δΦ las rotaciones conmutan. En general dos rotaciones finitas no conmutan. Tampoco conmuta una rotación finita con una infinitesimal: ˜ I˜ + ǫ˜) = A(

˜ǫ A˜ + A˜

(I˜ + ˜ǫ)A˜ =

A˜ + ǫÃ˜

(7.218) La rotación inversa a I˜ + ǫ˜ es I˜ − ˜ǫ, al primer orden en δΦ: (I˜ + ǫ˜)(I˜ − ǫ˜) = I˜ − ǫ˜2

(7.219)

O sea que: ~r0 = (I˜ − ˜ ǫ)~r

(7.220)

Por tanto al primer orden en δΦ, ǫ˜~r = ǫ˜~r0 = ∆~r. Generadores infinitesimales del grupo de rotaciones. La matriz ˜ǫ puede escribirse en la forma siguiente, seg´ un (7.213):     0 0 −1 0 0 0          δΦ + C2  0 0 0  δΦ 0 0 1 ǫ˜ = C1          1 0 0 0 −1 0 (7.221)   0 1 0      δΦ −1 0 0 +C3      0 0 0 o también:

ǫ˜ =

3 X i=1

˜ i δΦ = (C1 eˆ2 ∧ eˆ3 + C2 eˆ3 ∧ eˆ1 + C3 eˆ1 ∧ eˆ2 )δΦ Ci G

(7.222)

˜ i se llaman los generadores infinitesimales del grupo de rotaciones. Las matrices G Satisfacen: 1 ~~ G ˆj ∧ eˆk i = ǫijk e 2

(7.223)

El conmutador de dos generadores obedece la siguiente propiedad: ˜i = ˜j − G ˜j G ˜iG G

3 X

k=1

˜k ǫijk G

(7.224)

244 / Mec´ anica cl´ asica avanzada Las ecuaciones (7.224) definen el álgebra de Lie del grupo de rotaciones. Con esta notaci´ on podemos escribir a (7.214) como: 3

X d~r ˜ i ~r Ci G = dΦ i=1

(7.225)

Estas f´ ormulas, como hemos dicho, est´ an dentro de la interpretaci´ on activa de las rotaciones. Velocidad angular. Se define el vector velocidad angular como: d~r dΦ ⇒ = −~ω × ~r (7.226) dt dt El vector ~ ω est´ a situado en el eje de la rotación. Esta direcci´ on se conoce como eje instant´ aneo de rotaci´ on: el eje n ˆ no cambia al realizar la rotación infinitesimal por un angulo dΦ. Sin embargo el desplazamiento del cuerpo r´ıgido puede involucrar el cambio ´ del eje n ˆ . Por esta raz´ on ~ω no es en general la derivada temporal de alg´ un vector; en otras palabras, Ci dΦ no es el diferencial de alguna cantidad, a no ser que los Ci no cambien con el tiempo. ω=n ~ ˆ

C´ alculo de d~r/dt cuando n ˆ tambi´ en cambia con el tiempo. En este caso partimos directamente de la expresión: ˜ r0 ~r(t) = A(t)~

(7.227)

donde de la matriz A˜ convierte al vector ~r0 en el vector ~r. El vector ~r˙ estar´ a dado por: ˙˜r = A ˙Ã˜T ~r ~r˙ = A~ 0

(7.228)

Por otra parte, ~r0 = A˜T ~r nos da: ˙˜T ~r = −AÃ ˙˜T ~r ˙˜T ~r + A˜T ~r˙ ⇒ ~r˙ = −(A˜T )−1 A 0=A

(7.229)

˙˜T = A ˙Ã˜T ˜ = −AÃ Ω

(7.230)

˙˜T = −(A ˙Ã˜T )T = −Ω ˜ = −AÃ ˜ Ω

(7.231)

˜ as´ı: Definimos la matriz Ω

˜ r0 . Además: De (7.228) y (7.229) vemos que ~r = Ω~

˜ es una matriz antisimétrica. Sus elementos son entonces de la forma: Por tanto Ω Ωij =

3 X

ǫijk ωk

(7.232)

k=1

Entonces (7.228) se puede escribir como: x˙ i = (Ω~r)i =

3 X 3 X

j=1 k=1

ǫijk ωk xj = (~r × ~ω)i = −(~ω × ~r)i

(7.233)

Cinemática del cuerpo r´ıgido / 245 Por tanto: ~r˙ = −~ ω × ~r

(7.234)

Podemos expresar a ωi en términos de las Ωij . Para ello multiplicamos (7.232) por ǫijl y sumamos sobre i, j: 3 3 X X

ǫijl Ωij =

3 X 3 X

ǫijl ǫijk ωk

(7.235)

i=1 k=1

i=1 j=1

Ahora usamos la siguiente propiedad de la densidad de Levi-Civita: 3 3 X X

ǫijl ǫijk = 2δlk

(7.236)

i=1 j=1

con lo cual llegamos a: 3

ωl =

3

1 XX ǫijl Ωij 2 i=1 j=1

(7.237)

˜ (7.230), obtenemos: Usando la definición de Ω, 3

ωl =

3

3

1 XXX ˙ Aik Ajk ǫijl 2 i=1 j=1

(7.238)

k=1

donde ~ ω es la velocidad angular de rotación del cuerpo r´ıgido en el sistema de coordenadas espacial, de acuerdo con la interpretaci´ on activa de las rotaciones que estamos utilizando. La ecuaci´ on (7.238) permite hallar las componentes de ω en términos de la ˜ representación que se tenga de la matriz A. ˜ Notamos En términos de los par´ ametros Ci y Φ, usamos la expresión (7.138) para A. que los elementos de A˜ son de la forma:

Aij = δij cos Φ + Cj Ck (1 − cos Φ) +

3 X

ǫjkl Cl senΦ

(7.239)

l=1

Con lo cual A˙ ik es: 3 X d ˙ + d [Ci Ck (1 − cos Φ)] + A˙ ik = −δik senΦ Φ ǫjkm (Cm senΦ) dt dt m=1

(7.240)

246 / Mec´ anica cl´ asica avanzada Como ATkj = Ajk , podemos escribir: 3 X

k=1

d A˙ ik Ajk = −δik senΦ cos Φ Φ˙ + cos Φ [Ci Cj (1 − cos Φ)]+ dt 3 X

ǫijm cos Φ

m=1

Cj

d ˙ (Cm senΦ) − Ci Cj (1 − cos Φ)senΦ Φ+ dt

d [Ci n ˆ (1 − cos Φ)] · n ˆ (1 − cos Φ)+ dt

3 X

d ǫikm (Cm senΦ)Cj Ck (1 − cos Φ)− dt m=1 3 X

˙ + ǫjil Cl sen2 Φ Φ

l=1

3 X

3 X l=1

ǫjkl

d [Ci Ck (1 − cos Φ)]Cl senΦ+ dt

(δji δlm − δjm δli )Cl senΦ

l,m=1

(7.241)

d (Cm senΦ) dt

P3 donde hemos usado la conocida propiedad del tensor de Levi-Civita, l=1 ǫkij ǫklm = δil δjm − δim δjl . Las ecuaciones (7.241) se simplifican notando que n ˆ .n ˆ˙ = 0 y n ˆ×n ˆ=0y P3 ~ ~ ǫ A B = ( A × B) . Luego, al multiplicar por ǫ y sumar sobre i y sobre j, noijk i j k ikl k=1 tando además que ǫijk se anula cuando tiene sub´ındices repetidos, obtenemos finalmente para ~ ω: ˙ +n ω=n ~ ˆΦ ˆ˙ × n ˆ (1 − cos Φ) + n ˆ˙ senΦ

(7.242)

En términos de los par´ ametros de Euler, definidos en (7.139): ω = 2e0~e˙ − 2e˙ 0~e + 2~e˙ × ~e ~

(7.243)

Con la interpretaci´ on activa de las rotaciones, la velocidad angular que hemos obtenido nos permite hallar, por medio de (7.234), la forma en que cambia con el tiempo el vector de posición de un punto arbitrario del cuerpo r´ıgido. La velocidad angular en la interpretaci´ on pasiva de las rotaciones. En esta interpretaci´ on, ~r(t) es el vector de posición de un punto en el sistema de coordenadas espacial, y ~r en el sistema de coordenadas del cuerpo r´ıgido. En este caso: ~r(t) = A˜T (t)~r

(7.244)

y ~r˙ estar´ a dado por: ˜ r = −~ ~r˙ = Ω~ ω × ~r

(7.245)

Cinemática del cuerpo r´ıgido / 247 ahora ~ ω es la velocidad angular de los ejes unidos al cuerpo r´ıgido en el sistema de coordenadas espacial. El tratamiento es igual al anterior, con sólo reemplazar a A˜ por A˜T : ˙˜ = A ˙˜T A˜ ˜ = −A˜T A Ω

(7.246)

donde A˜T se obtiene de (7.138) con sólo reemplazar a Φ por −Φ. ~ω estar´ a dada en términos de A˜ por: 3

ωl =

3

3

1 X X X ˙T Aik Akj ǫijl 2 i=1 j=1

(7.247)

k=1

Se obtiene entonces que: ω ~ = −ˆ nΦ˙ + n ˆ˙ × n ˆ (1 − cos Φ) − n ˆ˙ senΦ

(7.248)

y en términos de los par´ ametros de Euler: ω ~ = −2e˙ 0~e + 2e0~e˙ + 2~e˙ × ~e

(7.249)

ahora n ˆ es el eje alrededor del cual giran los ejes coordenados unidos al cuerpo r´ıgido, y Φ es el ´ angulo de rotación en el sentido de la regla de la mano derecha (contrario a las agujas del reloj). ~ ω puede también ser evaluada en términos de los ángulos de Euler. Para ello hay varias posibilidades de c´ alculo. (a) Considerar que ~ ω tiene componentes a lo largo de los ejes de las rotaciones sucesivas que definen los ´ angulos de Euler: ˙ ez ˙ ez + θˆ ˙eµ + ψˆ ω ~ = φˆ 1

(7.250)

Obviamente (7.250) permite hallar a ω ~ respecto a los ejes espaciales (x, y, z) o respecto a los ejes rotantes (x, y, z). Para hallar a ~ω respecto a los ejes espaciales, basta expresar a ~eµ1 y eˆz en términos de (~ex , ~ey , ~ez ). Usando las expresiones (7.30), podemos escribir: ez ey + (ˆ eµ1 · eˆz )ˆ ex + (ˆ eµ1 · eˆy )ˆ eµ1 · eˆx )ˆ eˆµ1 = (ˆ = cos φ eˆx + senφ eˆy (7.251) eˆz = (ˆ ez · eˆx )ˆ ex + (ˆ ez · eˆy )ˆ ey + (ˆ ez · eˆz )ˆ ez = senθ senφ eˆx + senθ cos φˆ ey + cos θˆ ez donde en (7.251) hemos usado la ecuaci´ on (7.122). Las ecuaciones (7.251) permiten escribir a (7.250) en la forma: ˙ ez + (θsenθ ˙ ω = (φ˙ + cos ψ)ˆ ~ − ψ˙ senψ cos φ)ˆ ey + (θ˙ cos φ + ψ˙ senθ senφ)ˆ ex

(7.252)

248 / Mec´ anica cl´ asica avanzada De manera similar se obtiene para ~ω respecto a los ejes fijos al cuerpo r´ıgido: ~ω = (ψ˙ + φ˙ cos θ)ˆ ey ez + (φ˙ senθ cos ψ − θ˙ senψ)ˆ

(7.253)

+(φ˙ senθ senψ + θ˙ cos ψ)ˆ ex ˜ (b) La otra posibilidad de c´ alculo consiste en usar la ecuaci´ on que define a Ω, (7.246). A˜ se puede expresar como producto de tres rotaciones seg´ un (7.131). Por tanto: ˙˜ ˜ ˙˜ A˜ A˜ + A˜ A ˜ ˜ ˙˜ ˜ = A˜Tφ A˜Tθ A˜Tψ (A Ω ψ θ Aφ + Aψ Aθ Aφ ) ψ θ φ

(7.254)

˜ Usando la ortogonalidad de las matrices A: ˙˜ ˜ ˜ ˙˜ + A˜T A˜T A ˙˜ A˜ + A˜T A˜T A˜T A ˜ = A˜Tφ A Ω φ θ φ θ ψ ψ Aθ Aφ φ θ φ

(7.255)

˙˜ , ... ˜ φ = A˜T A Si llamamos Ω φ φ ˜T ˜T ˜ ˜ ˜ ˜ =Ω ˜ φ + A˜T Ω ˜ ˜ Ω φ θ Aφ + Aφ Aθ Ωφ Aθ Aφ Usando las definiciones (7.127) se llega fácilmente a:     0 0 0 0 1 0         ˜ ˙ ˜ ˙    Ωφ = φ  −1 0 0  Ωθ = θ  0 0 1       0 −1 0 0 0 0 

0

1

  ˜ ψ = ψ˙  −1 0 Ω   0 0

0



(7.256)

(7.257)

  0    0

con lo cual (7.256) conduce al resultado (7.252). (c) Otra v´ıa es expresar a ~ω en términos de los ángulos de Euler usando (7.249) y (7.142), lo cual se deja como ejercicio al lector. Las ecuaciones (7.252) y (7.253) muestran que no hay una relación simple entre las componentes de ~ ω expresadas respecto a los ejes fijos al sólido r´ıgido y respecto a los ejes espaciales. La ecuaci´ on (7.247) da las componentes de ω ~ respecto a los ejes espaciales. Llamaremos ~ω a la velocidad angular respecto a los ejes fijos al sólido r´ıgido. Para hallar ˜ r , de (7.245). Como ~r = A˜T ~r, tenemos que: ~ empecemos por notar que ~r˙ = Ω~ ω ˜ A˜T ~r ~r˙ = Ω

(7.258)

De transformar ~r˙ a las coordenadas del sólido r´ıgido obtenemos: ˜ A˜T ~r A˜~r˙ = A˜Ω

(7.259)

Cinemática del cuerpo r´ıgido / 249 Claramente A˜~r˙ no es ~r˙ , puesto que esta u ´ltima es cero. Usando (7.246) y la or˙˜T , matriz que llamaremos Ω ˜ que es Ω ˜ ˜ A˜ = AÃ togonalidad de A˜ obtenemos que A˜ Ω ˜ transformada a las coordenadas fijas al sólido r´ıgido. La matriz Ω es antisimétrica: T ˙˜ A˜T = −A˜Ω ˙Ã˜T = A( ˜ A˜T = −Ω ˜ =A ˜ A˜T A) ˜ Ω

(7.260)

por tanto puede expresarse como: Ωij =

3 X

ǫijk ω k

(7.261)

k=1

Esto conduce a: ˜~r = −ω ~ × ~r A˜~r˙ = Ω

(7.262)

Entonces se sigue que: 3

3

3

1 XXX ωl = ǫijk Aik A˙ Tkj 2 i=1 j=1

(7.263)

k=1

~ y ~ω en el punto de vista activo de Comparando a (7.238) y (7.263) vemos que ω las rotaciones son antiparalelas, como es de esperarse, o sea que, de acuerdo con (7.243): ~ = −2e0~e˙ + 2~ee˙ 0 − 2~e˙ × ~e ω

(7.264)

Usando (7.264) y (7.142) se obtiene el resultado (7.253). No existen en general, funciones λi (φ, θ, ψ) tales que: ωi =

d λi (φ, θ, ψ) dλ

(7.265)

Por ejemplo, si ω1 = λ˙ 1 se deber´ıa cumplir que: dλ1 ˙ dλ1 ˙ dλ1 ˙ φ+ θ+ ψ = θ˙ cos θ + ψ˙ senθ senφ dφ dθ dψ

(7.266)

y por tanto: dλ1 dλ1 =0; = cos φ ; dφ dθ

dλ1 = senθ senφ dψ

(7.267)

λ1 no existe puesto que: ∂ 2 λ1 ∂ 2 λ1 = 0 ; en tanto que = −senφ ∂θ ∂φ ∂φ∂θ ∂ 2 λ1 ∂ 2 λ1 = 0 ; en tanto que = cos θ senφ ∂ψ ∂θ ∂θ∂ψ ∂ 2 λ1 ∂ 2 λ1 = 0 ; en tanto que = sen θ cos φ ∂ψ ∂φ ∂φ∂ψ

(7.268)

250 / Mec´ anica cl´ asica avanzada La ecuaci´ on (7.265) se cumple solamente cuando φ = θ = 0 o sea cuando ω1 = 0. ˙ θ, ˙ ψ˙ (o de las derivadas Las componentes de ω ~ son combinaciones no integrables de φ, temporales de los par´ ametros usados para describir la rotación), llamadas las derivadas de cuasicoordenadas, o seudocoordenadas. Las ecuaciones de Appell son las ecuaciones de movimiento cuando se usan seudocoordenadas para describir el sistema (véase el texto de Gantmacher, Lectures in analytical mechanics, secci´ on 10). El c´ alculo de ωi implica considerar desplazamientos infinitesimales alrededor de una posición dada del sólido r´ıgido. Pero hay maneras diferentes de realizar esos desplazamientos. Como una rotación finita no conmuta con una infinitesimal, depende del orden en que se efect´ uen las transformaciones. Es de esperarse que ωi sea una derivada total respecto al tiempo sólo en el caso en que el desplazamiento infinitesimal sea alrededor del mismo eje de rotación en que se hizo la rotación finita. Por ejemplo, si A˜ = A˜φ ˙ y ǫ˜ = ˜ǫφ con θ = φ = 0, entonces ω1 = 0; ω2 = 0; ω3 = φ. Tasa de cambios temporales de un vector. Seguimos con el punto de vista ~ cambia con el tiempo en el sistema de pasivo de las rotaciones. Un vector arbitrario G ~ respecto a los ejes espaciales proviene coordenadas fijo al cuerpo r´ıgido. El cambio de G de dos efectos: de la rotación del sistema de ejes del sólido r´ıgido y de la rotación ~ Es decir: intr´ınseca de G. ~ ~˙ dG = G dt cuerpo

~ dG

rotacional

cuerpo

=

~ −~ω × G

(7.269)

espacio

dt

En (7.269) ~ ω est´ a dada por (7.248), que es el negativo de la velocidad angular que usan algunos autores para describir las rotaciones desde el punto de vista pasivo y para ~ ~ los cuales dG = −~ω × G dt. rotacional

espacio

~ visto en los ejes espaciales es: Entonces el cambio en G ~ dG

espacio

~ = dG

cuerpo

~ − ~ω × Gdt

(7.270)

o también: ~ dG dt

!

~ dG dt

= espacio

!

cuerpo

~ − ~ω × G

(7.271)

~ es: La segunda derivada temporal de G ~ d2 G 2 dt

!

espacio

=

~ d2 G 2 dt

!

cuerpo

− 2~ω ×

~ −ω ~ +~ω × (~ω × G) ~˙ × G

~ dG dt

!

espacio

(7.272)

Cinemática del cuerpo r´ıgido / 251 La ecuaci´ on (7.270), y por tanto también (7.271) y (7.272), es válida sólo cuando los ejes espaciales y del cuerpo r´ıgido coinciden instant´ aneamente. Para una posición arbitraria del cuerpo r´ıgido se cumple: ~ = G

~ A˜G

~˙ = G

˙˜G ~ + A˜G ~˙ A

~¨ = G

¨ ¨˜G ˙˜G ~ + 2A ~˙ + A˜G ~ A

(7.273)

~˙ y G ~¨ se pueden Las (7.273) pueden expresarse en funci´ on de ~ω . Los vectores G escribir respecto a los ejes espaciales as´ı: ˙˜G ~˙ = G ~ y ~˙ + A˜T A A˜T G

¨~ ¨˜G ˙˜G ~¨ = G ~ ~˙ + A˜T A A˜T G + 2A˜T A

(7.274)

˙˜ obtenemos: ˜ = −A˜T A, Usando la definición Ω ˜˙ = Ω ˜2 = Ω

˙˜T A ˙˜ − A˜T A ¨˜ −A ˙˜T A˜ −A˜T A ˙˜ = −A ˙˜T A ˙˜ ⇒ Ω ¨˜ ˜˙ = Ω ˜ 2 − A˜T A A

(7.275)

De (7.275) se sigue que: ~˙ = G ~˙ − Ω ˜G ~ A˜T G

(7.276)

¨~ ~¨ = G ˜G ~˙ + (Ω ˜ 2 − Ω) ˜˙ G ~ − 2Ω A˜T G Usando (7.245) obtenemos: ˜G ~ = −~ ~ Ω ω×G

(7.277)

T ˜˙ = d(Ω ˜ T )/dt = −Ω ˜˙ se sigue también que: Como Ω

˜˙ G ~ = −~ ~ Ω ω˙ × G Además se cumple que: ˜ 2G ~ =Ω ˜ −~ ~ = −~ ~ Ω ω×G ω × −~ω × G

(7.278)

(7.279)

De (7.277) y (7.278) se obtiene para (7.276): ~˙ = G ~˙ + ~ ~ ω×G A˜T G ¨~ ~¨ = G ~˙ + ω ~ + ~ω˙ × G ~ + 2~ ω×G ~ × (~ω × G) A˜T G

(7.280)

252 / Mec´ anica cl´ asica avanzada Expl´ıcitamente las ecuaciones (7.280) se pueden escribir as´ı: ! ! i h dG ~ ~ d2 G ~ ˜ + ω ~ × G = A dt2 dt espacio

cuerpo

~ d2 G 2 dt

!

cuerpo

h d2 G ~ = A˜ 2 dt

!

espacio

+ 2~ω ×

~ dG dt

!

(7.281) espacio

i ~ + ~ω˙ × G ~ +~ω × (~ω × G)

˜ esto es, cuando Vemos que (7.271) y (7.272) coinciden con (7.281) cuando A˜ = I, escogemos los ejes de modo que coincidan instant´ aneamente. En particular, para el vector de posición de una part´ıcula moviéndose en el sistema de coordenadas fijo a la Tierra, siendo ~ω la velocidad angular de la Tierra respecto al ˜ sistema de ejes espacial, (7.281) nos da para A˜ = I: ~¨r = ~¨r + 2~ ω × (~r˙ − ~ω × ~r ) + ~ω × (~ω × ~r ) + ~ω˙ × ~r

(7.282)

= ~¨r + 2~ ω × ~r˙ − ~ω × (~ω × ~r) + ~ω˙ × ~r Como para la Tierra ~ω = −ˆ nΦ˙ podemos escribir: ˙ n × ~r˙ − Φ˙ 2 n ~¨r = ~¨r − 2Φˆ ˆ × (ˆ n × ~r)

(7.283)

~ = m~¨r y F~ = m~¨r se sigue que: Como F ~ = F~ − 2mΦˆ ˙ n × ~r˙ − mΦ2 n F ˆ × (ˆ n × ~r)

(7.284)

En el sistema de coordenadas rotante, fijo a la Tierra, la fuerza efectiva no es F~ = m~g sino que hay otros dos términos de naturaleza inercial. El segundo es la fuerza de Coriolis y el tercero es la fuerza centr´ıfuga. La discusi´ on completa de estos efectos puede verse en el texto Classical mechanics de Goldstein, secci´ on 4-9, o en el texto F´ısica, vol. I de Alonso-Finn, secci´ on 6.5.

8 Din´ amica del cuerpo r´ıgido El fin de la din´ amica del cuerpo r´ıgido es describir la evoluci´ on del cuerpo r´ıgido, o sea, hallar las coordenadas generalizadas de rotación en funci´ on del tiempo cuando son conocidas: (i) La distribuci´ on de masa del cuerpo r´ıgido en reposo y (ii) Las fuerzas y ligaduras que act´ uan sobre él. Cuando no hay ligaduras, los ángulos de Euler constituyen un conjunto adecuado de coordenadas generalizadas independientes. Hay distintas formas de llegar a las ecuaciones de movimiento para los ángulos de Euler: a partir del lagrangiano, por medio de tres constantes de movimiento o por medio de las ecuaciones de movimiento de Euler. Cu´ al forma se utiliza es algo que depende del problema particular.

8.1.

El tensor de inercia

Un cuerpo r´ıgido puede considerarse como un sistema de part´ıculas sometido a las ligaduras de que cualquier par de part´ıculas permanece siempre a la misma distancia una de la otra. En muchos casos es u ´til considerar una distribuci´ on continua de materia, de acuerdo con cierta funci´ on de densidad de masa ρ(~r). La masa total, para distribuciones discreta y continua respectivamente, es: M=

N X

mi ;

M=

i=1

Z

ρ(~r)d3~r

(8.1)

Las correspondientes expresiones para la energ´ıa cinética y el momento angular son: T =

N X 1 i=1

~ = L

N X i=1

2

2

mi~r˙ i ;

mi~ri × ~r˙ i ;

T =

Z

~ = L

1 ρ(~r)~r˙ 2 d3~r 2

(8.2)

Z

(8.3)

ρ(~r)~r × ~r˙ d3~r 253

254 / Mec´ anica cl´ asica Similarmente el torque total es: ~ = K

N X i=1

~ri × F~i ;

~ = K

Z

~r × F~ (~r) d3~r

(8.4)

donde F~ (~r) es la fuerza por unidad de volumen en el punto ~r. Las ecuaciones (8.2), (8.3) y (8.4) son cantidades evaluadas en el sistema de coordenadas espacial; es deseable expresarlas en funci´ on de las coordenadas del cuerpo r´ıgido. ~ la Supondremos que el cuerpo r´ıgido se translada a la vez que rota, siendo V velocidad de translaci´ on del origen de coordenadas fijo al cuerpo y ω ~ la velocidad angular de rotación. Las f´ ormulas de transformaci´ on para la posición y la velocidad de un punto arbitrario son, seg´ un las fórmulas (7.5), (7.244) y (7.245): ~ + AT ~r˙ − ~ω × ~r ′ ~r˙ = V

~r = V~ t + AT ~r ;

(8.5)

~ constante. El vector ~ω est´ Por simplicidad hemos tomado a V a dado por (7.248). Si el punto en consideración es del cuerpo r´ıgido entonces se cumple que ~r˙ = 0. Constancia de ω respecto a diferentes sistemas de coordenadas fijos al cuerpo r´ıgido. Sean O1 y O2 dos puntos del cuerpo r´ıgido en los cuales se toma el ~1 y R ~ 2 son los vectores de origen de dos sistemas de coordenadas fijos al cuerpo r´ıgido. R ~ ~2 −R ~ 1 es el vector posición de O1 y O2 respecto a los ejes espaciales, de modo que R = R de posición de O2 respecto a O1 . Sea ~ω1 la velocidad angular de los ejes del cuerpo r´ıgido ~2 = R ~ +R ~1 y R ~1 = R ~2 − R ~ se con origen en O1 y ~ ω2 respecto a O2 . De las fórmulas R sigue que: ~ 2 ~ 1 ~ ~ 1 ~ dR dR dR dR dR ~ ~1 × R (8.6) = + = + −ω dt dt dt dt dt esp

~ 1 dR dt

esp

esp

~ 2 dR = dt

esp

esp

~ dR − dt

esp

esp

~ 2 dR = dt

esp

1

~ dR ~ − ~2 × R +ω dt

en donde usamos los resultados de (7.269) y siguientes. Por tratarse de un cuerpo r´ıgido se sigue que: ~ ~ dR dR = =0 dt dt 1

(8.7)

2

(8.8)

2

Entonces obtenemos de (8.6) y (8.7): ~ 1 ~ 1 dR dR ~ + ~ω2 × R ~ ~1 × R = −ω dt dt esp

(8.9)

esp

Por tanto:

~ =0 (~ ω2 − ω~1 ) × R

(8.10)

Din´ amica del cuerpo r´ıgido / 255 ~ siendo λ arbitraria. Como esta expresión debe cumplirse Entonces ~ ω2 − ω~1 = λR, en el caso l´ımite en que el cuerpo r´ıgido esté en reposo, λ debe anularse, por lo que se llega al resultado importante de que el vector ~ω es independiente del punto del cuerpo r´ıgido que se tome como origen del sistema de coordenadas fijo al cuerpo r´ıgido. Energ´ıa cin´ etica. La energ´ıa cinética respecto a los ejes espaciales, ecuaci´ on (8.2), puede descomponerse usando (8.5): h i 1X ~ 2 − 2V ~ · (~ ω × ~ri ) + (~ω × ~ri ′ )2 mi V 2 i=1 N

T =

(8.11)

Si escogemos el origen de coordenadas del sistema de coordenadas del cuerpo r´ıgido (que coincide con el origen de las coordenadas ~r ′ , seg´ un la figura 7.2) en el centro de masa, se cumple que: N X

′ ~ CM mi~ri ′ = M R =0

(8.12)

i=1

Entonces se sigue que: N

T =

1 ~2 1X mi (~ ω × ~ri ′ )2 MV + 2 2 i=r

(8.13)

Cuando los ejes del cuerpo r´ıgido coinciden instant´ aneamente con los espaciales, ~r = ~ri ′ , en vez de (8.13) podemos escribir: N

T =

2 1 ~2 1X ω × ~r i mi ~ MV + 2 2 i=r

(8.14)

La energ´ıa cinética, pues, consta de dos partes independientes: la energ´ıa cinética del centro de masa y la energ´ıa cinética de rotación respecto al centro de masa. Como ~ω depende de la orientación del cuerpo r´ıgido, seg´ un (7.252), se sigue que la energ´ıa cinética de rotación depende de los ángulos de Euler y sus derivadas temporales: ˙ θ, ˙ ψ) ˙ T = Ttraslacional + Trotacional (φ, θ, ψ, φ,

(8.15)

Es conveniente escribir a Trotacional de la siguiente manera. Usamos la expresión para el producto cruz en términos del tensor de Levi-Civita: 2 ω × ~ri = ǫmnp ωn rip ǫmst ωs r it ~ (8.16) donde los ´ındices mudos m, n, p, s, t, toman los valores 1, 2, 3, que representan a x, y, z, y usamos la convención de Einstein. El tensor de Levi-Civita tiene la propiedad: ǫmnp ǫmst = δns δpt − δnt δps de la cual se sigue que: 2 2 ~ · ~r i ω × ~ri = ω 2 r 2i − ω ~

(8.17)

(8.18)

256 / Mec´ anica cl´ asica La ecuaci´ on (8.18) permite escribir a Trotacional como: Trotacional =

N X 1 mi r2i δst − ris r it ωs ωt 2 i=1

(8.19)

Definimos el tensor de inercia as´ı: Ist =

N X i=1

mi (r 2i δst − r is r it )

(8.20)

o usando la notaci´ on diádica, ecuaci´ on (7.45), N ~~ X mi r 2i ~~1 − ~r i r~i I=

(8.21)

i=1

~ donde ~1 es el diádico unidad; vemos entonces que: 1 ~~ 1 ~ω · I · ~ω = ωs Ist ωt (8.22) 2 2 ~ ~ En la definición de I~ tomamos los ejes del cuerpo r´ıgido; I~ es el tensor de inercia respecto a los ejes del cuerpo r´ıgido con origen en el centro de masa. Sin embargo, cuando ~ = 0, T = Trotacional y la fórmula (8.22) resulta aplicable también en el caso en que el V origen de coordenadas no esté en el centro de masa. Trotacional =

Momento angular. El momento angular en el sistema de coordenadas espacial, ecuaci´ on (8.3), puede descomponerse en una parte del centro de masa y una parte respecto al centro de masa. Cuando los ejes ~r ′ y ~r coinciden instantáneamente, el momento angular de rotación alrededor del centro de masa es: ~ rotacional = L

N X i=1

N h 2 X i mi~r i × ω mi ~ω~ri − r i ω ~ × ~ri = ~ .~r i

(8.23)

i=1

Desarrollando el triple producto vectorial llegamos a una expresión que contiene el tensor de inercia: ~ rotacional = ~I~ · ~ω L (8.24) ~ rotacional son, usando los resultados de la secci´ o sea que las componentes de L on 7.3: ~ (Lrotacional )s = ~es · I~ · ~ω ;

s = 1, 2, 3

(8.25)

~ donde I~ es el tensor de inercia respecto a los ejes del cuerpo r´ıgido con origen en el centro de masa. Momentos de inercia y productos de inercia. Los elementos diagonales del tensor de inercia reciben el nombre de momentos de inercia: N 2 X ~~ mi ~r i − r 2is ; s = 1, 2, 3 Iss = ~es · I · ~es = (8.26) i=1

Din´ amica del cuerpo r´ıgido / 257 ~ Los elementos no diagonales de I~ reciben el nombre de productos de inercia (y a veces el de momentos centr´ıfugos respecto a los planos coordenados): Ist = −

N X

mi r is rit ;

s 6= t = 1, 2, 3

i=1

(8.27)

~~ I es un tensor simétrico, por lo tanto puede ser diagonalizado mediante una transformaci´ on de semejanza realizada por una matriz ortogonal, sus valores propios son reales y sus vectores propios son ortogonales, de acuerdo con conocidos teoremas del álgebra de matrices.1 Momento de inercia respecto al eje de rotaci´ on. Por simplicidad tomaremos el caso en que el eje de rotación instant´ aneamente est´ a fijo, de modo que ~ω est´ a dada por la fórmula (7.226), ω ~ = ωˆ n. Entonces de acuerdo con (8.22), Trotacional puede escribirse como: T =

1 2 Iω 2

(8.28)

donde el n´ umero I est´ a definido as´ı: I =n ˆ·I·n ˆ = In ˆn ˆ=

N X i=1

h 2 i ˆ mi r 2i − ~ri · n

(8.29)

I se denomina el momento de inercia respecto al eje de rotación. De manera similar puede calcularse el momento de inercia respecto a un eje arbitrario, que por supuesto será diferente del I dado en (8.29). La componente de Lrotacional en la direcci´ on de n ˆ es: ~ ~ ·n Lnˆ = L ˆ=n ˆ · I~ · n ˆ

ω = Iω

(8.30)

~ rotacional al cuadrado es: La magnitud de L ~ ~ L2 = ~ ω · I~ · I~ · ω ~ 6= I 2 ω 2

(8.31)

~ será distinto de Lnˆ ; en otras palabras, en general L ~ y ~ω no son o sea que en general L paralelos. De acuerdo con la definición elemental, el momento de inercia del cuerpo r´ıgido respecto al eje n ˆ depende de las distancias Ai de las part´ıculas al eje: In =

N X

A2i mi

(8.32)

i=1

De acuerdo con su definición: A2i = (~r i × n ˆ )2 = ~r i · n ˆ × ~ri × n ˆ 1 V´ ease

(8.33)

por ejemplo el texto de V. I. Smirnov, A course of higher mathematics, vol. III, numeral 40, Pergamon Press, 1964.

258 / Mec´ anica cl´ asica Utilizando un desarrollo similar al de las ecuaciones (8.16), (8.17) y (8.18): n ˆ × ~r i × n ˆ = ~ri − n ˆ n ˆ · ~r i (8.34)

Reemplazando (8.34) en (8.32) llegamos a: In =

N X i=1

h 2 2 i mi ~r i − ~r i .ˆ n

(8.35)

~ Si n ˆ es el eje de rotación vemos que In coincide con I = n ˆ · I~ · n ˆ. Teorema de Steiner. Es un teorema que permite relacionar los momentos de inercia respecto a ejes diferentes. Se llama también el teorema de los momentos de inercia respecto a ejes paralelos. Si ~r es el vector de posición de la part´ıcula i respecto a los ejes del cuerpo r´ıgido con origen en el centro de masa y ~ri ′ respecto a los ejes ~ respecto al centro de masa, del cuerpo r´ıgido con un origen diferente O′ , colocado en R entonces: ~ + ~r i ′ ~r i = R

(8.36)

Manipulaciones simples nos conducen a la relación: I ′ = I + M a2

(8.37)

donde a2 es: ~ ×n a2 = (R ˆ )2

(8.38)

y I ′ es el momento de inercia respecto a un eje paralelo a n ˆ que se separa de él una cantidad a. El teorema de Steiner para el tensor de inercia mismo es: ~~ ′ ~~ ~R ~ I = I + M R2~~1 − R (8.39)

~ ~ donde I~ es el tensor de inercia respecto al centro de masa y I~ ′ es el tensor de inercia ~ respecto a unos ejes del cuerpo r´ıgido con origen en R respecto al centro de masa. ~ ~~ Ejemplo 8.1.1 Expresar a I~ en términos de R ı: i definida as´   0 z i −y i     ~~ ˜ i =  −z i  o sea : R 0 x R ˆm eˆn i  i = ǫmnl xil e    y i −xi 0

(8.40)

Utilizando la propiedad del tensor de Levi-Civita dada en (8.17), llegamos a la ~~ ~~ siguiente expresión par R i · Ri : ~~ ~~ ~ r i~r i − r 2i ~1 R i · Ri = ~

(8.41)

Din´ amica del cuerpo r´ıgido / 259 ~~ Se sigue entonces la siguiente expresión para I: N

X ~ ~ ~~ mi R i · R i I =−

(8.42)

i=1

Ejemplo 8.1.2 Hallar el lagrangiano para una placa uniforme rectangular r´ıgida horizontal que est´ a colocada sobre cuatro resortes iguales, para el caso en el cual el centro de la placa sólo puede tener movimientos perpendiculares a la placa. La placa sólo puede desplazarse verticalmente y girar de modo que el centro permanezca fijo. Entonces las correspondientes energ´ıas cinéticas son: 1 1 ~~ M Z˙ 2 ; Trotacional = ~ω · I.~ ω (8.43) 2 2 Para una placa rectangular homogénea r´ıgida usamos la fórmula correspondiente a (8.21) para una distribuci´ on uniforme de masa: Z ~~ M 2~ ~ I= r I − ~r~r d2~r (8.44) A Ttraslacional =

donde A es el ´ area de la placa y d2~r el elemento diferencial de área. Tomando el plano x − y sobre la placa, con origen en el centro de la misma, y llamando 2a la longitud de la placa (dirección x) y 2b la anchura (dirección y), (8.44) toma la forma: Z Z M ~ ~~ (r2 I~ − ~r~r) dx dy (8.45) I= 4ab Con la elección de coordenadas que hemos hecho, los productos de inercia se anulan ~~ (I es diagonal). Los momentos de inercia son: 1 1 1 M b2 ; Iyy = M a2 ; Izz = M (a2 + b2 ) (8.46) 3 3 3 En vez de tomar como coordenadas generalizadas de rotación a los ángulos de Euler ordinarios, con lo cual la velocidad angular estar´ıa dada por las fórmulas (7.252) o (7.253), tomaremos los ´ angulos de rotación alrededor de los tres ejes perpendiculares fijos a la placa. Esta es la llamada convención “xyz” de los ángulos de Euler; ver el final de la secci´ on 7.6. Las componentes de ~ω a lo largo de los ejes de las rotaciones sucesivas que definen los ´ angulos de Euler en la convención “xyz” son: Ixx =

ω ~ = φ˙ eˆz + θ˙ eˆµ2 + ψ˙ eˆµ′1

(8.47)

Con lo cual se obtiene para las componentes de la velocidad angular respecto a los ejes del cuerpo r´ıgido:2 ~ω = (ψ˙ − φ˙ senθ)ˆ ex¯ + (θ˙ cos ψ + φ˙ cos θ senψ)ˆ ey

(8.48)

+(−φ˙ senψ + φ˙ cos θ cos ψ)ˆ ez¯ 2 Las componentes respecto a los ejes espaciales son (ψ˙ cos θ cos φ − θ˙ senφ, φ ˙ cos θ senφ + θ˙ cos φ, φ˙ − ˙ ψ senθ). V´ ease ap´ endice B del texto de Goldstein, Classical mechanics, 2a ed., Addison Wesley, 1980. ¯

260 / Mec´ anica cl´ asica En las f´ ormulas dinámicas hemos supuesto que los ejes espacial y de cuerpo r´ıgido coinciden instant´ aneamente. Por esto debemos tomar nulos los valores de los ángulos de ~ coinciden instant´ Euler, con lo cual ω ~ yω aneamente: ω = φ˙ eˆz + θ˙ eˆy + ψ˙ eˆx ~

(8.49)

Entonces Trotacional será: Trotacional =

1 1 1 ˙2 ψ Ixx + θ˙2 Iyy + φ˙ 2 Izz 2 2 2

(8.50)

˙ Con la convención ordinaria para los ańgulos de Euler aparecer´ an términos en φ˙ ψ. La energ´ıa potencial en funci´ on de z y de los ángulos de Euler es: V =

1 1 1 1 (4k)z 2 + (4k)(aθ)2 + (4k)(bψ)2 + (4k ′ )(a2 + b2 )φ2 2 2 2 2

(8.51)

En (8.51), k es la constante de estiramiento de los resortes, en tanto que k ′ es la constante asociada a los desplazamientos horizontales, en que no se estiran los resortes y por lo tanto k ′ no se puede expresar en funci´ on de k. El lagrangiano buscado es: L=

M 2 ˙2 1 |b ψ + a2 φ˙ 2 + (a2 + b2 )φ˙ 2 | + M z˙ 2 − 2kz 2 6 2 2 2

2

2

′

2

2

(8.52)

2

−2ka θ − 2kb ψ − 2k (a + b )φ

Vemos que z, φ, θ, ψ, son coordenadas normales.

8.2.

Diagonalizaci´ on del tensor de inercia

El tensor de inercia es simétrico, Ist = Its , con lo cual sus valores propios son reales y los vectores propios correspondientes a valores propios diferentes son ortogonales. En ~ depende general los productos de inercia no son nulos, o sea que cada componente de L de todas las componentes de ω ~: Ls = Is1 ω1 + Is2 ω2 + Is3 ω3 ;

s = 1, 2, 3

(8.53)

~ será proporcional a la si se anulan los productos de inercia, cada componente de L respectiva velocidad angular y T será una forma cuadrática en las componentes de ~ω sin términos cruzados. ~ Como I~ es simétrico, siempre es posible hallar un sistema de coordenadas fijo al cuerpo r´ıgido en que sea diagonal. Esto se logra resolviendo el problema de valores ~~ propios y vectores propios para I: ~~ ~ ~α ; I · Xα = Iα X

α = 1, 2, 3

(8.54)

o en términos de las componentes: 3 X t=1

Irt Xαt = Iα Xαr ;

r, α = 1, 2, 3

(8.55)

Din´ amica del cuerpo r´ıgido / 261 Vamos a admitir que los valores propios Iα puedan ser complejos. Entonces Iβ⋆ satisface: 3 X ⋆ ⋆ ⋆ Xβr = Iβ⋆ Xβt ; t, β = 1, 2, 3 (8.56) Itr r=1

⋆ Multiplicando a (8.55) por Xβr y a (8.56) por Xαt , sumando sobre r y t y restando los resultados obtenemos: 3 X 3 3 X 3 3 X X X ⋆ ⋆ ⋆ ⋆ ⋆ Irt Xαt Xβr − Itr Xβr Xαt = Iα Xαr Xβr Iβ r=1 t=1

t=1 t=1

r=1

(8.57)

−

3 X

⋆ Xαt Xβt

t=1

como Irt es real y simétrica, el lado izquierdo de (8.57) es nulo. El lado derecho puede escribirse como un producto escalar ordinario, quedando: ~α · X ~ ⋆ = 0 ; α, β = 1, 2, 3 (8.58) (Iα − Iβ⋆ )X β

~α ·X ~ ⋆ es real y positivo, que I ⋆ = Iα , Para α = β se sigue de (8.58), debido a que X α α ~α y X ~ β corresponden a valores propios o sea que los valores propios son reales. Cuando X ~ α normalizados diferentes, se sigue que son ortogonales. Escogiendo los vectores propios X ~ ~ β puede no ser a la unidad y notando que cuando ocurra que Iα = Iβ entonces Xα · X ~ 1, X ~2 y X ~ 3 , forman cero, pero que puede escogerse cero, obtenemos de esta manera que X una tr´ıada ortonormal de vectores unitarios: ~α · X ~ β = δαβ ; X α, β = 1, 2, 3 (8.59)

Analicemos más en detalle el caso en que ocurran valores propios degenerados, Iα = Iβ con α 6= β. De (8.58) se sigue que se debe cumplir, en el caso en que I1 6= I2 = I3 , ~1 · X ~2 = X ~1 · X ~ 3 = 0, pero no necesariamente se debe cumplir que X ~2 · X ~ 3 = 0. que X ~ Todos los vectores perpendiculares a X1 son vectores propios correspondientes al mismo valor propio I2 , formando un espacio bidimensional, o sea que sólo hay dos vectores propios de I2 linealmente independientes, con lo cual podemos escoger cualquier par de vectores ortogonales, lo cual nos est´ a a su vez indicando que el sólido r´ıgido posee ~ 1. simetr´ıa de rotación alrededor del eje X ~α Los ejes principales y la transformaci´ on principal. Los vectores propios X constituyen un sistema de tres ejes cartesianos fijos al cuerpo r´ıgido, respecto a los cuales el tensor de inercia es diagonal. Estos ejes se llaman ejes principales de inercia. Los valores propios Iα se llaman momentos principales de inercia. En cualquier caso es posible hallar una transformaci´ on de coordenadas que nos permita pasar a los ejes principales. Tal transformaci´ on se llama transformaci´ on principal y consiste en una rotación. De acuerdo con las f´ ormulas (7.30) y (7.60), las fórmulas de transformaci´ on para los vectores unitarios y para el tensor de inercia serán: ~r = X

3 X s=1

αrs eˆs ;

′ Irs

3 X t,u

αrt αsu Itu ;

r, s = 1, 2, 3

(8.60)

262 / Mec´ anica cl´ asica donde αrs son los cosenos directores de la transformaci´ on. Vemos que las componentes de los nuevos vectores unitarios coinciden con los cosenos directores: Xrs = αrs ;

r, s = 1, 2, 3

(8.61)

Es decir, con los elementos de los vectores propios formamos una matriz que coincide con la matriz de la transformaci´ on principal siendo las filas de tal matriz formadas con las componentes de los vectores propios. Esta matriz es ortogonal. ~ r · eˆs y las Los cosenos directores también pueden escribirse en la forma αrs = X ~~ ~ ~ ′ ~ componentes del tensor de inercia en las formas Irs = Xr · I · Xs y Itu = eˆt · I~ · eû , con lo cual las ecuaciones (8.60) de la derecha quedan en la forma de la identidad siguiente: 3 X ~ s) ~ r · ~I~ · X ~s = ~ r · eˆt ) eˆt · ~I~ · eû (ˆ eu · X (8.62) X (X t,u=1

Como

′ Irs

es diagonal, podemos escribir:

′ ~ r · ~I~ · X ~ s = Is δrs ; =X Irs

r, s = 1, 2, 3

(8.63)

~ 3 = ~~1, obtenemos ~2 + X ~ 3X ~1 + X ~ 2X ~ r, X ~ 1X Usando la completidad de los vectores X ~~ ~ r y sumando sobre r la ecuaci´ al multiplicar a (8.63) por X on de valores propios para I. En términos de componentes la ecuaci´ on de valores propios es (8.55): 3 X t=1

(Irt − Iα δrt )Xαt = 0 ;

r, α = 1, 2, 3

(8.64)

El anterior es un sistema de tres ecuaciones homogéneas en las inc´ ognitas Xαt , que admite soluciones no triviales solamente si los Iα tienen un valor tal que se anule el determinante de la matriz de los coeficientes: ~~ ~ ~ det I − Iα 1 = 0 (8.65) que en forma expl´ıcita es:  Ixx − Iα Ixy   Ixy Iyy − Iα det    Ixz Iyz

Ixz Iyz Izz − Iα



  =0  

(8.66)

La ecuaci´ on (8.66) es c´ ubica en Iα , que tendrá tres ra´ıces reales seg´ un hemos visto; esta ecuaci´ on se llama ecuaci´ on secular. Un cuerpo r´ıgido cuyos tres momentos principales de inercia son diferentes es asimétrico. Si por ejemplo I1 = I2 6= I3 , el ~ 3 . Por simetr´ıa de rotación cuerpo tiene simetr´ıa de rotación alrededor del eje principal X entendemos una rotación que deja inalterado el tensor de inercia; tal rotación puede ~~ representarse mediante cierto diádico ortogonal R. ~~ ~~ ~~ −1 ~~ R ·I ·R = I

(8.67)

Din´ amica del cuerpo r´ıgido / 263 Mediante (8.67) la ecuaci´ on de valores propios para I1 puede escribirse como: ~~ ~~ ~~ −1 ~ ~~ ~ ~ ~1 = R · I · R · X1 = I1 X I · X1 = I1 X

(8.68)

~~ o por la ortogonalidad de R: ~~ −1 ~ ~~ ~~ −1 ~ · X1 ) I · R X1 = I · (R

(8.69)

~~ ~ ~1 y R Las ecuaciones (8.68) y (8.69) nos dicen que los vectores X X1 son vectores ~~ propios de I con el mismo valor propio I1 ; estos dos vectores no necesariamente son ortogonales pero s´ı son linealmente independientes y permiten escribir cualquier vector ~ 3 . Si I1 = I2 = I3 se dice que el cuerpo en el plano perpendicular al eje de simetr´ıa X ~~ r´ıgido es esférico; en este caso I será diagonal respecto a cualquier sistema de ejes del cuerpo r´ıgido con origen en el centro de masa. Ejemplo 8.2.1 Sea un cuerpo r´ıgido formado por once masas discretas iguales distribuidas como se muestra en la figura 8.1. Las ocho masas del plano est´ an sobre una circunferencia de radio a, con un ´ angulo entre s´ı de 45o . Las masas del eje est´ an a una distancia a del centro de la circunferencia. Al rotar el cuerpo alrededor del eje un ángulo 2π/8, coincide consigo mismo; se dice que posee un eje de simetr´ıa de orden 8. Sobre el plano hay también cuatro ejes de simetr´ıa de orden 2. Calcular las componentes del tensor de inercia para este cuerpo y mostrar que dos momentos principales de inercia son iguales. z y

x

Figura 8.1 Cuerpo r´ıgido formado por once masas discretas iguales. Podemos elegir los ejes del cuerpo r´ıgido de modo que coincidan con la posición de algunas de las masas, digamos, tomando el plano x − y en el plano de la figura y el eje z

264 / Mec´ anica cl´ asica a lo largo del eje de simetr´ıa. Con esta elección se anulan los productos de inercia o sea que dichos ejes forman un conjunto de ejes principales y los momentos de inercia serán también momentos principales de inercia. Los valores de los Iα son: I1 = Ixx = 6ma2 ;

I2 = Iyy = 6ma2 ;

I3 = Izz = 8ma2

(8.70)

Vemos que ninguno de los tres momentos principales de inercia es mayor que la suma de los otros dos y que los momentos principales respecto a los ejes del plano de simetr´ıa son iguales. Se puede demostrar que si en vez de x − y se toma cualquier par de ejes en ese plano, perpendiculares o no entre s´ı, el tensor de inercia resulta diagonal, siempre que un eje pueda obtenerse a partir del otro eje mediante una de las operaciones de simetr´ıa del cuerpo. Es decir, cualquier par de ejes no colineales que hagan entre s´ı un ángulo que sea un m´ ultiplo de 2π/8, forma parte del conjunto de ejes principales del cuerpo. Usando el lenguaje de la teor´ıa de grupos, decimos que el cuerpo r´ıgido posee un grupo de simetr´ıas de orden 8, el grupo puntual D4 , que consta de cuatro rotaciones alrededor del eje de simetr´ıa de orden 8, y cuatro rotaciones de π alrededor de ejes horizontales. Además posee un conjunto de simetr´ıas de reflexión en planos horizontales y verticales. El conjunto de los vectores propios correspondientes al valor propio degenerado I1 constituye una representación irreductible del grupo de simetr´ıas D4 .3 El elipsoide de inercia. Sea n ˆ el vector unitario que define una direcci´ on cualquiera. El momento de inercia respecto al eje n ˆ es: 3 X ~ I =n ˆ · I~ · n ˆ= nr Irs ns

(8.71)

r,s=1

donde nx , ny , nz , son los cosenos directores del eje (véase figura 8.2). Si tomamos un punto cualquiera sobre el eje, estar´ a descrito respecto al centro de masa por el vector de posición ~r = (x, y, z) = r(nx , ny , nz ); por lo tanto si multiplicamos por r2 ambos lados en (8.71) obtenemos: In r2 = Ixx x2 + Iyy y 2 + Izz z 2 + 2Ixy xy + 2Ixz xz + Iyz yz

(8.72)

Ahora consideremos un conjunto de ejes que pasen por el centro de masa. Entonces podemos hallar el lugar geométrico de los puntos ~r para los cuales In r2 toma el mismo valor. Este lugar geométrico es una superficie elipsoidal llamada el elipsoide de inercia o elipsoide de momentos de inercia. Es claro que eligiendo adecuadamente el sistema de coordenadas fijo al cuerpo r´ıgido4 se obtiene la ecuaci´ on est´ andar para un elipsoide: x2 y2 z2 + 2 + 2 =1 2 a b c

(8.73)

3 V´ ease el cap´ıtulo de teor´ıa de la simetr´ıa en el libro de Mec´ anica cu´ antica no relativ´ıstica de LandauLifshitz. 4 Que coincide instant´ aneamente con el sistema de coordenadas espacial.

Din´ amica del cuerpo r´ıgido / 265 La ecuaci´ on (8.73) se identificará con (8.72) si se satisfacen las relaciones: a2 =

In r2 ; I1

I1 = Ixx ;

b2 =

In r2 ; I2

I2 = Iyy ;

c2 =

In r2 ; I3

I3 = Izz ;

(8.74)

Irs = 0

si r 6= s

Es claro que tal sistema de coordenadas coincide con el sistema de ejes principales ortogonales del cuerpo r´ıgido y que I1 , I2 , I3 , coinciden con los momentos principales de inercia.

Cuerpo rígido

r n

Elipsoide de inercia: In r 2 = constante

Figura 8.2 Superficie elipsoidal

El elipsoide de inercia es una superficie de la forma: F (x, y, z) = 0

(8.75)

La normal a F en un punto es el gradiente de F en ese punto. En los ejes principales de un elipsoide el gradiente es paralelo al eje: ∂F = Kn ˆ ∂~r En forma expl´ıcita (8.76) es:

(8.76)

∂F = 2xIxx + 2yIxy + 2zIxz = Knx ∂x ∂F = 2xIxy + 2yIyy + 2zIyz = Kny ∂y

(8.77)

∂F = 2xIxz + 2yIyz + 2zIzz = Knz ∂z Si estas ecuaciones las dividimos por 2r, luego multiplicamos la primera por nx y la tercera por nz , el resultado que se obtiene al sumarlas coincide con (8.72) si la constante

266 / Mec´ anica cl´ asica K se identifica con K = 2rIn . Entonces (8.77) coincide con el siguiente sistema de ecuaciones: (Ixx − In )nx + Ixy ny + Ixz nz = 0 Ixy nx + (Iyy − In )ny + Iyz nz = 0

(8.78)

Ixz nx + Iyz ny + (Izz − In )nz = 0 O sea que las ecuaciones (8.76), (8.77) y (8.78) nos dan los ejes principales y los momentos principales de inercia, ya que los ejes principales de inercia coinciden con los ejes principales del elipsoide de inercia. La construcci´ on del elipsoide de inercia permite interesantes análisis cualitativos del movimiento del cuerpo r´ıgido. Es la base de la representación de Poinsot para el estudio del movimiento de un cuerpo r´ıgido no sometido a torques. Ejemplo 8.2.2 ¿Cu´ al es la relación entre el diámetro y la altura de un cilindro circular recto tal que el elipsoide de inercia en el centro del cilindro es una esfera? Tomamos el origen en el centro de masa. En virtud de la simetr´ıa de rotación, cualquier par de ejes perpendiculares al eje y del cilindro forman un sistema de ejes principales. El momento de inercia Izz = I3 , siendo z el eje del cilindro, es: Z Z Z M I3 = (y 2 + x2 ) d3~r (8.79) V donde M es la masa total y V el volumen. Tomando el elemento de volumen como un anillo cil´ındrico de radios ρ y ρ + dρ y altura dl: d3~r = 2πρ dρ dl

(8.80)

Entonces una integraci´ on elemental nos lleva a: I3 =

1 M R2 2

siendo R el radio de la circunferencia de la base del cilindro. El momento de inercia Ixx = I1 es: Z Z Z M I1 = (z 2 + y 2 ) d3~r V

(8.81)

(8.82)

En las dos integrales que aparecen en (8.79) y (8.82) es c´ omodo tomar respectivamente los siguientes elementos de volumen: p (8.83) d3~r = πr2 dz y d3~r = 2lx dy = 2l R2 − y 2 dy Entonces obtenemos para I1 , que además será igual a I2 : 2 1 l I1 = M + R2 4 3

(8.84)

Din´ amica del cuerpo r´ıgido / 267 El elipsoide de inercia será una esfera si I1 = I2 = I3 , de acuerdo con las fórmulas (8.74). De (8.81) y (8.84) se sigue entonces que: l2 = 3R2

(8.85)

Ejemplo 8.2.3 Tres masas iguales est´ an en los puntos (a, 0, 0), (0, a, 2a) y (0, 2a, a), hallar los momentos principales de inercia y un conjunto de ejes principales respecto al origen de coordenadas. Los elementos del  5 0 ~~  0 3 I= 0 −2

tensor de inercia para este problema son:  0 −2  2ma2 3

El valor del determinante secular, ecuaci´ on (8.66), es: ~ ~ det I~ − I~1 ⇒ (5 − i)[(3 − i)2 − 4] = 0

(8.86)

(8.87)

donde hemos llamado: i=

I 2ma2

(8.88)

Las tres ra´ıces de la ecuaci´ on secular son entonces i = 5, 5, 1, con lo cual los tres momentos principales de inercia valen: I1 = 2ma2 ;

I2 = 10ma2 ;

I3 = 10ma2

(8.89)

~ ~ ~ ıcitamente son: Las ecuaciones de valores propios son ~i · X α = iα Xα , que expl´ (5 − iα )Xα1 = 0; (3 − iα )Xα2 − 2Xα3 = 0; −2Xα2 + (3 − iα )Xα3 = 0 ~ 1: X

(8.90)

Para i1 obtenemos las siguientes relaciones entre los componentes del vector propio X11 = 0 ;

X12 = X13

(8.91)

~ 1 normalizado a la unidad es entonces: El vector propio X ~ 1 = 0, √1 , √1 X 2 2

(8.92)

Para la ra´ız doble i2 = i3 = 5 las relaciones entre los componentes de los vectores ~ 2, X ~ 3 , son: propios X 0.Xα1 = 0 ;

Xα2 = −Xα3 ;

α = 2, 3

(8.93)

Vemos que los Xα1 pueden asignarse arbitrariamente, ya que la condición de normalizaci´ on sólo nos permite expresar a Xα2 en funci´ on de Xα1 . Este comportamiento es caracter´ıstico de los problemas de valores propios cuando hay degeneración. Una pareja

268 / Mec´ anica cl´ asica posible de vectores propios normalizados y ortogonales correspondientes al valor propio degenerado i2 = i3 = 5 es: 1 1 ~ 3 = (1, 0, 0) ~ √ √ ; X (8.94) X2 = 0, − , 2 2 La matriz de la correspondiente transformaci´ on principal es:   1 1 √ √ 0  2 2       1  A˜T =  0 − √1 √     2 2    1

0

(8.95)

0

~ 1 se puede construir Es claro que con cualquier par de ejes perpendiculares a X igualmente un sistema de ejes principales respecto al origen de coordenadas (véase figura 8.3). Otro problema ser´ıa hallar los momentos principales y los ejes principales respecto al centro de masa que est´ a localizado en el punto: a ~ = R , a, a (8.96) 3 z

m

m x2 x1

x

m

y

x3

Figura 8.3 Ejes principales de sistema de masas puntuales

8.3.

Las ecuaciones de movimiento de Euler

Vamos a suponer que el cuerpo r´ıgido no tiene ligaduras adicionales a la de poderse mover sólo de modo que un punto permanezca fijo; entonces los ángulos de Euler son coordenadas generalizadas para la descripción del movimiento del cuerpo r´ıgido.

Din´ amica del cuerpo r´ıgido / 269 El lagrangiano del cuerpo r´ıgido. La energ´ıa cinética es puramente rotacional y est´ a dada por la ecuaci´ on (8.22). La energ´ıa potencial dependerá de la orientación del cuerpo, con lo cual la lagrangiana será: ˙ θ, ˙ ψ) ˙ = 1 (I1 ω 2 + I2 ω 2 + I3 ω 2 ) − V (φ, θ, ψ) L(φ, θ, ψ; φ; x y z 2

(8.97)

donde se supone que los ejes fijos al cuerpo r´ıgido son ejes principales. Las fuerzas generalizadas de este problema son: Fφ = −

∂V ; ∂φ

Fθ = −

∂V ; ∂θ

Fψ = −

∂V ∂ψ

(8.98)

Fφ , Fθ y Fψ representan respectivamente el torque externo alrededor del eje espacial z, el torque alrededor de la l´ınea de nodos y el torque alrededor del eje principal del cuerpo r´ıgido z. Las ecuaciones de movimiento de Euler. Son las ecuaciones de movimiento. La ecuaci´ on de Lagrange que contiene el torque alrededor de la coordenada z del cuerpo r´ıgido es: ∂T ∂V d ∂T − =− = Kz dt ∂ ψ˙ ∂ψ ∂ψ

(8.99)

~ obtenemos que: Recordando las f´ ormulas (7.253) para las componentes de ω ∂T ∂ωx ∂T ∂ωy ∂T = + = ωx ωy (I1 − I2 ) ∂ψ ∂ωx ∂ψ ∂ωy ∂ψ

(8.100)

Por otra parte: ∂T ∂T ∂ωz ∂T = I3 ωz = = ˙ ˙ ∂ω ∂ω ∂ψ z ∂ψ z

(8.101)

Entonces la ecuaci´ on de Lagrange (8.99) toma la forma: I3 ω˙ z − ωx ωy (I1 − I2 ) = Kz

(8.102)

La ecuaci´ on (8.102) no depende de las coordenadas generalizadas espec´ıficas que se usen para describir el movimiento; en particular no depende de la convención usada para definir los ´ angulos de Euler, ya que esta sólo influye en las expresiones para las ω. Si hubiéramos usado convenciones para los ángulos de Euler en que componentes de ~ se intercambiaran los papeles de los ejes z y x, y z y y respectivamente, las ecuaciones de movimiento ser´ıan en vez de (8.102), las siguientes: I2 ω˙ y − ωx ωz (I3 − I1 ) =

Ky

I1 ω˙ x − ωy ωz (I2 − I3 ) =

Kx

(8.103)

Por tanto las ecuaciones (8.102) y (8.103) son tres ecuaciones diferenciales independientes que no dependen de la convención usada para definir los ángulos de Euler. En la convención adoptada en el numeral 7.6, las ecuaciones (8.103) no son las ecuaciones

270 / Mec´ anica cl´ asica de lagrange para φ y θ, en tanto que (8.102) es la ecuaci´ on de Lagrange para ψ. No vale tampoco que Fφ y Fθ correspondan a Ky y Kx pues como digimos representan el torque alrededor de z, Kz , y el torque alrededor de la l´ınea de nodos, Kµ1 , respectivamente. Una deducci´ on más simple de las ecuaciones de Euler es la siguiente: el torque total ~ respecto a los ejes espaciales: es igual a la rata de cambio temporal de L ~ d L ~ = K (8.104) dt esp

~ respecto a los ejes rotantes se introduce mediante la fórmula: La derivada de L ~ ~ dL dL ~ (8.105) = + ~ω × L dt dt esp

rot

donde hemos tomado los ejes coincidiendo instant´ aneamente. Las ecuaciones (8.104) y (8.105) nos dan: dLr + ǫr st ωs ωt Lt = Kr ; dt

r = 1, 2, 3

(8.106)

Como escogemos los ejes rotantes coincidiendo con los ejes principales se cumple que Lr = Ir ωr , de modo que obtenemos de (8.106) directamente las ecuaciones de Euler: Ir ω˙r + ǫr st ωs ωt Is = Kr ;

r = 1, 2, 3

(8.107)

Principales casos en que las ecuaciones de Euler se pueden reducir a cuadraturas. Las ecuaciones de Euler han sido reducidas a cuadraturas para valores arbitrarios de las constantes de movimiento en los siguientes casos: (a) El punto fijo es el centro de gravedad del cuerpo, de modo que no hay torques externos. Los valores de los momentos de inercia son arbitrarios. Es el problema del cuerpo r´ıgido libre. Para el cuerpo r´ıgido asimétrico (I1 6= I2 6= I3 ) el problema se reduce a cuadraturas en términos de funciones el´ıpticas y fue resuelto por Euler en 1758. Para el cuerpo r´ıgido simétrico (I1 = I2 6= I3 ) la solución est´ a dada en términos de funciones trigonométricas. Para el cuerpo libre esférico (I1 = I2 = I3 ) la solución es trivial. (b) El caso en que dos momentos principales de inercia alrededor de un punto del cuerpo que no coincide con el centro de masa y fijo en el espacio son iguales (trompo simétrico con un punto fijo). Tanto el punto fijo como el centro de masa est´ an sobre el eje de simetr´ıa. No hay torques de fricción en el punto fijo y el u ´ nico torque es producido por un campo gravitatorio homogéneo. El problema se reduce a cuadraturas en términos de funciones el´ıpticas y fue resuelto por Lagrange en 1788. (c) En 1887 la se˜ nora S.V. Kovalevski halló otro ejemplo soluble. Es el caso en que dos momentos principales de inercia alrededor del punto fijo que no coincide con el centro de masa son iguales entre s´ı, y dos veces más grandes que el tercero (I1 = I2 = 2I3 ). Además, el centro de masa est´ a sobre el plano formado por los ejes principales correspondientes a los momentos principales iguales, y el u ´ nico torque externo es el de la gravedad. La solución est´ a expresada en términos de las funciones hiper-el´ıpticas.

Din´ amica del cuerpo r´ıgido / 271 Ejemplo 8.3.1 Sea un sistema de ejes primados que coinciden en el origen con un sistema de ejes inercial pero que rota con respecto a los ejes inerciales con una velocidad angular fija ω ~ 0 . Hallar las ecuaciones de movimiento de Euler para un cuerpo r´ıgido que se mueve respecto a este sistema de ejes rotantes en el caso en que no haya torques externos, V = 0. El lagrangiano del sistema, considerado como un sistema de part´ıculas, es: N

L=

1 X ˙2 mi~ri 2 i=1

(8.108)

Transformemos primero el lagrangiano de los ejes espaciales a los ejes rotantes, usando f´ ormulas de la secci´ on 7.8. Llamemos A˜ a la matriz de rotación de los ejes rotantes respecto a los ejes espaciales, más adelante usaremos la notaci´ on A˜′ para denotar la matriz de rotación de los ejes del cuerpo r´ıgido respecto a los ejes rotantes. La velocidad ˜ ′ + A˜′ Ω ˜Ω ˜ ′T y por esto no podemos decir a priori que el vector velocidad angular total es Ω angular sea ω ~ +~ ω0 . Si ~r ′ es el vector de posición en los ejes rotantes, sabemos que: ˜r ; ~r ′ = A~

˙˜T ~r˙ ′ + A˜T ~r˙ ′ ~r˙ = A

(8.109)

de modo que: 2 ˙Ã ˙˜T ~r ′ ˙Ã˜T ~r˙ ′ + ~r˙ ′T AÃ ˙˜T ~r ′ + ~r ′T A ~r˙ = ~r˙ ′T AÃ˜T ~r˙ ′ + ~r ′T A

(8.110)

˜ ′ y las propiedades de A: ˜ Usando la siguiente definición de Ω 0 AÃ˜T = I˜ ;

˙Ã˜T + AÃ ˙˜T = 0 ; A

˙Ã˜T ; ˜′ = A Ω 0

˙Ã ˙˜T ˜ ′2 = −A Ω 0

(8.111)

llegamos a: 2 ˜ ′0 ~r˙ ′ − ~r ′T Ω ˜ ′2 r′ ~r˙ = ~r˙ ′2 + 2~r ′T Ω 0 ~

(8.112)

˜ ′0 en términos del vector velocidad Expresando ahora la matriz antisimétrica Ω angular respecto a los ejes rotantes: ˜ ′ ~r ′ = −~ Ω ω0′ × ~r ′ ; 0

˜ 2~r ′ = ω Ω ~ 0′ × (ω0′ × ~r ′ ) 0

(8.113)

Entonces podemos escribir a (8.112) como: 2 2 ~r˙ = ~r˙ ′ − 2~ ω0′ · (~r˙ ′ × ~r ′ ) − ω ~ 0 · [(~ω0′ × ~r ′ ) × ~r ′ ]

La ecuaci´ on (8.114) puede llevarse a la forma: 2 2 ~r˙ = ~r˙ ′ + 2~ ω0′ · (~r ′ × ~r˙ ′ ) + ω ~ 0′ · ~~1 × ~r ′2 − ~r ′~r ′ · ~ω0′

(8.114)

(8.115)

con lo cual llegamos a la siguiente expresión para L: ~ ~′ + 1ω ~ ′ · I~ · ~ω0 L = T′ + ω ~ 0′ · L 2 0

(8.116)

272 / Mec´ anica cl´ asica ~ ′ es el momento angular total respecto a los ejes rotantes e ~I~ es el momento de donde L inercia respecto a dichos ejes. Si ahora el cuerpo r´ıgido se mueve respecto a los ejes primados con velocidad angular ~ ω , es claro que: T′ =

1~ ~ ω · ~I · ~ω 2

(8.117)

~ donde ~I es el momento de inercia respecto a los ejes del cuerpo r´ıgido, que podemos tomarlos como ejes principales. Ahora se cumple que: ~r ′ = A˜′T ~r ;

~r = A˜′~r ′ ;

˙˜ ′ A˜′T ; ˜ =A Ω

˜ r = −~ω × ~r Ω~

(8.118)

˜ la matriz Ω ˜ ′0 respecto a los ejes del cuerpo r´ıgido: Llamamos además Ω 0 ˜ ′ A˜′T ˜ = A˜′ Ω Ω 0 0

(8.119)

Entonces el segundo término de la derecha en (8.112) puede escribirse as´ı: ˙˜ ′T ~r = 2(ω ˜′ A ˜ ′0~r˙ ′ = 2~rT A˜′ Ω ~ 0 × ~r) · (~ω × ~r) 2~r ′T Ω 0 El tercer término de (8.115) puede escribirse como: ~ ~1(~r ′ · ~r ′ ) − ~r ′~r ′ = ~~1r 2 − A˜′T ~r ~rA˜′ = A˜′T ~~1r2 − ~r ~r A˜′

(8.120)

(8.121)

Con lo cual construimos el tensor de inercia respecto a los ejes del cuerpo r´ıgido. Finalmente, L toma la forma: L=

N X ~ ~ 1~ ~ ~ × ~r i + 1 ω ~+ ~0 ~ 0 · ~I · ω mi ~ω 0 × ~ri · ω ω·I ·ω 2 2 i=1

(8.122)

que a´ un puede transformarse en el segundo miembro para dar: L=

~ ~ 1~ ~ ~ + ~ω · ~I · ω ~0 + ω·I ·ω 2

1 ~ ~~ ~ ω0 · I · ω 0 2

(8.123)

Vamos a suponer que ω ~ 0′ est´ a en la direcci´ on del eje x′3 , de modo que las componentes de ~ω 0 serán: ~ 0 = (senθ senψ, senθ cos φ, cos θ)ω0 ω

(8.124)

Entonces los términos que contienen a ~ω0 en (8.123) son de la forma: ~ ~ ~ · ~I · ~ω 0 + 1 ~ω0 · ~I · ~ω0 = ωx ω0 senθ senψ I1 ω 2 +ωy ω0 senθ cos ψ I2 + ωz ω0 cos θ I3 1 + (sen2 θ sen2 ψ I1 + sen2 θ cos2 ψ I2 + cos2 θI3 )ω02 2

(8.125)

Din´ amica del cuerpo r´ıgido / 273 La derivada parcial de (8.125) respecto a ψ es: ω0 (ωy senθ senψ + ωx senθ cos ψ + ω0 sen2 θ senψ cos ψ)I1 +ω0 (−ωx senθ cos ψ − ωy senθ senψ − ω0 sen2 θ cos ψ senψ)I2

(8.126)

= ω0 ωy senθ senψ(I1 − I2 ) + ω0 ωx senθ cos ψ(I1 − I2 ) +ω02 sen2 θ senψ cos ψ(I1 − I2 ) La derivada de estos términos respecto a ψ˙ es I3 ω0 cos θ de modo que la ecuaci´ on de Lagrange para ψ es: (ωx ωy + ωy ω0 senθ senψ + ωx ω0 senθ cos ψ +ω02 sen2 θ senψ cos ψ)(I1 − I2 ) − (ω˙z − θ˙ ω0 senθ)I3 = 0

(8.127)

Esta ecuaci´ on podemos expresarla en términos de las componentes de ~ω 0 : (ωx + ω0x )(ωy + ω0y )(I1 − I2 ) − (ω˙ z + ω˙ 0z )I3 = 0

(8.128)

Usando los mismos argumentos que en las ecuaciones (8.102) y (8.103), podemos concluir que las otras dos ecuaciones de Euler son: (ωx + ω0x )(ωz + ω0z )(I3 − I1 ) − (ω˙ y + ω˙ 0y )I2 =

0

(ωy + ω0y )(ωz + ω0z )(I2 − I3 ) − (ω˙ x + ω˙ 0x )I1 =

0

(8.129)

El resultado exhibe una dependencia “aditiva” con las velocidades angulares. Ejemplo 8.3.2 Si en el lagrangiano de un cuerpo r´ıgido se realiza el siguiente cambio de variables: ˙ θ, ˙ ψ) ˙ → (φ, θ, ψ; ω 1 , ω 2 , ω2 ) (φ, θ, ψ; φ,

(8.130)

encontrar las ecuaciones de Lagrange correspondientes a las nuevas variables, o sea las ecuaciones de Euler.5 De acuerdo con las f´ ormulas (7.253), las fórmulas de transformaci´ on son: ω 1 = cos ψ θ˙ + senθ senψ φ˙ ; ω 2 = −senψ θ˙ + senθ cos ψ φ˙ ;

(8.131)

ω 3 = ψ˙ + cos θ φ˙ y las inversas: φ˙ = ψ˙ = 5 Ver

senψ ω 1 + cos ψ ω2 ; senθ

θ˙ = cos ψ ω1 − senψ ω2

− cot θ(senψ ω 1 + cos ψ ω 2 ) + ω3

el texto de Corben y Stehle, Classical mechanics, secci´ on 77, cap´ıtulo 13, 1960.

(8.132)

274 / Mec´ anica cl´ asica ˙ q˙2 = θ, ˙ q˙3 = ψ, ˙ estas fórmulas pueden escribirse en forma de Si llamamos q˙1 = φ, matrices: ~ω = α ˜ ~q˙ ;

~ q~˙ = β˜ω

donde α ˜ y β˜ son: 

senθ senψ

  α ˜=  senθ cos ψ  cos θ 

   β˜ =   

(8.133)

cos ψ

0

−senψ 0



  0    1

senψ senθ

cos ψ senθ

cos ψ

−senψ

−senψ cot θ

− cos ψ cot θ

0



(8.134)

   0    1

˜ ω) a L[q, q(ω)] Si llamamos L(q, ˙ obtenemos que: ˜ ˜ ∂αsu ∂L ∂L ∂L = + q˙u ∂qr ∂qr ∂ωs ∂qr

(8.135)

˜ d ∂L d ∂L = αsr dt ∂ q˙r dt ∂ωs

(8.136)

y que:

Multiplicando a (8.135) y (8.136) por βrt y sumando sobre r llegamos a la siguiente ˜ expresión para las ecuaciones de Lagrange en L: ˜ ∂αsu ˜ ∂L ∂L βrt + βrt βuυ ω υ = ∂qr ∂ωs ∂qr βrt

˜ ˜ ∂αsr d ∂L ∂L αsr + βuυ ωυ βrt dt ∂ω s ∂ωs ∂qu

(8.137)

Usando la propiedad α ˜ β˜ = I˜ obtenemos finalmente: ˜ ˜ ˜ ∂L d ∂L ∂L βrt − = γtυs ωυ ; ∂qr dt ∂ωt ∂ω s donde: γtυs =

∂αsr ∂αsu − ∂qu ∂qr

t = 1, 2, 3

βrt βuυ

(8.138)

(8.139)

Para nuestro caso, el lagrangiano est´ a dado por la ecuaci´ on (8.97): ~ ˜ ω) = 1 ω ~ · ~I · ω ~ − V (q) L(q, 2

(8.140)

Din´ amica del cuerpo r´ıgido / 275 y as´ı: ˜ ∂L ∂V =− = Kr ; ∂qr ∂qr

˜ ∂L = ωr Ir ∂ωr

(8.141)

Por tanto obtenemos de (8.138): Kr βrt − ω˙ t It =

3 X

γtυs ωυ ω s Is ;

t = 1, 2, 3

(8.142)

υ,s=1

Notemos que γtυs puede escribirse como Astυ − Atsυ , donde: Astυ =

∂αsm βmt βnυ ∂qn

(8.143)

que también puede escribirse como: ∂α ˜ ˜ β βnυ Astυ = ∂qn st

(8.144)

De la expresión expl´ıcita para α ˜ obtenemos que:   cot θ sen2 ψ cot θ senψ cos ψ 0     ∂α ˜ ˜ ˜ ∂α ˜ ˜ 2  cot θ cos ψ 0 β = 0; β =  cot θ senψ cos ψ  ∂q1 ∂q2   −senψ − cos ψ 0 ∂α ˜ ˜ β= ∂q3



0

  +   −1  0

1 0

1

   −1 0   0 0

Se sigue entonces que:  cot θ sen2 ψ   Astυ =   cot θ senψ cos ψ  −senψ 

0



0



(8.145)

  0   0

cot θ senψ cos ψ 2

cot θ cos ψ − cos ψ

0



  0   (cos ψ, senψ, 0)υ  0 st

(8.146)

  0 0   (−senψ cot θ, − cos ψ cot θ, 1)t  0 0 sυ

Es simple concluir a partir de (8.146) que: γtυs = ǫtυs

(8.147)

276 / Mec´ anica cl´ asica Por tanto las ecuaciones (8.142) son: ω˙ t It +

3 X

ǫtυs ωυ ω s Is = Kr βrt ;

t = 1, 2, 3

(8.148)

υ,s=1

Kr son los torques alrededor de los ejes z, µ1 y z, en tanto que los lados derechos de (8.148) son los torques alrededor de los ejes x, y, z. Ejemplo 8.3.3 Otra variante de solución del ejemplo 8.3.1 puede obtenerse partiendo de las ecuaciones de Lagrange (8.138). Para este problema tenemos que: ˜ ∂L ~ ∂ω0 ω + ~ω 0 ) · I~ · = (~ ; ∂~q ∂~q

˜ ∂L ~ + ~ω 0 ) · ~I~ = (ω ~ ∂ω

(8.149)

En términos de componentes, las ecuaciones (8.138) son: 3 X

r,m=1

βrt

∂ω0m (ω 0m + ωm )Im − ω˙ 0t + ω˙ t It = ∂qr 3 X

ǫtυs (ω s + ω0s )Is ω υ

(8.150)

υ,s=1

O en otra forma: (ω˙ 0t + ω˙ t )It =

3 X ∂ω0m βrt − ǫt,m,r ω r (ω 0m + ω m )Im ∂qr r,m=1

Para cualquier funci´ on F se cumple que:  senψ/senθ cos ψ −senψ cot θ  ∂F ˜  β=  cos ψ/senθ −senψ cos ψ cot θ ∂~q  0 0 1



∂F/∂φ



      ∂F/∂θ      ∂F/∂ψ

~ 0 , hallamos que: Usando la expresión (8.124) para ω   0 −ω03 ω 02    ∂ ~ω0 ˜   ω 0 −ω β= 03 01   ∂~q   0 −ω 02 ω 01

(8.151)

(8.152)

(8.153)

O en forma más expl´ıcita: ∂ ~ω0m βrt = −ǫmrt ω0r ∂qr

(8.154)

Din´ amica del cuerpo r´ıgido / 277 Con lo cual concluimos que (8.151) toma la forma: (ω˙ 0t + ω˙ t )It =

3 X

r,m=1

ǫtrm (−ω0r − ωr )(ω 0m + ω m )Im

(8.155)

que coinciden con las ecuaciones (8.128) y (8.129)

8.4.

El movimiento de un cuerpo r´ıgido libre

En este caso en las ecuaciones (8.102) y (8.103) no aparecen torques, Kr = 0. Esto se presenta, por ejemplo, cuando el centro de masa coincide con el punto fijo de modo que la gravedad no produce torques. El cuerpo r´ıgido esf´ erico. Se define por la condición I1 = I2 = I3 = I. ~ yω Es el u ńico caso en el cual los vectores L ~ son paralelos: ~ = I~ L ω

(8.156)

~ como ~ω serán constantes en magnitud y direcci´ Si no hay torques, tanto L on. Cada punto del cuerpo r´ıgido se mover´ a sobre trayectoria circular. No hay precesi´ on de ~ω . La representaci´ on de Poinsot. Es una construcci´ on geométrica que permite analizar el movimiento de un cuerpo r´ıgido libre, el cual puede ser asimétrico. Fue elaborada por Poinsot (Par´ıs, 1834) y se basa en el elipsoide de inercia, descrito en la secci´ on 8.2. La ecuaci´ on del elipsoide de inercia est´ a dada en (8.73). La normal al elipsoide en un punto cualquiera tiene la direcci´ on del vector gradiente de F , siendo F la superficie (8.75): ∂F = (2xI1 , 2yI2 , 2zI3 ) = 2r(n1 I1 , n2 I2 , n3 I3 ) ∂~r

(8.157)

donde hemos tomado un sistema de ejes principales. Si escogemos el punto (x, y, z) sobre el eje de rotación, entonces: ω ~ = ω(n1 , n2 , n3 )

(8.158)

De modo que (8.149) toma la forma: ∂F 2r 2r ~ = (ω1 I1 , ω2 I2 , ω3 I3 ) = L ∂~r ω ω

(8.159)

Hay dos puntos donde el eje de rotación corta la superficie del elipsoide de inercia. De (8.159) podemos concluir que en esos dos puntos siempre se cumple que la normal ~ Cuando no hay torques se cumple que L ~ y por a la superficie est´ a en la direcci´ on de L. ~ son constantes, independientemente de la forma que tenga el movimiento lo tanto ∇F del elipsoide de inercia, el cual se mueve solidariamente con el cuerpo r´ıgido. La energ´ıa cinética se puede escribir en la forma: T =

1 ~ = ω ~r · L ~ ω·L ~ 2 2r

(8.160)

278 / Mec´ anica cl´ asica Cuerpo rígido

Elipsoide de inercia

b a 0

c r P L

∆

ω

F

Figura 8.4 Elipsoide de inercia

que se puede llevar a la forma: ~ ·L ~ =0 (~r − d)

(8.161)

donde d~ es un vector definido por la relación: ~ = 2r T d~ · L ω

(8.162)

~ entonces adquiere la forma: si escogemos a d~ paralelo a L, ~ L 2r T 2 d~ = ω L

(8.163)

~ y es la normal al plano La expresión (8.161) es la ecuaci´ on de un plano, donde L y ~r es un punto del mismo. Como ~r es un punto particular (el punto donde se cortan el eje de rotación y el elipsoide de inercia) que puede estar cambiando con el tiempo, vemos entonces que el elipsoide se mueve de tal manera que el punto donde se corta con el eje de rotación siempre permanece sobre un plano (véase figura 8.4). d~ es un vector constante, pues usando las relaciones: Ir2 = constante y T =

1 2 Iω = constante 2

~ podemos escribir el vector d~ como una expresión que solo depende de T y L: √ 2Ir2 T ~ L d~ = L2

(8.164)

(8.165)

Din´ amica del cuerpo r´ıgido / 279 ~ son constantes, el plano es constante y se llama plano invariable. d~ Como d~ y L es la perpendicular trazada desde el centro del elipsoide al plano tangente, o sea que es ~ la l´ınea que contiene a d~ se llama l´ınea invariable. igual a la proyección de ~r sobre L; Línea invariable Polodia Plano invariable

0 r d P

Herpolodia

r –d ω

L

Figura 8.5 El elipsoide de inercia rueda sin deslizar sobre el plano invariable Podemos concluir que el elipsoide de inercia toca al plano invariable en el punto donde el eje de rotación corta al elipsoide. El radio vector de O a P, ~r, est´ a sobre el eje instant´ aneo de rotación; no hay movimiento relativo entre un punto del elipsoide y un punto del plano; por lo tanto el elipsoide de inercia rueda sin deslizar sobre el plano invariable; en efecto, P est´ a sobre el eje de rotación y por ello es el u ´ nico punto del elipsoide de inercia que est´ a en reposo instant´ aneamente (véase figura 8.5). Como ω ~ es ~ es proporcional a d: ~ proporcional a ~r, la proyección de ~ω sobre L ~ ω ~ ·L ~ = 2T L ~ = L 2 L L2

r

2T ~ d Ir2

(8.166)

~ es constante; es decir, ω ~ o sea que la proyección de ~ ω sobre L ~ precesa alrededor de L, pero sin mantenerse constante el ańgulo entre estos dos vectores, cuyo coseno est´ a dado por: ~ ω ~ ·L Ir2 ω = ωL L r2

(8.167)

~ también puede Como ω y r pueden cambiar, se sigue que el ángulo entre ~ω y L cambiar, lo cual ocurre cuando el cuerpo es asimétrico. La curva trazada por el punto de contacto sobre el elipsoide de inercia se llama polodia (de odos, camino y polein, girar) y la curva correspondiente sobre el plano invariable se llama herpolodia (de herpeton, reptil). ~ no es constante, ver ecuaci´ Respecto a los ejes del cuerpo r´ıgido L on (8.105). De modo que (8.160) ya no representa un plano, sino un elipsoide que es precisamente

280 / Mec´ anica cl´ asica el elipsoide de inercia. Es fácil demostrar que respecto a los ejes del cuerpo r´ıgido la ~ es una constante: magnitud de L d 2 ~ =0 ~ ·L ~˙ = −2L ~· ω ~ ×L (8.168) L = 2L dt Esto implica que respecto a los ejes del sólido r´ıgido ~r est´ a además sobre el elipsoide: I12 x2 + I22 y 2 + I32 z 2 =

Ir2 L2 2T

(8.169)

La polodia es, en consecuencia, el lugar geométrico de los puntos del elipsoide de inercia que satisfacen simult´ aneamente las ecuaciones (8.73) y (8.169); es decir, es el lugar geométrico de la intersección de dos elipsoides cuyos semiejes est´ an dados respectivamente por: a2 :

Ir2 Ir2 L2 Ir2 Ir2 L2 Ir2 Ir2 L2 , ; b2 : , ; c2 : , I1 I1 2T I1 I2 I2 2T I2 I3 I3 2T I3

(8.170)

La existencia de una intersección est´ a asegurada por las desigualdades evidentes: ~ I = ~n · I~ · ~n ≥ I1 ;

I ≤ I3 ⇒ 2T I1 < L2 < 2T I3

(8.171)

siendo I1 el más peque˜ no de los tres momentos principales de inercia e I3 el mayor. El cuerpo r´ıgido sim´ etrico libre en la representaci´ on de Poinsot. Cuando I1 = I2 6= I3 , dos de los semiejes del elipsoide de inercia son iguales, siendo éste un elipsoide de revoluci´ on. Las ecuaciones de la polodia son (8.169) y (8.73): I1 (x2 + y 2 ) + I3 z 2 = Ir2 ;

I12 (x2 + y 2 ) + I32 z 2 =

De estas ecuaciones obtenemos las siguientes: L2 (I1 I3 − I32 )z 2 = Ir2 I1 − 2T 2

2

I1 (I1 − I3 )(x + y ) = Ir

2

L2 − I3 2T

Ir2 L2 2T

(8.172)

(8.173)

Vemos que la polodia est´ a situada a una distancia constante del origen, sobre el eje de simetr´ıa, y es una circunferencia. El elipsoide rueda sin deslizar sobre el plano siendo la polodia una circunferencia, o sea que ~r es paralelo ~ω (el vector de posición del centro de la polodia). El vector forma el mismo ángulo con ~ω, es decir que est´ a a lo largo del eje de simetr´ıa, siempre tienen el mismo ángulo; es decir, el eje de simetr´ıa y ~ω forman un ´ angulo que permanece constante, lo cual significa que ω ~ efect´ ua un movimiento de precesi´ on alrededor del eje de simetr´ıa. La proyección de ~ω sobre el eje z es constante y las proyecciones sobre los ejes x y y ejecutan movimientos armónicos simples con cierta frecuencia Ω. Respecto a los ~ (véase figura 8.6). El vector ~ω ejes espaciales, como se dijo, ~ω precesa alrededor de L precesa en los dos sistemas de ejes generando dos conos. En el sistema espacial ~ω precesa

Din´ amica del cuerpo r´ıgido / 281

Cono del cuerpo rígido 0

Cono fijo

ω z L

Figura 8.6 El cono del cuerpo r´ıgido rueda sin deslizar sobre el cono fijo

~ y en el sistema del cuerpo r´ıgido precesa alrededor del alrededor del vector constante L eje de simetr´ıa. En conclusi´ on, el movimiento del cuerpo r´ıgido puede obtenerse a partir del movimiento del cono del cuerpo r´ıgido que rueda sin deslizar sobre el cono fijo. Es claro que para un cuerpo no simétrico la polodia no será una circunferencia, ~ω ~ En el cuerpo r´ıgido no será constante, como tampoco el ángulo entre los vectores ~ω y L. asimétrico se presentar´ an estos tres movimientos: rotación alrededor del eje instant´ aneo ~ de rotación; precesi´ on del eje instant´ aneo de rotación alrededor del vector constante L ~ y nutaci´ on del eje instant´ aneo de rotación al cambiar el ángulo entre los vectores ~ω y L. Es claro que la frecuencia de nutación es el doble de la frecuencia de rotación. Soluci´ on de las ecuaciones de Euler para un cuerpo r´ıgido sim´ etrico libre. Las ecuaciones de Euler para este problema toman la forma: I1 ω˙ x = ωy ωz (I1 − I3 )

(8.174)

I1 ω˙ y = −ωx ωz (I1 − I3 )

(8.175)

I3 ω˙ z = 0

(8.176)

De (8.174) y (8.175) obtenemos las siguientes dos ecuaciones: I12 ω ¨ x + ωx ωz (I1 − I3 )2 = 0 ;

I1 ω˙ y = −ωz ωx (I1 − I3 )

(8.177)

O sea que la solución a las ecuaciones de Euler puede escribirse como: ωx = A sen(|Ω|t + δ) ;

ωy =

Ω A cos(|Ω|t + δ) |Ω|

(8.178)

a definida por: ωz = constante, donde Ω est´ Ω=

I1 − I3 ωz I1

(8.179)

282 / Mec´ anica cl´ asica El resultado nos dice que el vector ~ω precesa alrededor de z a una rata constante |Ω|. Como no hay nutación se dice que la precesi´ on es regular. El resultado est´ a de acuerdo con las conclusiones obtenidas mediante la construcci´ on de Poinsot. Ejemplo 8.4.1 Analizar el movimiento rotacional de la Tierra con un modelo de cuerpo r´ıgido simétrico libre. La Tierra puede suponerse aproximadamente como un elipsoide achatado y con una distribuci´ on uniforme de materia. Entonces la masa total puede asumirse que est´ a en el centro de masa, de modo que con esta aproximación los dem´ as cuerpos celestes no realizar´ an torques. Los momentos principales de inercia respecto al centro para un elipsoide son: 1 1 1 I2 = M (a2 + c2 ) ; I3 = M (a2 + b2 ) (8.180) I1 = M (b2 + c2 ) ; 5 5 5 Con este modelo tenemos que para la Tierra se cumple: I3 ≈ I1 = I2 ;

c≈a=b

(8.181)

La relaci´ on entre los diámetros polar y ecuatorial nos da: c = 0, 9672 (8.182) a Tomando el eje z a lo largo del eje polar y sabiendo que la rotación completa alrededor de un eje es un d´ıa, obtenemos: 2π = 7, 272 × 10−5 rad/s (8.183) d´ıa La magnitud de la precesi´ on, A, dependerá de la medida en que difieran ω y ωz , que es peque˜ na. La frecuencia de precesi´ on est´ a dada por: I1 − I3 ωz ≈ 1 − c ωz = 0, 00328ωz |Ω| = (8.184) I1 a ωz ≈

El per´ıodo de precesi´ on será pues de unos 305 d´ıas. Se ha observado que tal precesi´ on se presenta siendo su amplitud peque˜ na. El “radio” de la polodia es aproximadamente de 5 a 8 metros. La polodia es una curva complicada que exhibe algo as´ı como una nutaci´ on. El per´ıodo observado es de unos 427 d´ıas; es una precesi´ on no atribuible a torques; las discrepancias se deben a la idealización del modelo. Esta precesi´ on es diferente a la precesi´ on de los equinoccios, debida a los torques ejercidos por el Sol y la Luna, pues en realidad el centro de masa de la Tierra no coincide con el centro geométrico, el per´ıodo de esta precesi´ on es de 25.800 a˜ nos. Esta precesi´ on tampoco es la responsable ´ de las estaciones. Estas se deben a que el plano de la el´ıptica hace un ángulo de 23◦ con el plano ecuatorial de la Tierra. Las funciones el´ıpticas de Jacobi. Haremos un resumen de las principales propiedades de estas funciones que, sabemos, aparecen en la solución general para un cuerpo r´ıgido libre asimétrico.6 6 V´ ease

el texto de Abramowitz y Stegun, Handbook of mathematical functions, cap´ıtulos 16 a 18, 1965; y las referencias dadas en ´ el, especialmente el curso de an´ alisis de Whittaker y Watson.

Din´ amica del cuerpo r´ıgido / 283 Si z es una variable compleja, en general una funci´ on el´ıptica Fpq (z) es una funci´ on que posee un cero en el punto z = p y un polo en el punto z = q, donde p y q son los puntos de una red rectangular infinita en el plano complejo. En la construcci´ on de esta red se parte de una celdilla elemental constituida por un rectángulo cuyos vértices est´ an en los puntos O, K, K + iK ′ , iK ′ , llamados respectivamente s, c, d, n. Los n´ umeros reales K y K ′ est´ an definidos de la siguiente manera en funci´ on de un par´ ametro real m, 0 ≤ m ≤ 1: K=

Z

π/2

0

dθ √ ; 1 − msen2 θ

K′ =

Z

π/2

0

dθ p 1 − (1 − m)sen2 θ

(8.185)

K se llama el cuartiper´ıodo real e iK ′ el cuartiper´ıodo complejo de la funci´ on el´ıptica Fpq (z). Estas funciones se llaman funciones el´ıpticas de Jacobi y usualmente se denotan en la forma pqz. Hay doce de estas funciones que son sc z, sd z, sn z, cs z, cd z, cn z, ds z, dn z, dc z, ns z, nc z, nd z. La definición de las funciones el´ıpticas de Jacobi es: (i) pq z tiene solamente singularidades aisladas; tiene un cero en p y un polo en q; (ii) Las funciones pq z son periódicas. Entre p y q hay un semiper´ıodo de la funci´ on pq z, siendo 2K, 2iK ′ , 2K + 2iK ′ los per´ıodos. As´ı por ejemplo, las funciones copolares con polo en iK ′ , sn, cn y dn tienen respectivamente los per´ıodos 2iK ′ , 2K + 2iK ′ y 2K, o equivalentemente los per´ıodos 4K, 4K y 2K. Las funciones el´ıpticas de Jacobi pueden definirse también con respecto a ciertas integrales. Si: z=

Z

φ 0

dθ √ 1 − m sen2 θ

(8.186)

el ángulo φ es llamado la amplitud y m el par´ ametro. φ = am z

(8.187)

Entonces se definen las funciones as´ı: sn z = sen φ ;

cn z = cos φ ;

dn z =

p 1 − m sen2 φ

(8.188)

Todas las otras nueve funciones pueden expresarse en funci´ on del trio copolar sn, cn, dn. Estas funciones aparecen al evaluar ciertas integrales, llamadas integrales el´ıpticas, que son de la forma: Z R(x, y) dx (8.189) donde R(x, y) es una funci´ on racional de x, y, donde y 2 es igual a un polimonio en x de grado 3 o de grado 4. Cuando R(x, y) sólo contiene potencias pares de y, o cuando el polimonio y 2 tiene un factor repetido la integral (8.189) es elemental. En todos los dem´ as casos aparecer´ an las funciones el´ıpticas. Cualquier integral el´ıptica puede expresarse

284 / Mec´ anica cl´ asica en términos de las integrales el´ıpticas de primera, segunda y tercera clase, definidas respectivamente por: Z φp Z φ dθ √ ; 1 − m sen2 θ dθ ; 1 − m sen2 θ 0 0 (8.190) Z φ dθ p (1 − n sen2 θ)(1 − m sen2 θ) 0

Cuando φ = π/2, las integrales (8.190) se llaman integrales el´ıpticas completas de primera, segunda y tercera clase. Cuando el par´ ametro toma el valor cero las funciones el´ıpticas coinciden con funciones circulares. Cuando el par´ ametro es tan peque˜ no que podemos despreciar términos de orden superior a m2 tenemos las aproximaciones: sn z =

1 sen z − m(z − sen z cos z) cos z + ... 4

cn z =

1 cos z + m(z − sen z cos z) sen z + ... 4

dn z =

1 1 − m sen2 z + ... 2

(8.191)

1 z − m(z − sen z cos z) + ... 4 Cuando m tiende a la unidad, las funciones el´ıpticas coinciden con funciones hiperb´ olicas; por ejemplo sn z → tanh z; cn z → 1/ cosh z; dn z → 1/ cosh z. A partir de la ecuaci´ on diferencial que sirve para definir la funci´ on sn podemos obtener buena informaci´ on del comportamiento de las funciones el´ıpticas, para z real. La ecuaci´ on (8.186) equivale a la ecuaci´ on diferencial: 2 dφ = 1 − msen2 φ (8.192) dx an z =

Mediante la sustitución y = sen φ, (8.192) se transforma en: 2 dy = (1 − y 2 )(1 − my 2 ) dx

(8.193)

2 Claramente y = sen x es la solución cuando m = 0 (véase figura 8.7). (dy/dx) √ es igual a una funci´ on continua de y que se anula en y = ±1 y √ en y = ±1/ m; en m la derivada vale y = ±1 la derivada de esa funci´ o n vale ±2(m − 1) y en y = ±1/ √ ∓2(m − 1)/ m. De (8.193) podemos deducir las siguientes propiedades de la solución, y = s nx: (i) Si y(x) es una solución, y(x + c) es una solución ya que ni y ni dy/dx cambian en una translaci´ on en el eje x. (ii) y(x) est´ a siempre contenida √ entre los valores y = −1 y y = +1 puesto que para valores absolutos de y entre√1 y 1/ m, dy/dx es imaginaria, como también lo es para valores de y mayores que 1/ m.

Din´ amica del cuerpo r´ıgido / 285 (iii) Como para todos los valores de y entre −1 y +1 la derivada dy/dx es no nula, se sigue que en el intervalo (−1, +1) no hay otros puntos diferentes a y = ±1 donde la pendiente se anule dentro del intervalo. (iv) S´ olo hay una curva y(x) que toca una de las l´ıneas y = −1 o y = +1 en un punto x0 dado. Para x < x0 y para x > x0 la pendiente de y en la vecindad de x0 tiene valores opuestos. Por ejemplo, si (x = x0 , y = −1) es el punto en cuestión, se sigue integrando (8.193): Z y dy p x − x0 = − 2 (1 − y )(1 − my 2 ) −1 (8.194) Z y dy p x − x0 = (1 − y 2 )(1 − my 2 ) −1 seg´ un que dy/dx sea negativa o positiva respectivamente. y y=1

dn x sn x x0

x

2K cn x y = –1

Figura 8.7 Funciones circulares cuando se desprecian términos de orden superior a m2 Cuando (x, y) tiende a (x0 , −1), las ecuaciones (8.194) dan la u ńica curva y(x) que satisface la condición de tangencia. (v) La curva y(x) es inalterada mediante una reflexión en el origen. Basta con conocer la curva entre y = 0 y y = 1, o equivalentemente entre x = 0 y x = K para construir la curva total. (vi) La distancia en x entre dos sucesivos contactos de y(x) con las l´ıneas y = −1 y y = +1 est´ a dada por: Z +1 dy p (8.195) 2K = 2 (1 − y )(1 − my 2 ) −1

286 / Mec´ anica cl´ asica (vii) De la simetr´ıa de la curva respecto a la normal en el punto de contacto con una de las l´ıneas y = −1 o y = +1, se sigue que y(x) es periódica con per´ıodo 4K. Podemos entonces definir a sn x por las siguientes propiedades: 2 dsn x = (1 − sn2 x)(1 − msn2 x) ; sn0 = 0 dx (8.196) dsn x = 1 ; sn(x + 4K) = sn x dx x=0 Podemos definir las funciones cn x y dn x por las ecuaciones: cn2 x = 1 − sn2 x ;

dn2 x = 1 − msn2 x

(8.197)

con la condición de que las funciones y sus derivadas sean continuas. Como 0 ≤ m ≤ 1, dnx siempre puede tomarse positiva. El per´ıodo de cn x es 4K y el de dn x es 2K. Se sigue de (8.196) que: dsn x = cn x dn x dx

(8.198)

de (8.196) y (8.197) se sigue entonces que: dcn x = −sn x dn x ; dx

ddn x = −m sn x cn x dx

(8.199)

La figura 8.7 muestra las funciones el´ıpticas de Jacobi sn, cn y dn, para m = 1/2. Con las funciones el´ıpticas es posible hallar fórmulas análogas a las de la trigonometr´ıa ordinaria. Por ejemplo, la fórmula de adici´ on para la funci´ on sn es: sn(u ± υ) =

sn u cn υ dn υ ± sn υ cn u dn u 1 − m sn2 u sn2 υ

(8.200)

Algunos valores notables de sn son: sn 0 = 0 ;

sn K = 1 ;

1 sn(K + iK ′ ) = √ ; m

sn iK ′ = ∞ sn

K 1 =p √ 2 1 + m1

(8.201)

Con estas f´ ormulas podemos hallar la siguiente relación u ´ ltil: 1 ±√ = ±sn(u ± iK ′ ) m sn u

(8.202)

dada por la f´ ormula 16.8.1 del libro de Abramowitz, Op. cit. Relacionadas con las funciones el´ıpticas est´ an las funciones θ, denotadas por θ1 (z, q), θ2 (z, q), θ3 (z, q), θ4 (z, q), cuyas definiciones est´ an en la secci´ on 16.27 del libro de Abramowitz. Otros autores usan la notaci´ on siguiente para las mismas funciones: θ11 , θ10 , θ00 , θ01 , como en el Tratado de mec´ anica anal´ıtica de Wittaker, o en el texto de mecánica de

Din´ amica del cuerpo r´ıgido / 287 Landau (ver bibliograf´ıa). Nos interesar´ a la funci´ on θ4 que tiene la siguiente expresión como un producto infinito (f´ ormula 16.37.4 del del libro de Abramowitz): 1/2 Y ∞ m θ4 (v) = θ4 (0) (1 − 2q 2n−1 cos 2v + q 4n−2 ) (8.203) 16qm21 n=1 donde m y m1 = 1 − m tienen la misma significaci´ on que en las funciones el´ıpticas, y ϑ y q est´ an definidas por: ′ πu ; q = e−πK /K (8.204) v= 2K La siguiente expresión para θ4 (v) como un producto infinito es más u ´ til: θ4 (v) = constante

∞ Y

(1 − q 2n−1 e2iv )(1 − q 2n−1 e−2iv )

(8.205)

n=1

Tomando logaritmos en esta expresión y derivando respecto a v llegamos a la siguiente f´ ormula para la derivada logar´ıtmica de θ4 : ∞ θ4′ (v) X −2iq 2n−1 e2iv 2iq 2n−1 e−2iv + = (8.206) θ4 (v) n=1 1 − q 2n−1 e2iv 1 − q 2n−1 e−2iv Esta expresión tiene polos simples donde θ4 tiene ceros simples, o sea cuando v es tal que: e±2iv = ei(2n−1)πiK

′

/K

(8.207)

es decir, cuando u = 2Kv/π, vale: urm = (2r + 1)iK ′ + 2mK ;

r, n = 0, ±1, ±2. . . ± ∞

(8.208)

Con esta expresión para los polos de θ4′ /θ4 podemos formar la serie de Laurent para esta funci´ on: +∞ +∞ X X brm θ4′ (v) = θ4 (v) r=−∞ m=−∞ v − vrm

(8.209)

donde brm son los residuos de la funci´ on que obtenemos de: brm = l´ım (v − vrm ) v→vrm

θ4′ (v) θ4 (v)

(8.210)

Evaluando esta expresión llegamos finalmente a: +∞ +∞ X X 1 θ4′ (v) = θ4 (v) r=−∞ m=−∞ v − vrm

(8.211)

Soluci´ on de las ecuaciones de Euler para un cuerpo r´ıgido asim´ etrico libre.7 Supondremos que I3 > I2 > I1 . De acuerdo con la representación de Poinsot, 7 Este

problema fue resuelto por Jacobi en 1849.

288 / Mec´ anica cl´ asica las ecuaciones de la polodia est´ an dadas por la intersección del elipsoide de inercia con el elipsoide del momento angular: I1 ω21 + I2 ω 22 + I3 ω 23 = 2E (8.212) I12 ω21 + I22 ω 22 + I32 ω23 = L2 De estas ecuaciones podemos obtener las siguientes expresiones para ω21 y ω23 en funci´ on de ω 22 : ω21 =

1 [(2EI3 − L2 ) − I2 (I3 − I2 ) ω 22 ] I1 (I3 − I1 )

(8.213)

ω23 =

1 [(L2 − 2EI3 ) − I2 (I2 − I1 ) ω 22 ] I3 (I3 − I1 )

(8.214)

La ecuaci´ on de Euler para ω2 , (8.214), toma entonces la forma: ω˙ 2 =

1 √ (2EI3 − L2 ) − I2 (I3 − I2 )ω 22 · I2 I1 I3 1/2 2 (L − 2EI1 ) − I2 (I2 − I1 )ω 22

(8.215)

Al separar variables e integrar obtenemos una expresión que se puede reducir a una integral el´ıptica incompleta de primera clase en la forma normal, llamando: b2 =

2EI3 − L2 ; I2 (I3 − I2 )

a2 =

L2 − 2EI1 I2 (I2 − I1 )

(8.216)

Si para precisar suponemos que 2EI3 > L2 > 2EI2 , encontramos entonces que a2 y b son positivas. Notamos que al expresar a L y a E en funci´ on del momento de inercia alrededor del eje de rotación I, esta condición nos dice que I3 > I > I2 > I1 , con lo cual obtenemos que a es mayor que b. Con estas sustituciones, y escogiendo t = 0 de modo que ω 2 sea igual a cero, la integral de (8.215) es de la forma: 2

I1 I2 I3 t= (I3 − I2 )(L2 − 2EI1 )

1/2 Z

0

ω2

a dω 2 p 2 (a − ω 22 )(b2 − ω 22 )

(8.217)

Mediante la f´ ormula 17.4.45 del Handbook of mathematical functions de Abramowitz y Stegun, la integral en (8.217) puede llevarse a la forma de una integral el´ıptica de primera clase con par´ ametro m dado por: m=

I2 − I1 2EI3 − L2 b2 = 2 a I3 − I2 L2 − 2EI1

(8.218)

Esta integral puede expresarse en términos de la funci´ on el´ıptica sn de acuerdo con (8.188). En efecto, haciendo en (8.217) la sustitución se˜ nalada en la fórmula del Handbook: ω2 = b sn v

(8.219)

Din´ amica del cuerpo r´ıgido / 289 y teniendo en cuenta que, seg´ un (8.198): dω 2 = b cn v dn v dv

(8.220)

obtenemos en el lugar de la integral de (8.217): Z v dn v dv ω2 √ = v = sn−1 2 b 1 − msn v 0

(8.221)

Si llamamos: 1/2 (I3 − I2 )(L2 − 2EI1 ) c= I1 I2 I3

(8.222)

entonces (8.217) se reduce, llamando b2 = b, a: ω 2 = b2 sn ct

(8.223)

Reemplazando a ω2 (t) en (8.213) y (8.214) obtenemos para ω 1 y ω 3 : ω1 =

b1 sn ct

ω3 =

b3 sn ct

(8.224) donde b1 y b3 est´ an dadas por: b21 =

2EI3 − L2 ; I1 (I3 − I1 )

b23 =

L2 − 2EI1 I3 (I3 − I1 )

(8.225)

Al reemplazar la solución (8.224) en las ecuaciones de Euler, éstas resultan compatibles si el producto b1 b2 b3 es negativo. ω1 y ω2 son periódicas con per´ıodo 4K y ω3 es periódica con per´ıodo 2K, donde K es la integral el´ıptica completa de primera clase. El per´ıodo que nos interesa es con respecto al tiempo que est´ a dado por: T =

4K c

(8.226)

~ De acuerdo con la construcci´ on de Poinsot, al cabo de un tiempo T el vector ω completa un ciclo de precesi´ on alrededor del eje z, es decir, ω 1 y ω 2 coinciden consigo mismas, en tanto que al cabo de un tiempo T /2, ω 3 coincide consigo misma. El problema no termina hallando a ω r (t), pues interesa describir el movimiento absoluto del cuerpo r´ıgido en el espacio, o sea hallar los ángulos de Euler en funci´ on del tiempo. Reemplazando las expresiones (8.224) y (8.225) en (8.131), obtenemos tres ecuaciones diferenciales para θ, φ y ψ, cuya solución es complicada cuando los ejes espaciales se toman arbitrariamente, pero se simplifica un poco tomando el eje z en la direcci´ on de ~ Como el ángulo polar y el ángula l´ınea invariable definida por el vector constante L. ~ que coincide con el eje z, son respectivamente θ y π/2 − ψ, lo acimutal del vector L, podemos sin más escribir: L1 = L senθ senψ ;

L2 = L senθ cos ψ ;

L3 = L cos ψ

(8.227)

290 / Mec´ anica cl´ asica Como Lr = Ir ω r obtenemos que: 1/2 I3 (L2 − 2EI1 ) I3 ω 3 = dn ct cos θ = L L2 (I3 − I1 ) tan ψ =

I1 ω 1 I1 (I3 − I2 ) = I2 ω 2 I2 (I3 − I1 )

1/2

(8.228)

cn ct sn ct

θ y ψ al igual que las componentes de ~ω son funciones periódicas, con per´ıodo igual al de la funci´ on dn, o sea T /2. En efecto, dn z y cn z/sn z = cs z son coperiódicas con per´ıodo 2K. El ´ angulo φ se puede obtener de (8.132) y (8.228). El resultado para φ˙ en funci´ on de las componentes de ~ω solamente es: I1 ω 2 + I2 ω 22 L φ˙ = 2 12 I1 ω 1 + I22 ω22

(8.229)

φ˙ es periódica con per´ıodo T /2. En general, φ no se incrementar´ a por un m´ ultiplo de 2π en un per´ıodo y por ello el movimiento del cuerpo r´ıgido como un todo no es periódico, o sea que el cuerpo r´ıgido en general no vuelve nunca a su posición inicial. En efecto, reemplazando en (8.229) las expresiones (8.224) y (8.225) obtenemos: φ˙ = L

(I3 − I2 ) + (I2 − I1 )sn2 ct I1 (I3 − I2 ) + I3 (I2 − I1 )sn2 ct

(8.230)

Ahora, podemos definir una cantidad real β por medio de estas expresiones que son mutuamente consistentes: 1/2 1/2 I(I3 − I1 ) I3 (I − I1 ) ; cn iβ = sn iβ = i I1 (I3 − I) I1 (I3 − I) (8.231) 1/2 I2 (I3 − I1 ) dn iβ = I1 (I3 − I2 ) I que no es el momento de inercia respecto al eje de rotación, está dado por:

L2 2E de modo que la expresión para m toma la forma: I=

m=

I3 − I I2 − I1 I − I1 I3 − I2

(8.232)

(8.233)

φ˙ toma la siguiente forma al reemplazar a (8.231) en (8.230): L I2 + (I1 dn2 iβ − I2 )sn2 ct φ˙ = I1 I2 1 − m sn2 iβ sn2 ct

(8.234)

Esta expresión es de la forma (Ax + Bsn2 ct)/(Cx + Dsn2 ct) o sea es el cociente de dos funciones lineales de x. Al efectuar el cociente llegamos a: 1 dn2 iβ sn2 ct 1 L +L − (8.235) φ˙ = I1 I2 I1 1 − m sn2 iβ sn2 ct

Din´ amica del cuerpo r´ıgido / 291 Examinemos la estructura anal´ıtica del segundo término en (8.235). Tiene singularidades en los valores de ct tales que se anula el denominador: ±1 sn ct = √ = sn (±iβ + iK ′ ) m sn iβ

(8.236)

donde hemos usado la f´ ormula (8.202). Usando la propiedad de la funci´ on sn de ser doblemente periódica, con per´ıodos 2iK ′ , 4K y 4K + 4iK ′, podemos concluir de (8.236) que snu = (−1)r sn (u + 2mK + 2riK ′ ) y por lo tanto: (−1)r ct = ±iβ + (2r + 1)iK ′ + 2mK ;

r, m = 0, ±1, ±2, ...

(8.237)

Estos ceros del denominador son simples, o sea que la funci´ on puede expandirse en series de Laurent de la forma (8.209): " X +∞ +∞ X 1 1 arm L − I2 I1 r=−∞ m=−∞ (−1)r ct + iβ − urm (8.238) # brm − + constante (−1)r ct − iβ − urm Para evaluar los residuos, expandimos el denominador en (8.235) en serie de Taylor alrededor de los ceros, (8.237): 1 − m sn2 iβ sn2 ct = 1 − m sn2 iβ sn2 (±iβ + iK ′ ) + [(−1)r ct − (±iβ + urm )] 2m sn2 iβ sn(±iβ + iK ′ )·

(8.239)

cn(±iβ + iK ′ ) dn(±iβ + iK ′ ) donde hemos usado la periodicidad de las funciones el´ıpticas. Usando (8.236) y luego las expresiones (8.231), llegamos a que arm y brm valen respectivamente: ±

1/2 dn iβ 1 I1 I2 (I3 − I2 )(I − I1 ) =± 2m sn iβ cn iβ 2i II3 (I2 − I1 )

(8.240)

Los residuos del segundo término de (8.235) son entonces: ±i

c 2

(8.241)

Por tanto el segundo término del lado derecho de (8.235) es: " +∞ +∞ 1 c X X i r 2 r=−∞ m=−∞ (−1) ct + iβ − urm −

#

1 + constante (−1)r ct − iβ − urm

(8.242)

292 / Mec´ anica cl´ asica Es f´ acil ver que u−r,−m = ur−1,m , con lo cual es posible hacer que los términos con r impares tengan la misma forma de los términos con r pares. Entonces (8.242) es igual a una expresión que no contiene el (−1)r . Usando la expresión (8.226) para c y luego multiplicando numeradores y denominadores por π/(2K), obtenemos: " +∞ +∞ π X X 1 i T r=−∞ m=−∞ π (ct + iβ) − vrm 2K (8.243) # 1 + constante − π (ct − iβ) − vrm 2K Comparando ahora a (8.243) con (8.236), obtenemos finalmente la siguiente expresi´ on para φ˙ en términos de las funciones θ: " L iπ θ4′ [(ct + iβ)π/(2K)] ˙ φ= + I1 T θ4 [(ct + iβ)π/(2K)] # θ4′ (iβπ/2K) θ4′ [(ct − iβ)π/(2K)] (8.244) −2 − θ4 [(ct − iβ)π/(2K)] θ4 (iβπ/(2K) La integraci´ on ahora es simple:

2π t + iα L i 2πi θ4′ (iα) T φ(t) = t + ln − 2π I1 T θ4 (iα) 2 θ4 t − iα T

θ4

(8.245)

donde definimos a α = πβ/(2K). De acuerdo con la expresión (8.203), la funci´ on θ4 (v) tiene per´ıodo π y además es funci´ on par de v, de modo que al completarse un per´ıodo de θ y ψ, o sea cuando t = T /2, el término logar´ıtmico de φ se anula. Entonces: T L T θ′ (iα) φ = − πi 4 (8.246) 2 I1 2 θ4 (iα) Como θ4 tiene la expansi´ on: θ4 (v) = 1 − 2q cos v + 2q 4 cos4 v − ... Entonces: T LT q senh2α − 2 q 4 senh4α + ... φ = + 4π 2 2I1 1 − 2q cosh 2α + 2q 4 cosh 4α − ...

(8.247)

(8.248)

sólo en circunstancias muy especiales esta expresión será un m´ ultiplo entero de 2π; por esta raz´ on el cuerpo r´ıgido no vuelve nunca a su posición inicial. Ejemplo 8.4.2 Estudiar la estabilidad de las rotaciones de un cuerpo r´ıgido asimétrico libre alrededor de cada uno de los ejes principales.

Din´ amica del cuerpo r´ıgido / 293 Asumamos que el cuerpo inicialmente gira alrededor del eje x1 y que además I3 > I2 > I1 . Por efecto de alguna peque˜ na perturbación el cuerpo adquiere rotaciones nas alrededor de los otros ejes; asumiremos que ω2 y ω3 son entonces cantidades peque˜ on de Euler para ω1 contendrá el producto ω2 ω3 , o sea en comparaci´ on con ω1 . La ecuaci´ que al primer orden en estas cantidades ω 1 es constante. Esto permite resolver fácilmente las otras dos ecuaciones de Euler: I3 − I1 I1 − I2 ω˙2 = ω 1 ω 3 ; ω˙3 = ω1 ω 2 (8.249) I2 I3 De aqu´ı obtenemos la siguiente ecuaci´ on diferencial para ω2 : (I1 − I3 )(I1 − I2 ) 2 2 ω¨2 + ω1 ω2 = 0 I2 I3

(8.250)

Esta ecuaci´ on tiene como solución: ω 2 = A sen(Ω1 t + δ)

(8.251)

donde A es una cantidad peque˜ na y Ω1 satisface: 1/2 (I3 − I1 )(I2 − I1 ) ω1 Ω1 = I2 I3

(8.252)

Como Ω1 es real, entonces ω 2 y ω 3 tendrán movimientos oscilatorios con frecuencia Ω1 . La rotación alrededor de x1 es estable. De manera similar, cuando el cuerpo rota inicialmente alrededor de x3 , el movimiento es estable con frecuencia: 1/2 (I3 − I2 )(I3 − I1 ) ω3 (8.253) Ω3 = I1 I2 Sin embargo, cuando el cuerpo rota inicialmente alrededor de x2 el movimiento es inestable porque Ω2 resulta imaginario. O sea que para rotaciones alrededor del eje de menor momento de inercia o del eje de mayor momento de inercia hay estabilidad, siendo inestable la rotación alrededor del eje correspondiente al momento de inercia intermedio. Para un cuerpo r´ıgido simétrico, digamos para el cual I1 = I2 , es fácil mostrar que solamente es estable la rotación alrededor del eje x3 . Ejemplo 8.4.3 Calcular los diferentes per´ıodos asociados con el movimiento libre de un elipsoide homogéneo asimétrico cuyos semiejes tienen las longitudes a = 0, 1m, b = 0, 2m, c = 0, 3m y cuya masa es de 1 kg. Los valores iniciales de las componentes de la velocidad angular alrededor de los ejes principales son ω1 = πs−1 , ω 2 = 10πs−1 , ω 3 = πs−1 , asumiendo que I1 < I2 < I3 . De acuerdo con las f´ ormulas (8.180), los valores de los momentos principales de inercia son: I1 = 0, 010 kg m2 ;

I2 = 0, 020 kg m2 ;

I3 = 0, 026 kg m2

(8.254)

Los valores de las constantes de movimiento 2E y L son: 2E = 2, 036π 2J ;

L2 = 0, 040776π 2J2 s2

(8.255)

294 / Mec´ anica cl´ asica Reemplazando estos valores en (8.232) hallamos que I vale: I = 0, 0200275 kg m2

(8.256)

Definiendo el ´ angulo modular γ como m = sen2 γ, y usando la fórmula (8.218) para m hallamos que m y γ valen: m = 0, 9926866 ;

γ = 85, 09◦

(8.257)

La tabla 17.2 del texto de Abramowitz y Stegun nos da los siguientes valores para q, K y K ′ , usando interpolaci´ on lineal: K = 3, 8516333 ;

K ′ = 1, 5736950 ;

q = 0, 2770075

(8.258)

La cantidad c, dada por (8.222), vale: c = 4, 8535462 πs−1

(8.259)

El per´ıodo de los ángulos θ y ψ es T = 4K/c, que tiene el valor 1,010 s. Para hallar el per´ıodo de φ debemos calcular el valor de β. La fórmula (8.231) nos da que: dn iβ = 2, 3094003

(8.260)

La transformaci´ on imaginaria de Jacobi dice que dn iβ = dc1 β, donde el sub´ındice indica que el módulo de la funci´ on el´ıptica es m1 . Notando que dc1 = dn1 /cn1 y luego expresando a cn1 y dn en funci´ on de sn1 , obtenemos que: sn21 β =

1 − dn2 iβ = 0, 8136155 1 − m − dn2 iβ

(8.261)

Entonces sn1 β = 0, 9020063. β será igual al valor de la integral el´ıptica incompleta de primera clase con ángulo modular γ1 = 90◦ − 85, 09◦ = 4, 91◦ y amplitud igual a arcsen(0, 9020063) = 64, 45◦. De la tabla 17.5 del manual hallamos el valor mediante interpolaci´ on: β = 1, 1258087

(8.262)

Entonces α = πβ/(2K) = 0, 459134. Reemplazando este valor en (8.248) obtenemos:

T φ = 7, 303 × 2π 2

(8.263)

O sea que al movimiento en φ hay asociado otro per´ıodo T ′ cuyo valor es T ′ = 0, 069 s, que es el per´ıodo precesional alrededor de la l´ınea invariable, o sea el movimiento medio de φ. Este problema pertenece al caso tercero del ejemplo 8.4.2, donde se se˜ nal´ o que Ω22 resulta negativa. En efecto: Ω22 = ω22

(I2 − I1 )(I2 − I3 ) = −227, 759 s−2 I1 I3

a lo cual corresponde un tiempo caracter´ıstico de 0, 0662 s.

(8.264)

Din´ amica del cuerpo r´ıgido / 295

8.5.

El trompo con el punto inferior fijo en un campo gravitacional homog´ eneo

Whittaker en su tratado de dinámica anal´ıtica define un trompo como un cuerpo r´ıgido simétrico alrededor de un eje, que termina en una punta en un extremo del eje. Aqu´ı estudiaremos el movimiento del trompo bajo la acción de la gravedad cuando la punta permanece fija. Este problema fue estudiado por Lagrange en 1788. La figura 8.8 muestra el sistema de ejes empleados. Los ejes x, y, z, son un sistema z z y c.g. l θ

mg

y 0 ψ x

φ x

Figura 8.8 Trompo con el punto inferior fijo en un campo gravitacional. Sistema de ejes. de ejes principales en el punto fijo O. Si los momentos principales respecto al centro de gravedad son I1c , I2c , I3c , podemos usar el teorema de Steiner para evaluarlos respecto al punto O: I1 = ml2 + I1c ;

I2 = ml2 + I2c ;

I3 = I3c

(8.265)

como el cuerpo r´ıgido es simétrico entonces I1 = I2 . Las ecuaciones de movimiento. El lagrangiano respecto a los ejes x, y, z, es: L=

1 1 I1 (ωx2 + ωy2 ) + I3 ωz2 − mgl cos θ 2 2

(8.266)

Usando las ecuaciones (8.131) que expresan las ωi en funci´ on de los ángulos de Euler podemos expresar a L en términos de los ángulos de Euler: L=

1 1 I1 (θ˙2 + φ˙ 2 sen2 θ) + I3 (ψ˙ + φ˙ cos θ)2 − mgl cos θ 2 2

(8.267)

296 / Mec´ anica cl´ asica φ y ψ son coordenadas c´ıclicas y por lo tanto sus momentos canónicos conjugados son constantes de movimiento: pφ =

(I1 sen2 θ + I3 cos2 θ)φ˙ + I3 ψ˙ = Lz ≡ I1 b

pψ =

I3 (ψ˙ + φ˙ cos θ) = Lz = I3 ωz ≡ I1 a

(8.268)

a, b y ωz son constantes. El torque de la gravedad produce rotaciones sólo alrededor de la l´ınea de nodos, en tanto que alrededor de z y z no hay torques, raz´ on por la cual Lz y ~ no son constantes pero s´ı la energ´ıa Lz han de conservarse. Las otras componentes de L total: 1 1 I1 (θ˙2 + φ˙ 2 sen2 θ) + I3 (ψ˙ + φ˙ cos θ)2 + mgl cos θ 2 2

E=

(8.269)

Las ecuaciones (8.268) y (8.269) constituyen un conjunto de tres ecuaciones diferenciales simult´ aneas para θ, φ, ψ; por lo tanto son equivalentes a las ecuaciones de Lagrange para estas cantidades. En efecto, φ˙ y ψ˙ pueden expresarse en funci´ on de θ solamente: φ˙ =

b − a cos θ sen2 θ

ψ˙ =

I1 a b − a cos θ − cos θ I3 sen2 θ

(8.270)

˙ θ, ˙ φ˙ y θ, puede expresarse en términos de θ˙ y θ dando Como E depende sólo de ψ, una ecuaci´ on diferencial para θ: 1 1 (b − a cos θ)2 1 I3 ωz2 + I1 θ˙2 + I1 sen2 θ + mgl cos θ 2 2 2 sen4 θ

(8.271)

1 1 1 (b − a cos θ)2 E ′ = E − I3 ωz2 = I1 θ˙2 + I1 + mgl cos θ 2 2 2 sen2 θ

(8.272)

E= o sea que:

Vemos que la variación de θ es la misma que se presentar´ıa en un sistema dinámico con un grado de libertad para el cual las energ´ıas cinética y potencial son respectivamente: 1 ˙2 I1 θ ; 2

1 (b − a cos θ)2 I1 + mgl cos θ 2 sen2 θ

(8.273)

Llamando u = cos θ la ecuaci´ on (8.272) toma la forma: u˙ 2 = (α − βu)(1 − u2 ) − (b − au)2 = f (u)

(8.274)

donde se definen a α y β como: α=

2E ′ ; I1

β=

2mgl I1

(8.275)

Din´ amica del cuerpo r´ıgido / 297 La energ´ıa potencial efectiva. Est´ a dada por la segunda expresión en (8.273), que en términos de u toma la forma: 1 (b − au)2 Vef (u) = I1 + βu (8.276) 2 1 − u2 Podemos entonces escribir a f (u) como: f (u) =

2 [E ′ − Vef (u)] (1 − u2 ) I1

(8.277)

Las figuras 8.9 y 8.10 muestran las funciones Vef (θ), Vef (u) y f (u).

Vef (u)

f (u)

E′ E′0 u –1

u1

u0

0

u2

+1

u3

Figura 8.9 Funciones Vef (u) y f (u) Vemos que para un valor dado de E ′ habr´ a dos valores de u, u1 y u2 para los cuales ´ E = Vef (u), o sea para los cuales u˙ = 0 (θ˙ = 0). Estos son los puntos de retorno de la coordenada θ. Vemos que en general θ oscilará entre θ1 y θ2 esto es, habr´ a nutación. Cuando E ′ = E0′ entonces u1 = u2 = u0 y no habr´ a nutación; este caso corresponde a la precesi´ on estable o regular. u1 y u2 corresponden a los ceros de la funci´ on f (u) en el intervalo entre u = −1 y u = 1. La funci´ on f (u) es un polimonio c´ ubico en u que tiene el siguiente comportamiento. En u = ±1 la funci´ on f es negativa, puesto que f (±1) = −(b ∓ a)2 . Para algunos valores de u entre −1 y +1, f (u) debe de ser positiva porque el lado izquierdo en (8.274) es positivo. Cuando u → ∞, f (u) es positiva y cuando u → −∞, f (u) es negativa. La figura 8.9 muestra el comportamiento de f (u), la cual tiene por lo tanto dos ra´ıces reales u1 y u2 que se sit´ uan entre −1 y +1, y la tercera ra´ız u3 es también real y mayor que +1 (que corresponde a un valor de θ imaginario puro). Llamemos a esas ra´ıces cos θ1 , cos θ2 , cosh θ3 , donde hemos convenido en designar con θ3 al módulo del ángulo correspondiente a u3 y donde cos θ2 > cos θ1 , con lo cual θ1 > θ2 . E0′ es el valor de E ′ para el cual θ1 y θ2 son iguales, o sea, el valor de E ′ en el cual Vef tiene un m´ınimo. Este caso es análogo al de las órbitas circulares en el problema de ′

298 / Mec´ anica cl´ asica

Vef (θ)

E′ E′0

0

θ2

θ0

θ1 π θ

Figura 8.10 Energ´ıa ptencial efectiva Vef (θ) y Vef (u)

las fuerzas centrales entre dos part´ıculas. Integraci´ on de la ecuaci´ on diferencial para θ. Realicemos la siguiente transformaci´ on (Whittaker, Op. cit., p. 157): u=

α + a2 4 z+ β 3β

(8.278)

Al sustituir esta expresión en (8.274) obtenemos: z˙ 2 = 4z 3 − g2 z − g3 = 4s(z)

(8.279)

Si u1 , u2 y u3 son las ra´ıces del polinomio c´ ubico f (u) entonces las ra´ıces del polinomio c´ ubico s(z) son: zi =

β α + a2 ui − = ei ; 4 12

i = 1, 2, 3

(8.280)

Los coeficientes g2 y g3 pueden expresarse en funci´ on de los ei mediante las fórmulas 18.1 del texto de Abramowitz y Stegun: g2 =

2(e21 + e22 + e23 )

g3 =

4e1 e2 e3

(8.281) La conexión entre z y t est´ a dada en consecuencia por medio de una funci´ on el´ıptica

Din´ amica del cuerpo r´ıgido / 299 de Weierstrass, de acuerdo con la fórmula 18.1.6 del libro de Abramowitz:8 zi = P(t + ǫ)

(8.282)

donde ǫ es una constante de integraci´ on. En consecuencia: cos θ = u(t) =

2I1 2E ′ + I1 a2 P(t + ǫ) + mgl 6mgl

(8.283)

La funci´ on el´ıptica de Weierstrass puede expresarse en términos de la funci´ on el´ıptica sn de Jacobi, seg´ un la f´ ormula 18.9.11 de dicho manual, para el caso en que e1 , e2 , e3 , son reales y tomando e3 > e2 > e1 : e3 − e1 (8.284) P(x) = e1 + 2 √ sn (x e3 − e1 )

donde el par´ ametro de la funci´ on sn es: e2 − e1 m= e3 − e1

(8.285)

Conociendo las ra´ıces ei podemos calcular el per´ıodo de la funci´ on sn y en consecuencia el per´ıodo del ´ angulo θ, llamado el per´ıodo nutacional. Integraci´ on de las ecuaciones diferenciales para φ y ψ. φ˙ y ψ˙ est´ an dados por las ecuaciones (8.270). Notamos que θ no depende del valor de I3 , puesto que a no es más que una constante de integraci´ on. En consecuencia la expresión para ψ˙ difiere de la correspondiente expresión para un trompo esférico sólo por una constante (I1 a/I3 − a). En el c´ alculo de la parte no trivial de ψ podemos asumir que el trompo es esférico (I1 = I2 = I3 ), para el cual se cumple: a − b cos θ ψ˙ = sen2 θ Podemos expresar a φ˙ y ψ˙ en la forma: b − a cos θ ; φ˙ = sen2 θ

φ˙ =

a−b a+b + 2(cos θ + 1) 2(cos θ − 1)

ψ˙ =

a+b b−a + 2(cos θ + 1) 2(cos θ − 1)

(8.286)

(8.287)

Podemos ahora sustituir la expresión para cos θ en funci´ on del tiempo, ecuaci´ on (8.283). De (8.283) y (8.284) se sigue que el argumento de P debe ser complejo cuando cos θ = 1 y cos θ = −1. Para θ = 0 y θ = π, seg´ un (8.283) P vale respectivamente: P(iγ) =

mgl 2E ′ + I1 a2 − 2I1 12I1

P(iδ) =

mgl 2E ′ + I1 a2 − − 2I1 12I1

(8.288)

8 V´ ease tambi´ en el texto de E. T. Whittaker y G. N. Watson, A course of modern analysis, cap´ıtulo XX, Cambridge University Press, 1965; A treatise on analytical dynamics de E. T. Whittaker, cap´ıtulo VI, Cambridge University Press, 1960.

300 / Mec´ anica cl´ asica donde γ y δ son reales. Reemplazando a (8.288) y a (8.283) en las fórmulas (8.287) obtenemos: mgl(a + b) 1 φ˙ = 4I1 P(t + ǫ) − P(iδ) − mgl(a + b) 1 ψ˙ = 4I1 P(t + ǫ) − P(iδ) +

1 mgl(b − a) 4I1 P(t + ǫ) − P(iγ)

(8.289)

1 mgl(b − a) 4I1 P(t + ǫ) − P(iγ)

Cuando θ = 0 y θ = π la ecuaci´ on (8.274) nos dice que u˙ 2 vale: u˙ 2 θ=π = −(b + a)2 u˙ 2 θ=0 = −(b − a)2 ;

(8.290)

˙ ˙ En consecuencia P(iγ) y P(iδ) valen, usando (8.278): i ˙ P(iγ) = β(b − a) ; 4

i ˙ P(iδ) = β(b + a) 4

(8.291)

Este resultado nos permite escribir a (8.290) en la forma: 2iφ˙ =

˙ ˙ P(iγ) P(iδ) − P(t + ǫ) − P(iδ) P(t + ǫ) − P(iγ)

2iψ˙ =

˙ ˙ P(iγ) P(iδ) + P(t + ǫ) − P(iδ) P(t + ǫ) − P(iγ)

(8.292)

De acuerdo con (8.284), la funci´ on P tiene un polo doble en el origen, o sea que la funci´ on: ˙ P(iδ) P(x) − P(iδ)

(8.293)

tiene ceros en x = 0, tiene polos en x = iδ y x = −iδ, y en todos los puntos congruentes a estos, es decir, que se obtengan por translaciones en m´ ultiplos enteros de los per´ıodos de la funci´ on el´ıptica P(x), que son ciertos ω1 y ω2 , análogos a 2K y 2iK ′ en las funciones el´ıpticas de Jacobi. Los residuos de la funci´ on (8.293) en ésos polos son +1 y −1. En la teor´ıa de las funciones el´ıpticas de Weierstrass existe una función, de la familia de las funciones θ, que tiene una estructura anal´ıtica idéntica a la de la funci´ on (8.293). En efecto, la funci´ on σ(x + iδ) tiene ceros en x = −iδ y en los puntos congruentes a éste, y la funci´ on σ ′ (x + iδ)/σ(x − iδ) tiene polos en los puntos congruentes a x = −iδ y residuo igual a −1, en tanto que σ ′ (x − iδ)/σ(x − iδ) tiene polos en x = iδ y residuo igual a +1. En consecuencia la funci´ on (8.293) puede escribirse en la forma: ˙ σ(x ˙ − iδ) σ(x ˙ + iδ) σ(iδ) ˙ P(iδ) = − +2 P(x) − P(iδ) σ(x − iδ) σ(x + iδ) σ(iδ)

(8.294)

Din´ amica del cuerpo r´ıgido / 301 Llamando ς(iδ) = σ(iδ)/σ(iδ) ˙ y usando el resultado (8.294), las ecuaciones (8.292) pueden ser integradas inmediatamente para dar a φ y ψ en funci´ on de logaritmos de la funci´ on σ. Finalmente, φ y ψ pueden escribirse en la forma: e2i(φ−φ0 ) = e2[ς(iδ)−ς(iσ)]t

σ(t + ǫ − iδ) σ(t + ǫ + iδ) σ(t + ǫ + iδ)σ(t + ǫ − iδ)

e2i(ψ−ψ0 ) = e2[ς(iδ)+ς(iσ)]t

σ(t + ǫ − iδ) σ(t + ǫ − iδ) σ(t + ǫ + iδ)σ(t + ǫ + iδ)

(8.295)

donde φ0 y ψ0 son constantes de integraci´ on. Expresi´ on para los par´ ametros de Cayley-Klein de un trompo esf´ erico en funci´ on del tiempo. Los par´ ametros de Cayley-Klein especifican la posición del cuerpo r´ıgido y est´ an expresados en funci´ on de los ángulos de Euler mediante las fórmulas (7.175) de la secci´ on 7.8: α′ = cos

θ i(φ+ψ)/2 e ; 2

θ β ′ = i sen ei(ψ−φ)/2 2

(8.296) θ −i(φ+ψ)/2 θ −i(φ−ψ)/2 ′ ; δ = cos e γ = i sen e 2 2 Para expresar a cos(θ/2) en funci´ on de t, notemos que 2 cos2 (θ/2) = 1 + cos θ. Ahora, usando (8.283) y (8.288) llegamos fácilmente al resultado siguiente usando la fórmula 18.4.4 del citado manual: 2I1 θ [P(t + ǫ) − P(iδ)] 2 cos2 = 2 mgl (8.297) 2I1 σ(t + ǫ + iδ)σ(t + ǫ − iδ) = − mgl σ 2 (iδ) σ 2 (t + ǫ) ′

Para 2 sen2 (θ/2) hallamos una expresión similar reemplazando δ por γ. Combinando (8.297) con (8.295), obtenemos: r I1 ei(φ0 +ψ0 )/2 σ(t + ǫ − iδ) tς(iδ) ′ α = i e mgl σ(iδ) σ(t + ǫ) β′ = i

γ′ = i

′

δ = i

r

r

r

I1 ei(ψ0 −φ0 )/2 σ(t + ǫ − iγ) tς(iγ) e mgl σ(iγ) σ(t + ǫ) (8.298) I1 ei(φ0 −ψ0 )/2 σ(t + ǫ + iγ) tς(iγ) e mgl σ(iγ) σ(t + ǫ) I1 e−i(φ0 +ψ0 )/2 σ(t + ǫ + iδ) −tς(iδ) e mgl σ(iδ) σ(t + ǫ)

Para un trompo no esférico las fórmulas correspondientes a (8.295) y (8.298) se obtienen simplemente por reemplazar la funci´ on ς por ς + i(I3 − I1 )a/(2I3 ).

302 / Mec´ anica cl´ asica La precesi´ on estable o regular. Es el movimiento que se presenta cuando no hay nutaci´ on, o sea cuando θ es constante. En este caso θ˙ y θ¨ son permanentemente cero. Se sigue de las ecuaciones (8.270) que φ˙ y ψ˙ también son constantes. El valor de u0 = cos θ0 se obtiene resolviendo la ecuaci´ on algebraica dVef /dt = 0. De acuerdo con (8.276) esto nos da: 2(a − ub)(b − au) − β(1 − u2 )2 = 0

(8.299)

De aqu´ı obtenemos el valor de u0 , y en consecuencia el valor que debe tomar la constante E ′ para que se produzca la precesi´ on sin nutación. La ecuaci´ on (8.299) es la condición para que la “fuerza” en θ sea nula, o sea que es la condición para que θ¨ sea cero, que junto con θ˙ = 0 caracteriza la precesi´ on regular. Esta ecuaci´ on debe ser compatible con la ecuaci´ on (8.270). Si sustituimos en (8.299) a b − au0 por su valor φ˙ 0 (1 − u20 ) y a ˙ − u2 ) + au0 , obtenemos: b por φ(1 0 β φ˙ 20 u0 − aφ˙ 0 + = 0 2 Esta ecuaci´ on nos da para φ˙ los valores: ! s 4mglI a 1 1± 1− u0 φ˙ 0 = 2u0 p2ψ

(8.300)

(8.301)

Como φ˙ 0 debe ser real, debe cumplirse que: −∞ <

4mglI1 u0 2βu0 ≤1 ≤ 1 → −∞ < p2ψ a2

(8.302)

Esta expresión limita drásticamente los posibles valores de la velocidad angular del trompo ωz alrededor de su eje de simetr´ıa z: 4mglI1 u0 ≤ ωz2 I32

(8.303)

φ˙ 0 es la velocidad angular de precesi´ on alrededor del eje espacial z. La ecuaci´ on (8.301) nos dice que hay dos posibles valores de la velocidad angular de precesi´ on que (+) (−) llamaremos φ˙ 0 (precesión rápida) y φ˙ 0 (precesión lenta). El trompo r´ apido. Si ωz es tan grande que 2βu0 /a2 es mucho menor que la unidad tenemos el caso del trompo rápido. De (8.303) vemos que la condición de trompo rápido puede escribirse en la forma: I3 1 mgl ≪ (8.304) I3 ωz2 I1 2 Expandiendo al primer orden la ra´ız cuadrada en (8.301) obtenemos para las frecuencias de precesi´ on de un trompo rápido: I3 ωz (+) ; φ˙ 0 = I1 u0

mgl (−) φ˙ 0 = I3 ωz

(8.305)

Din´ amica del cuerpo r´ıgido / 303 Para el caso en que θ0 > π/2 (u0 negativo), la condición de precesi´ on estable (8.302) se cumple para todos los valores de ωz . Este es el caso en que el trompo “cuelga” (+) (−) del punto fijo O. Seg´ un (8.305), cuando u0 < 1, φ˙ 0 y φ˙ 0 tienen signos opuestos. Precesi´ on con nutaci´ on. Ocurre cuando E > E ′ ; en este caso θ oscila entre θ1 y θ2 . La frecuencia angular de precesi´ on est´ a dada por (8.270): b − a cos θ b/a − cos θ φ˙ = =a sen2 θ sen2 θ

(8.306)

˙ Se pueden presentar varios casos en cuanto al signo de φ: ˙ (a) φ tiene el mismo signo para todos los valores de θ. Ocurre que es positivo para todos los valores de θ si: b > cos θ (8.307) a El trompo precesa siempre en la misma direcci´ on alrededor del eje z en tanto que el eje z oscila entre θ1 y θ2 . La precesi´ on es monot´ onica con φ˙ siempre positivo. Si se toma una esfera fija en el espacio, con centro en O, la “marca” que dejar´ıa el eje z sobre la esfera se representa en la figura 8.11. z

Z θ2 θ1

θ2 θ1

θ2 θ1

φ

a

b

c

Figura 8.11 “Marcas” que dejar´ıa el eje z sobre la esfera: a. para b/a > cos θ, b. para cos θ1 < b/a < cos θ2 y c. para cos θ2 = b/a (b) φ˙ cambia de signo cuando el eje va de θ2 a θ1 . Si ocurre que: b < cos θ2 (8.308) a entonces cuando θ = θ1 , φ˙ es positivo y cuando θ = θ2 , φ˙ es negativo. Por lo tanto la precesi´ on no es monot´ onica, sino que se da un avance neto en forma de rizo como en la figura 8.11b. Es claro que en este movimiento φ˙ no se anula en la media. (c) Puede ocurrir que: cos θ1 <

cos θ2 =

b a

(8.309)

304 / Mec´ anica cl´ asica Esto implica que φ˙ es positivo para todo θ mayor que θ2 y se anula para θ = θ2 . Entonces, como θ = θ2 es un punto de retorno, all´ı θ˙ es igual a cero. En θ = θ2 el eje z se encontrará simult´ aneamente sin precesi´ on y sin nutación, o sea que se encuentra instant´ aneamente en reposo. El movimiento se representa en la figura 8.11c. Esta situaci´ on corresponde al método más simple de dejar girando un trompo. Primero se hace girar alrededor del eje z y luego se suelta haciendo un ángulo θ2 con la vertical. Las condiciones para t = 0 son entonces θ = θ2 y θ˙ = φ˙ = 0. Las ecuaciones (8.272) y (8.309) nos dicen entonces que la constante E ′ vale: E ′ = mgl cos θ2

(8.310)

Como en (8.272) los términos que contienen a I1 son positivos, para tiempos mayores que cero la energ´ıa potencial debe disminuir o sea θ debe aumentar hasta alcanzar el valor θ1 y seg´ un (8.306) entonces φ˙ aumenta a partir de cero hasta alcanzar el valor máximo positivo dado por: cos θ2 − cos θ1 a φ˙ 1 = sen2 θ1

(8.311)

O sea que el trompo al dejarse caer desde θ = θ2 con θ˙ = φ˙ = 0 en t = 0, en un tiempo mayor adquiere precesi´ on y nutación. Ocurre cuando el trompo es rápido y hay rozamiento en el punto O que la nutación se amortigua rápidamente, dando la impresión de que las condiciones iniciales se˜ naladas no dan lugar a precesi´ on con nutación sino a una precesi´ on regular. Los comportamientos descritos en (a), (b) y (c) est´ an contenidos en la expresión anal´ıtica (8.295). El producto que contiene las funciones σ es puramente periódico, de modo que el exponencial del lado derecho da el movimiento medio de φ, esto es el movimiento precesional neto. La ecuaci´ on (8.295) nos dice que ψ tiene un comportamiento análogo al de φ o sea una rotación neta acompa˜ nada de fluctuaciones periódicas. La precesi´ on seudoregular. Es el comportamiento usual de un trompo rápido, que de acuerdo con (8.304) se presenta cuando el efecto de la gravedad es peque˜ no y puede asimilarse a una peque˜ na perturbación. En la aproximación cero se presentar´ a la precesi´ on regular propia de un cuerpo r´ıgido simétrico libre, ecuaci´ on (8.179). El efecto de la gravedad es perturbar ligeramente ese movimiento dando lugar a una peque˜ na nutaci´ on. Los valores de las constantes de movimiento para la precesi´ on con nutación en el ˙ ˙ caso (c), correspondientes a las condiciones iniciales θ(0) = θ2 , θ(0) = φ(0) = 0, seg´ un las ecuaciones (8.268) son: ˙ cos θ2 = I3 ψ(0)

I1 b

˙ = I3 ψ(0)

I1 a

E′ =

(8.312)

mgl cos θ2

que pueden expresarse en términos de la energ´ıa de rotación, inicialmente dada por: R=

1 1 I3 ωz2 = I3 ψ˙ 2 (0) 2 2

(8.313)

Din´ amica del cuerpo r´ıgido / 305 Entonces: √ 2RI3 I3 a= = ωz ; I1 I1

b = a cos θ2 (8.314)

I1 β E = mgl cos θ2 = cos θ2 2 Entonces podemos escribir a f (u) en la forma: ′

f (u) = β(1 − u2 )(u2 − u) − a2 (u2 − u)2 Las ra´ıces de f (u) son: s " # a2 4β β u3,1 = 1± 1+ 2 − u2 2β a a2

(8.315)

(8.316)

a2 /β est´ a dado por: I3 R a2 = β I1 mgl

(8.317)

O sea que cuando el trompo es rápido podemos escribir a (8.316) en la forma aproximada: 2β 2β 2 a2 2 1 ± 1 − 2 u2 + 4 (1 − u2 ) (8.318) u3,1 = 2β a a lo cual nos da inmediatamente: u3 ≈

a2 ; β

u1 ≈ u2 −

β (1 − u22 ) a2

(8.319)

La magnitud de la nutaci´ on est´ a dada por: β sen2 θ2 (8.320) a2 O sea que cuando θ2 = 0, el eje z permanece vertical (trompo “dormido”). Además, la magnitud de la nutaci´ on var´ıa como R−1 ; cuanto más rápido gire el trompo menor será la nutaci´ on. Calculemos ahora la frecuencia de la nutación para un trompo rápido. Llamemos cos θ al promedio de cos θ, o sea a: cos θ2 − cos θ1 ≈

cos θ1 + cos θ2 β (8.321) = cos θ2 − 2 sen2 θ2 2 2a Podemos especificar la magnitud del desplazamiento del eje z en un tiempo t por: cos θ =

x = cos θ − cos θ = u − u

(8.322)

Usando las ra´ıces de la funci´ on f (u) podemos escribir la ecuaci´ on diferencial para u en la forma aproximada: β a2 u˙ 2 = β(u − u2 ) u − u2 + 2 (1 − u22 ) u − (8.323) a β

306 / Mec´ anica cl´ asica Como para un trompo rápido se cumple que a2 /β ≫ u, podemos aproximar a´ un más a (8.323). Luego expresamos a u en términos de x para obtener: β2 2 2 2 (8.324) x˙ = − 4 sen θ2 − x 4a Derivando (8.324) respecto a t llegamos a: x ¨ + a2 x = 0

(8.325)

La solución que satisface la condición θ(0) = θ2 es, en consecuencia: x=

β sen2 θ2 cos at ; 2a2

cos θ = cos θ2 −

β at sen2 θ2 sen2 a2 2

(8.326)

La frecuencia angular de la nutación es: 1 I3 ωz a= 2 2I1

(8.327)

O sea que la frecuencia de las nutaciones es mayor a medida que ωz es mayor. (8.306) nos da la frecuencia angular de precesi´ on. Como seg´ un (8.326) x es del orden de β/(2a2 ), podemos escribir aproximadamente a φ˙ como: u2 − u u2 − u β at φ˙ = a≈ a = sen2 2 2 1−u 1 − u2 a 2

(8.328)

un (8.305), coincide con la velocidad angular de preceβ/(2a2 ) = mgl/(I3 ωz ), seg´ si´ on lenta del trompo rápido, lo cual nos permite escribir a φ˙ como: at (−) φ˙ = 2φ˙ 0 sen2 2

(8.329)

La frecuencia angular de precesi´ on media durante un ciclo de la nutación es: (−) φ˙ = φ˙ 0

(8.330)

Vemos que mientras mayor sea ωz , menor será la velocidad angular de precesi´ on. Para un trompo rápido el movimiento es una nutación peque˜ na y una precesi´ on peque˜ na que coincide con la velocidad angular de precesi´ on lenta de un trompo rápido. Esta precesi´ on se llama precesi´ on seudoregular, pues aunque las condiciones iniciales no son las de la precesi´ on regular, en la práctica se comporta como ésta porque la fricción amortigua rápidamente la nutación y aparentemente el eje z del trompo empieza ins´ tant´ aneamente a precesar, con movimiento normal a la gravedad. Esta es la paradoja de Klein-Sommerfeld quienes explicaron que esta precesi´ on no implica aceleraciones infinitas sino que se trata de una precesi´ on con una imperceptible nutación. El trompo “dormido”. Es el caso cuando el eje z permanece vertical, sin precesi´ on ni nutaci´ on, o sea cuando: θ(t) = 0 ;

˙ =0 θ(t)

(8.331)

Din´ amica del cuerpo r´ıgido / 307 f (u)

u1 = u2 = 1 –1

0

u3 u

+1

Figura 8.12 Comportamiento de f (u) para u1 = u2 = 1

f (u)

0 –1 u1

+1 u2 = u 3 = 1

u

Figura 8.13 Comportamiento de f (u) para u2 = u3 = 1

Esta situaci´ on es un caso l´ımite de la precesi´ on estable cuando el m´ınimo de Vef (u) est´ a en u0 = 1. Como cuando E ′ = E0′ , los dos puntos de retorno coinciden, la funci´ on f (u) tiene el comportamiento mostrado en las figuras 8.12 y 8.13. Para este caso los valores de las constantes de movimiento son: ˙ ; I1 a = I3 (ψ˙ + φ)

b = a;

E ′ = mgl

(8.332)

Se sigue de (8.275) y (8.332) que: α=β

(8.333)

308 / Mec´ anica cl´ asica La ecuaci´ on (8.274) tiene entonces la forma: u˙ 2 = (1 − u)2 α(1 + u) − a2

(8.334)

Las ra´ıces de f (u) son en consecuencia: 1,

1,

a2 −1 α

(8.335)

Veamos qué condiciones se requieren en cada uno de los casos mostrados en las figuras 8.12 y 8.13. Para ello examinemos la curvatura de f (u) en la ra´ız doble: 2 a ′′ f (1) = 2α 1 − −1 (8.336) α Claramente en el caso de la figura 8.12, donde (a2 /α) − 1 es mayor que 1, la curvatura es negativa y en la figura 8.13 la curvatura es positiva. Los resultados de la precesi´ on estable en general se aplican en este caso en que u0 = 1. La condición (8.303) en este caso es: a2 ≥1 2α

(8.337)

que se˜ nala la velocidad angular cr´ıtica ωc debajo de la cual cesa la precesi´ on regular, o sea: ωc2 =

4mglI1 I32

(8.338)

Vemos pues que el caso de la figura 8.12 es en rigor el de precesi´ on regular en tanto que el caso de la figura 8.13 es inestable y mediante una peque˜ na perturbación degenera en el de precesi´ on con nutación; para este caso ωz < ωc y para el caso de la figura 8.12, ωz > ωc . Cuando ωz sea igual a ωc entonces a2 /α = 2 y seg´ un (8.335) las tres ra´ıces de f (u) coinciden y el movimiento a´ un es estable. Ejemplo 8.5.1 A partir de la solución anal´ıtica hallar los valores de la frecuencia angular de nutaci´ on y de la velocidad angular de precesi´ on media para la precesi´ on con nutación de un trompo pesado bajo las condiciones iniciales (8.312), caso (c). De acuerdo con las fórmulas (8.283) y (8.284), el per´ıodo de la nutación coincide con el per´ıodo de la funci´ on el´ıptica ns2 que es 2K. O sea que: √ T e3 − e1 = 2K (8.339) El par´ ametro de la funci´ on, seg´ un (8.285) y (8.280) es: √ u2 − u1 λu2 − 1 + 1 + λ2 − 2λu2 2β √ m= = ; λ= 2 u3 − u1 a 2 1 + λ2 − 2λu2

(8.340)

donde hemos usado (8.316). Para precisar, asumamos que: u2 =

1 ; 2

λ=1

(8.341)

Din´ amica del cuerpo r´ıgido / 309 Entonces los valores de m y de √ a e3 − e1 = m = 0, 25 ; 2

√ e3 − e1 son: (8.342)

De la tabla 17.1 del manual de Abramowitz y Stegun obtenemos: K(0, 25) = 1, 685

(8.343)

con lo cual el valor exacto del per´ıodo T es: T =

4K 6, 74 = a a

(8.344)

y el valor exacto de la frecuencia de nutación es: Ωnut = 0, 932 a

(8.345)

Promediando sobre un per´ıodo de las funciones P obtenemos que el término de φ˙ que en (8.292) da lugar a precesi´ on neta es: 2iφ˙ = 2

σ(iγ) ˙ σ(iδ) ˙ −2 σ(iδ) σ(iγ)

(8.346)

Seg´ un (8.288) y (8.314) se cumple para este caso que: P(iγ) =

βu2 + a2 5λ − 4 2 1 2 β − = a = a 4 12 48 48

P(iδ) =

βu2 + a2 7λ + 4 2 11 β =− a = − a2 − − 4 12 48 48

(8.347)

Seg´ un la expansi´ on en serie para P(x) el término dominante es x−2 de modo que: P(iγ) ≈ −

1 ; γ2

P(iδ) ≈ −

1 δ2

Entonces hallamos que: r √ 48 48 1 ; iγ ≈ −i iγ ≈ a 11 a

(8.348)

(8.349)

Por otra parte, el término dominante en la expansi´ on en serie para ς(x) es x−1 lo cual nos dice que: r 11 1 1 1 ς(iδ) ≈ ≈i a ; ς(iγ) ≈ ≈√ a (8.350) iδ 48 iγ 48 Entonces resulta que φ˙ vale: φ˙ ≈ 0, 48a + 0, 14ai

(8.351)

El resultado nos indica que para las condiciones iniciales (8.341) no hay precesi´ on neta estable; que el movimiento en φ dura menos de un per´ıodo de P, en tanto que

310 / Mec´ anica cl´ asica (8.346) supone que existe movimiento en φ durante más de un per´ıodo. En efecto, para λ mayor que 0,8 domina el efecto de la gravedad y el trompo cae. La fórmula (8.340) resulta aplicable para λ < 0,8. El movimiento descrito por la figura 8.11c existe si: I1 2mgl < 0, 8 I3 R

(8.352)

Si tomamos λ = 0, 1 y u2 = 0, 5, mediante idénticos procedimientos llegamos a los siguientes resultados: e1 = −0, 079659a2 ;

e2 = −0, 079166a2 ;

e3 = 0, 1188257a2

(8.353)

En consecuencia: m = 0, 6659781 ;

K(m) = 2, 025

(8.354)

Entonces un valor para la frecuencia de nutación más exacto que el resultado (8.327) es: Ωnut = 0, 691a

(8.355)

Sin embargo en el c´ alculo de la velocidad angular de precesi´ on entran en juego las aproximaciones hechas para evaluar las ς. Para iδ y iγ obtenemos: i iγ ≈ −3, 7032803 ; a

iδ ≈ −3, 1957416

i a

(8.356)

lo cual nos conduce a: φ˙ = 0, 04 a

(8.357)

que esta vez no tiene la contribución imaginaria. Seg´ un (8.330) que es aplicable en este caso pues λ ≪ 1, φ˙ debe valer: β = 0, 0025 a φ˙ ≈ 2a

8.6.

(8.358)

Movimiento en un sistema de referencia no inercial

Ya a lo largo del texto hemos considerado varios casos de sistemas de referencia no inerciales. En el ejemplo 4.1.5, secci´ on 4.1, encontramos las ecuaciones de movimiento para una part´ıcula en un sistema de referencia que rota uniformemente con velocidad angular ~ ω . Encontramos que la rotación a˜ nade a la energ´ıa un término que depende sólo de las coordenadas de la part´ıcula y es proporcional al cuadrado de la velocidad angular. Este término adicional, −m(~ω × ~r)2 /2 se llama energ´ıa potencial centr´ıfuga. En la ecuaci´ on de movimiento aparecen dos términos adicionales de tipo inercial. La fuerza 2m~r˙ × ~ ω se llama fuerza de Coriolis; es una fuerza no disipativa que depende de la velocidad de la part´ıcula, pero no da contribución a la energ´ıa. La fuerza m~ω × (~ω × ~r) se llama fuerza centr´ıfuga; est´ a en el plano formado por ~r y ~ω , siendo perpendicular al

Din´ amica del cuerpo r´ıgido / 311 eje de rotación y alej´ andose de él; el módulo de esta fuerza es mρω 2 siendo ρ la distancia de la part´ıcula al eje de rotación. Al final de la secci´ on 7.9 encontramos expresiones más exactas para las ecuaciones de movimiento, en funci´ on de la matriz de rotación. Encontramos en la ecuaci´ on (7.282) un término adicional, la fuerza m~r × ~ω˙ debida a la no uniformidad de la rotación. Consideremos ahora el sistema de referencia no inercial más general. Consiste en un sistema de referencia que rota no uniformemente y cuyo origen se translada con aceleraci´ on no ~ del origen de coordenadas y la velocidad anuniforme. Se supone que la aceleraci´ on A(t) gular de rotación ω ~ (t) son funciones del tiempo conocidas a priori. Entonces la ecuaci´ on de movimiento más general para una part´ıcula que se mueve en un sistema de referencia no inercial es: ∂V ~ + m~r × ~ω˙ + 2m~r˙ × ~ω + m~ω × (~r × ~ω) − mA (8.359) m~¨r = − ∂~r Ya hemos considerado el movimiento de un cuerpo r´ıgido en un sistema de referencia que rota uniformemente. En el ejemplo 8.3.1 hallamos la forma que toman las ecuaciones de Euler en tal sistema de referencia, ecuaciones (8.128) y (8.129). Ejemplo 8.6.1 Resolver el problema del péndulo de Foucault consider´ andolo como un cuerpo r´ıgido y usando las ecuaciones de Euler en un sistema de referencia rotante. En este problema intervienen tres sistemas de ejes. Los ejes inerciales, los ejes rotantes fijos a la Tierra y los ejes fijos al cuerpo r´ıgido. Llamaremos x′ , y ′ , z ′ , a los ejes fijos a la Tierra y x, y, z, a los ejes fijos al cuerpo r´ıgido. El vector de velocidad angular de la Tierra, que asumiremos constante respecto a los ejes inerciales, vale: ω ~ 0 = ω0~k

(8.360)

donde ~k est´ a en la direcci´ on de la l´ınea sur-norte que asumiremos fija en el espacio (ver la figura 8.14). El péndulo est´ a suspendido de un punto O fijo respecto a la Tierra. En ese punto tomaremos el origen com´ un de los ejes fijos a la Tierra y al cuerpo r´ıgido. Este es un cuerpo r´ıgido trivial que consiste en una part´ıcula mantenida a distancia fija de O por medio de un hilo sin masa y longitud l. El eje z lo tomamos a lo largo del hilo, de modo que la posición de la part´ıcula respecto a los ejes fijos al cuerpo r´ıgido est´ a en (0, 0, l). Los momentos principales de inercia de este cuerpo r´ıgido son: I1 = ml2 ;

I2 = ml2 ;

I3 = 0

(8.361)

Los ejes x y y son perpendiculares a z pero pueden tomarse arbitrariamente, pues este cuerpo r´ıgido no permite especificarlos. Podemos, sin perder generalidad, tomar el eje y perpendicular al plano de oscilación del péndulo y el eje x en el plano de oscilación ˙ asumir del péndulo y cuando aparezca la velocidad de rotación alrededor del eje z, ψ, que es cero, lo mismo que ψ. Las componentes del vector de velocidad angular de la Tierra respecto a los ejes primados son: ω0 ′ = ~ =

ω0 [(~k · ~i ′ )~i ′ + (~k · ~j ′ )~j ′ + (~k · ~k ′ )~k ′ ] ω0 (cos λ, 0, −senλ)

(8.362)

312 / Mec´ anica cl´ asica N i

0 φ j′ j

j′

i′

i′

k

k′

0 k

k′

θ

ω0 l

φ

λ m

S b

a

Figura 8.14 Péndulo de Foucault considerado como un cuerpo r´ıgido: a. Sistema de ejes y b. Componentes del vector de velocidad angular de la tierra respecto a los ejes primados.

La energ´ıa potencial vale V = −mgz ′ = −mgl cos θ. Entonces los torques alrededor de los ejes z ′ y z, y de la l´ınea de nodos, son respectivamente: Kφ = 0 ;

Kψ = 0 ;

Kθ = −mgl senθ

(8.363)

Las ecuaciones de Euler en un sistema de referencia rotante fueron halladas en los ejemplos 8.3.1 y 8.3.3, en la secci´ on 8.3. Las ecuaciones requeridas para este problema deben incluir los torques, o sea que a las ecuaciones (8.155) debemos adicionar en el lado derecho: 3 X

Kr βrt ;

t = 1, 2, 3

(8.364)

r=1

donde las Kr est´ an dadas por (8.363) y βrt es la matriz (8.134). Los torques (8.364), que llamaremos K1 , K2 , K3 , son en consecuencia: K1 = −mgl senθ cos ψ ;

K2 = mgl senθ senψ ;

K3 = 0

(8.365)

para escribir las ecuaciones (8.155) se requiere además conocer las componentes del vector ~ ω0′ respecto a los ejes fijos al cuerpo r´ıgido. Para ello debemos evaluar: ˜ω0′ ~ 0 = A~ ω

(8.366)

donde A˜ es la matriz de rotación entre los ejes con primas y los ejes con barras, dada por la ecuaci´ on (7.122) secci´ on 7.6. Las ecuaciones (8.128) y (8.129) con torques, con los

Din´ amica del cuerpo r´ıgido / 313 momentos de inercia (8.361) nos dan: (ω˙ z + ω˙ 0z ) · 0 =

0

(ω˙ y + ω˙ 0y ) =

g −(ωx + ω0x )(ωz + ω0z ) + senθ senψ l

(ω˙ x + ω˙ 0x ) =

g (ωy + ω0y )(ωz + ω0z ) − senθ cos ψ l

(8.367)

Debido a que I3 = 0 y I1 = I2 , la ecuaci´ on (8.367) da un valor indeterminado para ω˙ z + ω˙ 0z y en consecuencia para ωz + ω0z , la indeterminación proviene del hecho ya se˜ nalado al definir las coordenadas x, y, z. En efecto, como la masa m es puntual, carece de sentido hablar de rotación alrededor de z, por ello el lagrangiano (8.123) no ˙ Entonces, como se se˜ contiene ni a ψ ni a ψ. nal´ o, podemos tomar ceros los valores de ψ ˙ y ψ. De la ecuaci´ on (7.122), junto con las ecuaciones (8.366) y (8.131) podemos escribir ~ , cuando ψ = 0 y ψ˙ = 0: para el vector ~ω 0 y ω   θ˙ + ω0 cos φ cos λ     ~ + ~ω0 =  senθ φ˙ − ω0 cos θ senφ cos λ − ω0 senθ senλ  (8.368) ω     cos θ φ˙ + ω0 senθ senφ cos λ − ω0 cos θ senλ Las derivadas de este vector respecto al tiempo son:  ¨ ˙ θ−ω0 senφ cos λ φ

 ˙ ~ 0 =φ¨ senθ+ θ˙ φ˙ cos θ+ω0 θ(senφ ~ω + ω senθ 

  

cos λ−cos θ senλ)−ω0 φ˙ cos θ cos φ cos λ

(8.369)

˙ φ¨ cos θ− θ˙ φ˙ senθ+ω0 θ(senφ cos θ cos λ+senθ senλ)+ω0 φ˙ senθ cos φ cos λ

Ciertamente las ecuaciones (8.367) son consistentes cuando ωz + ω0z valga cero. En efecto, las dos u ´ltimas igualdades de (8.367) se convierten en: g θ¨ − ω0 φ˙ senφ cos λ + senθ = 0 l

(8.370)

senθ φ˙ − ω0 cos θ senφ cos λ − ω0 senθ senλ = constante Si tomamos cero el valor de la constante en (8.370), esta ecuaci´ on será consistente con la ecuaci´ on ωz + ω0z = 0, cos θ φ˙ + ω0 senθ senφ cos λ − ω0 cos θ senλ = 0

(8.371)

solamente si se cumple que: φ˙ = ω0 senλ ;

φ=0

(8.372)

Esto quiere decir que tomar simult´ aneamente ceros los valores de ωy + ω0y y ωz + ω0z da aneamente. La ecuaci´ on lugar a la solución cuando los ejes x′ −y ′ y x−y coinciden instant´

314 / Mec´ anica cl´ asica (8.372) muestra una rotación uniforme del plano de oscilación del péndulo alrededor del eje z, en sentido positivo. En efecto, si el péndulo oscilara en el polo norte, donde senλ = 1, un observador en la Tierra ver´ıa rotar el plano del péndulo uniformemente en sentido contrario al de la rotación de la Tierra y con una velocidad angular igual a ω0 ; esto se ve claramente al notar que el plano de oscilación del péndulo en un sistema de referencia inercial no cambia, o sea que los ejes x − y no cambian en un sistema de referencia inercial y respecto a ellos los ejes x′ − y ′ rotan uniformemente. Para un péndulo de 100 m, g/l vale aproximadamente 10−1 s−2 en tanto que ω0 ≈ −8 −1 10 s , de modo que las ecuaciones (8.367) pueden resolverse fácilmente, sin hacer las suposiciones: ωz + ω0z = ωy + ω0y = 0, despreciando los términos que contengan a ω02 ˙ El resultado es que el plano de oscilación del péndulo rota uniformemente con y ω0 φ. una velocidad angular ω0 senλ, aun en donde los ejes x′ − y ′ y x − y no coinciden, y en que la rotación de la Tierra no tiene efecto sobre la coordenada θ sino con un término centr´ıfugo, que es del orden de ω02 . Ejemplo 8.6.2 Un giróscopo es un cuerpo r´ıgido simétrico montado sobre anillos de suspensión de cardán de modo que el cuerpo r´ıgido se puede mover libremente con el centro de gravedad fijo, por lo cual no hay torque gravitacional. La br´ ujula giroscópica es un giróscopo al cual se le impone la ligadura que consiste en impedir que el eje de simetr´ıa se mueva fuera del plano horizontal. Demuéstrese usando las ecuaciones de Euler que cuando la velocidad angular del giróscopo es grande comparada con la de la Tierra, este giróscopo oscilará alrededor de un meridiano, pudiendo utilizarse como br´ ujula (br´ ujula giroscópica de Foucault). Los ejes principales del giróscopo x, y, z, los definimos de modo que el eje de simetr´ıa es el eje z, que permanecer´ a en el plano horizontal. La figura 8.15a muestra los ejes fijos a la Tierra x′ , y ′ , z ′ , y la figura 8.15b los ejes x, y, z. Línea de nodos (φ = 0)

N

x′

0

z

ψ

j′ k′

x

Vertical

z′ Norte

θ

i′

k′

y′ 0

ω0 λ

Este

Línea del meridiano

S

y a

b

Figura 8.15 Ejes principales del giróscopo: a. Ejes x′ , y ′ y z ′ fijos a la Tierra, b. Ejes principales x, y y z del giróscopo.

Din´ amica del cuerpo r´ıgido / 315 La condición de ligadura impuesta a la suspensión de Card´ an es: φ=0

(8.373)

´ Esta implica que φ˙ = 0, o sea que la ligadura impuesta a las velocidades angulares ωx , ωy , ωz , de acuerdo con las ecuaciones (8.132) es: senψ ωx + cos ψ ωy = 0

(8.374)

Usando la notaci´ on de la secci´ on 2.8, escribimos la ligadura en la forma a1 ωx + a2 ωy + a3 ωx donde a1 = tan ψ, a2 = 1, a3 = 0. Entonces los componentes de la fuerza de ligadura son: Rx = λ tan ψ ;

Ry = λ ;

Rz = 0

(8.375)

donde λ es un multiplicador indeterminado de Lagrange. Las ecuaciones de movimiento son las ecuaciones de movimiento de Euler en un sistema de referencia rotante, ecuaciones (8.128) y (8.129), donde de acuerdo con los resultados de la secci´ on 2.8, debemos incluir los términos de torque debidos a la ligadura, (8.375). Por lo anterior, tales ecuaciones son: (ω˙ z + ω˙ 0z )I3 = 0 (ω˙ y + ω˙ 0y )I1 = (ωx + ω0x )(ωz + ω0z )(I3 − I1 ) + λ

(8.376)

(ω˙ x + ω˙ 0x )I1 = (ωy + ω0y )(ωz + ω0z )(I1 − I3 ) + λ tan ψ Las componentes de la velocidad angular de la Tierra en los ejes primados son: ω ~ 0′ = ω0 (senλ, 0, cos λ)

(8.377)

˜ ecuaci´ ~ 0 debemos usar la matriz de rotación A, on (7.122) de la Para hallar a ω secci´ on 7.6, tomando φ = 0:   senλ cos ψ + cos λ senψ senθ      ~ ω 0 = ω0  −senλ senψ + cos λ cos ψ senθ  (8.378)    cos λ cos θ ~ seg´ un (8.131) es: En tanto que ω, ˙ −senψ θ, ˙ ψ) ˙ ~ = (cos ψ θ, ω

(8.379)

~ω˙ + ~ω˙ 0 est´ a dada por: ¨ ˙



θcψ− θsψ(e−ω0 cλ cθ)+ω0 (−sλ sψ+cλ cψ sθ)(e − ω0 cλ cθ)+ω0 θ˙ cλ sψ cθ

   ¨ ˙ ˙ ~˙ 0 =−θsψ− ~˙ ω θcψ(e−ω ω+ 0 cλ cθ)+ω0 (−sλ cψ−cλ sψ sθ)(e − ω0 cλ cθ)+ω0 θ cλ cψ cθ   ˙ 0 cλ sθ −θω

(8.380)

316 / Mec´ anica cl´ asica donde usamos s y c en vez de sen y cos, y e es el valor de la constante que se obtiene de (8.376) o sea un esp´ın axial neto que incluye una componente de la rotación de la Tierra: e = ωz + ω0z

(8.381)

Reemplazando las ecuaciones (8.378) a (8.381) en las ecuaciones (8.376) obtenemos: θ¨ cψ + θ˙ sψ(−e + 2ω0 cλ cθ + A) +ω0 sψ(−e sλ + ω0 sλ cλ cθ + sλ A)

(8.382)

+ω0 cψ(e cλ sθ − ω0 c2 λ sθ cθ − A cλ sθ) = Λ tan ψ −θ¨ sψ + θ˙ cψ(−e + 2ω0 cλ cθ + A) +ω0 cψ(−e sλ + ω0 sλ cλ cθ + sλ A)

(8.383)

+ω0 sψ(−e cλ sθ + ω0 c2 λ sθ cθ + A cλ sθ) = Λ donde Λ es igual a λ/I1 y A est´ a defnida por: A=

I1 − I3 e I1

(8.384)

Multiplicando (8.382) por cos ψ y (8.383) por senψ y restando las ecuaciones resultantes, obtenemos: I3 θ¨ + ω0 e cos λ senθ − ω02 cos2 λ senθ cos θ = 0 I1

(8.385)

Para un lugar que no esté en los polos, cos λ 6= 0, y para una alta velocidad de rotación del giróscopo, e ≫ ω0 , la ecuaci´ on (8.385) se puede aproximar a: I3 eω0 cos λ senθ = 0 θ¨ + I1

(8.386)

´ Esta es una ecuaci´ on similar a la de un péndulo simple. Indica que el eje del giróscopo oscila alrededor de la l´ınea del meridiano, siendo el per´ıodo de peque˜ nas oscilaciones: r I1 (8.387) T = 2π I3 eω0 cos λ es decir, el mecanismo indica el norte, por lo tanto sirve de br´ ujula que indica el norte verdadero, a diferencia de una br´ ujula magnética que indica el norte magnético. Para una discusi´ on más detallada que incluye el caso en que el giróscopo est´ a montado sobre un barco, véase el texto de Atkin, Din´ amica cl´ asica, John Willey, 1959, o referencias especializadas sobre el giróscopo. La ecuaci´ on de ligadura (8.374) permite obtener a ψ(t) al reemplazar el resultado de integrar a (8.386), y la ecuaci´ on (8.376) permite entonces hallar a λ, y en consecuencia la fuerza de ligadura. Como la solución de (8.386) es una funci´ on el´ıptica, sn, las ecuaciones (8.374), (8.376) y (8.386) permiten expresar a θ, ψ y λ en términos de funciones el´ıpticas.

Din´ amica del cuerpo r´ıgido / 317 Ejercicio 8.6.1 Integrar las ecuaciones (8.374), (8.376) y (8.386) para hallar expl´ıcitamente a θ, ψ y λ en funci´ on del tiempo. Analizar los resultados.


9 Las transformaciones can´ onicas

9.1.

La acci´ on en funci´ on de las variables de estado

Seg´ un el principio de Hamilton, entre todas las trayectorias en el espacio de configuración que parten de un punto (q1 ) en t = t1 y terminan en un punto (q2 ) en t = t2 , el sistema sigue efectivamente a través de la trayectoria que extremaliza la integral de acción o, equivalentemente, por aquella que satisface las ecuaciones de Lagrange. Para expresar la acción en funci´ on de las coordenadas, debemos considerar todas las posibles trayectorias reales y circuitosas en el espacio de configuración y no solamente aquellas que pasan por dos puntos dados. Entre un par de puntos dados, (q1 ) en t = t1 y (q2 ) en t = t2 , sólo pasa una trayectoria recta (o real). O sea que a una familia de parejas de puntos [(q1 ) en t = t1 , (q2 ) en t = t2 ], definida de acuerdo con cierta regla, le corresponde una familia de trayectorias en “l´ınea recta” (o reales). As´ı por ejemplo, para un sistema de dos grados de libertad las trayectorias estar´ an situadas en un plano. Para precisar, asumamos que se trata de part´ıculas en presencia del campo gravitacional, el cual act´ ua a lo largo de la direcci´ on y. La figura 9.1 muestra la familia de puntos extremos (x1 , y1 en t1 ; x2 , y2 en t2 ), definida de la siguiente manera: r π 2a senθ ; 0 ≤ θ ≤ x1 = a cos θ ; y1 = a senθ ; t1 = g 2 x2 = b ;

1 y2 = a senθ + g 2

b − a cos θ t2 = + vx

r

b − a cos θ vx

2

(9.1)

2a senθ g

Este ejemplo muestra que para a, b, dados se puede definir una familia de trayectorias por hacer variar a θ entre 0 y π/2, con lo cual se var´ıan además los tiempos t1 y t2 . Los correspondientes puntos inicial y final est´ an sobre un arco de circunferencia y sobre un segmento de l´ınea recta respectivamente. Obviamente para un par de puntos 319

320 / Mec´ anica cl´ asica avanzada b

0 θ′ θ a

x P1 (x1, y1, t1)

P1′ (x1′, y1′, t1′) P2 (x2, y2, t2)

P2′ (x2′, y2′, t2′)

y

Figura 9.1 Familia de trayectorias dependiente de θ entre 0 y π/2

inicial y final dados, P1 , P2 , o sea para un valor dado de θ, se puede encontrar una familia de trayectorias circuitosas que pasan por esos dos puntos en t = t1 y t = t2 . Haciendo variar la tripleta de par´ ametros (a, b, θ) sobre todo el rango de sus valores posibles podr´ıamos obtener todas las posibles trayectorias “rectas” en el plano x − y; para definir las trayectorias circuitosas requerir´ıamos de par´ ametros adicionales. En general, sea (α) un conjunto completo de par´ ametros que define una familia de trayectorias rectas en el espacio de configuración. A esa familia de trayectorias le corresponde una familia de puntos iniciales y finales P1 , P2 y de tiempos t1 y t2 , dada por: t1 = t1 (α) ;

qν1 = qν1 (α)

t2 = t2 (α) ;

qν2 = qν2 (α)

(9.2)

ν = 1, 2, ...l Debemos definir desplazamientos virtuales entre una trayectoria real y las correspondientes trayectorias circuitosas y entre trayectorias reales. Esto se logra considerando: (a) Cambios virtuales en las qν , como antes y (b) Cambios virtuales en el tiempo, con lo cual los tiempos de los puntos inicial y final son distintos para cada trayectoria. Queremos evaluar el cambio en la integral de acción: Z t2 L dt (9.3) S= t1

cuando se pasa de una trayectoria real a otra de la familia. La diferencia de las coordenadas de las dos trayectorias la denotaremos ∆qν = qν (α + ∆α) − qν (α). Tal cambio consta de dos partes, uno virtual producido con t fijo y otro debido al cambio virtual en el tiempo: ∆qν = δqν + q˙ν δt ;

ν = 1, 2, ...l (9.4)

∆t = t(α + ∆α) − t(α)

Las transformaciones canónicas / 321 La figura 9.2 muestra dos trayectorias reales en el espacio de configuración que difieren por cantidades peque˜ nas. C1 y C2 son dos curvas que describen la familia de puntos extremos, o sea definidas por las ecuaciones (9.2). C2 P2 t C1

P1

t1 + ∆t1

t1 t1 + ∆t1

(∆q)

t2

(α)

t2 + ∆t2

(∆q) q∆t

t + ∆t

t (q + δq) (q + ∆q)

P2′

t2 (α + ∆α)

P1′

Figura 9.2 Trayectorias reales en el espacio de configuraci´ on A cada una de las dos trayectorias reales le corresponde un valor de la integral de acción (9.3). La diferencia de los valores de S es: S′ − S

∆S =

Z

=

t2 +∆t2

t1 +∆t1

dt L(q + δq, q˙ + δ q, ˙ t) −

Z

(9.5)

t2

dt L(q, q, ˙ t)

t1

Para ∆t1 y ∆t2 lo suficientemente peque˜ nos se cumple: Z t2 Z t2 +∆t2 L dt + L(t2 ) ∆t2 − L(t1 ) ∆t1 Ldt ≈

(9.6)

t1

t1 +∆t1

t t1

t1 + ∆t1

t2

t2 + ∆t2

Figura 9.3 Cambio en el tiempo ∆t al variar (α) Entonces (9.5) se puede escribir como: ∆S =

Z

t2

t1

−

Z

t2

t1

t2 L(q + δq, q˙ + δ q, ˙ t)dt + L(q + δq, q˙ + δ q, ˙ t)∆t t1

L(q, q, ˙ t)dt

(9.7)

322 / Mec´ anica cl´ asica avanzada Por otra parte sabemos que: L(q + δq, q˙ + δ q, ˙ t) − L(q, q, ˙ t) = l X ∂L ν=1

d δqν + (pν δqν ) − p˙ ν δqν ∂qν dt

(9.8)

al primer orden en (δq). Entonces: ∆S =

Z

t2

t1

l X ∂L ν=1

∂qν

− p˙ν δqν +

l X

ν=1

t2 t2 pν ∆qν + L ∆t t1

(9.9)

t1

donde despreciamos todos los términos de orden superior al primero en (δq) y (q˙ ∆t). Como los (p) corresponden a la trayectoria real P1 P2 , de acuerdo con las ecuaciones de Lagrange la integral en (9.9) es cero, luego: ∆S =

l X

ν=1

! t2 pν δqν + L ∆t

(9.10)

t1

Debido a que δqν = δqν − q˙ν ∆t, obtenemos: ! t2 l X ∆S = pν ∆qν − H ∆t ν=1

(9.11)

t1

Esta expresión nos dice que: pν =

∂S ∂S ∂S ∂S , H=− , H= en t = t2 ; pν = − en t = t1 ∂qν ∂t ∂qν ∂t

(9.12)

Es claro que ∆S es la diferencia de dos términos infinitesimales, evaluados en t1 y t2 . Ahora, si llamamos t a t2 y escogemos a C1 de modo que se reduzca a un punto, es decir, tomamos fijo el punto p1 : δqν (t1 ) = 0, ∆t1 = 0; ν = 1, 2, ...l

(9.13)

Obtenemos: ∆S =

l X

ν=1

pν ∆qν − H ∆t

(9.14)

Esta expresión nos da la diferencial total de cierta funci´ on S de las coordenadas y del tiempo sobre la curva C2 . De P1 sale un haz de trayectorias reales que cortan la curva C2 . La ecuaci´ on (9.14) nos da la diferencia en la acción para dos trayectorias reales diferentes cuando cortan la curva C2 . Es claro entonces que: pν =

∂S ; ∂qν

ν = 1, 2, ...l; H = −

∂S ∂t

(9.15)

Las transformaciones canónicas / 323 Siendo S = S(q, t) la acción en funci´ on de las coordenadas y del tiempo: Z t2 L dt S(q, t) =

(9.16)

t1

Si se impone la condición de que las variaciones en el l´ımite superior se anulen, obviamente lo que se obtiene es ∆S = 0, y de ah´ı las ecuaciones de movimiento. A la funci´ on S[q(t), t] se le denomina la acción en funci´ on de las coordenadas: es el n´ umero que se asocia a la trayectoria que comienza en P1 y termina en q(t), t, o sea sobre la l´ınea C2 . Como q y t dependen de (α), S es una funci´ on de (α).

9.2.

La integral invariante de Poincar´ e-Cart´ an

En lugar del espacio de configuración l-dimensional, consideramos el espacio de fases 2l-dimensional, en el cual cada punto en el tiempo t se especifica por (q, p). En este espacio definamos dos curvas cerradas, C1 y C2 , cuyos puntos sean el comienzo y el final de una familia de trayectorias rectas en el espacio de fases; es decir, tales que si el sistema inicialmente estaba descrito por un punto de C1 evolucionará de acuerdo con las ecuaciones can´ onicas hasta llegar a cierto punto final sobre C2 . Las ecuaciones que definen las curvas cerradas C1 , C2 , son análogas a (9.2): t1 =

t1 (α);

qν1 = qν1 (α) ;

p1ν = p1ν (α)

t2 =

t2 (α) ;

qν2 = qν2 (α) ;

p2ν = p2ν (α) ;

(9.17) α = 1, 2, ...l

donde ahora los par´ ametros (α) son tales que var´ıan entre (αi ) y (αf ) de modo que las funciones de (α) definidas por (9.17) son periódicas, es decir toman el mismo valor cuando (α) = (αi ) que cuando (α) = (αf ). Por ejemplo, para el oscilador tridimensional ligado a moverse sobre un cilindro, la familia de trayectorias correspondiente a (9.17) es mostrada en la figura 9.4. (Véase el ejemplo 4.3.1 en la secci´ on 4.3). Es claro que C1 y C2 deben estar sobre la hipersuperficie Ez constante. En general, la familia de trayectorias tiene la apariencia de un “tubo”1 donde C1 y C2 son las curvas que describen la forma de las “puntas”. Por la causalidad, es claro que las trayectorias no se intersectan. A cada valor de las (α) le corresponde uno y sólo un punto sobre C1 , un punto sobre C2 y una trayectoria y sólo una. Cada trayectoria tiene un valor dado de la acción: Z t2 (α) ˜ ˜ [q(α, t), q(α, S= L ˙ t), p(α, t), p(α, ˙ t), t] (9.18) t1 (α)

˜ es definido en (3.77), seg´ donde L un: ˜ (q, p, q, L ˙ p, ˙ t) =

l X

ν=1 1 Llamado

pν q˙ν − H(q, p, t)

tambi´ en “tubo de l´ıneas caracter´ısticas”.

(9.19)

324 / Mec´ anica cl´ asica avanzada Pz C1

θ z C2

Figura 9.4 Familia de trayectorias para el oscilador tridimensional ligado a moverse sobre un cilindro

Por un procedimiento análogo al que conduce a (9.9), hallamos para la diferencia de la acción entre dos trayectorias vecinas:

∆S˜ =

(

l Z X

ν=1

dt

"

∂H q˙ν − ∂pν

!

δpν

# ) t2 d ∂H δqν + (pν ∆qν ) + L ∆t − p˙ ν + ∂qν dt

(9.20)

t1

Teniendo en cuenta que las trayectorias en el espacio de fases son “rectas”, definidas por las ecuaciones de Hamilton, se sigue:

∆S˜ =

"

l X

ν=1

# t2 pν δqν + L ∆t

(9.21)

t1

Ahora, usando (9.4) en (9.21) obtenemos que ∆S˜ = ∆S, ecuaci´ on (9.11):

∆S˜ =

"

l X

ν=1

# t2 pν ∆qν − H ∆t

(9.22)

t1

∆S˜ es el cambio en la acción al cambiar infinitesimalmente de una trayectoria de fases real a otra, o sea al variar infinitesimalmente las (α). Podemos integrar cada término en (9.22) respecto a (α), desde (α) = (αi ) hasta (α) = (αf ), o sea sobre todas

Las transformaciones canónicas / 325 las trayectorias que comienzan y terminan en las curvas cerradas C1 y C2 : # t2 Z (αf ) "X l pν ∆qν − H ∆t S(αf ) − S(αi ) = (αi ) ν=1

=

Z

l X

(αf )

p2ν ν=1

(αi )

−

=

Z

(αf )

(αi )

I

C2

−

I

C1

l X

ν=1

∆qν2

p1ν

2

− H ∆t2

∆qν1

ν=1

l X

ν=1

l X

1

C1

l X

ν=1

!

!


Hemos demostrado que la integral de l´ınea, ! I X l pν ∆qν − H ∆t I=

(9.23)

!


ν=1

!

− H ∆t1


Como S(αi ) = S(αf ) obtenemos: ! I I l X pν ∆qν − H ∆t − C2

t1

!

=0

(9.24)

(9.25)

ν=1

no cambia su valor tomada sobre un contorno arbitrario del espacio fásico, a través del cual pasan trayectorias reales que lo deforman al desplazarse sobre la “manguera” de trayectorias reales. I es una integral invariante, llamada la integral invariante de Poincaré-Cart´ an (véase el texto de Gantmacher, Lectures in analytical mechanics, secci´ on 18). Teorema de Poincar´ e-Cart´ an. I es una integral invariante a lo largo de un haz de trayectorias arbitrario en el espacio de fase si y sólo si esas trayectorias son solución a las ecuaciones can´ onicas de Hamilton. Hemos demostrado que si las trayectorias son solución a las ecuaciones de Hamilton, I es una integral invariante. Restar´ıa por mostrar que si I es una integral invariante entonces las trayectorias son solución a las ecuaciones de Hamilton. La demostración est´ a en el texto de Gantmacher indicado anteriormente. Como en este teorema se muestra que las ecuaciones de Hamilton son consecuencia de la invariancia de I, ésta puede plantearse como un principio general de la mecánica, que fue hallado por Poincaré en el a˜ no 1890. Las ecuaciones de Whittaker. En la integral de Poincaré-Cart´ an (9.25), podemos ver que hay analog´ıa entre las pν y −H, y entre las qν y t. Podemos pensar en un

326 / Mec´ anica cl´ asica avanzada formalismo en el cual se intercambien los papeles de (−H, t) y una pareja de variables can´ onicamente conjugadas, digamos (p1 , q1 ),2 en un espacio de fases ampliado 2l + 1dimensional, donde t no es simplemente un par´ ametro. Sean (S = −H, t) las cantidades que cambiaremos por (p1 , q1 ): s = −H(q, p, t)

(9.26)

La ecuaci´ on (9.26) nos permite expresar a p1 en términos de (q), p2 , ...pl , s, t: p1 = −K(q1 , q2 , ...ql , p2 , p3 , ...pl , s, t) Entonces podemos escribir la integral invariante I como: I I = (s∆t + p2 ∆q2 + pl ∆ql − K ∆q1 )

(9.27)

(9.28)

En estas variables, K hace las veces de H y q1 las veces de t. Hemos probado, pues, que el movimiento del sistema con las nuevas variables obedece las ecuaciones: dt = dq1

∂K ; ∂s

∂K ∂s =− dq1 ∂t

dqν = dq1

∂K ; ∂pν

dpν ∂K =− ; dq1 ∂qν

(9.29) ν = 1, 2, ...l

donde ahora q1 es la variable independiente o “tiempo”. Sea ahora un sistema generalizado conservativo (o sea un sistema arbitrario para el cual H no depende del tiempo). En este caso: H(q, p) = h = constante

(9.30)

que sabemos, en general no coincide con E = T + V . Ahora, en la integral invariante I tomemos sólo aquellos estados para los cuales la constante h toma un mismo valor, h0 . Todas las trayectorias tendrán la misma energ´ıa. Entonces: I I H ∆t = h0 ∆t = 0 (9.31) La integral invariante será:3 I=

I X l

pν ∆qν

(9.32)

ν=1

Si ahora en (9.30) despejamos p1 obtenemos: p1 = −K(q1 , q2 , ...ql ; p2 , p3 , ...pl , h0 )

(9.33)

2 V´ ease el texto de Whittaker, A treatise on the analytical dynamics of particles and rigid bodies, cap´ıtulo XII, numeral 141. 3 La invariancia de I es an´ aloga a un teorema de hidrodin´ amica que establece que la circulaci´ on en cualquier curva cerrada que se mueve con un fluido no cambia con el tiempo.

Las transformaciones canónicas / 327 con lo cual (9.32) se puede escribir en la forma: ! I X l pν ∆qν − K∆q1 I=

(9.34)

ν=2

Esta integral toma la forma de la integral invariante de Poincaré-Cart´ an, tomando como variables de estado a q2 , p2 , q3 , p3 , ...ql , pl , a q1 como el tiempo, y a K en lugar de H. En virtud del teorema mencionado, se cumple que el movimiento de este sistema obedece las ecuaciones de Hamilton siguientes (2l − 2 en total): dqν ∂K = ; dq1 ∂pν

dpν ∂K =− ; dq1 ∂qν

ν = 2, 3, ...l

(9.35)

Las ecuaciones (9.35) son las ecuaciones de Whittaker. O sea que para un sistema generalizado conservativo (para el cual H es constante) se requieren sólo 2l − 2 ecuaciones para definir la trayectoria del sistema. El sistema de ecuaciones hamiltonianas de Whittaker puede ser expresado en forma lagrangiana: ∂M d ∂M = 0; − dq1 ∂qν′ ∂qν

ν = 2, 3, ...l

(9.36)

donde qν′ = dqν /dq1 y M (la funci´ on análoga de la lagrangiana) es el generador de la transformaci´ on de Legendre de las variables (qν , qν′ ) a las variables (qν , pν ). M y K tienen una relaci´ on análoga a L y H, véase (3.16). M (q2 , q3 , ...ql ; q2′ , q3′ , ...ql′ ; q1 ) = l X

ν=2

pν qν′ − K(q1 , q2 , q3 , ...ql , p2 , p3 , ...h0 )

(9.37)

La integraci´ on de las ecuaciones de Whittaker nos conduce a qν , pν , en funci´ on de q1 , es decir, a las ecuaciones de la trayectoria en el espacio de fases. La solución de (9.35) contendrá 2l − 2 constantes de integraci´ on y dependerá además de la constante h0 : qν = qν (q1 , h0 , C1 , C2 , ...C2l−2 )

(9.38) pν = pν (q1 , h0 , C1 , C2 , ...C2l−2 ) ;

ν = 2, , 3, ...l

Reemplazando (9.38) en (9.33) llegamos a: p1 = p1 (q1 , h0 , C1 , C2 , ...C2l−2 )

(9.39)

Las expresiones (9.38) y (9.39) constituyen las ecuaciones de las trayectorias en el espacio de fases. La dependencia temporal de las coordenadas se recobra de la ecuaci´ on q˙1 = ∂H/∂p1 : Z dq1 t= + C2l−1 (9.40) ∂H/∂p1 donde ∂H/∂p1 se puede expresar en términos de q1 por medio de las ecuaciones (9.38) y (9.39). Para sistemas que poseen la constante de movimiento h, se puede resolver el problema mecánico con sólo 2l − 2 ecuaciones del tipo hamiltoniano o con l − 1 ecuaciones del tipo lagrangiano, (9.35) y (9.36) respectivamente.


9.3.

El principio de m´ınima acci´ on y expresiones equivalentes

El principio de m´ınima acci´ on de Maupertuis-Euler-Lagrange. Como las ecuaciones (9.36) son de tipo lagrangiano, pueden ser obtenidas de un principio variacional, ∆Σ = 0, donde: Σ=

Z

q22 q11

M (q2 , q3 , ...ql ; q2′ , q3′ , ...ql′ ; q1 ) dq1

(9.41)

La variable Σ es llamada la acci´ on de Lagrange, en tanto que S se llama la acci´ on de Hamilton. ∆Σ = 0 caracteriza las trayectorias que pasan por los puntos definidos por q1 = q11 y q1 = q12 , o sea las soluciones de (9.36) tales que ∆qν (q11 ) = ∆qν (q12 ) para ν = 2, 3, ...l. ∆ representa “desplazamientos virtuales” respecto a q1 , es decir, desplazamientos realizados con q1 fijo y que no cambian los extremos de la trayectoria; en cuanto al tiempo la situaci´ on es diferente, pues t1 y t2 pueden variar cuando se pasa de una trayectoria real a una circuitosa. Esto es esquematizado en la figura 9.5, donde B representa una trayectoria real y A una circuitosa, ambas con el mismo valor de la energ´ıa.4 t2 + ∆t2 (q + ∆q) t + ∆t

t

P1

1 q1

P2 2

t2

A

t1 + ∆t1

q1

(∆q)

(q) B

t

t1

Figura 9.5 Paso de una trayectoria real B a una circuitosa A

La funci´ on M se puede expresar en términos de L. En efecto, se sigue de (9.27) y (9.37) que:

M=

l X

ν=2 4 Las

l

pν qν′ + p1 =

1X 1 1 pν q˙ν = (L + H) = (2T2 + T1 ) q˙ ν=1 q˙ 1 q˙ 1

(9.42)

trayectorias A y B que se cortan en P1 y P2 en el espacio de configuraci´ on, son las proyecciones de dos trayectorias en el espacio de fases ampliado, sobre H = h0 , que no se cortan.

Las transformaciones canónicas / 329 En la igualdad (9.42) se ha usado la ecuaci´ on (3.127). La integral (9.41) se puede escribir como: Z t2 (L + H)dt = S + h(t2 − t1 ) (9.43) Σ= t1

se ve que ∆Σ = ∆S + h(∆t2 − ∆t1 ), cuando tomamos sólo trayectorias circuitosas con el mismo valor de la energ´ıa. La expresión ∆Σ = 0 define la ecuaci´ on de la trayectoria entre todas las que satisfacen la conservaci´ on de la energ´ıa, con ∆qν = 0 en P1 y P2 . Además, se sigue de (9.41) y (9.43): Z t2 X l Σ= pν q˙ν dt (9.44) t1

ν=1

Para un sistema conservativo ordinario (tal que T + V es constante), T1 = 0 y T = T2 , con lo cual (9.42) nos dice que M = 2T /q1 . Entonces: Z t2 N Z ri2 X mi r˙i dri (9.45) 2T dt = Σ= t1

i=1

ri1

Esto nos dice: “dada la configuración inicial y final de un sistema descrito por un hamiltoniano constante, e igual a la energ´ıa total, con un valor dado de la energ´ıa, la trayectoria del sistema en el espacio de configuración es aquella para la cual la integral de la energ´ıa cinética es estacionaria, cuando se compara con las trayectorias vecinas que satisfacen dichas condiciones”. Este principio es aplicable sólo a sistemas conservativos. Los tiempos requeridos para moverse sobre las diferentes trayectorias pueden cambiar pero la energ´ıa es la misma sobre cada curva. En el principio de Hamilton aplicado a sistemas conservativos, se consideran sólo aquellas trayectorias para las cuales el tiempo de movimiento a lo largo de ellas es el mismo, aunque las energ´ıas asociadas a ellas pueden diferir. Las trayectorias variadas en el principio de Hamilton no corresponden necesariamente con trayectorias posibles del movimiento del sistema, H puede no conservarse sobre ellas. En el principio de m´ınima acci´ on se consideran trayectorias variadas donde el tiempo puede variar pero H s´ı se conserva. En estos dos principios se halla la trayectoria verdadera “escogiendo” entre las trayectorias de dos conjuntos de trayectorias definidas de manera diferente. Otra forma de obtener que ∆Σ = 0 es la siguiente: Z t2 X Z t2 l (L + H) dt = S + h(t1 − t2 ) (9.46) Σ= pν q˙ν dt = t1

t1

ν=1

Tomando variaciones en (9.46) y usando la expresión (9.11) para ∆S: t2 " l # t2 X ∆Σ = ∆S + h(∆t1 − ∆t2 ) = pν ∆qν − h∆t + h∆t ν=1 t1 t1 t2 l X = pν ∆qν ν=1

t1

(9.47)

330 / Mec´ anica cl´ asica avanzada Tomando a ∆qν = 0 en t1 y t2 y ν = 1, 2, ...l, se sigue que ∆Σ = 0. A la funci´ on S se le llama acci´ on principal ( o de Hamilton) y a la funci´ on Σ se le llama acci´ on reducida (o de Lagrange). Resumen Hist´ orico. Fermat, matemático francés (1601-1665), formuló el principio del m´ınimo tiempo en la óptica de rayos: un rayo de luz se propaga sobre aquella trayectoria para la cual el tiempo de tránsito es m´ınimo. En lenguaje variacional (moderno): Z B Z B dl ∆ dt = 0 ⇒ ∆ =0 (9.48) A A v Maupertuis, especulando con las concepciones filosóficas de Leibnitz, expresó en 1744 la conjetura de que la evoluci´ on de una part´ıcula material se da de tal manera que el producto m.v.l es m´ınimo, dio ejemplos en los cuales las trayectorias son rectil´ıneas y por tanto v es constante. El matemático suizo Euler (1703-1793) enunci´ o en 1744 el principio de m´ınima acción, esta vez como un teorema, basado en sus trabajos sobreRel c´ alculo de variaciones. Tal enunciado es de la forma: la diferencia entre la integral vdl para una part´ıcula, tomada a lo largo de una trayectoria real, y la misma integral sobre una trayectoria vecina (es decir sobre una trayectoria sobre la cual se mueve la part´ıcula sin obedecer las leyes de Newton), que pasan por dos puntos dados, es una cantidad infinitesimal de segundo orden; se supone que la part´ıcula viaja sobre la trayectoria variada con una velocidad para la cual la energ´ıa total tiene un valor dado: Z B ∆E=C v dl = 0 (9.49) A

donde C es una constante. En 1760 Lagrange (1736-1813) extendió el principio de Euler a sistemas de part´ıculas: ∆E=C

Z

N BX

A

i=1

m~vi · d~ri = 0

(9.50)

Lagrange mostró además que (9.50) se cumple si y sólo si vale la segunda ley de Newton, mi~¨r i = −∂V /∂~ri , i = 1, 2, ...N . Además, Lagrange fue el primero que introdujo las coordenadas generalizadas, con las cuales (9.50) es: ∆E=C

Z

N BX

A

pν dqν = 0

(9.51)

i=1

Cuando en (9.51) se asume que T es funci´ on cuadrática de las velocidades generalizadas se tiene: Z B ∆E=C 2T dt = 0 (9.52) A

Lagrange llam´ o a (9.52) el principio de la más peque˜ na o más grande fuerza viva.

Las transformaciones canónicas / 331 Hamilton, escocés que vivió entre 1805 y 1865, aport´ o en 1835 la formulaci´ on general del principio de m´ınima acción y las ecuaciones de Hamilton. Extiende la formulaci´ on al considerar trayectorias circuitosas en que la energ´ıa no se conserva: Z B Z B ∆ L dt = ∆ (2T − H)dt = 0 (9.53) A

A

El conjunto de trayectorias es tal que pasa simult´ aneamente por los mismos puntos inicial y final. Es claro ya por qué a Σ se llama la acción de Lagrange y a S la acción de Hamilton. Los principios de Hamilton y de m´ınima acción son aplicables equivalentemente para sistemas conservativos, sin embargo, el primero es más general pues se aplica además a sistemas hol´ onomos generales, con una generalizaci´ on a sistemas hol´ onomos con fuerzas no derivables de un potencial, ecuaci´ on (3.12). Las ecuaciones de Jacobi. Para el caso de un sistema conservativo ordinario T puede escribirse como: T = T2 =

l X

aµν q˙µ q˙ν = q12 G(q1 , q2 , ...ql , q2′ , q3′ , ...ql )

(9.54)

µ,ν=1

donde: G=

l X

aµν qµ′ qν′

(q1′ = 1)

(9.55)

µ,ν=1

Como H = h = T + V , (9.54) conduce a: r h−V q˙1 = G

(9.56)

Para M , (9.56) nos da: M=

p 2T = 2 G(h − V ) q˙1

(9.57)

Las ecuaciones diferenciales lagrangianas de Whittaker, (9.36) con M dado por (9.57), que son aplicables a sistemas conservativos ordinarios, se llaman las ecuaciones de Jacobi (1886). Otras formas del principio de acci´ on estacionaria de Maupertuis-EulerLagrange. Definimos en el espacio de configuración los vectores l-dimensionales ρ~ = {q1, q2, ...ql }. Entonces el vector ρ ~ determina la posición del sistema en el espacio de configuración. La energ´ıa cinética est´ a relacionada con la velocidad del punto representativo del sistema en el espacio de configuración, ρ ~˙ . Para un sistema esclerónomo la energ´ıa cinética es funci´ on cuadrática de las velocidades generalizadas, de acuerdo con (9.54): T =

l l 1 X 1 X 2aµν q˙µ q˙ν = mµν dqµ dqν 2 µ,ν=1 2dt2 µ,ν=1

(9.58)

332 / Mec´ anica cl´ asica avanzada Si definimos en el espacio de configuración la métrica no cartesiana mµν = 2aµν , donde aµν est´ a dada por (3.105), el producto escalar de dos vectores, ρ ~ y ~n, estar´ a dado por: (~ ρ, ~η ) =

l X

mµν ρµ ην

(9.59)

µ,ν=1

O sea que es posible asociar al espacio de configuración de un sistema mecánico un espacio riemanniano, dado por la métrica (tensor métrico) mµν (véase el texto de Lichnerowicz, C´ alculo tensorial, cap´ıtulo VI). De las expresiones (9.58) y (9.59), tenemos que: T =

1 ˙2 dρ ρ ~ ⇒ dt = √ 2 2T

(9.60)

Se sigue que la energ´ıa cinética de un sistema dinámico siempre coincide con la energ´ıa cinética del punto representativo en el espacio de configuración, si a ese punto se le asigna una masa m = 1. El principio de acción estacionaria tomará la forma: Z (q2 ) √ Z t2 2T dρ = 0 (9.61) 2T dt = ∆ ∆Σ = ∆ t1

(q1 )

Para sistemas conservativos, tales que h = T + V : Z (q2 ) √ ∆ h − V dρ = 0

(9.62)

(q1 )

La ecuaci´ on (9.62) se llama la forma de Jacobi del principio de acción estacionaria. Para un movimiento libre, V = 0: Z (q2 ) dρ = 0 (9.63) ∆ (q1 )

La ecuaci´ on (9.63) indica √ que la trayectoria es la √ más corta, la l´ınea recta; donde la longitud recorrida es ρ = 2h, donde ρ = (t1 − t2 ) 2h. Para V = 0, el punto representativo del sistema en el espacio de configuración se √ mueve uniformemente con velocidad 2h sobre una trayectoria recta. En general, para V 6= 0, de la forma de Jacobi del principio de acción estacionaria se deduce que la trayectoria del sistema en el espacio de configuración (trayectoria real) es la geodésica. Esta trayectoria también es la “m´ as recta” o sea la de m´ınima curvatura (principio variacional de Hertz de la m´ınima curvatura).

9.4.

El teorema de Li Hua Chung

Sea la integral invariante de Poincaré-Cart´ an, I, definida en (9.25). Seg´ un (9.24), I tiene el mismo valor sobre cualquier contorno cerrado que envuelva el mismo haz de trayectorias reales en el espacio de fases. Particularicemos para el caso en que los puntos

Las transformaciones canónicas / 333 sobre C1 y C2 tienen los mismos tiempos. Es decir, sea C1 un conjunto de puntos del espacio de fases que forma una l´ınea cerrada y que corresponde a estados simult´ aneos de un sistema de acuerdo con (9.17), las ecuaciones paramétricas de C1 son: qν1 = qν1 (α) ;

t1 (α) = constante ;

p1ν = p1ν (α) ;

ν = 1, 2, ...l

(9.64)

C2 est´ a definida similarmente. A lo largo de estos contornos se cumple que ∆t = 0, reduciéndose la ecuaci´ on (9.24) a: I

l X

pν ∆qν =

C2 ν=1

I

l X

pν ∆qν = I1

(9.65)

C1 ν=1

La integral I1 fue introducida por Poincaré pero fue Cart´ an quien la extendió a contornos formados por estados no simult´ aneos con la introducción del término adicional −Ht.5 Sea C un contorno arbitrario en el espacio de fases (véase figura 9.6). Es claro que las proyecciones de C sobre cada uno de los planos de fase (qν , pν ), ν = 1, 2, ...l, constituye una curva cerrada bidimensional, que llamaremos Cν , ν = 1, 2, ...l. Pν

Cν

Aν

qν

Figura 9.6 C es un contorno arbitrario en el espacio de fases con proyecciones Cν Se sigue entonces que: I (p1 ∆q1 + p2 ∆q2 + ...pl ∆ql ) = C I I I p2 ∆q2 + ... p1 ∆q1 +

pl ∆ql

(9.66)

El a ´rea encerrada por el contorno Cν es Aν , donde: I pν ∆qν = ±Aν

(9.67)

C1

C2

Cl

Cν

5 La

mec´ anica de Hamilton puede desarrollarse postulando un espacio de dimensi´ on par dotado de una estructura definida por la invariancia de I1 .

334 / Mec´ anica cl´ asica avanzada Se toma el signo más si se eval´ uHa la integral Hen el sentido de las agujas del reloj y menos en el sentido contrario. Como C pν ∆qν = cν pν ∆qν , el sentido del contorno Cν dependerá del sentido de C. Entonces: I X l l X ±Aν (9.68) pν ∆qν = I1 = C ν=1

ν=1

donde C consta de estados simult´ aneos. Los contornos C y Cν var´ıan durante el movimiento del sistema y las áreas Aν también var´ıan, pero la suma algebraica de esas areas, (9.68), permanece constante. La anterior es pues la interpretaci´ ´ on geométrica de la invariancia de la integral de Poincaré I1 . Como H no aparece en I1 , hallamos que la invariancia de I1 no depende del sistema mecánico particular, es decir, I1 es invariante para cualquier sistema hamiltoniano. Por esto se llama a I1 la integral universal invariante. Es válido entonces enunciar el siguiente teorema: si q˙ν = ∂H/∂pν ; p˙ ν = −∂H/∂qν , ν = 1, 2, ...l, entonces I1 es invariante. Si I1 es invariante para alg´ un sistema de ecuaciones diferenciales q˙ν = Qν = Qν (q, p, t), p˙ν = Pν (q, p, t), ν = 1, 2, ...l, entonces ese sistema debe ser hamiltoniano. Para demostrar la segunda parte, sea: I X l dpν dI1 d∆qν = ∆qν + pν dt dt dt ν=1 =

I X l

(p˙ ν ∆qν + pν ∆q˙ν )

I X l

(p˙ ν ∆qν + ∆(pν q˙ν ) − ∆pν q˙ν )

I X l

(p˙ ν ∆qν − q˙ν ∆pν )

I X l

(Pν ∆qν − Qν ∆pν )

ν=1

=

ν=1

=

ν=1

=

ν=1

(9.69)

Como I1 = 0, se sigue que (9.69) debe ser igual a la integral de una diferencial ∆ exacta de alguna funci´ on de (q, p, t) que llamaremos −H: I X l (Pν ∆qν − Qν ∆pν ) = ν=1

I

−∆H = −

Z X l ∂H ν=1

∂H ∆qν + ∆pν ∂qν ∂pν

(9.70)

entonces, Pν = −∂H/∂qν ; Qν = ∂H/∂pν ; ν = 1, 2, ...l, con lo cual se concluye la prueba.

Las transformaciones canónicas / 335 Teoremas de Stockes. En la teor´ıa de campos vectoriales se muestra que la integral de l´ınea a lo largo de una curva rectificable es igual a la integral de superficie sobre la regi´ on encerrada por esa l´ınea del rotacional del vector: I Z Z ~ · dS ~ V~ · d~r = rotV (9.71) C

S

En términos de las componentes: Z Z X I X 3 3 ∂Vj Vi dxi = dSk ǫijk ∂xi C i=1

(9.72)

S i,j,k=1

~ que determina un donde ǫijk es el tensor de Levi-Civita. dSk es la componente de dS plano perpendicular a la direcci´ on ~ek ; por tanto dSk = dxi dxj con i 6= j 6= k, o sea que: Z Z X I X 3 3 ∂Vj ∂Vi Vi dxi = dxi dxj (9.73) − ∂xi ∂xj C i=1 i
En geometr´ıa diferencial se llama a una integral sobre un contorno cerrado “integral relativa” y a una integral sobre una región que no es cerrada “integral absoluta”; una integral de l´ınea se llama de “primer orden” y una de superficie se llama “de segundo orden” porque aparecen uno y dos diferenciales respectivamente. En el espacio de fases, el teorema de Stockes toma la forma: Z Z X I X 2l 2l ∂Vj ∂Vi Vi ∆xi = ∆xi ∆xj (9.74) − ∂xi ∂xj C i=1 i
donde x1 = q1 , ...xl = ql ; xl+1 = p1 , ...x2l = pl . As´ı, para l = 1, (9.74) es: Z Z I ∂A ∂B ∆q ∆p − (A∆q + B∆p) = ∂q ∂p C

(9.75)

S

En particular, para A = p y B = 0, como es de esperarse: Z Z Z p ∆q = ∆p ∆q C

(9.76)

S

La ecuaci´ on (9.74) puede escribirse como: I X l (Aν ∆qν + Bν ∆pν ) = C ν=1

Z Z " X l ∂Aν ∂Aµ ∆qµ ∆qν + − ∂qµ ∂qν µ<ν=1 S

l X ∂Aµ ∂Bν ∆qµ ∆pν + − ∂qµ ∂qν µ,ν=1 # l X ∂Bν ∂Aµ ∆pµ ∆pν − ∂pµ ∂pν µ<ν=1

(9.77)

336 / Mec´ anica cl´ asica avanzada Para Aν = pν y Bν = 0, se cumple: I X Z Z X l l pν ∆qν = ∆pν ∆qν C ν=1

(9.78)

S ν=1

En general, una integral relativa de orden 2ν − 1, de orden impar, puede escribirse como una integral absoluta de orden par 2ν, para ν = 1, 2, ...l. As´ı por ejemplo, se cumple que: Z Z X I X l l pν ∆qν = J2 = ∆qν ∆pν (9.79) I1 = S ν=1

ν=1

I3

=

=

Z Z Z

l X

pν ∆qν ∆pµ ∆qµ = J4

µ,ν=1

Z Z Z Z X l

∆qν ∆pν ∆qµ ∆pµ

(9.80)

µ,ν=1

I2l−1 =

=

Z Z

Z Z Z

...

Z ···

Z

l X

pν1 ∆qν1 ∆pν2 ∆qν2 ... ∆pνl ∆qνl = J2l

ν1 , ν2 , ...νl =1 l X

(9.81) ∆q1 ∆p1 ... ∆ql ∆pl

ν1 , ν2 , ...νl =1

Se puede mostrar que I1 , I3 , ...I2l−1 son integrales universales invariantes. O sea que una integral universal invariante relativa de orden impar I2ν−1 puede representarse como una integral invariante absoluta de orden par J2ν . En 1947 Li Hua Chung prob´ o que cualquier integral universal invariante difiere por un factor constante de una de las integrales (9.79), (9.80) o (9.81). Gantmacher presenta la demostración de que cualquier integral universal invariante relativa de primer orden es un m´ ultiplo de I1 , para l = 1. Teorema de Li Hua Chung. Este teorema dice que si: ZZ Z h l X ··· Aµ1 ∆qµ1 ∆pµ2 ∆qµ2 ... I (ν) = Vν

µ1 , µ2 , ...µl =1

∆pµν ∆qµν + Bµ1 ∆pµ1 ∆pµ2 ∆qµ2 ... ∆pµν ∆qµν es una integral universal invariante relativa, entonces: I (ν) = CIν

(9.82)

i

(9.83)

donde C es una constante, e Iν es una de las l integrales universales invariantes de Poincaré. Vν es una variedad cerrada de ν dimensiones en el espacio de fases, donde

Las transformaciones canónicas / 337 ν = 1, 3, ..,2l − 1. Notaci´ on vectorial en el espacio de fases. V~ denotará una matriz columna ˜ es una matriz cuadrada, l × l, de l dimensiones con componentes Vν , ν = 1, 2, ...l. M con componentes Mµν . El gradiente de una funci´ on F respecto a las coordenadas y a los momentos, se denota respectivamente por: ∂F ∂F , ∂~q ∂~ p

(9.84)

y es un vector, o sea una matriz columna con componentes ∂F/∂qν y ∂F/∂pν respectivamente; ν = 1, 2, ...l. El gradiente de un vector es una matriz l × l, as´ı: ! ! ~ ~ ∂Vµ ∂Vµ ∂V ∂V = = ; ; µ, ν = 1, 2, ...l (9.85) ∂~q ∂qν ∂~ p ∂pν µν

µν

El producto escalar de dos vectores es: ~ ·V ~ = U

l X

Uν Vν

(9.86)

ν=1

˜V ~ , es un vector. y el producto de una matriz por un vector, M Prueba del teorema de Li Hua Chung para ν = 1. Usando la notaci´ on vectorial, se cumple que: I X l h i I ~ · ∆~q + B ~ · ∆~ p) Aν (~ q , p~, t)∆qν + Bν (~q, ~p, t)∆pν = (A I = ′

(9.87)

C ν=1

Las ecuaciones de movimiento en el espacio de fases son: ∂H ∂H ˙ ; p~ = − q~˙ = ∂~ p ∂~q

(9.88)

La solución de las ecuaciones (9.88) es de la forma: q=~ ~ q (~ q0 , ~ p0 , t); p~ = p~(~ q0 , p~0 , t)

(9.89)

donde ~q0 y p~0 son los valores de ~ q y ~q para t = t0 . En el tiempo t = t0 definimos la curva cerrada C0 , constituida por un conjunto de estados simult´ aneos, caracterizada por un conjunto de par´ ametros (α): q0 = ~ ~ q (α); p~0 = ~ p0 (α); (αi ) ≤ (α) ≤ (αf )

(9.90)

Los puntos que en t = t0 estaban sobre el contorno C0 , formarán un contorno C en alg´ un otro instante de tiempo t. Los puntos del contorno C se obtienen reemplazando (9.90) en (9.89): q=~ ~ q (α, t); ~ p = p~(α, t); (αi ) ≤ (α) ≤ (αf )

(9.91)

338 / Mec´ anica cl´ asica avanzada Poniendo (9.91) en (9.87) se obtiene a I ′ en funci´ on de t. De la invariancia de I ′ ′ se sigue que dI /dt = 0. Derivando a (9.87): I ′ ~˙ · ∆~q + A ~ · ∆~q˙ + B ~˙ · ∆~ ~ · ∆p~˙ = 0 ˙ A p+B (9.92) I =

donde se usó la propiedad d(∆~q)/dt = ∆~q˙ . La ecuaci´ on (9.92) también se puede escribir como: I h i ~˙ · ∆~q + ∆(A ~ · ~q˙ ) − ∆A ~ · ~q˙ + B ~˙ · ∆~ ~ · p~˙ ) − ∆B ~ · p~˙ A p + ∆(B (9.93) I˙′ = Se cumple que: I

C

(αi ) ˙ ˙ ~ ~ ∆(A · ~ q ) = A · ~q =0

(9.94)

(αf )

debido a que ~ q (αi , t) = ~q(αf , t); ~p(αi , t) = p~(αf , t), por ser C un contorno cerrado. Por otra parte: ~ ~ ~ ~˙ = ∂ A · ~q˙ + ∂ A · p˙ + ∂ A A ∂~q ∂~p ∂t

(9.95)

~ ~ ∂A ∂A · ∆~q + · ∆~ p ∂~q ∂~p

(9.96)

~= ∆A

Usando (9.95) y (9.96), obtenemos: ! I " ~ ~ ~ ∂A ∂A ∂A ′ ˙ ˙ I = · ∆~q − · ~q + · p˙ + ∂~q ∂~p ∂t +

~ ~ ~ ∂B ∂B ∂B · ~q˙ + · p˙ + ∂~q ∂~p ∂t

!

· ∆~ p−

! ~ ~ ∂A ∂A · ∆~q + · ∆~ p · ~q˙ ∂~q ∂~p ! # ~ ~ ∂B ∂B · ∆~q + · ∆~ p · ~p˙ ∂~q ∂~p

(9.97)

Reagrupando términos y expresando a ~q˙ y ~p˙ por medio de (9.88) obtenemos: ! ! # I " ~ ~ ∂H ∂H ∂A ∂B ′ ˜ ˜ ˙ −Z · ∆~q + −Z · ∆~ p (9.98) I = + + ∂~q ∂t ∂~p ∂t donde la matriz Z˜ se define como: ~ ~ ∂A ∂B Z˜ = − ∂~ p ∂~q

(9.99)

Como I˙′ = 0, el integrando en (9.98) debe ser el diferencial de alguna función F : ∆F =

∂F ∂F · ∆~q + · ∆~ p ∂~q ∂~p

(9.100)

Las transformaciones canónicas / 339 comparando (9.98) y (9.100) vemos que: ~ ∂F ∂H ∂A = −Z˜ + ; ∂~q ∂~q ∂t

~ ∂F ∂H ∂B = −Z˜ + ∂~p ∂~p ∂t

(9.101)

En términos de componentes (9.101) toma la forma: l

l

λ=1

λ=1

X X ∂F ∂H ∂H ∂Aν ∂Bν ∂F =− Zνλ + =− Zνλ + ; ∂qν ∂qλ ∂t ∂pν ∂pλ ∂t

(9.102)

Como F ha de ser una funci´ on continua de ~q y p~ se debe cumplir: ∂2F ∂2F ∂2F ∂2F ∂2F ∂2F = ; = ; = ∂qµ ∂qν ∂qν ∂qµ ∂pµ ∂pν ∂pν ∂pµ ∂pµ ∂qν ∂qν ∂pµ

(9.103)

De (9.102) y (9.103) se sigue que: −

X ∂Zνλ ∂H X ∂ 2 Aν ∂2H − + = Zνλ ∂qµ ∂qλ ∂qµ ∂qλ ∂qµ ∂t

−

X ∂Zµλ ∂H X ∂ 2 Aµ ∂2H − + Zµλ ∂qν ∂qλ ∂qν ∂qλ ∂qν ∂t

−

X ∂Zνλ ∂H X ∂ 2 Bν ∂2H − + = Zνλ ∂pµ ∂pλ ∂pµ ∂pλ ∂pµ ∂t

λ

λ

λ

λ

λ

λ

X ∂Zµλ ∂H X ∂ 2 Bµ ∂2H − − + Zµλ ∂pν ∂pλ ∂pν ∂pλ ∂pν ∂t λ

λ

−

X ∂Zνλ ∂H X ∂ 2 Aν ∂2H − + = Zνλ ∂pµ ∂qλ ∂pµ ∂qλ ∂pµ ∂t

−

X ∂Zµλ ∂H X ∂2H ∂ 2 Bµ − + Zµλ ∂qν ∂pλ ∂qν ∂pλ ∂qν ∂t

λ

λ

(9.104)

λ

λ

En (9.104) consideremos los casos µ = ν y µ 6= ν. Para µ = ν se tiene sólo una relaci´ on no trivial, la tercera: X ∂Zνλ ∂H ∂2H ∂2H Zνλ ∂H − − + Zνλ − Zνλ ∂pν ∂qλ ∂qν ∂pλ ∂pν ∂qλ ∂qν ∂pλ λ 2 2 ∂ ∂ Aν ∂ Bν + =0 (9.105) − ∂t ∂pν ∂qν Como H es arbitrario, (9.105) se cumple sólo si: Zνλ = Zνν δνλ ;

∂Zνν ∂Zνν ∂Zνν = 0; = 0; =0 ∂pν ∂qν ∂t

(9.106)

340 / Mec´ anica cl´ asica avanzada Para µ 6= ν y usando (9.106), las relaciones (9.104) quedan:

−

∂Zνν ∂H ∂2H ∂ 2 Aν − Zνν + = ∂qµ ∂qν ∂qµ ∂qν ∂qµ ∂t

−

∂2H ∂ 2 Aµ ∂Zµµ ∂H − Zµµ + ∂qν ∂qµ ∂qν ∂qµ ∂qν ∂t

−

∂2H ∂ 2 Bν ∂Zνν ∂H − Zνν + = ∂pµ ∂pν ∂pµ ∂pν ∂pµ ∂t (9.107)

∂2H ∂ 2 Bµ ∂Zµµ ∂H − Zµµ + − ∂pν ∂pµ ∂pν ∂pν ∂pν ∂t −

∂2H ∂ 2 Aν ∂Zνν ∂H − Zνν + = ∂pµ ∂qν ∂pµ ∂qν ∂pµ ∂t

−

∂2H ∂ 2 Bµ ∂Zµµ ∂H − Zµµ + ∂qν ∂pµ ∂qν ∂pµ ∂qν ∂t

Las ecuaciones (9.107) pueden escribirse as´ı:

−

∂Zνν ∂H ∂Zµµ ∂H ∂2H + + (Zµµ − Zνν ) ∂qµ ∂qν ∂qν ∂qµ ∂qµ ∂qν

+

∂ ∂t

−

∂Zµµ ∂H ∂2H ∂Zνν ∂H + + (Zµµ − Zνν ) ∂pµ ∂pν ∂pν ∂pµ ∂pµ ∂pν

∂ + ∂t

∂Aν ∂Aµ − ∂qµ ∂qν

∂Bν ∂Bµ − ∂pµ ∂pν

=0

(9.108) =0

−

∂Zµµ ∂H ∂ 2H ∂Zνν ∂H + + (Zµµ − Zνν ) ∂pµ ∂qν ∂qν ∂pµ ∂pµ ∂qν

+

∂ ∂t

∂Aν ∂Bµ − ∂pµ ∂qν

=0

Las transformaciones canónicas / 341 Como H es arbitrario, de (9.108) se sigue que: ∂Zνν ∂Zµµ = 0; = 0 ; Zµµ = Zνν ∂qµ ∂pµ ∂ ∂t ∂ ∂t

∂Aν ∂Aµ − ∂qµ ∂qν ∂Aν ∂Bµ − ∂pµ ∂qν

= 0;

∂ ∂t

∂Bν ∂Bµ − ∂pµ ∂pν

=0

(9.109)

=0

Las relaciones (9.106) y (9.109) nos dan que para todos µ, ν, se cumple: Zνλ = Z δνλ ;

∂Z ∂Z = 0; =0 ∂qν ∂pν

∂Z = 0 ⇒ Z = constante ∂t ∂ ∂Bν ∂Aµ ∂Bµ ∂ ∂Aν = 0; =0 − − ∂t ∂qµ ∂qν ∂t ∂pµ ∂pν ∂ ∂t

∂Aν ∂Bµ − ∂pµ ∂qν

(9.110)

=0

donde Z = Zνν . Para µ = ν cumple Zµν = 0, o sea: ∂Bµ ∂Aµ = ; ∂pν ∂qν

µ=ν

reemplazando (9.111) en la u ´ltima igualdad (9.110) se obtiene: ∂ ∂Aν ∂Aµ =0 − ∂t ∂pµ ∂pν

(9.111)

(9.112)

La ecuaci´ on (9.112) y la primera igualdad (9.110) nos dan: ∂ ∂Aν ∂ ∂Aµ ∂ ∂Aν ∂ ∂Aµ = ; = ∂pµ ∂t ∂pν ∂t ∂qµ ∂t ∂qν ∂t

(9.113)

Las expresiones (9.113) se cumplen si Aν (q, p, t) son de la forma: Aν =

∂f (q, t) ∂g(p, t) + ∂qν ∂pν

(9.114)

donde f y q son funciones continuas. Bν satisfacen, por los mismos argumentos, relaciones similares a (9.113), por tanto: Bν =

∂f ′ (q, t) ∂g ′ (p, t) + ∂qν ∂pν

(9.115)

342 / Mec´ anica cl´ asica avanzada ~ y B ~ para Las ecuaciones (9.114) y (9.115) son las condiciones que deben satisfacer A que (9.87) sea una integral universal invariante. Se cumple entonces que, para µ 6= ν: ∂Aν ∂Aµ ∂2f ∂2f − = − =0 ∂qµ ∂qν ∂qµ ∂qν ∂qν ∂qµ

∂Bµ ∂ 2g′ ∂ 2g′ ∂Bν − = − =0 ∂pµ ∂pν ∂pµ ∂pν ∂pν ∂pµ

(9.116)

∂Bµ ∂Aν ∂Aµ ∂2g ∂2g ∂Aν − = − = − =0 ∂pµ ∂qν ∂pµ ∂pν ∂pµ ∂pν ∂pν ∂pµ Para µ = ν las dos primeras igualdades en (9.116) siguen siendo válidas, en tanto que la tercera se reemplaza por: ∂Aν ∂Bν − = Zνν = C ∂pν ∂qν

(9.117)

Por tanto, (9.116) y (9.117) nos dan para todos µ, ν: ∂Aν ∂Aµ = ; ∂qµ ∂qν

∂Bν ∂Bµ = ; ∂pµ ∂pν

∂Aν ∂Bµ − = Cδµν ∂pµ ∂qν

(9.118)

También podemos escribir a (9.118) as´ı: ∂Aν ∂Aµ = ; ∂qµ ∂qν

∂Bν ∂Bµ = ; ∂pµ ∂pν

∂ ∂Bµ (Aν − Cpν ) = ∂pµ ∂qν

(9.119)

Las expresiones (9.119) nos dicen que debe existir cierta funci´ on Φ(~q, ~p, t) tal que: ∆Φ =

∂Φ ∂Φ ~ − C~ ~ · ∆~ · ∆~q + · ∆~ p = (A p) · ∆~q + B p ∂~q ∂~p

(9.120)

puesto que: ∂Φ ∂Φ = Aν − C pν ; = Bν ∂qν ∂pν

(9.121)

Lo anterior implica que se cumplan las relaciones (9.119) a fin de que Φ sea continua. Se tiene entonces que: I I I ~ ~ (A · ∆~ q + B · ∆~ p) = C~ p · ∆~q + ∆Φ (9.122) La integral universal invariante (9.87) es entonces igual a: I I ′ ~ ~ I = (A · ∆~ q + B · ∆~ p) = C p~ · ·∆~q = CI1

(9.123)

lo cual constituye la prueba del teorema de Li Hua Chung para I ′ . De paso hemos hallado ~ yB ~ deben tener la forma (9.114) y (9.115) respectivamente a fin de que I ′ sea que A una integral universal invariante. Esta prueba es una generalizaci´ on para l grados de libertad de la presentada en Gantmacher para l = 1.

Las transformaciones canónicas / 343

9.5.

Las transformaciones can´ onicas

En la secci´ on 4.5 se dio la definición de una transformaci´ on canónica como una transformaci´ on de coordenadas en el espacio de fases 2l-dimensional, que en general puede depender del tiempo y que no cambia la forma de las ecuaciones de Hamilton. All´ı derivamos las f´ ormulas de la transformaci´ on a partir de la segunda forma del principio de Hamilton. Aqu´ı usaremos la invariancia de la integral de Poincaré-Cart´ an y el teorema de Li Hua Chung. La funci´ on generatriz de una transformaci´ on can´ onica. Sean dos espacios de fase 2l dimensionales (q, p), (q, p). La transformaci´ on canónica establece una correspondencia biun´ıvoca entre los puntos de estos dos espacios en cada instante t: q ν = q ν (q, p, t) ; J

pν = pν (q, p, t) ;

q 1 , q 2 , ...q l , p1 , p2 , ... pl q1 , q2 , ...ql , p1 , p2 , ... pl

ν = 1, 2, ...l

6= 0

(9.124) (9.125)

Un conjunto de trayectorias rectas en el espacio (q, p) est´ a definido por el sistema de ecuaciones diferenciales: ∂H(q, p, t) dpν ∂H(q, p, t) dqν ; ; = =− dt ∂pν dt ∂qν

ν = 1, 2, ...l

(9.126)

A cada una de las trayectorias definidas por (9.126) la transformaci´ on canónica le hace corresponder una trayectoria recta en el espacio (q, p), definida por el sistema de ecuaciones diferenciales: dq ν ∂H(q, p, t) dpν ∂H(q, p, t) = ; =− ; ν = 1, 2, ...l dt ∂pν dt ∂q ν

(9.127)

Sea un “tubo” de trayectorias en el espacio de fases y sea C un contorno arbitrario que rodea ese tubo de trayectorias en el espacio (q, p). En el espacio (q, p) en virtud de la transformaci´ on habr´ a otro tubo de trayectorias rectas y C es un contorno que corresponde a C. C0 y C 0 son los contornos definidos por un conjunto de estados simult´ aneos, t = constante, y que se corresponden mediante la transformaci´ on. C0 y C 0 est´ an dadas por ecuaciones paramétricas del tipo de (9.64), y C y C por ecuaciones como (9.17). Es decir, C 0 y C0 obedecen a: C : t=

t(α) ; qν = qν (α) ; pν = pν (α) (9.128)

C0 : t =

t(α) = constante ; qν = qν (α) ; pν = pν (α) ; ν = 1, 2, ...l

y análogamente para C 0 y C. Como las trayectorias son hamiltonianas en (q, p) y en an, (9.25), que: (q, p), se sigue de la invariancia de la integral de Poincaré-Cart´ ! I X I l l X pν ∆qν (9.129) pν ∆qν − H ∆t = C

ν=1

C0 ν=1

344 / Mec´ anica cl´ asica avanzada I

C

l X

ν=1

pν ∆q ν − H ∆t

!

=

I

l X

C 0 ν=1

pν ∆q ν

(9.130)

Como t es invariante bajo una transformaci´ on canónica, se sigue que el lado derecho de (9.129) est´ a evaluado en el mismo tiempo que el lado derecho de (9.130). Si en la H Pl integral universal invariante ν=1 pν ∆q ν pasamos a las variables (q, p) por medio de la transformaci´ on can´ onica (9.124), obtenemos: I

l X

C 0 ν=1

pν ∆q ν =

I

l X

C0 ν=1

"

l X

µ=1

∂qµ pµ ∂qν

!

l X

∆qν +

µ=1

∂q µ pµ ∂pν

!

∆pν

#

(9.131)

La ecuaci´ on (9.131) es de la forma de (9.87): es una cierta integral universal invariante de primer orden en el espacio (p, q). Por el teorema de Li Hua Chung, el invariante obtenido puede diferir de I1 sólo por un factor constante C, ecuaci´ on (9.123): I

l X

C 0 ν=1

pν ∆q ν = C

I X l

pν ∆qν

(9.132)

C ν=1

de las ecuaciones (9.129), (9.130) y (9.132) se sigue entonces que: ! ! I I l l X X pν ∆qν − H ∆t pν ∆q ν − H ∆t = C C

C

ν=1

(9.133)

ν=1

on de las (q, p), la trayectoria Si en la primera integral expresamos a (q, p) en funci´ de integraci´ on C será reemplazada por C, por lo cual podemos escribir a (9.133) como: ! !# I " X l l X pν ∆q ν − H ∆t − C pν ∆qν − H ∆t =0 (9.134) C

ν=1

ν=1

C es un contorno arbitrario en el espacio (q, p), o sea que el integrando en (9.134) debe ser la diferencial exacta ∆ de alguna funci´ on de (q, p, t), que llamaremos −F (q, p, t). Por tanto podemos escribir: ! ! l l X X pν ∆q ν − H ∆t (9.135) ∆F = C pν ∆qν − H ∆t − ν=1

ν=1

donde además se tiene que: ∆F =

l X ∂F ν=1

∂F ∆qν + ∆pν ∂qν ∂pν

+

∂F ∆t ∂t

(9.136)

Pl Como ν=1 pν ∆q ν − H ∆t no es un diferencial exacto, o sea no es igual a −∆F , se sigue que C nunca es cero. La funci´ on F se llama la funci´ on generatriz y la constante C

Las transformaciones canónicas / 345 la valencia de la transformaci´ on canónica (9.124). La transformaci´ on canónica se llama univalente, o simplemente transformaci´ on canónica cuando C = 1. Algunos autores llaman las transformaciones can´ onicas con C 6= 1 transformaciones canónicas extendidas. En conclusi´ on, una condición necesaria y suficiente para que la transformaci´ on (9.124) sea can´ onica es la existencia de una funci´ on generatriz F y alguna constante C para las cuales la ecuaci´ on (9.135) se satisfaga idénticamente en virtud de la transformaci´ on (9.124). Es de notarse que la ecuaci´ on (9.135) vale para toda transformaci´ on canónica independientemente de cuál sea la funci´ on H: vale para todo sistema hamiltoniano, o sea F no depende de H. Esto se prueba fácilmente para un hamiltoniano arbitrario H1 definiendo a H 1 de modo que H 1 − H = C(H1 − H), con lo cual se llega a que (9.135) vale también para H 1 y H1 . Formas alternas de definir la funci´ on generatriz de una transformaci´ on can´ onica. El principio de Hamilton modificado también puede expresarse como: ! Z t2 l X − qν p˙ ν − H dt = 0 (9.137) δ t1

ν=1

puesto que las ecuaciones de Euler-Lagrange correspondientes al principio variacional (9.137) son las ecuaciones de Hamilton o ecuaciones de movimiento en el espacio de fases. En lugar de (9.22) podemos escribir: ∆S˜ =

−

l X

ν=1

! t2 qν ∆pν − H∆t

(9.138)

t1

Consecuentemente se obtiene la siguiente forma para la integral invariante de Poincaré-Cart´ an, (9.25): I=

I

−

l X

ν=1

qν ∆pν − H∆t

!

(9.139)

Es f´ acil ver que (9.139) se puede derivar directamente de (9.25) mediante la transformaci´ on can´ onica ~ q → −~ p, p~ → q~. Se sigue entonces que además de (9.129) son posibles las siguientes relaciones: ! I I l l X X − qν ∆pν − qν ∆pν − H∆t = C

I

C

C0

ν=1

−

l X

q ν ∆pν − H∆t

ν=1

!

=

I

ν=1

(9.140)

C0

−

l X

q ν ∆pν

ν=1

P Por el teorema de Li Hua Chung se sigue que lν=1 qν ∆pν , que es una integral universal invariante, es proporcional a I1 . Usando (9.129) y (9.140) conjuntamente con el teorema de Li Hua Chung, podemos obtener además de (9.132) las siguientes tres

346 / Mec´ anica cl´ asica avanzada relaciones, que nos dar´ an otras tres expresiones para la funci´ on generatriz completamente equivalentes (9.135): I I I

C0

C0

l X

pν ∆q ν = C

l X

q ν ∆pν = C

C 0 ν=1

−

−

ν=1 l X

q ν ∆pν = C

ν=1

I I I

C0

−

l X

qν ∆pν

ν=1

l X

(9.141)

pν ∆qν

C0 ν=1

C0

−

l X

qν ∆pν

ν=1

Es claro que las “C” que aparecen en (9.132) y en (9.141) no tienen por qué ser la misma. De cada una de las expresiones (9.141) se obtiene una forma diferente para la funci´ on generatriz de la transformaci´ on canónica por un procedimiento igual al que conduce a la forma (9.135). En primer lugar, y en virtud de (9.129) y (9.140), las ecuaciones (9.141) son equivalentes a: ! ! I I l l X X qν ∆pν − H∆t (9.142) − pν ∆q ν − H∆t = C C

I

C

I

C

C

ν=1

−

l X

−

l X

ν=1

ν=1


!


!

=C

ν=1

I

l X

C

=C

ν=1

I

−

C

pν ∆qν − H∆t

l X

ν=1

!


(9.143) !

(9.144)

de (9.144) se sigue que: ∆F = C

∆F = C

−

l X

ν=1

l X

ν=1

∆F = C

−

qν ∆pν − H∆t !

−


!


l X

ν=1

!

−

l X

ν=1

− −

l X

ν=1

−

pν ∆q ν − H∆t

!

(9.145)


!

(9.146)

l X

ν=1


!

(9.147)

Las transformaciones can´ onicas libres. En el conjunto de todas las transformaciones can´ onicas hay una clase que se puede caracterizar por la siguiente propiedad: su funci´ on generatriz puede expresarse como una funci´ on de un conjunto de (2l) variables independientes que pueden ser (q q), (q p), (p q) o (p p). A estas transformaciones las llamaremos transformaciones canónicas libres de la primera, segunda, tercera y cuarta

Las transformaciones canónicas / 347 clase respectivamente. Es posible que una transformaci´ on canónica dada sea a la vez canónica libre de más de una clase. En (3.20) encontramos transformaciones canónicas libres de la primera clase. Ejemplo 9.5.1 Demostrar que la transformaci´ on canónica (4.134), para l = 1, es libre de primera clase: 1 p p2 2 p = mω q + ; q = −tan−1 (9.148) 2 mω 2 mωq Las f´ ormulas de transformaci´ on pueden escribirse en la forma: p = mωq tan q ;

p=

1 mωq 2 sec2 q 2

o sea que es libre de la primera clase. También se puede escribir como: s r mωq 2 2p −1 q = cos ; p = −mω − q2 2p mω

(9.149)

(9.150)

o sea que también es libre de la segunda clase. Es fácil ver que también es libre de tercera y cuarta clase. Ejemplo 9.5.2 Demostrar que la transformaci´ on identidad es canónica de segunda y tercera clase pero no es de primera ni de cuarta clase. La transformaci´ on identidad es: q ν = qν ;

pν = pν ;

ν = 1, 2, ...l

(9.151)

Esta transformaci´ on puede escribirse en cualquiera de las formas siguientes: qν =

qν ; pν = pν

qν =

q ν ; pν = pν ;

(9.152) ν = 1, 2, ...l

on es o sea que sólo es posible tomar independientes a (q, p) o a (q, p). Esta transformaci´ canónica de segunda y tercera clase pero no es de primera ni de cuarta clase. Ejemplo 9.5.3 Mostrar que la transformaci´ on que intercambia coordenadas y momentos y cambia de escala, es libre de primera y cuarta clase pero no de segunda ni de tercera clase: qν = pν =

1 p β ν

αpν ;

qν =

βqν ;

1 pν = q ν ; α

(9.153) ν = 1, 2, ...l

Ejemplo 9.5.4 Mostrar que la transformaci´ on canónica q = −αp/q, p = q 2 /2α, con l = 1, es una transformaci´ on can´ onica libre de primera y de cuarta clase pero no de segunda ni de tercera clase:

348 / Mec´ anica cl´ asica avanzada q=

αp ; −√ 2αp

p=

q2 ; 2α

q=

p 2αp

(9.154)

qq p=− α

Las transformaciones canónicas libres de primera clase se caracterizan porque (p, p) se pueden expresar en funci´ on de (q, q). Esto dice que las (p) dependen de (q), o sea que: q 1 , q 2 , ...q l 6= 0 (9.155) J p1 , p2 , ...pl En este caso la funci´ on generatriz F (q, p, t) puede representarse mediante una funci´ on de (q, q) que llamaremos F1 : F (q, p, t) = F1 (q, q, t)

(9.156)

De (9.135) y (9.156) se sigue que: ∆F1 (q, q, t) = C

l X

ν=1


!

−

l X

ν=1

pν ∆q ν − H∆t

!

(9.157)

Como para estas transformaciones ∆qν y ∆q ν son todos independientes se sigue entonces que: ∂F1 = Cpν ; ∂qν

∂F1 = −pν ; ∂qν

ν = 1, 2, ...l

∂F1 = H − CH ∂t

(9.158) (9.159)

Las ecuaciones (9.158) definen la transformaci´ on canónica bajo consideración, esto es, ellas pueden reducirse a la forma (9.124). Con ello probaremos que toda transformaon ci´ on can´ onica libre de primera clase define una funci´ on F1 (q, q, t) y que a cada funci´ F1 (q, q, t) le corresponde una transformaci´ on canónica libre de primera clase. Debemos mostrar que es posible resolver las ecuaciones (9.158) para expresar a (q, p) en funci´ on de (q, p). Empecemos por mostrar que todas las derivadas parciales ∂F1 /∂qν son independientes. Supongamos que no lo fueran, es decir, que pudiéramos encontrar una expresión para una de ellas en funci´ on de las dem´ as. Ello requerir´ıa que exista una funci´ on Ω diferente de cero tal que: ∂F1 ∂F1 ∂F1 (9.160) , , ... , q1 , q2 , ...ql = 0 Ω ∂q1 ∂q2 ∂ql donde en (9.160) los (q) son tomados como par´ ametros. De (9.158) se sigue: Ω(Cp1 , Cp2 , ...Cpl , q1 , q2 , ...ql ) = 0

(9.161)

como (q, p) son cantidades independientes, se sigue de (9.161) que Ω ≡ 0 y en consecuencia las ∂F1 /∂qν son independientes, consideradas como funciones de las variables

Las transformaciones canónicas / 349 q 1 , q 2 , ...q l . Que las l cantidades independientes ∂F1 /∂qν sean funciones de las l cantidades independientes q ν se expresa diciendo que el jacobiano de esas funciones no es idénticamente cero: 2 ∂ F1 ∂F1 /∂~q 6= 0 (9.162) = det J q ~ ∂~q ∂~q De la desigualdad (9.162) se sigue que las primeras l ecuaciones (9.158) pueden resolverse para las q ν , con lo cual todas las nuevas variables de fases q ν , pν (ν = 1, 2, ...l) pueden expresarse en funci´ on de las viejas variables qν , pν (ν = 1, 2, ...l). La ecuaci´ on (9.162) también permite que en (9.158) las l u ´ltimas ecuaciones sean resueltas para qν en on, las ecuaciones (9.158) definen una transformación funci´ on de las q ν , pν . En conclusi´ canónica libre de primera clase con funci´ on generatriz y valencia dadas, F1 y C 6= 0, en tanto que la f´ ormula (9.159) permite relacionar las funciones hamiltonianas H y H, que serán proporcionales sólo en el caso en que la transformación canónica no dependa expl´ıcitamente del tiempo. Podemos decir que la clase de las transformaciones canónicas libres de primera clase se puede obtener hallando todas las funciones generatrices F1 que satisfacen la condición (9.162) y las diferentes valencias C 6= 0, y usando las fórmulas (9.158). Para las transformaciones canónicas libres de primera clase univalentes (C = 1), (9.158) y (9.159) toman la forma más simple: ∂F1 ∂F1 ∂F1 = pν ; = −pν ; ν = 1, 2, ...l ; H = H + ∂qν ∂qν ∂t

(9.163)

La u ´ltima ecuaci´ on (9.163), dice que H − H no depende del sistema hamiltoniano espec´ıfico que se tenga sino simplemente de cuál es la transformaci´ on canónica, que puede ser definida sin hacer referencia a la forma del hamiltoniano. La discusi´ on de los otros tipos de transformaciones canónicas libres es completamente análoga a la de las transformaciones canónicas libres de primera clase. Las fórmulas son las siguientes, que se obtienen usando las formas (9.145), (9.146) y (9.147) para la funci´ on generatriz. En las Transformaciones Canónicas (T.C.) libres de segunda clase (q, p) son independientes, luego: ! ~p J 6= 0 (9.164) p~ Como (q, p) son independientes, (9.146) permite escribir: ∂F2 ∂F2 = Cpν ; = q ν ; ν = 1, 2, ...l ∂qν ∂pν

(9.165)

∂F2 = H − CH ∂t

(9.166)

donde F2 es funci´ on de (q, p, t) y satisface la condición: 2 ∂ F2 6= 0 det ∂~q ∂~p

(9.167)

350 / Mec´ anica cl´ asica avanzada En las T.C. libres de tercera clase (p, q) son independientes, luego: ! ~q 6= 0 J q ~

(9.168)

como (p, q) son independientes, (9.145) permite escribir: ∂F3 ∂F3 = −Cqν ; = −pν ; ν = 1, 2, ...l ∂pν ∂qν

(9.169)

∂F3 = H − CH ∂t

(9.170)

donde F3 es funci´ on de (p, q, t) y satisface la condición: 2 ∂ F3 6= 0 det ∂~ p ∂~q En las T.C. libres de cuarta clase (p, p) son independientes, luego: ! ~p J 6= 0 q ~

(9.171)

(9.172)

Como (p, p) son independientes, (9.147) permite escribir: ∂F4 = −Cqν ; ∂pν

∂F4 = qν ; ∂pν

ν = 1, 2, ...l

∂F4 = H − CH ∂t donde F4 es funci´ on de (p, p, t) y satisface la condición: 2 ∂ F4 6= 0 det ∂~ p ∂~p

(9.173)

(9.174)

(9.175)

Se tienen, pues, 4l cantidades no independientes (q, p, q, p) de las cuales, además de (q, p) y (q, p), se pueden extraer conjuntos de variables independientes (q, q), (q, p), (p, q), (p, p). En cada uno de estos cuatro casos decimos que la transformación canónica es libre. Una transformaci´ on canónica arbitraria es no libre y obedece fórmulas de transformaci´ on en términos de una funci´ on generatriz que veremos más adelante y de las cuales (9.158) y (9.164) a (9.175) no son más que casos particulares. Ejemplo 9.5.5 Hallar la funci´ on generatriz del tipo F2 para la transformaci´ on canónica (9.148). Usando (9.146) y (9.150) obtenemos: ∆F2 = C(p ∆q − H ∆t) − (−q ∆p − H ∆t) = Cp ∆q + q ∆p

(9.176)

Las transformaciones canónicas / 351 La u ´ltima igualdad en (9.176) se sigue de que la transformaci´ on no depende del tiempo. También: s r 2p mωq 2 −1 ∆F2 = C(−mω)∆q − q 2 + ∆p cos (9.177) mω 2p Como ∆F2 es exacto se sigue que ∂ 2 F2 /∂p ∂q = ∂ 2 F2 /∂q ∂p lo cual implica que la transformaci´ on es univalente, o sea C = 1. La funci´ on generatriz es: s r mωq 2 2p 1 F2 (q, p) = p cos−1 − mωq − q2 (9.178) 2p 2 mω Para esta misma transformaci´ on se cumple que: q=−

p p2 cot q ; p = csc2 q mω 2mω

(9.179)

Entonces para una funci´ on generatriz del tipo F3 se cumple: p p2 ∂F3 ∂F3 = cot q ; =− csc2 q ∂p mω ∂q 2mω

(9.180)

donde hemos usado (9.169) con C = 1. Es claro que: ∆F3

= =

1 (2p cot q ∆p − p2 csc2 q ∆q) 2mω 1 2 ∆ p cotq 2mω

(9.181)

con lo cual: F3 =

p2 cot q 2mω

(9.182)

similarmente hallamos para F4 : F4 =

p2 p p 2mωp − p2 + p sen−1 √ 2mω 2mωp

(9.183)

En s´ıntesis, las funciones generatrices de la transformaci´ on canónica (3.107) son: 1 F1 = − mωq 2 tan q 2 s r mωq 2 2p 1 2 −1 − mωq −1 F2 = p cos 2p 2 mωq 2 p2 cot q F3 = 2mω r s p2 2mωp p2 −1 − 1 + F4 = p sen 2mω p2 2mωp

(9.184)

352 / Mec´ anica cl´ asica avanzada Ejemplo 9.5.6 Hallar las funciones generatrices del tipo F2 y F3 para la transformaci´ on can´ onica identidad. Sabemos que no existen funciones del tipo F1 o F4 . La transformaci´ on no depende del tiempo, luego, de (9.146) y (9.152): ∆F2 = C

l X

pν ∆qν +

ν=1

l X

q ν ∆pν = C

ν=1

l X

pν ∆qν +

ν=1

l X

qν ∆pν

(9.185)

ν=1

de la condición ∂ 2 F2 /∂qν ∂pµ = ∂ 2 F2 /∂pµ ∂qν se sigue que la transformaci´ on debe ser univalente, en consecuencia: ∆F2 =

l X

(pν ∆qν + qν ∆pν ) = ∆

ν=1

l X

q ν qν

(9.186)

ν=1

Por tanto: F2 =

l X

pν qν

(9.187)

ν=1

Similarmente: F3 = −

l X

q ν pν

(9.188)

ν=1

Ejemplo 9.5.7 Hallar las funciones generatrices del tipo F1 y F4 para la transformaci´ on can´ onica de cambio de escala e intercambio de coordenadas y momentos (9.153). Sabemos que F2 y F3 no existen para esa transformaci´ on. El resultado es: C = −α β ;

C = −α β ;

F1 = −β

F4 = α

l X

q ν qν

(9.189)

ν=1

l X

pν pν

(9.190)

ν=1

Ejemplo 9.5.8 Hallar las funciones generatrices de la transformaci´ on de cambio de escala: q ν = αqν ; pν = βpν C = α β ; F2 = α

l X

pν qν

(9.191)

ν=1

C = α β ; F3 = −β

l X

ν=1

q ν pν

(9.192)

Las transformaciones canónicas / 353 Ejemplo 9.5.9 Sea una transformaci´ on canónica libre de primera clase (q, p) → (q, p) on inversa (q, p) → (q, p) también con generatriz F1 (q, q, t). Mostrar que la transformaci´ es can´ onica, y hallar la correspondiente funci´ on generatriz. La transformaci´ on original satisface: ! l X ∆F1 = C pν ∆qν − H ∆t − ν=1

l X

ν=1


!

∂F1 ∂F1 ∂F1 = Cpν ; = −pν ; ν = 1, 2, ...l ; = H − CH ∂qν ∂qν ∂t

(9.193)

(9.194)

La desigualdad (9.162) garantiza que las dos u ´ltimas ecuaciones (9.194) se pueden resolver para (q) en funci´ on de (p), tomando (q) como par´ ametros, con lo cual se pueden expresar (p, q) en funci´ on de (q, p), o sea que las ecuaciones (9.124) se pueden invertir. Esto prueba que la transformaci´ on inversa existe, la cual además es canónica. Para la transformaci´ on inversa: ! ! l l X X i i pν ∆q ν − H ∆t − pν ∆qν − H ∆t (9.195) ∆F1 = C ν=1

ν=1

∂F1i ∂F1i = C i pν ; = −pν ; ∂q ν ∂qν

ν = 1, 2, ...l ;

∂F1i = H − CiH ∂t

(9.196)

comparando (9.194) y (9.196) vemos que: −

∂F1i 1 ∂F1 = ; ∂qν C ∂qν

−

∂F1 1 ∂F1i = i ∂qν C ∂qν

Ci

∂F1 ∂F1i + ∂t ∂t

= (−CC i + 1)H

C

∂F1i ∂F1 + ∂t ∂t

= (−CC i + 1)H

(9.197)

De (9.197) se sigue que: F1 = −CF1i ;

F1i = −C i F1 ;

Ci =

1 C

(9.198)

1 F1 (q, q, t) ; C

Ci =

1 C

(9.199)

o más expl´ıcitamente: F1i (q, q, t) = −

Para una transformaci´ on canónica libre univalente de primera clase se cumple simplemente: F1i (q, q, t) = −F1 (q, q, t)

(9.200)

354 / Mec´ anica cl´ asica avanzada o sea que la funci´ on generatriz de la transformaci´ on canónica inversa es el negativo de la funci´ on generatriz de la T.C. original. Para una transformaci´ on canónica arbitraria, se cumplen las expresiones siguientes para las funciones generatrices F y F i , aunque no se cumplen las f´ ormulas (9.194) y (9.196): ! ! l l X X ∆F (q, p, t) = C pν ∆q ν − H ∆t (9.201) pν ∆qν − H ∆t − ν=1

i

∆F (q, p, t) =

C

i

l X

ν=1

ν=1


!

l X

−

ν=1


La ecuaci´ on (9.202) también se puede escribir como: ! l 1 X 1 i − i ∆F (q, p, t) = pν ∆qν − H ∆t − C C i ν=1

l X

ν=1

!

(9.202)

!

pν ∆q ν − H ∆t(9.203)

de donde se llega al resultado general: F i (q, p, t) = −

1 1 F (q, p, t) ; C i = C C

(9.204)

Ejemplo 9.5.10 Mostrar que el resultado de dos transformaciones canónicas sucesivas es una transformaci´ on canónica. El generador de la transformaci´ on resultante es la suma de los generadores de las transformaciones separadas. Si las transformaciones son libres de primera clase: (a+b)

F1

(a)

(b)

(q, q, t) = F1 (q, q, t) + F1 (q, p, t)

(9.205)

donde a es la transformaci´ on (q, p) → (q, p) y b es la transformaci´ on (q, p) → (q, p); a + b representa la transformaci´ on combinada (q, p) → (q, p). Ejemplo 9.5.11 Mostrar que la realizaci´ on de tres transformaciones canónicas sucesivas es asociativa. Para transformaciones libres de primera clase esto se expresa as´ı: (a+b)+c a+(b+c) q, q, t q, q, t = F1 F1

lo que se sigue de la propiedad (9.205): a+(b+c) (a) (b+c) q, q, t = F1 (q, q, t) + F1 F1 q, q, t = (a) F1 (q,

q, t) +

donde c es la transformaci´ on (q, p) → (q, p).

(b) F1

q, q, t +

(c) F1

q, q, t

(9.206)

(9.207)

Las transformaciones canónicas / 355 Las ecuaciones (9.205), (9.206) y (9.207) valen también para transformaciones canónicas arbitrarias. Significado de la valencia de una transformaci´ on can´ onica. Sea la transformaci´ on de cambio de escala (9.191) y una transformaci´ on canónica univalente arbitraria. Si esas dos transformaciones se realizan en sucesión, las respectivas funciones generatrices se pueden escribir como: ∆Fc.e. = αβ

l X

ν=1

∆Fµ.v. =

l X

ν=1



!

!

−

−

l X

ν=1

l X

ν=1



!

!

(9.208)

(9.209)

Entonces la propiedad (9.205), permite escribir para la funci´ on generatriz de la transformaci´ on completa: ∆Fµ.v. = αβ

l X

ν=1


!

−

l X

ν=1


!

(9.210)

O sea que cualquier transformaci´ on canónica no univalente puede suponerse compuesta de una transformaci´ on de cambio de escala donde c = αβ seguida de una transformaci´ on univalente. Lo anterior permite que en la práctica se usen sólo las transformaciones can´ onicas univalentes. El grupo de las transformaciones can´ onicas. El conjunto de todas las transformaciones can´ onicas de un sistema de l grados de libertad es un conjunto infinito no contable. Este conjunto posee la estructura algebraica de grupo: (i) Hay una ley de composición interna, mediante la cual a dos transformaciones can´ onicas se les puede asociar una tercera; es decir, est´ a definida la suma de dos transformaciones can´ onicas para dar una transformaci´ on canónica, ecuaci´ on (9.205). (ii) Existe la transformaci´ on canónica identidad, ecuaci´ on (9.189). (iii) La transformaci´ on inversa de una transformaci´ on canónica dada existe y es canónica, (9.204). (iv) La realizaci´ on de transformaciones canónicas sucesivas es asociativa, (9.206). Por todo lo anterior podemos decir que la forma de las ecuaciones can´ onicas es invariante con respecto al grupo de las transformaciones can´ onicas. La integral de Poincaré-Cart´ an, las integrales invariantes de Poincaré, los corchetes de Poisson y otras cantidades también poseen esta propiedad de invariancia bajo el grupo de las transformaciones can´ onicas. Relaci´ on entre las diferentes funciones generatrices de transformaciones can´ onicas libres. Interpretaci´ on en t´ erminos de transformaciones de Legendre. En la secci´ on (4.1) se definió la transformaci´ on de Legendre. Sea una transformaci´ on

356 / Mec´ anica cl´ asica avanzada can´ onica libre de primera clase, univalente, las fórmulas de transformaci´ on se obtienen de: pν =

∂F1 ∂F1 ; −pν = ; ν = 1, 2, ...l ∂qν ∂qν

(9.211)

Usando la notaci´ on de la secci´ on 4.1, sea (x) = (q); (α) = (q, t); (y) = (p) y X = F1 . Entonces (9.211) se pueden escribir como: yν =

∂X ∂X ∂X(x, α) ; −pν = ; H −H = ∂xν ∂q ν ∂t

(9.212)

Podemos interpretar, pues, a F1 , como el generador de la transformaci´ on de Legendre (q) → (p). El generador de la transformaci´ on de Legendre inversa, (y) → (x) es Y (y, α), tal que: Yν =

l X

ν=1

xν yν − X ; xν =

∂Y ∂yν

(9.213)

donde además se satisface: ∂Y ∂X ∂Y ∂X =− → =− ; ∂αi ∂αi ∂q ν ∂qν

∂X ∂Y =− ∂t ∂t

(9.214)

∂Y ∂t

(9.215)

se cumple, pues, que: qν =

∂Y ; ∂pν

−pν = −

∂Y ; ∂qν

H −H =−

Si llamamos Y = −F 3(p, q, t), las ecuaciones (9.215) quedan as´ı: qν = −

∂F3 ; ∂pν

pν = −

∂F3 ; ∂qν

H −H =−

∂F3 ∂t

(9.216)

que coinciden con las fórmulas (9.168) a (9.171). En conclusi´ on, F1 y F3 est´ an relacionadas mediante una transformaci´ on de Legendre: F3 = F1 −

l X

pν qν

(9.217)

ν=1

Con argumentos completamente análogos llegamos a: F2 = F1 +

l X

q ν pν

l X

q ν pν −

(9.218)

ν=1

F4 = F1 +

ν=1

l X

qν pν

(9.219)

ν=1

Ejercicio 9.5.1 Usar las relaciones (9.217), (9.218) y (9.219) para obtener a F2 , F3 y F4 a partir de F1 para un oscilador armónico lineal. Comparar con las fórmulas (9.184).

Las transformaciones canónicas / 357 Ejemplo 9.5.12 Verificar las expresiones (9.187) y (9.188) usando la transformación de legendre: F3 = F2 −

l X

ν=1

q ν pν −

l X

pν qν

(9.220)

ν=1

Usando (9.187) obtenemos: F3

l X

=

ν=1 l X

=

ν=1

(pν qν − q ν pν − pν qν ) (pν q ν − q ν pν − pν q ν ) =

l X

ν=1

−q ν pν

(9.221)

en efecto, (9.221) coincide con (9.188). Notaci´ on de las funciones generatrices. Corben-Stehle usan la siguiente notación para las funciones generatrices de las T.C. libres F1, 2, 3, 4 de Goldstein: F1 = φ(q, q, t) F2 = ψ ′ (q, p, t) (9.222) F3 = ψ(q, p, t) F4 = φ′ (q, p, t) Landau usa F1 = F y F2 = Φ. Las transformaciones puntuales. Una transformaci´ on de coordenadas llamada transformaci´ on puntual, puede escribirse como una transformaci´ on canónica. Las nuevas coordenadas son funciones de las viejas coordenadas pero no de los viejos momentos. Entonces en una transformaci´ on puntual pueden tomarse como independientes (p, q) o (p, q), o sea que una transformaci´ on puntual es libre de segunda y de tercera clase. Puede expresarse en las siguientes formas: q ν = fν (q, t) ; pν =

∂F2 ; ∂qν

qν = −

∂F3 ; ∂pν

pν = gν (q, p, t) qν =

∂F2 ∂pν

pν = −

∂F3 ∂q ν

(9.223) (9.224) (9.225)

Se requiere entonces que F2 y F3 sean de la forma: F2 =

l X

ν=1

fν (q, t)pν

(9.226)


F3 = −

l X

fν−1 (q, t)pν

(9.227)

ν=1

donde fν−1 son las funciones inversas a fν , o sea, qν = fν−1 (q, t). Entonces se tiene para pν y pν : pν =

l X ∂fµ (q, t) pν ∂qν µ=1

pν =

l X ∂fµ−1 (q, t) pµ ∂q ν µ=1

(9.228)

(9.229)

Seg´ un lo anterior es claro que (p) y (p) estar´ an conectados por una transformaci´ on lineal que depende de las coordenadas que llamaremos T˜ de modo que en forma de matrices y vectores l-dimensionales (9.228) y (9.229) toman la forma: p = T˜(q, t)~p ; ~p = T˜−1 (q, t)~ ~ p Tµν =

−1 ∂fµν ∂fν −1 ; Tµν = ∂qµ ∂qµ

(9.230) (9.231)

Por poderse expresar en términos de funciones generatrices, la transformaci´ on puntual es can´ onica. Entonces, tanto las ecuaciones de Hamilton como las de Lagrange son covariantes bajo transformaciones puntuales. Las ecuaciones (9.223) y (9.228) pueden tomarse como las f´ ormulas de una transformaci´ on canónica puntual. Ejemplo 9.5.13 Sea un sistema de tres grados de libertad y la transformaci´ on de coordenadas cartesianas a coordenadas esféricas. Expresar esta transformaci´ on como transformaci´ on can´ onica. La transformaci´ on es: p r = x2 + y 2 + z 2 = fr (q)

z θ = cos−1 p = fθ (q) 2 x + y2 + z 2

φ = tan−1

(9.232)

y = fθ (q) x

x = r senθ cos φ = fx (q) y = r senθ senφ = fy (q) z = r cos θ = fz (q)

(9.233)

Las transformaciones canónicas / 359 donde tomamos a (q) = (x, y, z) y (q) = (r, θ, φ). Además usamos la notaci´ on (fν−1 ) = (fx , fy , fz ). La funci´ on generatriz F2 , de acuerdo con (9.226) y (9.232) es: F2 (q, p) = =

pr f r + pθ f θ + pφ f φ p z x2 + y 2 + z 2 + p2θ cos−1 p 2 x + y2 + z 2 −1 y +pφ tan x pr

(9.234)

Similarmente para F3 (q, p) tenemos: F3 (q, p) = =

−px fx − py fy − pz fz

(9.235)

−px r senθ cos φ − py rsenθ senφ − pz r cos θ

Usando (9.228) junto con (9.234) y (9.235) obtenemos las siguientes fórmulas para la transformaci´ on de los momentos: y xz x pr − 2 pθ p +p px = p 2 φ 2 2 2 2 2 x + y x +y +z x + y (x2 + y 2 + z 2 ) x y yz pr + 2 pθ py = p pφ + p 2 x +y x2 + y 2 + z 2 x2 + y 2 (x2 + y 2 + z 2 )

(9.236)

p x2 + y 2 pr − 2 px = p pθ 2 2 2 x + y2 + z 2 x +y +z z

y similarmente: pr =

px senθ cos φ + py senθ senφ + pz cos θ

pθ =

px r cos θ cos φ + py r cos θ senφ − pz r senθ

pr =

−px r senθ senφ + py rsenθ cos φ

(9.237)

Notemos que: p~2 = p2x + p2y + p2z = p2r +

p2φ p2θ + r2 sen2 θ r2

Expresadas en términos de r, θ, φ, las matrices T˜ y T˜ −1 son:   senφ 1 cos θ cos φ − senθ cos φ  r r senθ        cos φ 1   senθ senφ cos θ senφ T˜(q) =  r r senθ        1   0 cos θ − senθ   r

(9.238)

(9.239)

360 / Mec´ anica cl´ asica avanzada 

senθ cos φ

  −1 ˜ T (q) =   r cos θ cos φ  −r senθ senφ

cos θ senφ r cos θ senφ r senθ cos φ

cos θ



  −r senθ    0

(9.240)

˜ Sin embargo T˜ −1 6= T˜ T , o sea que Se ve, como debe ser, que T˜T˜−1 = T˜ −1 T˜ = I. la transformaci´ on de los momentos no es ortogonal. Transformaci´ on puntual lineal. En este caso se tiene: qν =

l X

Sνµ qµ + bν = fν (q, t)

(9.241)

ν=1

donde asumimos que Sνµ y bν pueden depender expl´ıcitamente del tiempo, aunque obviamente no dependen de (q) ni de (p). La transformaci´ on inversa es: qν =

l X

ν=1

−1 Sνµ q µ − bµ = fν−1 (q, t)

(9.242)

−1 donde Sνµ es la matriz inversa de Sνµ . Las funciones generatrices F2 (q, p, t) de la transformaci´ on, y −F2 (q, p, t) = F3 (q, p, t) de la transformaci´ on inversa son:

F2 (q, p, t) =

l X

Sµν pµ qν +

µ,ν=1

F2 (q, p, t) = −

l X

l X

b ν pν

(9.243)

ν=1

µ,ν=1

−1 Sµν q µ − b µ pν

(9.244)

La relaci´ on entre los momentos también será lineal: pν =

l X

Sµν pµ ;

pν =

l X

−1 Sµν pµ

(9.245)

µ=1

µ=1

La “representaci´ on” de las coordenadas y la “representaci´ on” de los momentos. La transformaci´ on (q, p) → (p, −q) es canónica. De acuerdo con (9.189) puede ser generada por las funciones generatrices. F1 (q, q) =

l X

ν=1

q µ qν ; F4 (p, p) =

l X

pµ pν

(9.246)

ν=1

Como la transformaci´ on no depende del tiempo, H = H: H(q, p, t) = H(q, p, t) = H(−p, q, t)

(9.247)

Las transformaciones canónicas / 361 As´ı por ejemplo, para un oscilador armónico lineal: H(q, p, t) =

1 2 k 2 q + p 2m 2

(9.248)

Ciertamente en el formalismo hamiltoniano las ecuaciones de movimiento son covariantes. El contenido de esta transformaci´ on es el siguiente: en el espacio de configuración el estado del sistema se puede representar mediante dos puntos, o equivalentemente, mediante las coordenadas y velocidades generalizadas; la transformaci´ on nos dice que en el espacio de momentos también est´ a toda la información requerida para describir el estado; en el espacio de momentos el estado se puede representar entonces mediante los momentos generalizados y sus derivadas temporales. Hallemos las ecuaciones de lagrange en el espacio de los momentos. Partimos de P l on canónica generada por (9.246): L = ν=1 pν q˙ν − H y usamos la transformaci´ ! l l l l X X X X pν q˙ν + pν q˙ ν − H − pν q˙ ν (9.249) L= pν q˙ν − H = ν=1

ν=1

ν=1

ν=1

El nuevo lagrangiano L estar´ a entonces relacionado con L por: L=

l X

ν=1

pν q˙ ν − H = L −

l X

ν=1

l d X pν qν pν q˙ν − pν q˙ν = L − dt ν=1

(9.250)

Como L y L difieren por una derivada total respecto al tiempo, el principio de Hamilton nos dice que las ecuaciones de movimiento son: d ∂L(p, p, ∂L(p, p, ˙ t) ˙ t) − = 0 ; ν = 1, 2, ...l ∂pν dt ∂ p˙ ν

(9.251)

lo cual coincide con el resultado (4.48) que se obtuvo con base en consideraciones sobre las transformaciones de Legendre. El paso del formalismo lagrangiano al hamiltoniano, secci´ on 3.1, se realiza mediante la transformaci´ on pν = ∂L(q, q, ˙ t)/∂ q˙ν , que se expresa en términos de transformaciones de Legendre. Esta transformaci´ on tiene la forma de cierta transformaci´ on (p, q) → (p = q, ˙ q) en el espacio de fases. Podr´ıamos investigar si es una transformaci´ on canónica donde los nuevos momentos sean las (q). ˙ También la transformaci´ on puede escribirse en una forma tal que q ν = q˙ν ; que es más u ´til en el contexto de las transformaciones canónicas pues permite interpretar on generatriz del tipo F1 de cierta transformaci´ on a L(q, q, ˙ t) = L(q, q, t) como la funci´ canónica. Es decir, L genera la transformaci´ on: pν =

∂L(q, q, t) ∂L(q, q, t) ∂L(q, q, t) ; pν = − ; H −H = ∂qν ∂q ν ∂t

(9.252)

que equivale a la transformaci´ on (q, p) ˙ ↔ (−p, q). ˙ H es el hamiltoniano en las variables ˙ Si quisiéramos expresar esta transformaci´ on canónicas (q, p) ˙ y H en las variables (−p, q). mediante una funci´ on generatriz del tipo F4 (p, p, t), dada de acuerdo con (9.219) por Pl Pl L(q, q, t)+ ν=1 (q ν pν −qν pν ) = L(q, q)− ˙ ν=1 (pν q˙ν +qν p˙ ν ), notamos que ese generador, de acuerdo con (9.250), ser´ıa precisamente la funci´ on que llamamos L(p, p, ˙ t).

362 / Mec´ anica cl´ asica avanzada Ejercicio 9.5.2 Hallar los hamiltonianos y las ecuaciones de movimiento que corresponden a los conjuntos de variables canónicas (q, p) ˙ y (−p, q). ˙ Ejercicio 9.5.3 Analizar la transformaci´ on (q, p) ↔ (q, q) ˙ como una transformaci´ on en el espacio de fases, e investigar si es canónica. De serlo hallar la correspondiente funci´ on generatriz. La funci´ on generatriz de una transformaci´ on can´ onica arbitraria. En general, una transformaci´ on canónica es no libre, o sea que no se puede describir mediante funciones generatrices del tipo F1, 2, 3, 4 . As´ı por ejemplo para un sistema de dos grados de libertad la transformaci´ on: q 1 = q1 , p1 = p1 , q 2 = p2 , p2 = −q2

(9.253)

es can´ onica pero no se puede describir mediante una funci´ on generatriz de una transformaci´ on can´ onica libre, pues involucra una mezcla de los cuatro tipos. El tratamiento de estas transformaciones se basa en el lema de Carathéodory, cuya demostración est´ a dada en el texto de Gantmacher, Lectures in analytical mechanics, secci´ on 29. El enunciado del lema es el siguiente. Lema. Si hay 2l funciones independientes q 1 , q 2 , ...q l , p1 , p2 , ...pl de las 2l cantidades independientes q1 , q2 , ...ql , p1 , p2 , ...pl , entonces del conjunto de 4l cantidades qν , pν , q ν , pν (ν = 1, 2, ...l) siempre es posible escoger 2l cantidades independientes de tal manera que no hay ni un sólo par de cantidades conjugadas (qν , pν ) o (q ν , pν ) entre an ellas. Tenemos entonces que de las 4l cantidades qν , pν , q ν , pν (ν = 1, 2, ...l) que est´ conectadas mediante la transformaci´ on canónica: ~q , ~p ) 6= 0 (9.254) q ν = q ν (q, p, t) ; pν = pν (q, p, t) ; ν = 1, 2, ...l ; J( q, p es posible tomar las siguientes 2l cantidades independientes: q1 , q2 , ...qr , pr+1 , pr+2 , ...pl , q 1 , q 2 , ...q s , ps+1 , ps+2 , ...pl (9.255) 0 ≤ r ≤ l, 0 ≤ s ≤ l donde, de acuerdo con el lema de Carathéodory no hay ni un par de variables canónicamente conjugadas. Como la transformaci´ on es canónica existe cierta funci´ on F (q, p, t) tal que: ! ! l l X X ∆F = C pν ∆q ν − H ∆t (9.256) pν ∆qν − H ∆t − ν=1

ν=1

de acuerdo con (9.136). Es claro que igualmente podr´ıamos haber usado cualquiera de las expresiones (9.145), (9.146) o (9.147), obteniéndose cuatro expresiones para F que sólo difieren por una transformaci´ on de Legendre. La expresión (9.256) usando (9.255) se puede separar as´ı: ∆F = C

r X

ν=1

pν ∆qν +C

l X

ν=r+1

pν ∆qν −

s X

ν=1

pν ∆q ν −

s X

ν=s+1

pν ∆q ν + H − H ∆t

(9.257)

Las transformaciones canónicas / 363 Usando las siguientes expresiones: l X

l X

pν ∆qν = ∆

pν qν

ν=r+1

ν=r+1

l X

l X

pν ∆q ν = ∆

ν=s+1

!

pν q ν

ν=s+1

!

−

∆

F+

ν=s+1

C

r X

q ν pν − C

pν ∆qν −

ν=1

l X

−

qν pν

ν=r+1

l X

qν ∆pν

ν=r+1

ν=s+1

l X

q ν ∆pν

(9.258)

ν=s+1

!

=

!

l l X X + − pν ∆q ν + q ν ∆pν ν=1

qν ∆pν

ν=r+1

podemos escribir a (9.257) como: l X

l X

!

+ H − CH ∆t

(9.259)

seg´ un (9.255), ∆qν (ν = 1, 2, ...r), ∆pν (ν = r + 1, r + 2, ...r), ∆q ν (ν = 1, 2, ...s), ∆pν (ν = s + 1, s + 2, ...l) son independientes y por tanto: C pν

=

−C qν

=

qν

=

−pν

=

H − CH =

∂U ; ∂qν ∂U ; ∂pν ∂U ; ∂pν ∂U ; ∂qν

ν = 1, 2, ...r ν = r + 1, r + 2, ...l ν = s + 1, s + 2, ...l ν = 1, 2, ...s

∂U ∂t

(9.260)

donde U es funci´ on de las cantidades (9.255) y est´ a definida por: U =F+

l X

ν=s+1

q ν pν − C

l X

pν qν

(9.261)

ν=r+1

Las f´ ormulas (9.260) son equivalentes a las fórmulas (9.254) y determinan la transformaci´ on can´ onica por medio de la valencia C y la funci´ on generatriz U de las variables independientes (9.255). Las f´ ormulas (9.260) relacionan el conjunto de variables independientes (9.255) con el siguiente conjunto de variables independientes complementarias: p1 , p2 , ...pr , qr+1 , qr+2 , ...ql , p1 , p2 , ...ps , q s+1 ; q s+2 , ...q l (9.262) 0 ≤ r ≤ l, 0 ≤ s ≤ l

364 / Mec´ anica cl´ asica avanzada El jacobiano de las variables p1 , p2 , ...ps , q s+1 , q s+2 , ...q l respecto a las variables q1 , q2 , ...qr , pr+1 , pr+2 , ...pl es diferente de cero. Ese jacobiano puede escribirse como:   ∂~ps ∂~ps !  ∂~qr ∂~pl−r  ~ps , ~q l−s     = det  J  qr , p~l−r ~  ∂~q l−s ∂~q l−s  ∂~qr ∂~pl−r   2 ∂2U ∂ U − −  ∂~qr ∂~q ∂~pl−r ∂~q s  s    (9.263) = det      ∂2U ∂2U ∂~qr ∂~pl−s ∂~pl−r ∂~pl−s

donde ~ps es el vector p1 , p2 , ...ps . p~l−r es el vector pr+1 , pr+2 , ...pl , con significado análogo para los otros vectores que aparecen en (9.263). En vista de (9.263), las ecuaciones (9.260) de la primera l´ınea pueden resolverse para expresar a q 1 , q 2 , ...q s , ps+1 , ps+2 , ...pl en funci´ on de p1 , p2 , ...pr , qr+1 , qr+2 , ...ql . Después se reemplazan las expresiones obtenidas en las l ecuaciones de la segunda l´ınea de (9.260) para obtener las ecuaciones de la transformaci´ on can´ onica (9.254). Las fórmulas de la transformaci´ on canónica inversa pueden obtenerse de manera análoga mediante una funci´ on generatriz que depende de las variables (9.262) en vez de las variables complementarias igual a (9.255), −C −1 U y una valencia igual a C −1 . Queda claro que las transformaciones canónicas libres resultan como casos particulares de la transformaci´ on canónica arbitraria, al definir apropiadamente los valores de r y s.

9.6.

La ecuaci´ on de Hamilton-Jacobi

En la secci´ on 3.4 hemos discutido la especificaci´ on del estado del sistema mediante las constantes de movimiento. Por simplicidad estamos considerando que el sistema es integrable y posse por lo tanto un conjunto de 2l constantes de movimiento uniformes. El objetivo de la descripción clásica es encontrar a las variables de estado en funci´ on del tiempo para cada valor de las constantes de movimiento, considerados como un conjunto completo de variables dinámicas independientes. Si se quiere pueden tomarse como constantes de movimiento los 2l valores iniciales de las variables de estado. La solución estar´ a dada por: q = ~q(~ ~ q0 , p~0 , t) ; p~ = ~p(~q0 , p~0 , t)

(9.264)

La ecuaci´ on (9.264) puede interpretarse como una transformaci´ on canónica de las variables ~ q0 , p~0 a las variables ~q, p~. En la secci´ on 4.7 vimos que para un sistema conservativo la acción coincide con el negativo de la funci´ on generatriz de la transformaci´ on canónica de evoluci´ on temporal (9.264). Veamos que este resultado vale en general. En la secci´ on 9.1 vimos que la diferencia de acción entre dos trayectorias rectas infinitesimalmente

Las transformaciones canónicas / 365 próximas, ∆S, cuyos puntos iniciales y finales est´ an sobre ciertas curvas C1 y C2 respectivamente, del espacio de configuración, est´ a dada por la ecuaci´ on (9.11), ! ! l l X X ∆S = pν ∆qν − H ∆t − pν ∆qν − H ∆t (9.265) ν=1

C2

ν=1

C1

Describiendo la transformaci´ on canónica (9.264) mediante la funci´ on generatriz (9.135) con C = 1 y tomando a (q, p) como las nuevas variables y a q0 , p0 , como las viejas variables, obtenemos: ! ! l l X X −∆F = pν ∆qν − H ∆t − (9.266) pν0 ∆qν0 − H0 ∆t ν=1

ν=1

Si en (9.265) definimos la curva C1 como el conjunto de puntos iniciales simult´ aneos, t1 (α) = constante = t0 y dejamos a C2 arbitraria, entonces (9.265) tomará la forma: ∆S =

l X

ν=1

pν ∆qν − H ∆t −

l X

pν0 ∆qν0

(9.267)

ν=1

Las expresiones (9.266) y (9.267) coincidirán si la transformaci´ on canónica generada por F , (9.264), satisface: −∆F − H0 ∆t = ∆S

(9.268)

Tomando H0 = 0 obtenemos F = −S. Además como ∂F/∂t = H − H0 se sigue que: F = −S ; →

∂S +H =0 ∂t

(9.269)

El resultado (9.269) fue obtenido por Hamilton (1805-1865) en 1835, quien además supuso que la transformaci´ on canónica (9.264), es libre de primera clase, con lo cual (9.267) conduce a: pν =

∂S ∂S ; pν0 = ; ∂qν ∂qν0

ν = 1, 2, ...l

(9.270)

Las f´ ormulas (9.270) conducen a la transformaci´ on canónica (9.264). 6 S se llama la funci´ on principal de Hamilton (o simplemente acción de Hamilton). Que F = −S, sin emRt bargo, no da un método para encontrar a F , puesto que para evaluar a S = t0 L(q, q, ˙ t) dt se requiere conocer a q(t), q(t), ˙ o sea haber resuelto el problema, es decir conocer la “transformación” (9.264). El resultado de Hamilton fue un c´ırculo vicioso: para escribir a partir de (9.270) las ecuaciones (9.264) se requiere conocer la funci´ on principal de Hamilton, y para evaluar esta funci´ on se requiere conocer la solución (9.264). La contribuci´ on de Jacobi (1804-1851), en 1837, fue romper este c´ırculo vicioso; mostró que al resolver la ecuaci´ on diferencial que resulta de (9.269), llamada la ecuaci´ on de HamiltonJacobi, para obtener una funci´ on S mediante las fórmulas (9.270), se obtiene la solución 6 Es

una transformaci´ on can´ onica a unas variables donde el sistema est´ a completamente en equilibrio; su trayectoria de fases se reduce a un punto.

366 / Mec´ anica cl´ asica avanzada buscada (9.264). La ecuaci´ on de Hamilton-Jacobi para la funci´ on principal de Hamilton. Tratemos de hallar la transformaci´ on canónica libre univalente de primera clase que transforma las ecuaciones de Hamilton: q˙ν =

∂H ; ∂pν

p˙ν = −

∂H ; ∂qν

ν = 1, 2, ...l

(9.271)

ν = 1, 2, ...l

(9.272)

en las ecuaciones de Hamilton: ∂H ; q˙ ν = ∂pν

∂H ; p˙ ν = − ∂qν

donde H sea idénticamente cero: H ≡0

(9.273)

Las ecuaciones (9.272) y (9.273) conducen a la solución inmediata: q ν = βν ;

pν = αν ;

ν = 1, 2, ...l

(9.274)

donde αν y βν son 2l constantes arbitrarias. En virtud de (9.158), las fórmulas de transformaci´ on estar´ an dadas por: ∂S(q, β, t) ∂S(q, β, t) = pν ; = −αν ; ν = 1, 2, ...l ∂qν ∂βν

(9.275)

En tanto que por (9.159) y (9.273) S necesariamente satisface: ∂S +H =0 ∂t

(9.276)

La ecuaci´ on (9.276) junto con (9.275) nos da la siguiente ecuaci´ on diferencial en derivadas parciales para S: ! ~ t) ~ t) ∂S(~q, β, ∂S(~ q, β, (9.277) + H ~q, ∂t ∂~q ~ t) La ecuaci´ on (9.277) se llama la ecuaci´ on de Hamilton-Jacobi.7 La solución S(~q, β, de la ecuaci´ on de Hamilton-Jacobi con l constantes arbitrarias β1 , β2 , ...βl se llama la integral completa de la ecuaci´ on de Hamilton-Jacobi si se cumple la condición: det

∂2S 6= 0 ~ ∂~q ∂ β

(9.278)

La expresión (9.278) es equivalente a la (9.162) que es la condición necesaria para que las ecuaciones (9.275) puedan resolverse para expresar a ~q, p~, en la forma ~ t); ~ ~ t). Lo anterior constituye el teorema de Jacobi cuyo enunciado q = ~q(~ ~ α, β, p = p~(~ α, β, 7 Ya

optica. ´

en 1824 el mismo Hamilton hall´ o una ecuaci´ on diferencial de esta forma en conexi´ on con la

Las transformaciones canónicas / 367 ~ t) es alguna integral completa de la ecuaci´ es el siguiente: “si S(~ α, β, on de HamiltonJacobi (9.277), entonces la solución para las variables de estado ~q y p~ del sistema puede escribirse en la forma (9.275) para cualquier hamiltoniano H”.8 Seg´ un esto, en vez de integrar directamente las ecuaciones de movimiento (9.271), que nos dar´ an a ~q, p~, con 2l constantes de integraci´ on arbitrarias, el teorema de Jacobi nos permite hacerlo encontrando la integral completa de la ecuaci´ on de Hamilton-Jacobi. Una integral completa de la ecuaci´ on de Hamilton-Jacobi no es una solución más general de esta ecuaci´ on. Pero en este contexto sólo es importante saber que existe una solución completa. Hasta aqu´ı no hemos impuesto ninguna restricción sobre las constantes αν , βν . Si las escogemos de tal manera que coincidan con los valores iniciales de pν y qν obtendremos una solución completa que coincide con la acci´ on principal de Hamilton –es la funci´ on generatriz de la transformaci´ on inversa de (9.264)–. En este caso S coincide con el generador de la transformaci´ on canónica de evoluci´ on hacia atr´ as en el tiempo, pero para otra elección de las constantes αν , βν , la solución completa S de la ecuación de Hamilton-Jacobi no admite esta interpretaci´ on. En esto se basa el aporte de Jacobi, quien no sólo rompió el c´ırculo vicioso que mencionamos antes sino que además ~ t) mostró que cualquier solución completa de la ecuaci´ on (9.277) permite escribir a ~q(~ α, β, ~ t) en la forma (9.275) donde las βν son las constantes de integraci´ y ~q(~ α, β, on de la ecuación de Hamilton-Jacobi. Hay en efecto, un n´ umero infinito de integrales completas de la ecuaci´ on de Hamilton-Jacobi. Ejemplo 9.6.1 Formar la funci´ on principal de Hamilton para el movimiento de una part´ıcula en ca´ıda libre en presencia de la gravedad. En este caso (tomando t0 = 0): x = 0,

S=

y = 0,

Z t 0

1 z = z0 + z˙0 t − gt2 2

1 mz˙ 2 − mgz 2

dt

=

1 1 m z˙02 t − z˙0 gt2 + g 2 t3 2 3 1 2 1 3 −mg z0 t + z˙0 t − gt 2 6

(9.279)

(9.280)

teniendo en cuenta que E = 1/2 mz˙ 02 + mgz0 : 1 S = −Et + mz˙02 t − mz˙0 gt2 + mgt3 2 y como: z˙0 t= g

1−

s

2g 1 + 2 (z0 − z) z˙0

!

podemos escribir a S en la forma: 3/2 mz˙03 2g S = −Et − 1 + 2 (z0 − z) 3g z˙ 8 Este

(9.281)

(9.282)

(9.283)

enunciado constituye la contribuci´ on de Jacobi a este problema y fue publicado en el a˜ no 1837.

368 / Mec´ anica cl´ asica avanzada donde omitimos una constante. La expresión (9.283) también se puede escribir en términos de E como: 3/2 m 2 S(z, E, t) = −Et − (E − mgz)3/2 (9.284) 3g m que coincide con la ecuaci´ on (4.190), que fue obtenida integrando la ecuaci´ on de HamiltonJacobi. Otras formas de la ecuaci´ on de Hamilton-Jacobi. Si queremos hallar una transformaci´ on can´ onica libre univalente de segunda, tercera o cuarta clase que haga a H idénticamente igual a cero, podemos emplear un procedimiento análogo al que nos condujo a la ecuaci´ on (9.277) y también buscar una integral completa de la misma. Una forma equivalente de hallar esas transformaciones es por medio de las fórmulas (9.217), (9.218) y (9.219). Además son u ´tiles: F2 =

F1 +

l X

q ν pν

l X

q ν pν

ν=1

F4 =

F3 +

(9.285)

ν=1

La ecuaci´ on de Hamilton-Jacobi para las diferentes funciones generatrices de las transformaciones can´ onicas libres que hacen a H idénticamente cero son: ! ~ t) ~ t) ∂F1 (~q, β, ∂F1 (~ q , β, + H ~q, ,t = 0 ∂t ∂~q ∂F2 (~q, α ~ , t) ∂F2 (~ q, α ~ , t) + H ~q, ,t = 0 ∂t ∂~q ~ t) ∂F3 (~ q , β, +H ∂t

~ t) ∂F3 (~ p, β, − , p~, t ∂~p

!

(9.286)

=0

∂F4 (~ q, α ~ , t) ∂F4 (~q, α ~ , t) +H − , p~, t = 0 ∂t ∂~p Vemos que F1 y F2 satisfacen la misma ecuaci´ on diferencial, lo cual es consistente con (9.285), esto es, F1 y F2 difieren por una constante aditiva. Similarmente F3 y F4 satisfacen la misma ecuaci´ on. F3 y F4 en la práctica son de poco interés en el método de Hamilton-Jacobi puesto que las qν entran en la energ´ıa potencial que es una funci´ on complicada y se hace por ello más dif´ıcil la separación de variables. Es posible hallar la ecuaci´ on de Hamilton-Jacobi asociado a la transformaci´ on can´ onica (9.260), lo cual se deja como ejercicio. Ejemplo 9.6.2 El oscilador arm´ onico lineal. Resolver la ecuaci´ on de Hamilton-Jacobi y con ella hallar la solución a las ecuaciones de movimiento.

Las transformaciones canónicas / 369 El hamiltoniano es: H=

p2 kq 2 + 2m 2

La ecuaci´ on de Hamilton-Jacobi (9.277) es: 2 ∂S(q, β, t) kq 2 ∂S(q, β, t) + + =0 ∂t ∂q 2

(9.287)

(9.288)

Aqu´ı podemos buscar una solución separando las variables q y t en la forma:9 S(q, β, t) = −ht + Σ(q, β)

(9.289)

donde h es la constante de Jacobi que en este caso coincide con la energ´ıa total E. Como el sistema tiene sólo un grado de libertad hay sólo una constante de integraci´ on, por tanto, podemos hacer h = E = β. Σ(q, E) será solución a la ecuaci´ on: 2 kq 2 1 d Σ(q, E) + =E (9.290) 2m dq 2 La ecuaci´ on (9.290) puede resolverse directamente: r √ Z q 2E Σ(q, E) = mk − q 2 dq k q0

(9.291)

No evaluaremos a (9.291) por cuanto el objetivo no es hallar a S sino, mediante las fórmulas (9.275) encontrar a q y p en funci´ on del tiempo: Z qr √ 2E S(q, E, t) = Σ(q, E, t) = −Et + mk − q 2 dq (9.292) k q0 reemplazando a (9.292) en (9.275) obtenemos: r √ 2E ∂S p= = mk − q2 ∂q k Z q √ 2/k ∂S r = −t + mk −α = ∂E 2E q0 2 − q2 k

(9.293)

(9.294)

La ecuaci´ on (9.294) se puede integrar directamente, incorporando la constante que depende de q0 en α para obtener: ! √ q −1 (9.295) −α = −t + mk sen p 2E/k 9 En

la secci´ on 4.4 encontramos una segunda soluci´ on de esta ecuaci´ on en la cual las variables no est´ an separadas. Tal soluci´ on est´ a dada por la ecuaci´ on (4.143).

370 / Mec´ anica cl´ asica avanzada La ecuaci´ on (9.295) nos da a q en funci´ on del tiempo y reemplazándolo en (9.293) obtenemos a p en funci´ on del tiempo: r 2E sen ω(t − α) q(E, α, t) = k (9.296) √ p(E, α, t) = 2mE cos ω(t − α) Vemos que, como β y α son cantidades canónicamente conjugadas, la energ´ıa E y el tiempo α son un par de cantidades canónicamente conjugadas. E y α no coinciden con las condiciones iniciales, aunque est´ an relacionadas con ellas: r r √ 2E k q0 = − sen ωα ; p0 = 2mE cos ωα ; ω = (9.297) k m Ejemplo 9.6.3 Comparar a S con la acción para el oscilador armónico: Z

t

L dt = t0

E

Z

t

t0

Z

t t0

kq 2 p2 − 2m 2

dt =

[cos2 ω(t − α) − sen2 ω(t − α)] dt =

E E sen 2ω(t − α) − sen 2ω(t0 − α) 2ω 2ω Omitiendo la constante aditiva podemos escribir: Z t E 1 L dt → sen ω(t − α) cos ω(t − α) = mω 2 q 2 cot ω(t − α) ω 2 t0 Evaluando a S en (9.292): √ S = −Et + mk× # " r 2E q 2E 1 −1 2 q −q + sen p + constante 2 k k 2E/k

(9.298) (9.299)

(9.300)

(9.301)

reemplazando a (9.296) en (9.301) y omitiendo una constante aditiva: S = −Et +

1√ 2mEq cos ω(t − α) + E(t − α) 2

1 ⇒ S → mωq 2 cot ω(t − α) 2

(9.302)

Comparamos (9.300) y la parte final de (9.302) para encontrar el resultado que se espera: la solución a la ecuaci´ on de Hamilton-Jacobi coincide con la integral de acción. La ecuaci´ on de Hamilton-Jacobi independiente del tiempo. Si el sistema es conservativo generalizado (puede ser esclerónomo, aunque no hay fuerzas disipativas

Las transformaciones canónicas / 371 y H no depende del tiempo expl´ıcitamente) posee una constante de movimiento que es la constante de Jacobi h, que coincide con la energ´ıa total cuando además el sistema es escler´ onomo –véase la ecuaci´ on (3.99)–. Entonces la ecuaci´ on de Hamilton-Jacobi (9.277) tiene la forma: ! ~ t) ~ t) ∂S(~ q , β, ∂S(~ q , β, =0 (9.303) +H ~ q, ∂t ∂~q Una solución completa puede escribirse en la forma:10 S(~ q , β1 , β2 , ...βl−1 , h, t) = −ht + Σ(~q, β1 , β2 , ...βl−1 , h)

(9.304)

donde β1 , β2 , ...βl−1 son constantes con valores arbitrarios. Reemplazando a (9.304) en (9.303) y llamando β~l−1 a β1 , β2 , ...βl−1 obtenemos: ! ~l−1 , h) ∂Σ(~ q, β H ~ q, =h (9.305) ∂~q La integral completa de (9.305) satisface (9.278) es decir: 2 ∂ Σ det 6= 0 (βl = h) ~ ∂~q ∂ β

(9.306)

Conocida la solución de la ecuaci´ on de Hamilton-Jacobi independiente del tiempo (9.305), la condición (9.306) permite obtener a qν y pν en funci´ on del tiempo (ν = 1, 2, ...l) a partir de las ecuaciones que corresponden a (9.275): ~l−1 , h ∂Σ ~ q, β = pν ; ν = 1, 2, ...l ∂qν (9.307) ~ ∂Σ ~ q , βl−1 , h = −αν ; ν = 1, 2, ...l − 1 ∂βν ∂Σ(~ q , β~l−1 , h) = t − αl ∂h

(9.308)

donde αν , βν , h, son constantes arbitrarias. Usando las segundas l − 1 ecuaciones (9.307) podemos expresar a l − 1 coordenadas en términos de la restante l-ésima coordenada y de las 2l − 1 constantes arbitrarias ~l−1 , h, α1 , α2 , ...αl−1 , como en la ecuaci´ ´ β on (9.38). Estas son las ecuaciones de las trayectorias en el espacio de configuración. La ecuaci´ on (9.308) conecta las coordenadas con la variable temporal t, y equivale a la ecuaci´ on (9.40). As´ı como la acción principal de Hamilton coincide con una de las integrales completas de la ecuaci´ on de Hamilton-Jacobi dependiente del tiempo, la acción de Lagrange 10 El

ejemplo 4.4.2, secci´ on 4.4, ilustra la propiedad general de la ecuaci´ on de Hamilton-Jacobi de poseer soluciones en las cuales las variables t y ~ q no est´ an separadas.

372 / Mec´ anica cl´ asica avanzada Σ coincide con una de las integrales completas de la ecuaci´ on de Hamilton-Jacobi independiente del tiempo (Véase secci´ on 9.3). La conexión entre la acción principal de Hamilton S, y la acción reducida, Σ, est´ a dada por la ecuaci´ on (9.46). Si tomamos all´ı a t2 = t y a t1 arbitrario, y omitimos una constante aditiva, vemos que la ecuaci´ on (9.46) coincide con la ecuaci´ on (9.304). Como se se˜ nalaba en la secci´ on 9.3, la acción reducida Σ permite determinar las trayectorias en el espacio de configuración, consistentemente con el principio de m´ınima acción. S es la funci´ on generatriz de la transformaci´ on canónica que lleva a unas cantidades can´ onicas que son constantes. Σ es la funci´ on generatriz de cierta transformaci´ on can´ onica que no depende del tiempo, que no coincide con la transformaci´ on generada por S pero que tiene alguna relación con ella, seg´ un veremos. Σ considerada como la funci´ on generatriz de una transformaci´ on can´ onica. Sea una transformaci´ on canónica independiente del tiempo que al ser aplicada a un sistema conservativo generalizado (∂H/∂t = 0) nos lleva a unas nuevas variables canónicas q ν , pν , donde todas las pν sean c´ıclicas. Por tanto todos los q ν serán constantes de movimiento. Llamemos βν a esas constantes. Esta transformaci´ on satisface: ∂F1 =0⇒H =H; ∂t ∂F1 = pν ; ∂qν

H = H(q) = constante = h

∂F1 = pν ; ∂qν

ν = 1, 2, ...l

(9.309)

(9.310)

F1 , seg´ un (9.309) y (9.310), debe ser solución a la ecuaci´ on diferencial:

H

∂F1 (~ q , ~q) q, ~ ∂~q

!

=h

(9.311)

Si llamamos βl = h, (9.309) y (9.310) se pueden escribir como:

H

∂F1 (~ q , β~l−1 , h) q, ~ ∂~q

!

=h

(9.312)

~l−1 , h) ∂F1 (~ q, β = p~ ∂~q ~l−1 , h) ∂F1 (~ q, β = −~pl−1 ~l−1 ∂β ~l−1 , h) ∂F1 (~ q, β = −~ pl ∂h

(9.313)

Las transformaciones canónicas / 373 Las ecuaciones de Hamilton y sus soluciones para las variables pν y qν son: ~ ~ ~q˙ = ∂H(q) = 0 ⇒ ~q = constante = β ∂~p ~ ~p˙ = − ∂H(q ) = − ∂βl ~ ~ ∂p ∂β ⇒ ~pl−1 = constante = α ~ l−1 ;

(9.314)

pl = −t + αl

Las ecuaciones (9.312) y (9.313) junto con las (9.314) quedan as´ı: ~l−1 , h) ∂F1 (~ q, β = pν ; ν = 1, 2, ...l ∂~qν ~l−1 , h) ∂F1 (~ q, β = −αν ; α = 1, 2, ...l − 1 ∂βν

(9.315)

~l−1 , h) ∂F1 (~ q, β = t − αl ∂h Comparando (9.312) con (9.305) y a (9.315) con (9.307), vemos que la funci´ on generatriz de la transformaci´ on buscada, F1 (q, q), coincide con la funci´ on Σ. Σ puede considerarse como la funci´ on generatriz de una transformaci´ on canónica libre univalente de primera clase que al ser aplicada a un sistema conservativo generalizado nos conduce a unas variables canónicas (q, p) donde todas las q ν son constantes, lo mismo que l − 1 pν . Una de las constantes q ν coincide con h y el l-ésimo pν es una on se aplica a un sistema funci´ on lineal del tiempo, pl = −t + αl . Si esta transformaci´ para el cual ∂H/∂t 6= 0, es claro que las nuevas variables canónicas ya no tendrán las caracter´ısticas se˜ naladas. ~ lo cual No es drástica la exigencia βl = h. Podr´ıamos haber dejado a h = H(β), nos conducir´ıa a que todos los q ν son constantes y todos los pν son funciones lineales del tiempo. Tratamiento cuando H(q, p) tiene coordenadas c´ıclicas. Si el sistema es conservativo generalizado y además hay l − r coordenadas c´ıclicas, entonces H = H(q1 , q2 , ...qr , p1 , p2 , ...pl ). Los momentos pr+1 , pr+2 , ...pl , conjugados a las coordenadas c´ıclicas serán constantes de movimiento. La solución completa de la ecuaci´ on de Hamilton-Jacobi puede escribirse como: S = −ht +

l X

βν qν + Σ0 (q1 , q2 , ...qr , β1 , β2 , ...βl , h)

(9.316)

ν=r+1

donde la funci´ on Σ0 es solución a la ecuaci´ on diferencial: ∂Σ0 ∂Σ0 ∂Σ0 , , ... , βr+1 , βr+2 , ...βl = h H q1 , q2 , ...qr , ∂q1 ∂q2 ∂qr

(9.317)

en la cual hemos tomado los momentos constantes coincidiendo con l − r constantes βν .


9.7.

Las transformaciones can´ onicas infinitesimales

Ecuaciones de transformaci´ on. Las transformaciones canónicas infinitesimales (T.C.I.) son las transformaciones canónicas en las que (p, q) difieren infinitesimalmente de (p, q): q ν = qν + δqν ;

pν = pν + δpν ;

ν = 1, 2, ...l

(9.318)

aqu´ı δ no denota desplazamientos virtuales sino simplemente los cambios infinitesimales en las coordenadas y momentos en la T.C.I. La T.C.I. (9.318) difiere infinitesimalmente de la transformaci´ on identidad. Si la transformaci´ on infinitesimal sólo depende de un par´ ametro ε, podemos decir que la funci´ on generatriz de la T.C.I. ser´ıa igual a la funci´ on generatriz de la transformaci´ on identidad más un término del orden de ε. La transformaci´ on identidad es univalente libre de tercera y de segunda clase, seg´ un las ecuaciones (9.184) a (9.188). La funci´ on generatriz de la T.C.I. (9.318) será pues: F2 (q, pν , t) =

l X

pν qν + ε G(q, p, t)

(9.319)

ν=1

Si la T.C.I. posee m par´ ametros infinitesimales, F2 será: F2 =

l X

pν qν +

ν=1

m X

εj Gj

(9.320)

j=1

Es decir, las T.C.I. son las que se obtienen a partir de la identidad variando de manera continua uno o varios par´ ametros. Los Gj se llaman los generadores infinitesimales de la T.C.I., en términos de los cuales se pueden expresar las fórmulas (9.135). Una transformaci´ on canónica del tipo F2 satisface: pν =

∂F2 ∂F2 ∂F2 ; qν = ; ν = 1, 2, ...l ; H − H = ∂qν ∂pν ∂t

(9.321)

Entonces para la T.C.I. con funci´ on generatriz (9.319) tenemos: δpν = −ε

∂G ∂G ; δqν = ε ; ν = 1, 2, ...l ∂qν ∂pν

(9.322)

∂G H =H +ε ∂t donde en (9.322) hemos notado que ε f (q, p, t) = εf (q, p, t) al primer orden en ε. La T.C.I. de evoluci´ on temporal. Sabemos que la evoluci´ on temporal puede considerarse como una transformaci´ on canónica. Queremos hallar el generador de la T.C.I. de evoluci´ on temporal. La transformaci´ on es: qν (t); pν (t) → q ν (t) = qν (t + τ )pν (t) = pν (t + τ ) ; ν = 1, 2, ...l

(9.323)

Las transformaciones canónicas / 375 donde tomamos a τ infinitesimal. De acuerdo con (9.269), la funci´ on generatriz de la transformaci´ on can´ onica de evoluci´ on temporal entre t0 y t es −S, Z t e.t. L dt (9.324) F1 = − t0

O sea que para la transformaci´ on (9.323) con τ infinitesimal, la funci´ on generatriz es: F1e.t.

=

=

− −

Z

l X

t+τ

L dt ≈ −Lτ = −

t

l X

ν=1

pν q˙ν − H

!

τ

pν q˙ν τ + Hτ

(9.325)

ν=1

Por otra parte, q˙ν = (q ν − qν )/τ → q˙ν τ = q ν − qν , o sea que: F1e.t. ≈ −

l X

(pν qν − pν q ν ) + Hτ

(9.326)

ν=1

De acuerdo con (9.217), (9.218), (9.187) y (9.188) vemos que: F1id. = F2id. +

l X

(pν qν + pν q ν ) =

l X

(−q ν pν + pν qν + pν q ν )

(9.327)

ν=1

ν=1

donde F2id. es la funci´ on generatriz de la T.C. identidad y F1e.t. se refiere a la evoluci´ on temporal. Comparando (9.326) y (9.327) obtenemos: F1e.t. = F2id. −

l X

pν q ν + Hτ

(9.328)

ν=1

Comparando (9.328) con (9.218) obtenemos: F1e.t. = F2id. + Hτ =

l X

pν qν + Hτ

(9.329)

ν=1

Si comparamos a (9.329) con (9.319) vemos que en este caso τ hace el papel del par´ ametro infinitesimal ε y H es el generador infinitesimal de la T.C.I. de evoluci´ on temporal. Al mismo resultado llegamos de la siguiente manera, notemos que: q ν = qν + τ q˙ν ⇒ δqν = τ q˙ν = dqν

(9.330)

pν = pν + τ p˙ν ⇒ δpν = τ p˙ ν = dpν ; H = H +

∂H τ ∂t

(9.331)

Comparando a (9.322) con (9.330) obtenemos: ε

∂G = τ q˙ν ; ∂pν

−ε

∂G = τ p˙ν ; ∂qν

ε

∂G ∂H =τ ∂t ∂t

(9.332)

376 / Mec´ anica cl´ asica avanzada De las ecuaciones de Hamilton obtenemos para (9.332): ε

∂G ∂H =τ ; ∂pν ∂pν

−ε

∂ (εG − τ H) = 0 ; ∂qν

∂G ∂H ∂ = −τ ⇒ (εG − τ H) = 0 ∂qν ∂qν ∂pν ν = 1, 2, ...l ;

(9.333)

∂ (εG − τ H) = 0 ∂t

Las ecuaciones (9.333) nos dicen que εG = τ H. En efecto, podemos tomar τ como ε y a H como el generador de la T.C.I. El movimiento finito del sistema puede considerarse como una sucesión de T.C.I. Si H es constante, el generador de la T.C.I. de evoluci´ on temporal es el mismo para cada una de las transformaciones en tal sucesión. Si H depende de t, H es G para la evoluci´ on de t a t + τ y H + (∂H/∂t)τ es G para la evoluci´ on de t + τ a t + 2τ , etc. En el l´ımite τ → 0, la evoluci´ on finita es el desarrollo continuo de una T.C. En este caso el generador de la T.C.I. es H. En general, el generador de cualquier T.C.I. es una variable din´ amica del sistema. La T.C.I. de translaci´ on espacial. Esta transformaci´ on involucra tres par´ ametros infinitesimales. Supongamos que el sistema es libre, de modo que las coordenadas cartesianas son a la vez coordenadas generalizadas independientes. La transformaci´ on es: xi = xi + εx ; y i = yi + εy ; z i = zi + εz ; i = 1, 2, ...N

(9.334)

Además, como para este sistema p~i = mi~r˙ i , se tiene que: ~pi = p~i ; i = 1, 2, ...N

(9.335)

En este caso δxi = εx , δyi = εy , δzi = εz , δ~ pi = 0; i = 1, 2, ...N . Entonces las ecuaciones (9.322) toman la forma: ∂ ~ = ~ε ; (~ε · G) ∂~ pi

∂ ~ = 0; (~ε · G) ∂~ri

i = 1, 2, ...N

(9.336)

donde nos basamos en (9.320) con m = 3 y formamos los εj con el vector ~ε y con los Gj ~ De (9.336) se sigue que G ~ tiene la expresión: el vector G. ~ = G

n X

pi = P~ ~

(9.337)

i=1

Vemos que el momento total del sistema P~ es el generador infinitesimal de la transformaci´ on can´ onica de translaci´ on espacial. M´ as exactamente, en la translaci´ on por una cantidad ε a lo largo del vector unitario ~n, entonces ~ε = ε~n y el generador infinitesimal ~ = Pn . El generador infinitesimal de translaciones a lo largo de la direcci´ será ~n · G on ~n es la componente del momento total en esa direcci´ on, Pn . El hecho de que se emplee (9.335) no implica que P~ o Pn sea constante en el tiempo. Veremos que P~ es constante sólo si H no depende de la coordenada de posición del centro de masa.

Las transformaciones canónicas / 377 y

ri

ε

r

θi

x

Figura 9.7 Rotación de las part´ıculas alrededor del eje z

La T.C.I. de rotaci´ on espacial. Suponemos también qué sistema es libre. Por simplicidad consideremos una rotación de todas las part´ıculas alrededor del eje z (véase figura 9.7). La transformaci´ on es: xi =

ri cos(θi + ε)

yi =

ri sen(θi + ε)

zi =

zi ; i = 1, 2, ...N

(9.338)

y similarmente para las componentes de P~i . Al primer orden en ε, las ecuaciones (9.338) y sus similares para p~i nos dan: xi = xi − εyi ; yi = yi + εxi ; z i = zi pxi = pxi − εpyi ; pyi = pyi + εpxi ; pzi = pzi ;

(9.339) i = 1, 2, ...N

Comparando (9.339) con (9.322) hallamos: −εyi = δxi = ε

∂G ∂G ; εxi = δyi = ε ; ∂pxi ∂pyi

−εpyi = δpxi = −ε εpxi = δpyi = −ε

0 = δzi = ε

∂G ∂pxi

∂G ∂pzi (9.340)

∂G ∂G ; 0 = δpzi = −ε ∂yi ∂zi

vemos que G no depende de zi ni de pzi . (9.340) se satisfacen si: G=

N X i=1

(xi pyi − yi pxi ) = Lz

(9.341)

378 / Mec´ anica cl´ asica avanzada O sea que Lz es el generador infinitesimal de una rotación del sistema alrededor del eje z, donde Lz es la componente z del momento angular total del sistema. Vemos que: Lz =

N X i=1

(xi pyi − y i pxi ) =

N X (xi pyi − yi pxi ) + 0 (ε2 )

(9.342)

i=1

O sea que, como debe ser, Lz = Lz . Veremos que Lz será constante en el tiempo sólo si H no depende de la coordenada φ del vector de posición del centro de masa.

9.8.

Los corchetes de Poisson

En el numeral anterior vimos que los generadores infinitesimales H, Pn y Lz corresponden a cantidades con claro significado f´ısico. Aqu´ı consideraremos algunas propiedades de las funciones del estado del sistema que hemos definido como variables dinámicas (véase secci´ on 3.4). Las variables din´ amicas. Definimos una variable dinámica como una funci´ on del estado del sistema y del tiempo que no cambia su valor en una transformaci´ on canónica. As´ı que bajo una transformaci´ on canónica (q, p) → (q, p), f será una variable dinámica si se cumple: f (q, p, t) = f [q(q, p, t), p(q, p, t)] = f (q, p, t)

(9.343)

De acuerdo con esta definición, como en una transformaci´ on canónica: H(q, p, t) = H(q, p, t) +

∂F ∂t

(9.344)

se sigue que el hamiltoniano no es una variable dinámica cuando se consideran transformaciones can´ onicas que dependen del tiempo. As´ı por ejemplo, para un sistema conservativo H = E, igual a la energ´ıa total, en tanto que por medio de una transformaci´ on can´ onica dependiente del tiempo podemos hacer H = 0. Tenemos en general que el ~ o p~. As´ı también, la energ´ıa generador de una T.C.I. es una variable dinámica, como L cinética es una variable dinámica. En esta definición de variables dinámicas est´ a impl´ıcita la idea de las transformaciones canónicas desde un punto de vista pasivo. Formas “activa” y “pasiva” de una transformaci´ on can´ onica. En la secci´ on 7.7 vimos que las rotaciones de un cuerpo r´ıgido admiten las interpretaciones “activa” y “pasiva”. Análogamente esas consideraciones se pueden hacer a las transformaciones en el espacio de fases. En la interpretaci´ on “pasiva”, una transformaci´ on canónica es una regla de correspondencia que asocia a cada punto del espacio de fases (q, p) un punto del espacio de fases (q, p), tal que las ecuaciones de movimiento toman la misma forma en los dos espacios. Es una aplicación de un espacio en otro espacio. Una variable dinámica es una funci´ on del estado del sistema, considerado como algo intr´ınseco o sea independiente del espacio de fases que se use para describirlo. As´ı, si el estado del sistema en un tiempo

Las transformaciones canónicas / 379 dado se describe por el punto A(q, p) en un espacio de fases y por el punto A(q, p) en otro espacio de fases, una variable dinámica tiene el mismo valor en A que en A. Por otra parte, hay transformaciones canónicas que admiten una interpretaci´ on activa. Son aquellas transformaciones canónicas del espacio de fases en s´ı mismo; o sea aquellas en que se tiene una aplicación del espacio de fases sobre s´ı mismo. As´ı, la transformaci´ on can´ onica de evoluci´ on temporal asocia al estado del sistema en el tiempo t0 , (q0 , p0 ) el estado en el tiempo t, (q, p); la transformaci´ on canónica de translaci´ on espacial asocia a la posición del sistema (~r1 , ~r2 , ...~rN ) una posición en la cual todas las part´ıculas se han desplazado una distancia ~ ε: (~r1 + ~ε, ~r2 + ~ε, ...~rN + ~ε); la transformaci´ on canónica de rotación espacial es la misma estudiada en el cap´ıtulo 7. Son susceptibles de una interpretaci´ on “activa” todas aquellas transformaciones canónicas que se pueden obtener a partir de la transformaci´ on identidad por medio de la variación continua de uno o varios par´ ametros. As´ı por ejemplo, la inversi´ on de las coordenadas, o la transformaci´ on canónica que intercambia coordenadas y momentos, no son susceptibles de una interpretación activa. Tampoco mediante una variación continua de par´ ametros podemos llegar de las coordenadas cartesianas a las coordenadas esféricas, por ejemplo. Toda T.C.I. es pues susceptible de ser tratada en las formas pasiva (el sistema descrito desde diferentes espacios de fases) o activa (el sistema es cambiado de un estado a otro). En (9.318) es entonces válido tomar desplazamientos del tipo ∆. Cambio de una variable din´ amica en una T.C.I. En la interpretaci´ on “pasiva” no tiene sentido preguntarse por el “cambio de una variable dinámica f bajo una transformaci´ on can´ onica”, pues de acuerdo con (9.343) no hay tal cambio. En la interpretaci´ on “activa”, si tiene sentido preguntarse c´ omo cambia el valor de f al pasar el sistema de un estado A(q, p) a un estado B(q, p). Usaremos el s´ımbolo ∂ para denotar tal cambio: ∂f (q, p, t) = f (q, p, t) − f (q, p, t)

(9.345)

Para ser más precisos, en la interpretaci´ on “pasiva” podemos preguntarnos por el cambio en la forma funcional de la variable dinámica al ser descrita desde dos espacios de fases diferentes, lo cual es mucho más dif´ıcil de visualizar. Este cambio de forma funcional est´ a definido por: f (q, p, t) − f (q, p, t)

(9.346)

de acuerdo con la notaci´ on (9.343). Usando (9.343) podemos escribir a (9.346) como: f (q, p, t) − f (q, p, t) = −∂f

(9.347)

comparando (9.345) y (9.347) vemos que: ∂f = −∂f

(9.348)

Los dos cambios (9.345) y (9.346) son iguales, o sea que ∂f puede significar el cambio del valor de f al pasar el sistema del estado (q, p, t) al estado (q, p, t) o el cambio funcional de la funci´ on f en el mismo estado, en la interpretaci´ on “pasiva”. La T.C.I. es

380 / Mec´ anica cl´ asica avanzada (9.318) y expresada en términos de generadores es (9.322). Con la interpretaci´ on “activa” ∂f es: ∂f

= =

=

f (q + δq, p + δp, t) − f (q, p, t) l X ∂f (q, p, t) ∂f (q, p, t) δqν + δpν ∂qν ∂pν ν=1 l m X X ∂f (q, p, t) ∂Gj (q, p, t) ∂f (q, p, t) ∂Gj (q, p, t) εj − εj ∂qν ∂pν ∂pν ∂qν j=1 ν=1 =

m X

εj [f (q, p, t), Gj (q, p, t)]

(9.349)

j=1

donde hemos definido el corchete de Poisson de dos variables dinámicas g(q, p, t) y h(q, p, t) como: l X ∂g ∂h ∂g ∂h − [g, h] = ∂qν ∂pν ∂pν ∂qν ν=1

(9.350)

Vemos que el corchete de Poisson de dos variables dinámicas a su vez es una variable din´ amica. En s´ıntesis: f (q, p, t) − f (q, p, t) = f (q, p, t) − f (q, p, t)   m X εj Gj (q, p, t) = f (q, p, t),

(9.351)

j=1

Si la T.C.I. es la evoluci´ on temporal, tenemos que ε = τ y G = H. En este caso: l

∂f X f˙ = + ∂t ν=1 l

=

∂f X + ∂t ν=1

∂f ∂f q˙ν + p˙ ν ∂qν ∂pν

∂f ∂H ∂f ∂H − ∂qν ∂pν ∂pν ∂qν

(9.352)

∂f + [f, H] ⇒ f˙ = ∂t Si la variable dinámica f no depende expl´ıcitamente del tiempo, su rata de cambio es igual a su corchete de Poisson con H. Si f es una constante de movimiento, el corchete de Poisson de f con H es igual al negativo de su derivada parcial respecto al tiempo; si f no depende expl´ıcitamente del tiempo será una constante de movimiento si su corchete de Poisson con H es cero. Simetr´ıa y leyes de conservaci´ on. Sabemos que la simetr´ıa dinámica de un sistema se expresa mediante las simetr´ıas de las funciones L o H.

Las transformaciones canónicas / 381 Sea una T.C.I. y sea G el generador de la misma; G es una variable dinámica. Entonces es correcto expresar el siguiente teorema: G es una constante de movimiento si H es invariante bajo la transformaci´ on generada por G. Recordemos que H no es en general una variable dinámica. Por esta raz´ on al realizar la T.C.I. generada por G el cambio en H no est´ a dado por (9.349). H es simplemente una funci´ on que en un espacio de fases dado define las ecuaciones canónicas de movimiento. Por esta raz´ on, cuando la transformaci´ on canónica depende del tiempo, no se cumple on que H(q, p, t) = H(q, p, t). Denotemos por ∂H a la siguiente diferencia. Ver ecuaci´ (9.346): ∂H = H(q, p, t) − H(q, p, t)

(9.353)

H(q, p, t) y H(q, p, t), de acuerdo con (9.344) y (9.319) est´ an relacionadas por: H(q, p, t) − H(q, p, t) = ε

∂G ∂t

(9.354)

reemplazando a (9.354) en (9.353) tenemos: ∂H = H(q, p, t) − H(q, p, t) + ε

∂G ∂t

(9.355)

Ahora s´ı podemos usar la ecuaci´ on (9.351) para H: H(q, p, t) − H(q, p, t) = ε [H(q, p, t), G(q, p, t)]

(9.356)

La diferencia entre H y H es del orden de ε, luego, al primer orden en ε (9.356) toma la forma: H(q, p, t) − H(q, p, t) = ε [H(q, p, t), G(q, p, t)] Ahora, reemplazamos a (9.357) en (9.355) para obtener: ∂G ∂G ∂H = −ε [H, G] + ε =ε + [G, H] ∂t ∂t

(9.357)

(9.358)

De (9.352) vemos entonces que: ∂H = ε G˙

(9.359)

La ecuaci´ on (9.359) nos permite inmediatamente obtener el enunciado del teorema: G es una constante de movimiento si y s´ olo si es el generador de una transformaci´ on can´ onica infinitesimal que no cambia la forma funcional del hamiltoniano. As´ı pues, si H no cambia al desplazar el sistema a lo largo de una direcci´ on ~n, P~ .~n es una constante de movimiento y si H no cambia al rotar el sistema alrededor del eje ~ n es una constante de movimiento. P~ es el momento lineal total y L ~ es el ~n entonces L.~ momento angular. Este resultado ya lo hab´ıamos obtenido en unos casos particulares en la secci´ on 3.4. Como seg´ un este teorema las constantes de movimiento han de ser los generadores de T.C.I. que dejan invariante a H, se sigue que hallando todas las transformaciones de simetr´ıa de H podemos encontrar todas las constantes de movimiento.

382 / Mec´ anica cl´ asica avanzada Por otra parte si se conocen 2l constantes de movimiento del sistema se tendrá resuelto el problema mecánico, si esas 2l constantes son independientes. En efecto, el método de Hamilton-Jacobi permite mediante una transformaci´ on canónica expresar las coordenadas y momentos del sistema en términos de las constantes de movimiento y del tiempo. En el cap´ıtulo 11 se muestra que el resultado falla si el sistema es no integrable. La conservaci´ on del momento que vimos en el cap´ıtulo 3 se sigue de este teorema. Si qν0 es c´ıclica, H no depende de ella y por tanto es invariante en una T.C.I. que implique on habr´ a de ser una el cambio de qν0 , y el generador infinitesimal de esta transformaci´ constante de movimiento. Las ecuaciones de tal transformaci´ on canónica serán: δqν = ε δνν0 ;

δpν = 0 ;

ν = 1, 2, ...l

(9.360)

por otra parte se tiene que: δqν = ε

∂G ; ∂pν

δpν = −ε

∂G ; ∂qν

ν = 1, 2, ...l

(9.361)

Se sigue de (9.360) y (9.361) que: (9.362)

G = pν0

O sea que el generador es precisamente el momento canónico conjugado de la coordenada c´ıclica qν0 . En general, un cambio en cualquier variable canónica del sistema, qν o pν , es generado por su variable canónicamente conjugada, pν o −qν , respectivamente. Las ecuaciones de movimiento en t´ erminos de los corchetes de Poisson. Si en la ecuaci´ on (9.352) reemplazamos a f por qν y por pν obtenemos: q˙ν = [qν , H] ;

p˙ ν = [qν , H] ;

ν = 1, 2, ...l

(9.363)

o también, usando las ecuaciones de Hamilton: ∂H ∂H = [qν , H] ; = −[pν , H] ; ν = 1, 2, ...l ∂pν ∂pν

(9.364)

Las expresiones (9.363) son las ecuaciones de movimiento de Poisson, totalmente equivalentes a las ecuaciones de movimiento de Hamilton. Las ecuaciones (9.364) no son más que el resultado de aplicar el p´ arrafo que sigue a la ecuaci´ on (9.362), conjuntamente con (9.351). Ejemplo 9.8.1 Hallar las ecuaciones de movimiento de Poisson para una part´ıcula cargada en presencia de un campo electromagnético externo. Usamos la ecuaci´ on (3.117) para h conjuntamente con la ecuaci´ on (4.1) para ~r˙ en funci´ on del momento canónico p~: H=

e ~ 2 1 p~ − A + eφ 2m c

(9.365)

Las transformaciones canónicas / 383 ~ y φ son los potenciales vectorial y escalar del campo externo. Evaluemos los donde A corchetes de Poisson de ~r con H y de p~ con H para mostrar la consistencia con las fórmulas (9.363): ∂rn ∂H ∂rn ∂H · − · ∂~r ∂~ p ∂~p ∂~r e~ p~ − A ∂H c ; ~n = ~i, ~j, ~k = ~n · = ~n · ∂~ p m

[rn , H] =

(9.366)

Por otra parte: [pn , H] = =

∂pn ∂H ∂pn ∂H ∂H ∂H · − · = −~n · =− ∂~r ∂~ p ∂~p ∂~r ∂~r ∂rn ~ e ~ ∂A ∂φ e p~ − A · −e mc c ∂rn ∂rn

(9.367)

La ecuaci´ on (9.367) también puede escribirse as´ı: [pn , H] =

~ ∂φ e ∂ ˙ ~ ∂An e ˙ ∂A + −e = (~r · A) − A˙ n + ~r · c ∂rn ∂rn c ∂rn ∂t e ˙ e ∂An ∂φ An − −e c c ∂t ∂rn

(9.368)

~ y E se pueden expresar en términos de A ~ y φ as´ı: Notamos que B ~ ~ = − ∂φ − 1 ∂ A ; E ∂~r c ∂t

~ = ∂ ×A ~ B ∂~r

(9.369)

Notemos que: ∂ ∂Aµ ~ ~r˙ × ×A = ǫnms ǫstµ r˙m ∂~r ∂rt n = (δnt δmµ − δnµ δmt ) r˙m

∂Aµ ∂rt

(9.370)

~ ∂A ∂Aµ = ~r˙ · − ~r˙ · ∂rn ∂~r y, ∂An ˙ ∂An A˙ n = + ~r · ∂t ∂~r

(9.371)

con lo cual: ~ ∂ ~ + ∂An − A˙ n ~ = ~r˙ · ∂ A + ∂An − A˙ n = ∂ (~r˙ · A) ×A ~r˙ × ∂~r ∂rn ∂t ∂rn ∂t

(9.372)

384 / Mec´ anica cl´ asica avanzada remplazando (9.372) en (9.369) obtenemos: e ˙ 1 ∂An ∂ ∂φ e ˙ ~ [pn , H] = + ~r × ×A + An − e c ∂~r c ∂rn c ∂t n e ˙ ~ e = (~r × B)n + eEn A˙ n + A˙ n c c pero, seg´ un la expresión para la fuerza de Lorentz: e ~ n + eEn m¨ rn = (~r˙ × B) c Usando (9.374), (9.373) queda como: e e d [pn , H] = m¨ rn + A˙ n = mr˙n + An = p˙ n c dt c en concordancia con (9.363). También de (9.366) se sigue que: [rn , H] = r˙n

de donde:

(9.374)

(9.375)

(9.376)

El corchete de Poisson de dos componentes del momento cinem´ atico es: ∂pci ∂pcj ∂pci ∂pcj · − · [pci , pcj ] = ∂~r ∂~p ∂~p ∂~r ~ pero p~c = p~ − (e/c) A, por tanto: e ∂Aj e ∂Ai · ~nj − ~ni · [pci , pcj ] = − c ∂~r c ∂~r =

(9.373)

e c

∂Aj ∂Ai − ∂ri ∂rj

e = ǫijk c

∂ ~ ×A ∂~r k

e [pci , pcj ] = ǫijk Bk c Esto u ´ltimo también puede escribirse como: e [r˙i , r˙j ] = 2 ǫijk Bk m c O sea que el corchete de Poisson de x˙ con y˙ es cero sólo si Bz se anula.

(9.377)

(9.378)

(9.379)

(9.380)

Algunas propiedades de los corchetes de Poisson. Para cualesquiera tres funciones f (q, p, t), g(q, p, t) y h(q, p, t), se cumple: (i) [f, g] = −[g, f ] (ii) [cf, g] = [f, cg] = c[f, g] ; c : constante (iii) [f + g, h] = [f, h] + [g, h] (iv) [f g, h] = f [g, f ] + g[f, h] (v)

∂g ∂f ∂ [f, h] = , g + f, ∂t ∂t ∂t

(9.381)

Las transformaciones canónicas / 385 Estas propiedades se siguen directamente de la definición de los corchetes de Poisson, ecuaci´ on (9.350). La identidad de Jacobi. Para cualesquiera tres funciones f , g y h se cumple: [f, [g, h]] + [g, [h, f ]] + [h, [f, g]] = 0

(9.382)

esta relaci´ on se llama la identidad de Jacobi. Para demostrarla es u ´til la siguiente interpretaci´ on del corchete de Poisson: l X ∂g ∂ ∂g ∂ ˆg φ [g, φ] = − φ=D (9.383) ∂qν ∂pν ∂pν ∂qν ν=1 ˆ g es un operador diferencial lineal en el espacio de fases. donde D Con esta notaci´ on podemos escribir el siguiente conmutador: ˆ g f = [g, [h, f ]] − [h, [g, f ]] ˆh − D ˆ hD ˆ gD D =

(9.384)

[g, [h, f ]] + [h, [f, g]]

La expresión (9.384) sólo contiene derivadas primeras respecto a pν y qν de la funci´ on f . En efecto: ˆg = D

2l X i=1

gi

∂ ; xν = qν ; xν+l = pν ; ν = 1, 2, ...l ∂xi

(9.385)

por tanto, tenemos que: ˆg f ˆh − D ˆ hD ˆ gD D 2l 2l X X ∂ ∂ ∂ ∂ = gi hj − hi gj f ∂xi ∂xj ∂xi ∂xj i=1 j=1 " 2l X 2l X ∂2 ∂hj ∂ ∂2 g i hj = + gi − hi g j ∂xi ∂xj ∂xi ∂xj ∂xi ∂xj i=1 j=1

# ∂gj ∂ f − hi ∂xi ∂xj

=

2l X 2l X ∂hj ∂gj ∂f gi − hi ∂xi ∂xi ∂xj i=1 j=1

(9.386)

Por otra parte tenemos que: [f, [g, h]] =

ˆ h g, f ] = [[h, g], f ] = [D

2l X i=1

=

∂g ,f hi ∂xi

2l X l X ∂ ∂g ∂g ∂ ∂f ∂f hi hi − ∂qν ∂xi ∂pν ∂pν ∂xi ∂qν i=1 ν=1

(9.387)

386 / Mec´ anica cl´ asica avanzada La ecuaci´ on (9.386) se puede escribir como:

ˆg ˆh − D ˆ hD ˆ gD D

" 2l X l X ∂hν ∂gν ∂f gi f= − hi ∂xi ∂xi ∂qν i=1 ν=1 # ∂hl+ν ∂gl+ν ∂f + gi − hi ∂xi ∂xi ∂pν

(9.388)

Sumando (9.387) y (9.388) obtenemos:

[f, [g, h]] + [g, [h, f ]] + [h, [f, g]] = 2l X l X ∂g ∂gν ∂ ∂f ∂hν hi − hi − gi ∂x ∂x ∂p ∂x ∂q i i ν i ν i=1 ν=1 +

(9.389)

2l X l X ∂g ∂gl+ν ∂ ∂f ∂hl+ν hi − hi + gi ∂xi ∂xi ∂qν ∂xi ∂pν i=1 ν=1

De (9.383) y (9.385) se sigue que:

gν = −

∂g ; ∂pν

gl+ν =

∂g ; ∂qν

ν = 1, 2, ...l

(9.390)

Por tanto:

∂gν ∂ ∂hν − hµ − gµ ∂qµ ∂qµ ∂pν =

∂g hµ ∂qµ

∂h ∂ 2 g ∂g ∂ 2 h − ∂pµ ∂qµ ∂pν ∂pµ ∂qµ ∂pν (9.391)

∂ 2 h ∂g ∂h ∂ 2 g + + ∂pν ∂pµ ∂qµ ∂pµ ∂pν ∂qµ =

∂g ∂ 2 h ∂g ∂ 2 h + ∂pµ ∂qµ ∂pν ∂qµ ∂pµ ∂qν

Las transformaciones canónicas / 387 Similarmente hallamos que: gl+µ

∂gν ∂ ∂hν − hl+µ − ∂qµ ∂pµ ∂pν −

∂g hl+µ = ∂pµ

∂g ∂ 2 h ∂g ∂ 2 h − ∂qµ ∂pµ ∂pν ∂pµ ∂pν ∂qµ

∂hl+ν ∂gl+ν ∂ gµ − hµ + ∂qµ ∂qµ ∂qν

∂g hµ = ∂qµ

(9.392)

∂g ∂ 2 h ∂g ∂ 2 h − − ∂pµ ∂qµ ∂qν ∂qµ ∂qν ∂pµ ∂hl+ν ∂gl+ν ∂ gl+µ − hl+µ + ∂pµ ∂pµ ∂qν

∂g hl+µ = ∂pµ

∂g ∂ 2 h ∂g ∂ 2 h + ∂qµ ∂pµ ∂qν ∂pµ ∂qν ∂qµ Reemplazando (9.391)y (9.392) en (9.389) obtenemos: [f, [g, h]] + [g, [h, f ]] + [h, [f, g]] = l X

µ,ν=1

∂g ∂ 2 h ∂g ∂ 2 h + ∂pν ∂qµ ∂pν ∂qµ ∂pµ ∂pν ∂g ∂ 2 h ∂g ∂ 2 h − − ∂qµ ∂pµ ∂pν ∂pµ ∂pµ ∂qν

+

l X

µ,ν=1

−

∂g ∂ 2 h ∂g ∂ 2 h − ∂pµ ∂qµ ∂qν ∂qµ ∂qν ∂pµ ∂g ∂ 2 h ∂g ∂ 2 h + + ∂qµ ∂pµ ∂qν ∂pν ∂qν ∂qµ

!

!

∂f ∂qν

(9.393)

∂f ∂pν

La ecuaci´ on (9.393) es idénticamente cero, lo cual prueba la identidad de Jacobi. Invariancia de los corchetes de Poisson bajo T.C.I. Se trata de mostrar que: [f (q, p, t), g(q, p, t)] = [f (q, p, t), g(q, p, t)]

(9.394)

De la definición (9.343) se sigue que: l X ∂f ∂qµ ∂f ∂f ∂pµ ∂f = = + ∂q ∂q ν ∂qµ ∂qν ∂pµ ∂q ν µ=1

(9.395)

388 / Mec´ anica cl´ asica avanzada De (9.318) y (9.322) se sigue:

∂qµ ∂2G ; = δµν − ǫ ∂q ν ∂qν ∂pµ

∂pµ ∂2G =ǫ ∂q ν ∂qν ∂qµ

(9.396)

Por tanto, se cumple: ∂f ∂f ∂ ∂f ∂f ∂G +ǫ ,f = +ǫ [G, f ] − ǫ G, = ∂qν ∂qν ∂qν ∂qν ∂qν ∂qν

(9.397)

donde la u ´ltima igualdad se sigue de (9.381-v). De (9.318) y (9.322) se sigue:

∂2G ∂pµ ; = δµν + ǫ ∂pν ∂pν ∂qµ

∂qµ ∂2G = −ǫ ∂pν ∂pν ∂pµ

(9.398)

y análogamente se llega a: ∂f ∂ ∂f ∂f +ǫ [G, f ] − ǫ G, = ∂pν ∂pν ∂pν ∂pν

(9.399)

Reemplazando (9.397) y (9.399) y expresiones análogas para g, en (9.394):

f, g

(q,p)

=

" l X ∂[G, f ] ∂f ∂f +ǫ − ǫ G, · ∂qν ∂pν ∂qν ν=1

∂[G, g] ∂g ∂g + +ǫ − ǫ G, ∂pν ∂pν ∂pν

∂[G, f ] ∂f ∂f · +ǫ − ǫ G, ∂pν ∂pν ∂pν # ∂[G, g] ∂g ∂g +ǫ − ǫ G, ∂qν ∂qν ∂qν

(9.400)

Las transformaciones canónicas / 389 Al primer orden en ε podemos escribir:

f, g

(q,p)

l X ∂[G, f ] ∂g = [f, g](q,p) + ε ∂qν ∂pν ν=1

∂f − G, ∂qν

∂f ∂[G, g] ∂g + ∂pν ∂qν ∂pν

∂g ∂[G, g] ∂f ∂g ∂f ∂f G, − + G, − ∂qν ∂pν ∂qν ∂pν ∂qν ∂pν −

∂f ∂g ∂g ∂[G, f ] G, + ∂qν ∂pν ∂qν ∂pν

(9.401)

=

[f, g](q,p) + ǫ ([[G, f ], g] + [f, [G, g]]) +ǫ

l X ∂g ∂f ∂g ∂f ,G − ,G ∂pν ∂qν ∂qν ∂pν ν=1

En la u ´ltima igualdad se ha hecho uso de la propiedad (9.381-iv). Ahora los u ´ ltimos términos en (9.401) dan [[f, g], G], con lo cual el término del orden de ε es cero con base en la identidad de Jacobi, por tanto: [f , g](q,p) = [f, g]q,p

(9.402)

Llegamos a la conclusi´ on de que el corchete de Poisson de dos variables dinámicas es una variable din´ amica que es invariante bajo transformaciones canónicas infinitesimales. En otras palabras, el corchete de Poisson de dos variables dinámicas es una variable dinámica con un valor independiente de las variables usadas para describir el estado del sistema: los corchetes de Poisson son invariantes can´ onicos. Veremos que esta invariancia se cumple aun bajo transformaciones canónicas que no se pueden obtener de manera continua a partir de la transformaci´ on identidad, o sea como sucesión de T.C.I. El teorema de Jacobi-Poisson. Si f y g son dos constantes de movimiento, entonces [f, g] también es una constante de movimiento.11 De (9.352) se sigue que si f y g son constantes de movimiento se cumple: ∂g ∂f + [f, H] = 0 y + [g, H] = 0 ∂t ∂t

(9.403)

Debemos probar que esto implica que: ∂[f, g] + [[f, g], H] = 0 ∂t 11 Este

teorema fue enunciado por Poisson en 1809.

(9.404)

390 / Mec´ anica cl´ asica avanzada En efecto:

∂ ∂g ∂f = − [[f, H] , g] − [f, [g, h]] [f, g] = , g + f, ∂t ∂t ∂t

(9.405)

[[H, f ] , g] + [g, [H, f ]] = − [[f, g] , H] La u ´ltima igualdad en (9.405) se sigue de la identidad de Jacobi, lo cual demuestra el teorema. El corchete de Poisson de dos variables dinámicas que se conservan es una variable din´ amica que se conserva. Esto permite, por ejemplo, construir a partir de un conjunto de s constantes de movimiento independientes C1 , C2 , ...Cs (s < 2l) las 2l − s constantes independientes restantes Cs+1 , Cs+2 , ...C2l por formar los corchetes de Poisson entre todos los posibles pares de estas S variables dinámicas. En total hay s(s − 1)/2 corchetes de Poisson, de los cuales algunos pueden ser cero o funciones de constantes de movimiento conocidas antes, pero es de esperarse que haya 2l − s que sean independientes. Es claro que puede haber un n´ umero m´ınimo s de constantes de movimiento independiente tal que a partir de ellas se pueda obtener el conjunto completo de 2l constantes de movimiento independientes. Ejemplo 9.8.2 Sea una part´ıcula en una dimensi´ on, sometida a una fuerza constante. Hallar dos constantes de movimiento independientes y mostrar que el corchete de Poisson de ellas no da lugar a una tercera constante de movimiento. La solución al problema es: 1 x = v(t + t0 ) + g(t + t0 )2 ; p = mv + mg(t + t0 ) 2

(9.406)

donde t0 y v son constantes. Dos constantes de movimiento son t0 y la energ´ıa total E. x puede escribirse en la forma: x=

1 p (t + t0 ) − g(t + t0 )2 m 2

Entonces las expresiones para t0 y E en funci´ on de p y x son: s 2x p p2 p2 − t0 = −t + − ; E = − mgx mg m2 g 2 g 2m

(9.407)

(9.408)

El corchete de Poisson de t0 y E es: [t0 (p, x, t), E(p, x, t)] =

∂t0 ∂E ∂t0 ∂E − ∂x ∂p ∂p ∂x

(9.409)

Haciendo el c´ alculo indicado en (9.408), usando (9.409), obtenemos: [t0 , E] = 1

(9.410)

La ecuaci´ on (9.408) puede interpretarse como una transformaci´ on canónica que permite expresar las nuevas variables canónicas t0 y E en funci´ on de las viejas x y p. Tal transformaci´ on depende del tiempo. Esto ilustra un resultado más general: [qν , pν ] = [q ν , q ν ] = 1, para todo ν, que veremos más adelante.

Las transformaciones canónicas / 391 Ejemplo 9.8.3 Sea una part´ıcula para la cual lz y py son constantes de movimiento. Hallar una tercera constante de movimiento. Por el teorema de Poisson, [lz , py ] es constante. [lz , py ] = [xpy , py ] − [ypx , py ]

(9.411)

= x[py , py ] + py [x, py ] − y[px , py ] − px [y, py ] Es f´ acil, de la definición, verificar que: [x, py ] = 0 ; [px , py ] = 0 ; [y, py ] = 1 son.

(9.412)

Por tanto, [lz , py ] = −px . O sea que px es constante de movimiento si lz y py lo

Ejemplo 9.8.4 Demostrar que si dos componentes del momento angular son constantes de movimiento, la tercera también lo es. Si li y lj son dos componentes de ~l constantes, por el teorema de Poisson [li , lj ] también es una constante. Recordando que: li = ǫikl xk pl

(9.413)

Vemos que: [li , lj ] = ǫikl ǫjmn [xk pl , xm pn ]

(9.414)

Usando la propiedad (9.381-iv) vemos que: [xk pl , xm pn ] =

xk [pl , xm pn ] + pl [xk , xm pn ]

=

−xk [xm pm , pl ] − pl [xm pn , xk ]

=

−xk (xm [pn , pl ] + pn [xm , pl ])

(9.415)

−pl (xm [pn , xk ] + pn [xm , xk ]) Es f´ acil ver que: [pn , pl ] = 0 ; [xm , pl ] = δml ; [xm , xk ] = 0

(9.416)

con lo cual (9.415) queda: [xk pl , xm pn ] = −xk pn δml + pl xm δnk

(9.417)

reemplazando (9.417) en (9.414) obtenemos: [li , lj ] = −ǫikl ǫjln xk pn + ǫikl ǫjnk pl xn

(9.418)

Usando la propiedad: ǫikl ǫjnl = δij δkn − δin δjk

(9.419)

392 / Mec´ anica cl´ asica avanzada obtenemos: [li , lj ] = (δij δkn − δin δkj )xk pn − (δij δkn − δin δkj )pk xn

(9.420)

Finalmente encontramos que: [li , lj ] = δij ~r · ~p − rj pi − δij ~r · ~p + pj ri = ri pj − pi rj

(9.421)

no es otra cosa que: [li , lj ] = ǫijk lk

(9.422)

As´ı, vemos que [lx , ly ] = xpy − ypx = lz , o sea que si lx y ly son constantes de movimiento, lz también lo es. Los corchetes de Poisson fundamentales. Son los corchetes de Poisson para las coordenadas y los momentos del sistema. Se sigue de la definición de corchete de Poisson que: [qν , qµ ] = 0 ; [pν , pµ ] = 0 ; [qν , pµ ] = δµν ; µ, ν = 1, 2, ...l

(9.423)

De acuerdo con la invariancia de los corchetes de Poisson bajo transformaciones can´ onicas se tiene que las relaciones (9.423) se cumplen independientemente de las variables can´ onicas usadas para describir el estado del sistema; veremos que esta propiedad proporciona un criterio para saber si una transformaci´ on en el espacio de fases es o no can´ onica. Algunos corchetes de Poisson de inter´ es. En principio el corchete de Poisson de un par de variables dinámicas se obtiene a partir de los corchetes de Poisson fundamentales. Algunos corchetes de Poisson que se calculan directamente son: [qν , f ] =

∂f ; ∂pν

[pν , f ] = −

∂f ; ∂qν

µ, ν = 1, 2, ...l

(9.424)

siempre t0 es una de las constantes de movimiento y tiene una forma similar a (9.408), ver también la ecuaci´ on (3.91): t0 (q, p, t) = −t + θ(q, p)

(9.425)

de acuerdo con (9.411) se cumple que: [t0 , H] = −

∂t0 = 1 ⇒ [t0 , H] = 1 ∂t

(9.426)

La ecuaci´ on (9.423) nos dice que el corchete de Poisson de un par de variables canónicamente conjugadas es igual a +1; [qν , pν ] = 1 ; ν = 1, 2, ...l (9.426) nos dice entonces que t0 y H son un par de variables dinámicas canónicamente conjugadas. Muchos autores se˜ nalan que t y H son canónicamente conjugadas, pero esto es erróneo, pues realmente t no es una variable din´ amica, como s´ı lo es t0 . Enfaticemos que f es una variable dinámica si satisface f (q, p, t) = f (q, p, t).

Las transformaciones canónicas / 393 Vimos que el método de Hamilton-Jacobi permite mediante una transformaci´ on canónica describir el estado por medio de constantes de movimiento. Los corchetes fundamentales de Poisson, (9.423), permiten a priori saber si dos constantes de movimiento dadas pueden tomarse como dos “coordenadas” o dos “momentos” o una “coordenada” y su “momento” can´ onicamente conjugado. La ecuaci´ on (9.426) nos dice categóricamente que t0 y H pueden tomarse como un par de variables canónicamente conjugadas pero no es posible que ambos sean “coordenadas” o “momentos”. Algo análogo se concluye de las siguientes relaciones entre componentes de los momentos angular y lineal: [li , lj ] = ǫijk lk ; [pi , lj ] = ǫijk pk ; [xi , lj ] = ǫijk xk [ li , ~l2 ] = 0 ; [~ p, ~l2 ] = 2~l × ~p ; i, j, k = 1, 2, 3

(9.427)

Se sigue que dos componentes de ~l no pueden tomarse como variables canónicas de estado, como tampoco una componente de p~ y ~l2 . Sin embargo, por ejemplo, [px , lx ] = 0 y [lz , lx ] = 0, permiten que px y lx sean momentos canónicos respectivamente, lo mismo que la componente de p~ paralela a ~l y ~l2 . Como ejemplo, para una part´ıcula en un campo de fuerzas centrales se cumple que [ ~l2 , H] = 0 y [lz , H] = 0. Para este sistema se cumple: [~l, H] = 0 ; [lz , H] = 0 ; [~l2 , lz ] = 0

(9.428)

O sea que H, ~l2 y lz pueden tomarse como tres “momentos” constantes, que junto con sus tres “coordenadas” canónicamente conjugadas, que son funciones lineales del tiempo seg´ un se vio al final del cap´ıtulo 2, constituyen un conjunto de seis variables can´ onicas que describen exhaustivamente el sistema. Por ser independientes, li y lj podr´ıan servir de variables de estado pero en un formalismo no canónico (no hamiltoniano). Funciones escalares y vectoriales del estado de una part´ıcula. Una funci´ on escalar por definición, es aquella que no cambia al efectuar una rotación del sistema de coordenadas (punto de vista “pasivo”). Al efectuar la rotación los vectores de estado ~r on 7.7: y p~ cambian en ~r y ~p, ver secci´ ˜r ; ~p = A~ ˜p ~r = A~

(9.429)

donde A˜ es la matriz de rotación. Entonces φ(~r, p~) es escalar si: φ(~r, p~) = φ(~r , ~p)

(9.430)

Una funci´ on vectorial del estado de la part´ıcula es una funci´ on F que se transforma de acuerdo con (9.428), es decir, F~ tiene tres componentes que se transforman por rotaciones como las componentes de ~r: ~ (~r, ~p) F~ (~r, ~p) = A˜F~ (~r, p~) = F

(9.431)

Para rotaciones infinitesimales A˜ est´ a dada por: ˜ i δφ A˜ = I˜ + Ci G

(9.432)

394 / Mec´ anica cl´ asica avanzada ˜ i est´ donde los G an dados en la ecuaci´ on (7.221), los Ci son los cosenos directores del eje de rotación y δφ es el ángulo de rotación. De acuerdo con (9.318) y (9.432): ˜ i ~r δφ ; ~p = p~ + Ci G ˜ i p~ δφ ~r = ~r + Ci G

(9.433)

De acuerdo con (9.318), (9.322) y (9.433) tenemos que: δ~r =

˜ i~r δφ = ∂ ǫ G(~r, ~p) Ci G ∂~p

δ~ p=

∂ ˜ip ~ δφ = Ci G ǫ G(~r, ~p) ∂~r

(9.434)

donde G es el generador infinitesimal de la rotación, que de acuerdo con (9.340) es la componente de ~l a lo largo del eje de rotación: G(~r, p~) = ~n · ~r × ~p = Ci li

(9.435)

Vemos entonces que δφ = ǫ y que: ˜ i ~r = Ci G

∂ ∂ Ci li = (~n · ~r × ~p) = ~n × ~r ∂~ p ∂~p

˜ i p~ = Ci G

∂ ∂ − Ci li = − (~n · ~r × p~) = ~n × p~ ∂~p ∂~r

(9.436)

Tomando componentes en (9.432) a (9.436): ˜i ˜i = ǫkil xl = ǫkil Ci xl ⇒ G Ci G kl

kl

(9.437)

El lector puede verificar fácilmente que este resultado es consistente con las ecuaciones (7.222), teniendo en cuenta que all´ı se ten´ıan rotaciones “activas”. De (9.436) vemos que se puede escribir: ˜ i~r = −Ci~r · G ˜ i p~ G(~r, ~ p) = ~l · ~n = Ci p~ · G

(9.438)

˜ i~r = −~r · G ˜ i ~p ; i = 1, 2, 3 ⇒ li = p~ · G ˜ i , (9.437). consistente con la antisimetr´ıa de G Evaluemos el corchete de Poisson de dos componentes de ~l: [li , lj ] = =

∂li ∂li ∂li ∂lj ˜ i p~) · (G ˜ j ~r) − (G ˜ i ~r) · (−G ˜ j p~) · − · = (−G ∂~r ∂~ p ∂~p ∂~r ˜ i~r · G ˜j p ˜ j ~r · G ˜ i ~p G ~−G

(9.439)

˜ i )~ ˜j − G ˜T G ˜ i p~ = ~rT (G ˜T G ˜ j ~p − ~rT G ˜T G ˜T G p = ~rT G j i j i ˜ i son antisimétricos, G ˜ T = −G ˜i, Como los G i ˜ j )~ ˜i − G ˜iG ˜j G p [li , lj ] = ~rT (G

(9.440)

Las transformaciones canónicas / 395 De acuerdo con la ecuaci´ on (7.224) que define el álgebra de Lie de las rotaciones: ˜j ˜i − G ˜iG ˜j G G [li , lj ] =

˜k = ǫjik G ˜ k p~ ǫjik ~rT G (9.441)

=

˜ k p~ −ǫijk ~r · G

=

ǫijk lk

lo cual concuerda con el resultado obtenido en (9.422). ˜ i tienen la misma álgebra de Lie, definida por corchetes de Decimos que li y G Poisson de variables din´ amicas y de conmutadores de matrices respectivamente. Volvamos al problema de las funciones escalares y vectoriales. Para rotaciones infinitesimales una funci´ on escalar cumple: φ(~r, p~) = φ(~r + δ~r, p~ + δ~ p) = φ(~r, ~p) + δ~r ·

∂φ ∂φ + δ~ p· ∂~r ∂~p

(9.442)

o sea que se cumple: ∂φ ∂φ + δ~ p· =ǫ δ~r · ∂~r ∂~ p

∂G ∂φ ∂G ∂φ · − · ∂~ p ∂~r ∂~r ∂~p

= −ǫ [G, φ] = 0

lo cual es consistente con (9.351). La ecuaci´ on (9.443) también implica que: ∂φ ∂φ ∂φ ∂φ ~n × ~r · =0 + ~n × p~ · = 0 ⇒ ~n · ~r × + p~ × ∂~r ∂~ p ∂~r ∂~p

(9.443)

(9.444)

Como ~n es arbitrario, a fin de que φ sea escalar debe cumplirse: ~r ×

∂φ ∂φ + p~ × =0 ∂~r ∂~ p

(9.445)

se cumple si ∂φ/∂~r = a~r + b~ p y ∂φ/∂~p = c~r + d~ p puesto que: ~r ×

∂φ ∂φ + p~ × = b~r × p~ + c~ p × ~r = 0 si b = c ∂~r ∂~ p

(9.446)

es decir, φ es de la forma: φ=

1 2 1 2 a~r + c~r · p~ + d ~ p = A~r2 + B~ p2 + c~r · ~p 2 2

(9.447)

donde A, B y C no dependen de ~r ni de ~p. As´ı pues: [~r2 , li ] = 0 ; [~ p2 , li ] = 0 ; [~r · p~, li ] = 0 implican : [φ, li ] = 0

(9.448)

Una funci´ on vectorial F~ (~r, p~) puede escribirse en la forma: F~ = f1 ~r + f2 ~ p + f3 ~l donde f1 , f2 y f3 son funciones escalares, o sea de la forma (9.447).

(9.449)

396 / Mec´ anica cl´ asica avanzada Usando las f´ ormulas (9.427) vemos que: [Fi , lj ] = ǫijk Fk → [F~ , li ] = ~ei × F~

(9.450)

De (9.428) se sigue que F~ se transforma bajo rotación como (9.431). Los vectores de la forma (9.449) dependen del estado del sistema, en tanto que los vectores unitarios de base ~ei son independientes de él como también los vectores ~n, que definen las rotaciones. Si ~n mismo estuviera determinado por los vectores ~r y p~, entonces una rotación cambiar´ıa no sólo los componentes de la funci´ on F~ sino la naturaleza misma de la funci´ on (algo análogo a lo que sucede con el hamiltoniano cuando las transformaciones canónicas dependen del tiempo). En una rotación el cambio en F~ es: ∂ F~ = δφ [F~ , ~l.~n]

(9.451)

´ donde los vectores unitarios no son rotados por ~l · ~n. Este no ser´ıa el caso si F~ fuera un vector externo como un campo magnético, que no depende del estado de la part´ıcula. La expresión (9.451) vale pues sólo para funciones vectoriales de la forma (9.449). La ecuaci´ on (9.450) también puede escribirse usando la notaci´ on diádica en términos del ~ ~ diádico unidad 1 = ~e1~e1 + ~e2~e2 + ~e3~e3 : ~ [F~ , ~l] = −~1 × F~

(9.452)

~ Es fácil mostrar que: Sean dos vectores de estado del sistema, F~ , G. ~ ~l · ~n] = 0 [F~ · G,

(9.453)

~ es una funci´ En efecto, F~ · G on escalar, que no cambia por rotaciones. Por contraste, F~ · ~n′ donde ~n′ es un vector independiente del estado, no es una funci´ on escalar y satisface que: [F~ · ~n′ , ~l · ~n] = (~n′ × ~n) · F~

(9.454)

que en general no es cero. Ejemplo 9.8.5 Mostrar que (9.450) no se cumple cuando F~ no depende exclusivamente ~ = (~r × B)/2 ~ del estado de la part´ıcula, por ejemplo cuando es el potencial vectorial A ~ es un vector fijo y constante en el espacio; digamos B ~ = B~l3 , o sea un campo donde B magnético homogéneo en la direcci´ on z. [Ai , li ] =

1 1 B[(~r × ~e3 )i , lj ] = Bǫik3 [xk , li ] 2 2

(9.455)

usando (9.427) obtenemos: [Ai , lj ] = =

1 1 Bǫik3 ǫkjl xl = − B(δij δ3l − δil δ3j ) xl 2 2 1 − B(δij x3 − δ3j xi ) 2

(9.456)

Las transformaciones canónicas / 397 Por otra parte, el lado derecho en (9.450) es: 1 ǫijk Ak = Bǫijk ǫkl3 xl 2

(9.457) 1 1 = B(δil δj3 − δi3 δjl ) xl = B(δj3 xi − δi3 xj ) 2 2 Comparando (9.456) con (9.457) vemos que no son iguales. En conclusi´ on, no hay una f´ ormula general para evaluar el corchete de Poisson de un vector que depende del estado solamente y un vector espacial. Correspondencia del formalismo de Poisson con el cuadro de Heisenberg de la mec´ anica cu´ antica.12 Hay una correspondencia entre el conjunto de las variables dinámicas en la descripci´ on cl´ asica y el conjunto de los operadores herm´ıticos en la descripci´ on cuántica de un sistema de l grados de libertad. En esos dos conjuntos se puede definir un ´ algebra de Lie, de la siguiente manera: (i) En esos conjuntos se puede definir una ley de composición interna mediante la cual se hace corresponder a cada par de elementos del conjunto un tercer elemento del mismo conjunto: C = [a, b]. Tal ley de composición satisface: (ii) La propiedad reflexiva: [a, a] = 0, para todo elemento del conjunto, siendo 0 elemento del mismo. (iii) La propiedad antisimétrica: [a, b] = −[b, a]. (iv) La propiedad de linealidad: [αa + βb, c] = α[a, c] + β[b, c] siendo α y β n´ umeros cualesquiera. (v) La identidad de Jacobi: para cualesquiera tres elementos a, b, c, del conjunto se cumple [a, [b, c]] + [b, [c, a]] + [c, [a, b]] = 0. Esta ´ algebra es en general no conmutativativa, además de ser no asociativa: [a, [b, c]] 6= [[a, b], c]. En el conjunto de las variables dinámicas clásicas el álgebra de Lie est´ a dada por los corchetes de Poisson, que satisfacen todas las propiedades (i) a (v). En el conjunto de los operadores hem´ıticos cuánticos se satisfacen las propiedades (i) a (v) definiendo la ley de composición interna por medio de conmutadores: [ˆ a, ˆb] = a ˆˆb − ˆbˆ a. La correspondencia entre el formalismo de Poisson y el de Heisenberg se establece de la siguiente manera: a cada variable canónica de estado pν o qν , ν = 1, 2, 3, ...l, le corresponde un operador herm´ıtico, pˆν o qˆν , ν = 1, 2, ...l. En consecuencia a cada variable din´ amica f (q, p, t) le corresponde un operador herm´ıtico construido a partir de los operadores pˆν o qˆν : fˆ(ˆ q , pˆ, t). A cada corchete de Poisson fundamental le corresponde un conmutador fundamental. La correspondencia entre el corchete de Poisson y conmutadores es: 1 1 (9.458) [f, g] → [fˆ, gˆ] = (fˆgˆ − gˆfˆ) i¯ h i¯ h En particular a los corchetes fundamentales de Poisson, (9.423), les corresponde: qˆµ qˆν − qˆν qˆµ = 0 ;

pˆµ pˆν − pˆν pˆµ = 0

qˆµ pˆν − pˆν qˆµ = i¯ hδµν ; µ, ν = 1, 2, ...l 12 V´ ease

el cap´ıtulo 12.

(9.459)

398 / Mec´ anica cl´ asica avanzada A la relaci´ on (9.426) le corresponde: ˆ −H ˆ tˆ0 = i¯h tˆ0 H

(9.460)

similarmente, ˆli ˆ li = i¯hǫijk ˆlk lj − ˆ lj ˆ Las ecuaciones de movimiento de Heisenberg son: ˆ −H ˆ qˆν ; ˆp˙ ν = 1 pˆν H ˆ −H ˆ pˆν ; ν = 1, 2, ...l ˆq˙ν = 1 qˆν H i¯ h i¯h

(9.461)

(9.462)

˜ i (q, p, t) son los generadores infinitesimales de un grupo de simetr´ıas, que Si G satisface las relaciones de álgebra de Lie clásicas, i h ˜k ˜i, G ˜ j = Cijk G (9.463) G

˜ i (q, p, t) son llamadas las constantes estructurales, las correspondientes relaciodonde G nes de ´ algebra de Lie cuánticas son: ˆ i = iCijk ¯hG ˆk ˆj − G ˆj G îG G

(9.464)

en particular para el grupo de rotaciones tridimensional, Cijk = ǫijk , que caracterizan al grupo SO(3). Toda la mecánica cuántica puede hacerse corresponder con la mecánica clásica a partir de las relaciones que hemos mencionado; con la mecánica cuántica en el formalismo de Heisenberg y con la mecánica clásica en el formalismo de Poisson. La analog´ıa llega hasta el punto de formularse un principio de Hamilton cuántico (principio de acción de Schwinger) y construirse una integral de Poincaré-Cart´ an. Ejemplo 9.8.6 Sea una variable dinámica B independiente del tiempo, la cual satisface la u ´ltima igualdad de la ecuaci´ on (9.352). Mostrar que la solución de dicha ecuaci´ on coincide formalmente con la fórmula de Hausdorff-Baker-Campbell (H.B.C.) de la mecánica cuántica. En mecánica cuántica se obtiene un operador en el tiempo t a partir del operador en el tiempo cero por la relación: ˆ h ˆ ˆ ˆ = eiHt/¯ B(t) B(0)e−iHt/¯h

(9.465)

ˆ es el operador hamiltoniano. Se puede mostrar que esta ecuaci´ donde H on equivale a la f´ ormula de H.B.C: 2 1 it it ˆ ˆ ˆ [H, ˆ B ô ]] ˆ ˆ [H, B(t) = B0 + [H, B0 ] + ¯h 2! ¯h n (9.466) 1 it ˆ [H, ˆ ...[H, ˆ B ˆ0 ]...]] + ... +... [H, {z } | n! ¯h n corchetes

Las transformaciones canónicas / 399 (véase el texto de Messiah, Mécanique quantique, tomo 1, cap´ıtulo 8). Clásicamente la ecuaci´ on de movimiento para la variable dinámica B es (9.352): B˙ = [B, H] (9.467) Formalmente B puede expandirse en serie de Tayor alrededor de t = 0: t2 ¨ tn (n) ˙ B = B0 + tB + B + ... B + ... 2! n! 0

0

Notando que: ¨ = [B, ˙ H] = [[B, H], H], ... B

obtenemos: B = B0 − t[H, B]|0 +

(9.468)

0

(9.469)

t2 [H, [H, B]] 2! 0

(9.470) 1 + ... (−t)n [H, [H ...[H, B] ...]] + ... {z } | n! n corchetes 0 Es clara la correspondencia entre (9.466) y (9.470) con sólo reemplazar el corchete de Poisson por i/¯ h veces el conmutador. La expresión (9.466) puede también obtenerse a partir de las fórmulas cuánticas que corresponden a (9.467) y (9.468): ˆ˙ = i [H, ˆ B] ˆ (9.471) B h ¯ Como ilustraci´ on, sea una part´ıcula en un campo homogéneo gravitacional −mg. El hamiltoniano cuántico será: 2 ˆ = pˆ − mg x ˆ (9.472) H 2m ˆ = H ˆ y B ˆ0 = x Sea B ˆ0 . Hallemos a xˆ usando la fórmula (9.466). Es necesario evaluar los siguientes conmutadores: 1 2 −1 ˆ x [H, ˆ0 ] = pˆ0 , x ˆ0 = x ˆ0 , pˆ20 2m 2m (9.473) −1 i¯h = ([ˆ x0 , pˆ0 ] pˆ0 + pˆ0 [ˆ x0 , pˆ0 ]) = − pˆ0 2m m i¯ h ˆ [H, ˆ x0 ]] = −mg x [H, ˆ0 , − pˆ0 = −g¯h2 (9.474) m Como el conmutador (9.474) es constante, todos los conmutadores de orden superior se anulan. Reemplazando (9.473) y (9.474) en (9.466): 1 pˆ0 t + gt2 (9.475) m 2 La ecuaci´ on (9.475) es formalmente igual a la expresión clásica que se obtendr´ıa a partir de (9.470). xˆ = x ˆ0 +


9.9.

Pruebas del car´ acter can´ onico de una transformaci´ on

La prueba más directa consiste en usar la transformaci´ on junto con las ecuaciones de Hamilton en las variables originales para obtener las ecuaciones de movimiento en las nuevas variables; la transformaci´ on será canónica si las nuevas ecuaciones de movimiento lo son para un hamiltoniano cualquiera; esto se usó en los ejemplos de las ecuaciones (3.92) y (3.93). Otra prueba consiste en mostrar que existe una funci´ on generatriz U para la transformaci´ on, tal que las fórmulas de la transformación se puedan llevar a la forma (9.260). A continuación veremos otros métodos de prueba como son los corchetes de Lagrange y Poisson y la llamada condición simplicial. Veamos que en la prueba del car´ acter canónico de una transformaci´ on es suficiente demostrar que la transformaci´ on para un tiempo dado es canónica. Sea la transformaci´ on: q ν = q ν (q, p, t) ; pν = pν (q, p, t) ; ν = 1, 2, ...l

(9.476)

Si la transformaci´ on es canónica se debe cumplir: l X

ν=1

pν ∆q ν − H ∆t = C

l X

ν=1


!

− ∆F (q, p, t)

(9.477)

Si en (9.477) tomamos un tiempo fijo y arbitrario t = t′ obtenemos: l X

ν=1

pν δq ν = C

l X

ν=1

pν δqν − δF (q, p, t)

(9.478)

Ahora (9.478) es la identidad que define una transformaci´ on canónica que no depende del tiempo, q ν = q ν (q, p, t′ ) ; pν = pν (q, p, t′ ) ; ν = 1, 2, ...l

(9.479)

Entonces, las ecuaciones (9.479) definen una transformaci´ on canónica con valencia C y funci´ on generatriz F (q, p, t′ ) que no depende del valor escogido para t = t′ . Veamos ahora c´ omo la identidad que define el car´ acter canónico de la transformaci´ on dependiente del tiempo, ecuaci´ on (9.477), puede obtenerse de la identidad correspondiente para la transformaci´ on independiente del tiempo, ecuaci´ on (9.478). La ecuaci´ on (9.4) relaciona las variaciones δ con las variaciones ∆: ∆q ν = δq ν + q˙ ν ∆t ;

ν = 1, 2, ...l

(9.480)

Con expresiones análogas para ∆pν , ∆qν , ∆pν . Entonces la relación entre ∆F y δF será: # " l X ∂F ∂F ∂F ∆t (9.481) q˙ν + p˙ ν + ∆F = δF + ∂qν ∂pν ∂t ν=1

Las transformaciones canónicas / 401 Usando las f´ ormulas (9.480) y (9.481), la ecuaci´ on (9.478) se transforma en: l X

ν=1

p ∆q ν − q˙ ν ∆t

= C

l X

ν=1

+

"

pν (∆qν − q˙ν ∆t) − ∆F

l X ∂F

ν=1

∂F q˙ν + p˙ ν ∂qν ∂pν

∂F + ∂t

#

∆t

(9.482)

La ecuaci´ on (9.482) coincidir´ a con (9.477) si se define la funci´ on H por la ecuaci´ on: l X ∂F ∂F ∂F H = CH + pν q˙ ν − Cpν q˙ν + q˙ν + p˙ ν + (9.483) ∂qν ∂pν ∂t ν=1

El paréntésis en (9.483) se puede escribir también en la forma siguiente si asumimos que la transformaci´ on es libre de primera clase, de modo que F es funci´ on de (q, q, t): l X ∂F1 ∂F1 pν q˙ ν − Cpν q˙ν + (9.484) q˙ν + p˙ ν ∂qν ∂pν ν=1

Esta expresión es cero, de acuerdo con las fórmulas de la transformaci´ on (9.158). Se sigue entonces que:

∂F1 (9.485) ∂t Se llega al resultado correspondiente a (9.485) si la transformación tiene una estrutura arbitraria, es decir, regida por las fórmulas (9.260). Concluimos que a fin de que la transformaci´ on (9.476) sea can´ onica es necesario y suficiente que todas las transformaciones independientes del tiempo obtenidas de la transformaci´ on (9.476) por reemplazar a t por un valor ´ arbitrario t′ , sean canónicas, es decir, que satisfagan la ecuaci´ on (9.478), con una y la misma valencia C y una y la misma funci´ on generatriz F . Por esta raz´ on, al formular las pruebas para el car´ acter canónico de una transformaci´ on, basta restringirse a la consideración de las transformaciones que no contienen la variable temporal t expl´ıcitamente: ! ~q, ~p q ν = q ν (q, p) ; pν = pν (q, p) ; ν = 1, 2, ...l ; J 6= 0 (9.486) ~q, p~ H = CH +

Los corchetes de Lagrange. Para la transformaci´ on canónica (9.486), la identidad (9.477) toma la forma: l X

ν=1

pν ∆ q ν = C

l X

ν=1

pν ∆qν − ∆K(q, p)

(9.487)

on de ∆qν y ∆pν usando las fórmulas Si en (9.487) expresamos a ∆q ν en funci´ (9.486) obtenemos: # " ! ! l l l X X X ∂q ν ∂qν (9.488) Cpν − ∆qν − ∆pν ∆K = pν pµ ∂qν ∂pν ν=1 µ=1 ν=1

402 / Mec´ anica cl´ asica avanzada ∆K será un diferencial exacto si se cumplen las condiciones: ! ! l l X X ∂q µ ∂q µ ∂ ∂ Cpλ − = Cpν − pµ pµ ∂qν ∂qλ ∂qλ ∂qν µ=1 µ=1 ∂ ∂pν ∂ ∂pν

l X

∂q µ − pµ ∂pλ µ=1 l X

∂q µ Cpλ − pµ ∂qλ µ=1

!

!

=

∂ ∂pλ

=

∂ ∂qλ

l X

∂qµ − pµ ∂pν µ=1 l X

∂q µ − pµ ∂pν µ=1

!

(9.489)

!

Si efectuamos las operaciones, las ecuaciones (9.489) se transforman en: l X ∂pµ ∂q µ ∂pµ ∂q µ = 0 − ∂qν ∂qλ ∂qλ ∂qν µ=1 l X ∂pµ ∂q µ ∂pµ ∂qµ = 0 − ∂pν ∂pλ ∂pλ ∂pν µ=1

(9.490)

l X ∂pµ ∂q µ ∂pµ ∂q µ = Cδνλ − − ∂pν ∂qλ ∂qλ ∂pν µ=1 Se define el corchete de Lagrange de dos variables dinámicas f y g como: l X ∂qν ∂pν ∂qν ∂pν {f (q, p, t), g(q, p, t)} ≡ − ∂f ∂g ∂g ∂f ν=1

(9.491)

Con esta notaci´ on, las fórmulas (9.490) toman la forma: {qν (q, p, t), qλ (q, p, t)} = 0 ; {qν (q, p, t), pλ (q, p, t)} =

{pν (q, p, t), pλ (q, p, t)} = 0

Cδνλ ;

(9.492)

ν, λ = 1, 2, ...l

En las f´ ormulas (9.492) hemos colocado la variable t, teniendo en cuenta el resultado anterior, seg´ un el cual el car´ acter de la transformaci´ on dependiente del tiempo es el mismo que el de la transformaci´ on realizada en un tiempo fijo t = t′ . Las ecuaciones (9.492) expresan las condiciones suficientes y necesarias para que la transformaci´ on (9.476) sea can´ onica. Esta es una de las mencionadas pruebas del car´ acter canónico de una transformaci´ on. Las f´ ormulas (9.492) se llaman los corchetes de Lagrange fundamentales: con las ecuaciones (9.492) se pueden formar las siguientes igualdades entre matrices l × l: {~ q, ~ q )} = ˜ 0l ; {~ p, p~)} = ˜0l ; {~q, ~p)} = C I˜l

(9.493)

Las transformaciones canónicas / 403 donde el elemento ν, λ, de la matriz {~q, ~q}, es {qν , qλ }, ..., y 0˜l y I˜ son las matrices cero e identidad de orden l × l respectivamente. A su vez las fórmulas (9.493) se pueden condensar en la siguiente expresión con matrices 2l × 2l:  

{~ q, ~ q )} {~ q, p~)}

−{~ q, ~ p)} {~ p, p~)}





=

˜0l

−I˜l

I˜l

˜0l



˜ ≡E

(9.494)

˜ es una matriz 2l × 2l antisimétrica, ortogonal, de cuadrado igual al negativo de E la matriz identidad, y de determinante +1: ˜T = E

˜ −E

˜T = E

˜ −1 E

˜2 = E

−I˜

˜= det E

+1

(9.495)

Vectores y matrices simpliciales. Se trata de una notaci´ on vectorial en el espacio de fases con vectores de 2l elementos y matrices de dimensi´ on 2l × 2l. Con esta notaci´ on se “entremezclan” las coordenadas y momentos generalizados, y de ah´ı el nombre de “simplicial” que recibe esta notaci´ on. El término matriz simplicial se reserva ˜ que satisfacen la relación: para una cierta clase de matrices 2l × 2l, las matrices M ˜ T E˜ M ˜ =E ˜ M

(9.496)

el conjunto de todas las matrices simpliciales de dimensi´ on 2l × 2l forma un grupo, llamado el grupo simplicial. En efecto: (i) El producto de dos matrices simpliciales es una matriz simplicial. (ii) Las matrices simpliciales son no singulares, o sea que para toda matriz simplicial existe la matriz inversa. La matriz inversa de una matriz simplicial es simplicial. (iii) La matriz identidad 2l × 2l es simplicial. (iv) El producto de matrices simpliciales es asociativo. Los vectores de 2l elementos en el espacio de fases se pueden escribir en la forma [~u, ~v ], donde ~u y ~v son vectores columna de l elementos. Una forma bilineal de dimensi´ on 2l es: f=

l X

(−uν vν′ + vν u′ν ) = ~v · ~u ′ − ~u · ~v ′

(9.497)

ν=1

que puede escribirse en la forma:  ′  ~u ˜  f = (~u, ~v ) E ′ ~v

(9.498)

404 / Mec´ anica cl´ asica avanzada Si ahora se someten los vectores [~u, ~v ] y [~u ′ , ~v ′ ] a una transformaci´ on mediante una ˜: matriz simplicial M     ′    ′  ~u ~u ~u ~u ˜  ˜  =M =M  ;  (9.499) ′ ′ ~v ~v ~v ~v Entonces se cumple que:  ′   ′  ~u ~u ˜ TE ˜M ˜  = (~u, ~v ) M  f = ~u, ~v E˜  ′ ~v ′ ~v  ′  ~u ˜  =f = (~u, ~v ) E ′ ~v

(9.500)

Es decir, la forma bilineal f es invariante bajo transformaciones de los vectores [~u, ~v ] realizados por matrices simpliciales; en otras palabras, f es invariante bajo las transformaciones del grupo simplicial. La matriz jacobiana de una transformaci´ on biana de una transformaci´ on canónica:  ∂q 1 ∂q1 ∂q 1 ∂q1 ∂q1 ∂q 1 ... ...  ∂q1 ∂q2 ∂ql ∂p1 ∂p2 ∂pl    ∂q ∂q 2 ∂q 2 ∂q2 ∂q 2 ∂q2  2 ... ...  ∂q ∂q ∂q ∂p ∂p ∂pl  1 2 l 1 2    ... ... ... ... ... ... ... ...     ∂ql ∂q l ∂ql ∂q l ∂q l ∂ql  ... ...  ∂q ∂q2 ∂ql ∂p1 ∂p2 ∂pl 1  J˜ =    ∂p1 ∂p1 ∂p1 ∂p1 ∂p1 ∂p1   ∂q1 ∂q2 . . . ∂ql ∂p1 ∂p2 . . . ∂pl    ∂p2 ∂p2 ∂p2 ∂p2  ∂p2 ∂p2  ... ...  ∂q1 ∂q2 ∂q ∂p ∂p ∂pl l 1 2    ... ... ... ... ... ... ...  ...    ∂p ∂pl ∂pl ∂pl ∂pl ∂pl l ... ... ∂q1 ∂q2 ∂ql ∂p1 ∂p2 ∂pl

can´ onica. Sea la matriz jaco

                    =                   

∂~q ∂~q ∂~p ∂~q

 ∂~q ∂~p     ~ ∂p  ∂~p

(9.501)

donde ∂~p/∂~q, etc., son matrices jacobianas de orden l. Mostremos que J˜ satisface la relaci´ on: ˜ J˜ = C E ˜ J˜T E

(9.502)

Las transformaciones canónicas / 405 donde C es la valencia de  T ∂~q   ∂~q ˜ J˜ =  J˜T E    ∂~q T ∂~ p

la transformaci´ on canónica. En   T ∂~p ∂~q   ˜ ˜  0l −Il ∂~q   ∂~q     T   ∂~p I˜l ˜0l ∂~p  ∂~q ∂~ p

efecto:  ∂~q ∂~p     ~ ∂p  ∂~p

(9.503)

efectuando el producto de matrices indicado en (9.503), teniendo en cuenta que cuando las matrices constan de bloques se siguen las mismas reglas de la multiplicación ordinaria de matrices, obtenemos:   T T T T ∂~q ∂~p ∂~p ∂~q ∂~q ∂~p ∂~p ∂~q   − −  ∂~q ∂~q ∂~q ∂~q ∂~q ∂~p ∂~q ∂~p    T ˜ J˜ =  (9.504) J˜ E    T T T T  ∂~p ∂~q ∂~q ∂~p ∂~p ∂~q ∂~q ∂~p  − − ∂~ p ∂~q ∂~ p ∂~q ∂~p ∂~p ∂~p ∂~p

∂~p/∂~qT indica la matriz traspuesta de ∂~p/∂~q. Notemos que los corchetes de Langrange fundamentales, (9.490) y (9.492), se pueden escribir en forma de matrices. En efecto, las ecuaciones (9.490) son los siguientes elementos de matriz:  ! ! ! !  l X ~p T ~q ~q T ~p ∂ ∂ ∂ ∂   =0 − ∂~ q ∂~ q ∂~ q ∂~ q µ=1 νµ



!



!

~T  ∂p ∂~ p µ=1 l X

~T  ∂q ∂~ p µ=1 l X

νµ

νµ

µλ

∂~q ∂~ p

!

∂~p ∂~q

!

µλ

µλ

νµ

−

T ∂~q ∂~p

!

−

T ∂~q ∂~p

!

νµ

νµ

µλ

∂~p ∂~p

!

∂~q ∂~q

!

µλ

µλ

Comparando a (9.504) con (9.505) obtenemos que:   ˜ 0l −C I˜l ˜ J˜ =  ˜  = CE J˜T E ˜ C I˜l 0



 =0

(9.505)



 = Cδνλ

(9.506)

Con lo cual queda demostrada la relación (9.502). Si la transformaci´ on canónica es univalente, C = 1, entonces J˜ es una matriz simplicial. En general, para C 6= 1, se dice que J˜ es una matriz simplicial generalizada, con valencia C. El conjunto de todas ˜ las matrices simpliciales generalizadas (todas con la misma C) forma un grupo. Si M l ˜ es una matriz simplicial generalizada, se cumple que det M = ±C . En efecto, tomando el determinante de (9.506) y teniendo en cuenta que el determinante de un producto de ˜ = +1, matrices es igual al producto de los determinantes y que det E ˜ detJ˜ = C 2l det E ˜ det J˜T detE

(9.507)

406 / Mec´ anica cl´ asica avanzada Como det J˜T = det J˜ se sigue que: ˜ 2 = C 2l ⇒ detJ˜ = ±C l (det J)

(9.508)

˜ = ±1, o sea que las O sea que para una matriz simplicial se cumple que det M matrices simpliciales son no singulares. Sabemos que las igualdades (9.492), o sea (9.505), son las condiciones suficientes y necesarias para que la transformaci´ on sea canónica. Por tanto la igualdad (9.506) se cumple solamente si la transformaci´ on es canónica. Llegamos pues, a otra prueba del car´ acter can´ onico de una transformaci´ on: Para que la transformaci´ on q ν = q ν (q, p, t), pν = pν (q, p, t), ν = 1, 2, ...l sea can´ onica, es necesario y suficiente que la matriz jacobiana J˜ correspondiente a esta transformaci´ on sea una matriz simplicial generalizada con valencia constante C. Si la transformaci´ on es univalente, entonces J˜ es una matriz simplicial ordinaria. Entonces, ˜ ecuaci´ la condici´ on de la naturaleza simplicial de J, on (9.502), debe cumplirse idénticamente para todos las variables (q, p, t). El teorema de Liouville. En la secci´ on 9.6, ecuaci´ on (9.269), se halló que el movimiento de un sistema hamiltoniano puede considerarse como una transformaci´ on can´ onica libre de primera clase univalente. En consecuencia, su matriz jacobiana es simplicial y su determinante vale ±1. Se sigue entonces que el volumen de una región arbitraria del espacio de fases es constante en el tiempo. Tal volumen es: Z Z Z Γ= ... dq 1 dq 2 ...dq l dp1 dp2 ...dpl (9.509) que puede expresarse también en la forma: ! Z Z Z ~q, ~p Γ= ... J dq1 dq2 ...dql dp1 dp2 ...dpl ~q, p~

(9.510)

˜ Si la transformaci´ donde J es el determinante de la matriz jacobiana J. on es canónica, l ˜ J = det J = ±C , o se a que: Γ = Γ|C|l

(9.511)

En particular, Γ es invariante bajo la transformaci´ on canónica de evoluci´ on temporal, o sea que: dΓ =0 dt

(9.512)

La ecuaci´ on (9.512) puede considerarse como una prueba del teorema de Liouville, véase ecuaci´ on (3.137). Γ es una de las integrales invariantes de Poincaré, ecuaci´ on (9.81). Invariancia de los corchetes de Poisson bajo transformaciones can´ onicas. Hemos ya mostrado esta invariancia bajo transformaciones canónicas infinitesimales, ecuaci´ on (9.394) y siguientes. Veremos ahora que esta invariancia vale para cualquier tipo de tranformación can´ onica univalente; no solamente para aquellas que pueden obtenerse a partir de la transformaci´ on continua de par´ ametros.

Las transformaciones canónicas / 407 Empecemos por mostrar que la condición de canonicidad (9.502) puede expresarse en la forma: ˜ J˜E˜ J˜T = C E

(9.513) ˜T −1

˜−1

en efecto, multiplicando por (J ) a (9.502) por la izquierda y por J por la derecha, obtenemos: 1 ˜ (J˜T )−1 E˜ J˜−1 = E (9.514) C En (9.514) ahora tomamos las matrices inversas de ambos lados y usamos las propiedades de las ecuaciones (9.495): −1 i−1 h 1 ˜ ˜ J˜−1 ˜ −1 J˜T = −J˜E ˜ J˜T ; ˜ E = J˜E (J˜T )−1 E = −C E (9.515) C O sea que la siguiente es otra expresión de la condición de canonicidad: ˜ J˜E˜ J˜T = C E

(9.516)

La ecuaci´ on (9.516) puede obtenerse a partir de (9.502) intercambiando los papeles ˜ J˜T se puede obtener de (9.504) de J˜ y J˜T . Comparando con (9.503) vemos que J˜E intercambiando a ∂~q/∂~q y ∂~p/∂~ p por sus respectivas traspuestas y a ∂~p/∂~q por (∂~q/∂~p)T . Es decir:   T T T T ∂~q ∂~q ∂~q ∂~q ∂~q ∂~p ∂~q ∂~p   − −  ∂~ ∂~q ∂~p ∂~p ∂~q ∂~q ∂~p   p ∂~q  T ˜ ˜ ˜ J EJ =  (9.517)   T T T T   ∂~p ∂~q  ~ ~ ~ ~ ~ ~ ∂p ∂q ∂p ∂p ∂p ∂p − − , ∂~ p ∂~q ∂~q ∂~p ∂~p ∂~q ∂~q ∂~p Los corchetes de Poisson fundamentales pueden escribirse en forma de matriz. En efecto:  ! !  ! ! l X ~q ~q ~p T ~p T ∂ ∂ ∂ ∂   [q ν , pλ ] = − ∂~q ∂~p ∂~p ∂~q µ=1 µλ µλ νµ νµ (9.518) ! T T ∂~q ∂~p ∂~q ∂~p = − ∂~q ∂~ p ∂~p ∂~q νλ

y similarmente: [q ν , q λ ] =

T T ∂~q ∂~q ∂~q ∂~q − ∂~q ∂~ p ∂~ p ∂~q

!

µλ

;

[pν , pλ ] =

T T ∂~p ∂~p ∂~p ∂~p − ∂~q ∂~p ∂~p ∂~q

Se sigue entonces que (9.516) se puede escribir como:     ~ ~ ˜0l −I˜l C − q, q − ~q, ~p  = C E˜ =   J˜E˜ J˜T =  T ˜ ˜ ~ ~ ~q , ~p Il C 0l − p, p

!

(9.519) µλ

(9.520)

408 / Mec´ anica cl´ asica avanzada O sea que las condiciones de canonicidad de la transformaci´ on también se pueden expresar por medio de los corchetes de Poisson, seg´ un (9.520): [~q , ~q ] = ˜0l ; [~p, ~p] = ˜0l ; [~q, ~p] = C I˜l , o en términos de los elementos de matriz. [q ν , q λ ] = 0 ;

[pν , pλ ] = 0 ;

[q ν , pλ ] = Cδνλ ;

ν, λ = 1, 2, ...l

(9.521)

Las ecuaciones (9.521) coinciden con (9.423) cuando la transformaci´ on canónica es univalente. Sean ahora dos variables dinámicas f (q, p, t) y g(q, p, t). Al expresar a las qν , pν ; ν = 1, 2, ...l, en términos de las variables (q, p, t) por medio de la transformaci´ on canónica, obtenemos las variables dinámicas f (q, p, t) y g(q, p, t). O sea que los corchetes de Poisson de f con g pueden evaluarse bien respecto a las variables (q, p) o respecto a las variables (q, p). Mostremos qué vale la identidad: [f, g](q,p) = C[f, g](q,p)

(9.522)

notemos que: [f, g](q,p) =

=

[f, g](q,p) =

=

l X ∂f ∂g ∂f ∂g − ∂qν ∂pν ∂pν ∂qν ν=1 ∂f ∂g ∂f ∂g − ∂~q ∂~p ∂~p ∂~q (9.523)

l X ∂f ∂g ∂f ∂g − ∂q ν ∂pν ∂pν ∂q ν ν=1 ∂f ∂g ∂f ∂g − ∂~q ∂~p ∂~p ∂~q

Las ecuaciones (9.523) se pueden expresar de la siguiente manera con la notaci´ on de (9.498):

[f, g](q,p) =

∂g ∂g , ∂~q ∂~p

 ∂f  ∂~q    E˜    ∂f  ∂~p 

(9.524)

y similarmente [f, g](q,p) . Veamos c´ omo se transforman las derivadas respecto a qν y respecto a pν en funci´ on de las derivadas respecto a q ν y respecto a pν : l X ∂f ∂qµ ∂f ∂pµ ∂f = = + ∂qν ∂q ν ∂qν ∂pµ ∂qν µ=1

T T ∂~q ∂f ∂~p ∂f − ∂~q ∂~q ∂~q ∂~p

!

(9.525) ν

Las transformaciones canónicas / 409 y similarmente para ∂f /∂pν . Vemos entonces que:   T T   ∂~p ∂f ∂~q ∂f ∂f +   ∂~q ∂~p   ∂~q   ∂~q ∂~q      =  =    ∂f  T T  ∂~q ∂f ~ ∂ p ∂f  + ∂~ p ∂~ p ∂~q ∂~p ∂~p    T T ∂f ∂~p ∂~q    ∂~q ∂~q  ∂~q           T T   ∂f   ∂~q ∂~p  ∂~p ∂~ p ∂~p

(9.526)

Comparando a (9.526) con (9.501) vemos que: [∂f /∂~q, ∂f /∂~p] = J˜T ∂f /∂~q, ∂f /∂~p Es decir:   ∂f  ∂~q   ∂g ∂g ˜ ˜ ˜T   (9.527) J EJ  [f, g](q,p) = ,   ~ ∂~ q ∂p  ∂f  ∂~p De acuerdo con (9.516) obtenemos entonces:   ∂f  ∂~q    ∂g ∂g ˜   = C [f, g] CE [f, g](q,p) = , (q,p)   ∂~ q ∂~p  ∂f  ∂~p

(9.528)

Hemos mostrado que si la transformaci´ on (q, p) → (q, p) es canónica entonces se cumple la igualdad (9.522). El inverso también vale: si para cualquier par de variables din´ amicas f y g vale la identidad (9.522) para una y la misma constante C 6= 0, entonces la transformaci´ on de las 2l variables qν y pν a las 2l variables q ν y pν es can´ onica con valencia C. Este es pues otro test del car´ acter canónico de una transformaci´ on. Para una transformaci´ on can´ onica univalente, C = 1, se cumple: [f, g](q,p) = [f, g](q,p)

(9.529)

En otras palabras, los corchetes de Poisson son invariantes bajo transformaciones canónicas univalentes, lo cual es el mismo resultado (9.402). En resumen, para estas transformaciones es innecesario especificar respecto a cuales variables se eval´ uan los corchetes de Poisson. Otras propiedades de los corchetes de Lagrange. Sea el siguiente conjunto de 2l variables din´ amicas: u1 , u2 , ...ul , v1 , v2 , ...vl . Usando notaci´ on vectorial, dicho

410 / Mec´ anica cl´ asica avanzada conjunto se puede escribir como (~u, ~v ). Podemos formar con estas variables los siguientes corchetes de Lagrange y Poisson: [~u, ~u]; [~u, ~v ]; [~v , ~v ]; {~u, ~u}; {~u, ~v }; {~v , ~v } A su vez con estos corchetes podemos formar las siguientes matrices de orden 2l:     [~u, ~u] [~u, ~v ] {~u, ~u} {~u, ~v } ˜= ; L  P˜ =  (9.530) [~v , ~u] [~v , ~v ] {~v , ~u} {~v , ~v }

˜ P˜ = I, donde I˜ es la identidad de orden Mostremos que se cumple lo siguiente: L 2l. Los corchetes de Langrange se pueden expresar en forma similar a (9.524):  ∂~q  ∂~q ∂~p ˜   ∂f  {f, g} = E ,   ∂~p  ∂g ∂g ∂f 

(9.531)

˜ P˜ es de la forma siguiente: Un elemento t´ıpico de la matriz L 2l X i=1

{xn , xi } [xi , xm ] =

2l X i=1

∂~z T ˜ ∂~z E ∂xi ∂xn

!

∂xm T ˜ ∂xi E ∂~z ∂~z

!

(9.532)

donde xi es una componente del vector [~u, ~v ] y zi representa una componente del vector [~ q , p~].13 Notando que: 2l X ∂zr ∂xi ∂zr = = δrs ; ∂x ∂z ∂zs i s i=1

˜ 2 = −I˜ E

(9.533)

y que: Eµr Ert

∂zt ∂xm = −δnm ∂xn ∂zµ

(9.534)

obtenemos entonces que: 2l X i=1

˜ P˜ = −I˜ {xn , xi } [xi , xm ] = −δnm ⇒ L

(9.535)

O sea que el corchete de Lagrange es, excepto por el signo, el rec´ıproco del corchete de Poisson. La invariancia del uno implica la invariancia del otro. Vimos que los corchetes de Poisson son invariantes bajo transformaciones canónicas univalentes, por tanto se 13 V´ ease

las f´ omulas (9.385).

Las transformaciones canónicas / 411 sigue la invariancia de los corchetes de Lagrange bajo estas fransformaciones.14 Otras propiedades de los corchetes de Lagrange son las siguientes:     q ~q   ~ ˜  ,  = E   p~ p ~ {~ q, f } =

∂~p ∂~q ; {~ p, f } = − ∂f ∂f

(9.536)

{g, f } = −{f, g} {cf, g} = {f, cg} =

1 {f, g} c

No se cumplen las propiedades de linealidad ni la identidad de Jacobi, o sea que los corchetes de Lagrange no permiten definir un álgebra. Ejemplo 9.9.1 Analizar la siguiente transformaci´ on compleja, y si es canónica, hallar la funci´ on generatriz y la valencia. 1 1 q = √ (q + ip) ; p = √ (q − ip) 2 2 La transformaci´ on puede escribirse en la forma: √ √ p = i(q − 2q) ; p = 2q − q

(9.537)

(9.538)

La transformaci´ on será can´ onica libre de primera clase con valencia C, si, de acuerdo con (9.158), puede generarse por una funci´ on tal que: Cp =

∂F ∂F ; p=− ∂q ∂q

(9.539)

Es simple mostrar que la transformaci´ on (9.537) será canónica si F y C est´ an dadas por: F =

1 2 1 2 √ q + q − 2qq ; C = −i 2 2

(9.540)

De acuerdo con (9.159), el nuevo hamiltoniano será: H = iH

(9.541)

Es simple mostrar de (9.492) que {q, p} = −i. Ejemplo 9.9.2 En la transformaci´ on canónica del ejemplo 9.9.1 hallar el corchete de Poisson de q, y de p. Resolver el problema del oscilador armónico lineal usando dicha transformaci´ on can´ onica. 14 El corchete de Lagrange de dos constantes de movimiento es una constante de movimiento. Sin embargo, a diferencia de los de Poisson, los corchetes de Lagrange no sirven para hallar nuevas constantes de movimiento porque para evaluarlos hay que conocer todas esas constantes.

412 / Mec´ anica cl´ asica avanzada Como la transformaci´ on (9.537) es canónica con valencia C = −i, se sigue de la f´ ormula general para los corchetes de Poisson que: [q, p] = −i

(9.542)

resultado que también puede obtenerse directamente de las fórmulas de la transformaci´ on. N´ otese que toda transformaci´ on lineal con coeficientes constantes en el espacio de fases bidimensional será canónica con valencia igual al determinante de la matriz de la transformaci´ on: q = aq + bp ;

p = eq + f p ⇒ c = af − be

(9.543)

El hamiltoniano del oscilador armónico lineal es: H=

1 p2x + kx2 2m 2

(9.544)

y puede escribirse en la forma siguiente: H=

1 I(q 2 + p2 ) 2

mediante la transformaci´ on: r √ I q ; px = Imω p x= mω

(9.545)

(9.546)

donde k = mω 2 e I es una constante que puede tomar cualquier valor. En la transformaci´ on (9.546) procedemos por analog´ıa con una correspondiente transformaci´ on cuántica. Si ahora realizamos la transformaci´ on canónica: 1 i q = √ (q + p) ; q = √ (p − q) 2 2

(9.547)

obtenemos para H: H = Iωqp

(9.548)

entonces el hamiltoniano CH será: −iH = −iIωN

(9.549)

donde llamamos N a: N = qp podemos ver que E = IN y que: N , q = −q ; N , p = p

(9.550)

(9.551)

Vemos que q, p y N son análogos a los operadores de destrucción, de creación y de ˆ , de la mecánica cuántica. n´ umero, a ˆ, a ˆ+ , N

Las transformaciones canónicas / 413 La transformaci´ on (9.543) es de cambio de escala, o sea que seg´ un las fórmulas (9.191) y (9.192) es libre de segunda clase, con valencia igual al producto de los factores de escala: r mω 1 1 C= ·√ (9.552) = I I Imω de modo que el hamiltoniano correspondiente a las variables canónicas q y p será ωqp. Entonces, el hamiltoniano correspondiente a q y p es: H = −iωq p

(9.553)

Las f´ ormulas (9.551) nos permiten escribir directamente las ecuaciones de movimiento de Poisson, ecuaciones (9.363): q˙ = q, H ; p˙ = p, H (9.554)

con lo cual de (9.553) y (9.551) obtenemos: q˙ = −iωq ; p˙ = iωp

(9.555)

Que podemos integrar f´ acilmente: q = q 0 e−iωt ; p = q ⋆0 eiωt

(9.556)

donde hemos notado que q y p son complejo conjugadas entre s´ı. Utilizando las fórmulas (9.547) obtenemos a q y p en funci´ on del tiempo: √ √ q = 2Re (q 0 e−iωt ) ; p = 2Im(q 0 e−iωt ) (9.557) Es claro que q 0 puede determinarse de las condiciones iniciales sobre q y p: √ √ (9.558) q0 = 2Re q 0 ; p0 = 2Imq0 Entonces obtenemos para q(t) y p(t) en términos de sus valores iniciales: q = q0 cos ωt + p0 sen ωt (9.559) p = p0 cos ωt + q0 sen ωt y para las variables originales x y px , obtenemos: x = x0 cos ωt +

px0 sen ωt mω

(9.560)

px = px0 cos ωt − mωx0 sen ωt Ejemplo 9.9.3 Analizar las dispersiones de x y de px para un ensamble de osciladores armónicos lineales que tengan la misma energ´ıa. El ensamble est´ a ilustrado en el ejemplo 4.8.1, secci´ on 4.8.

414 / Mec´ anica cl´ asica avanzada Los distintos sistemas del ensamble difieren sólo por la fase. La dispersi´ on en x se caracteriza por su varianza (∆x)2 , definida por: (∆x)2 = h(x − hxi)2 i = hx2 i − hxi2

(9.561)

x = Ax sen(ωt + δ)

(9.562)

donde h...i denota el promedio sobre el ensamble. Como x(t) puede escribirse en la forma: Si promediamos sobre todos los posibles valores de δ, 0 ≤ δ ≤ 2π, obtenemos los promedios de ensamble microcanónicos:

A2x ; hxi = 0 (9.563) 2 px se comporta análogamente. Obtenemos entonces que: 1 1 (∆x)2 = A2x ; (∆p)2 = A2p (9.564) 2 2 El producto ∆x ∆px será entonces: 1 (9.565) (∆x) (∆px ) = Ax Ap 2 Notamos seg´ un el ejemplo 9.9.2 que los máximos valores de x y px , que se obtienen de las f´ ormulas (9.560), son: px A2x = x20 + 2 0 2 ; A2p = p2x0 + m2 ω 2 x20 (9.566) m ω que pueden expresarse en funci´ on de q0 y p0 mediante (9.546): I A2x = (q 2 + p20 ) ; A2p = Iωm(q02 + p20 ) (9.567) mω 0 Reemplazando (9.548) en (9.546) obtenemos: hx2 i =

(∆x) (∆px ) = I(q02 + p20 )

(9.568)

Notando que seg´ un (9.550): N = (Re q 0 )2 + (Im q 0 )2

(9.569)

Entonces obtenemos al usar (9.549): E (9.570) ω Este valor no depende del tiempo, en concordancia con el teorema de Liouville, ejemplo 4.8.4, secci´ on 4.8. El resultado (9.569) es una propiedad del ensamble o sea que para un valor dado de E, queda determinado de manera u ´ nica el valor del producto ∆x ∆px . Solamente disminuyendo el valor de E es posible disminuir el valor de este producto; o sea que una disminuci´ on de ∆x implica un aumento en ∆px y viceversa. Seg´ un la desigualdad de Heisenberg para osciladores mecánico-cu´ anticos: h ¯ ∆x ∆px ≥ (9.571) 2 se sigue entonces de (9.551) que E ≥ ¯hω/2. Si tomamos I igual a la constante de Planck, se sigue también de (9.551) que E = n¯hω. Estos resultados recuerdan a análogos resultados mecánico-cu´ anticos. ∆x ∆px = IN =

10 La ecuaci´ on de Hamilton-Jacobi con variables de acci´ on-´ angulo Aqu´ı estudiaremos más en detalle el significado f´ısico de las soluciones de la ecuación de Hamilton-Jacobi con énfasis en los sistemas que presentan movimientos multiperiódicos. Se desarrollar´ a la teor´ıa hasta el punto en el cual se perciban claramente las diferencias y similitudes con la mecánica c´ uantica, cuando se trate con sistemas atómicos. Las soluciones y los métodos de solución de la ecuaci´ on de Hamilton-Jacobi han merecido numerosos estudios. El método de separación de variables permite en principio resolver cualquier problema integrable introduciendo las coordenadas adecuadas. Los modelos no integrables, como el famoso problema de los tres cuerpos, son objeto de muchas investigaciones en la actualidad. Un estudio matemático de los principales casos en que se resuelve la ecuaci´ on de Hamilton-Jacobi est´ a en la sección 27 del texto de (Gantmacher Op. cit.).

10.1.

Los invariantes adiab´ aticos

Desde cuando el f´ısico aleman Max Planck en 1899 descubri´ o que la absorci´ on y la emisi´ on de energ´ıa radiante por la materia no se producen en cantidades arbitrarias sino de una manera cuantizada, los f´ısicos han tratado de introducir las ideas c´ uanticas en la mecánica cl´ asica. En 1913 Niels Bohr explicó el espectro del hidrógeno con la mecánica cl´ asica más dos suposiciones de tipo c´ uantico: que los electrones sólo tienen ciertos movimientos periódicos (´ orbitas) estables y no un continuo de tales movimientos, y que pueden pasar entre dos ´ orbitas adyacentes por emitir o absorber un cuanto de luz. Los movimientos ligados de los sistemas cuánticos aislados que son estables o estacionarios forman un conjunto discreto. Los dem´ as estados son inestables, aunque ligados, y forman un conjunto continuo; son estados no estacionarios. Desde entonces hasta la actualidad (y pasar´ a alg´ un tiempo hasta que la cuestión sea definitivamente resuelta), los f´ısicos téoricos investigan los movimientos estables que presentan los sistemas atómicos; con ello se busca determinar la causa de que ciertos estados sean estables y los dem´ as sean inestables. A comienzos del siglo la cuestión de interés no era tanto las causas de 415

416 / Mec´ anica cl´ asica avanzada la cuantización de los sistemas atómicos (lo cual se tomó como un dato experimental) sino determinar cuales son las cantidades susceptibles de ser cuantizadas. Se halló que las cantidades a ser cuantizadas deben satisfacer los siguientes dos requisitos: pueden cambiar sólo por m´ ultiplos enteros de la constante de Planck ¯h y deben permanecer absolutamente inalteradas cuando se someta el sistema a una influencia externa que no sea capaz de causar una alteración de magnitud ¯h en esa cantidad. Tales cantidades se llaman invariantes adiab´ aticos y fueron extensivamente estudiados por P. Ehrenfest en los a˜ nos 1914-1923.1 Los invariantes adiabáticos de la vieja teor´ıa c´ uantica coinciden con las llamadas variables de acción. Un invariante adiab´ atico para un sistema de un grado de libertad. Sea un sistema de un grado de libertad en un estado arbitrario de movimiento acotado con lo cual el movimiento además será periódico. Sea λ un par´ ametro caracter´ıstico de los efectos externos sobre el sistema; si λ cambia, cambian los efectos externos sobre el sistema con lo cual se realizará un trabajo y posiblemente cambie también la frecuencia de la oscilaci´ on además de la energ´ıa total. Ciertamente la energ´ıa total dependerá del valor de λ siendo constante para cada valor que tenga λ: E = E(q, p, λ). Las expresiones para la energ´ıa total y el per´ıodo del movimiento son de la forma: 1 (10.1) E = a(q, λ) q˙2 + U (q, λ) 2 Z q2 √ 2a dq √ T = (10.2) E −U q1 donde q1 y q2 son las ra´ıces de la ecuaci´ on E = U (q, λ) para valores dados de E y λ. Puesto que E depende de λ, T depende de E y de λ. Si λ cambia con el tiempo, E dependerá del tiempo a través de λ: ∂E ˙ λ E˙ = ∂λ

(10.3)

Se dice que el par´ ametro λ var´ıa adiabáticamente si: λ λ˙ ≪ T

(10.4)

es decir, si λ var´ıa muy poco en el curso de un per´ıodo del movimiento del sistema. Un invariante adiabático es una cantidad que no cambia cuando el sistema se somete a una variaci´ on adiabática de λ. Sabemos que, en virtud de las ecuaciones de Hamilton: ∂H H˙ = ∂t

(10.5)

O sea que para un sistema conservativo como el que consideramos aqu´ı: ∂H ˙ ∂H λ = E˙ = ∂t ∂λ 1 El

(10.6)

tema contin´ ua estudi´ andose en la actualidad. V´ ease por ejemplo: K.P. Marzlin, B.C. Sanders, Physics review letters 93, 160408(2004). Tambi´ en http://xxx.lanl.gov/abs/quant-ph/0405059.

La ecuaci´ on de Hamilton-Jacobi con variables acción-´ angulo / 417 Como λ var´ıa muy poco en un per´ıodo del movimiento, podemos considerar que λ˙ también es constante. Entonces al promediar la ecuaci´ on (10.6) sobre un per´ıodo obtenemos: Z 1 T ∂H E˙ = λ˙ dt (10.7) T 0 ∂λ De acuerdo con una de las ecuaciones de Hamilton se cumple: dt =

dq ∂H/∂p

(10.8)

La ecuaci´ on (10.7) se puede entonces escribir como: I ∂H/∂λ dq ∂H/∂p (10.9) E˙ = λ˙ I 1 dq ∂H/∂p H donde denota la integral de l´ınea sobre la trayectoria de fases del sistema en un per´ıodo de movimiento. En un per´ıodo, por hipótesis, λ cambia muy poco, por tanto E es constante, seg´ un (10.6). Como una trayectoria de fases se caracteriza por la relación: p = p(q; E, λ)

(10.10)

donde E y λ son fijos, entonces p (o q) solo, es suficiente para especificar el estado. Sobre una trayectoria de fases dada C se cumple entonces que H(q, p, λ) = HC (p, λ), luego: dHc ∂Hc ∂Hc ∂p = + dλ ∂λ ∂p ∂λ

(10.11)

Como durante un per´ıodo E no cambia apreciablemente y HC = E se cumple aproximadamente que: ∂Hc ∂Hc /∂λ =− ∂p ∂p/∂λ

(10.12)

como por otra parte ∂HC /∂E = (∂HC /∂p)(∂p/∂E) = 1, cumple: 1 ∂Hc = ∂p ∂p/∂E Reemplazando a (10.12) y (10.13) en (10.9) obtenemos: I ∂p dq − ∂λ E˙ = λ˙ I ∂p dq ∂E La ecuaci´ on (10.14) se puede escribir en la forma: I ∂p ˙ ∂p ˙ E+ λ dq = 0 ∂E ∂λ

(10.13)

(10.14)

(10.15)

418 / Mec´ anica cl´ asica avanzada Dado que durante un per´ıodo E y λ permanecen prácticamente constantes, de (10.10) se sigue que: ∂p ∂p ˙ ∂p ˙ E+ λ = ∂t ∂E ∂λ

(10.16)

˙ con lo cual en vez de (10.15) podemos y podemos sin mayor error reemplazar a E˙ por E, escribir: I I d ∂p dq = 0 (λ˙ 2 ) ⇒ p dq = 0 + 0(λ˙ 2 ) (10.17) ∂t dt Se define la variable de acci´ on J como: I J = p dq

(10.18)

Entonces (10.17) nos dice que J˙ = 0, o sea que J es un invariante adiabático (una cantidad que no cambia cuando λ var´ıa adiabáticamente). Concluimos que J depende de la energ´ıa del sistema pero var´ıa muy poco con λ. Esto permite calcular a partir de J la frecuencia del movimiento: I I I ∂p 1 ∂J = dq = dq = dt = T (10.19) ∂E ∂E ∂HC /∂p o sea que:

ν=

1 ∂J/∂E

(10.20)

La ecuaci´ on (10.18) tiene la siguiente interpretaci´ on geométrica: J es el valor del ´rea encerrada por la curva de fases que describe el sistema en un per´ıodo. La invariancia a adiabática de J permite concluir que una perturbación al sistema que var´ıa lentamente con el tiempo puede producir una deformación de la trayectoria de fases pero de tal manera que no se cambia el valor del área encerrada por esa curva. J también se puede escribir como una integral de superficie: Z J = dq dp (10.21) Ejemplo 10.1.1 Evaluar la variable de acción J para un oscilador armónico unidimensional. En este caso el hamiltoniano constante es: H=

p2 1 + mω 2 q 2 = E 2m 2

(10.22)

que puede escribirse en la forma: q2 p2 + =1 2mE 2E/(mω 2 )

(10.23)

La ecuaci´ on de Hamilton-Jacobi con variables acción-´ angulo / 419 on (10.23) define una elipse en el plano de fases cuyos semiejes son p La ecuaci´ y 2E/(mω 2 ). El valor de J es igual al área encerrada por la elipse, esto es: p √ E J = π ( 2mE) ( 2E/(mω 2 )) = 2π ω

√ 2mE

(10.24)

La invariancia adiabática de J significa en este caso que al variar lentamente los par´ ametros del oscilador (m y ω), la energ´ıa var´ıa de manera proporcional a la frecuencia ω. Ejemplo 10.1.2 Mostrar expl´ıcitamente la invariancia adiabática de J para un péndulo simple sometido a un acortamiento o alargamiento adiabático de la cuerda, para peque˜ nas oscilaciones. En este caso el hamiltoniano, constante, es: H=

1 2 2 ml ϕ˙ + mgl(1 − cos ϕ) = E 2

(10.25)

para peque˜ nas oscilaciones: ϕ˙ 2 ϕ2 1 2 2 1 ml ϕ˙ + mgl ϕ2 = E ⇒ + =1 2 2 2 2E/(ml ) 2E/(mgl)

(10.26)

que es la ecuaci´ on de una elipse en el plano ϕ − ϕ, ˙ el área encerrada es:

p 2πE E 1 √ = 2π 2E/(mgl) = ω ml2 ml gl H Es claro que J = p dq est´ a dada también por la expresión (10.24): π

p

2E/(ml2 )

(10.27)

E ω

(10.28)

J = 2π

para probar la invariancia adiabática de J, calculemos el trabajo realizado al variar la longitud del hilo del péndulo en una cantidad dl. Este trabajo es: dA = −mlϕ˙ 2 − mg cos ϕ dl (10.29)

en (10.29) el primer término representa el trabajo de la fuerza de la ligadura y el segundo el trabajo de la fuerza de gravedad. Para peque˜ nas oscilaciones (10.29) se puede escribir como: 1 (10.30) dA = −mg dl + mg ϕ2 − mlϕ˙ 2 dl 2 El primer término en (10.30), −mg dl, representa el trabajo hecho para subir la posición de equilibrio de la masa del péndulo; y el otro término representa la energ´ıa comunicada a la oscilaci´ on, que llamaremos dE: 1 (10.31) mg ϕ2 − mlϕ˙ 2 dl dE = 2

420 / Mec´ anica cl´ asica avanzada Sabemos que para un valor dado de l los valores medios de las energ´ıas cinética y potencial son iguales, e iguales a la mitad de la energ´ıa total E (teorema del virial): 1 2 2 1 1 ml ϕ˙ = mgl ϕ2 = E 2 2 2

(10.32)

Comparando (10.32) y (10.31), al tomar el promedio temporal de dE, obtenemos que: E dl 2l

(10.33)

dω 1 dl =− ω 2 l

(10.34)

dE = −

p Como la frecuencia angular es ω = g/l, vemos que el cambio fraccional de ω es proporcional al cambio fraccional de l cuando la longitud del péndulo se altera en dl:

Comparando a (10.33) y (10.34) obtenemos que: dω dE = E ω

(10.35)

Se sigue por integraci´ on de (10.35) que: J E = = Constante 2π ω

(10.36)

Argumentos similares se pueden usar cuando ω se var´ıa lentamente a causa de alguna otra influencia externa. Se usó el car´ acter adiabático de la variación en l, dl, al tomar en (10.31) el promedio temporal: se asumió que dl es prácticamente constante durante un per´ıodo de la oscilación. Como el oscilador armónico del ejemplo de (10.22) equivale matemáticamente a un péndulo con una amplitud de oscilación peque˜ na, se sigue que E/ω es constante en tal caso. Sin embargo, se puede mostrar que para otros sistemas de un grado de libertad, E/ω no es un invariante adiabático, aunque para tales sistemas habr´ a otros invariantes adiabáticos.

10.2.

Los toroides invariantes

En la secci´ on 9.6 analizamos en detalle la solución de las ecuaciones de movimiento de un sistema conservativo generalizado por el método de Hamilton-Jacobi. Esto nos condujo a la ecuaci´ on de Hamilton-Jacobi independiente del tiempo, ecuaciones (9.305) y siguientes del cap´ıtulo anterior. El resultado es que para tales sistemas es posible hallar una transformaci´ on canónica generada por Σ, que permite expresar a (~q, p~) en funci´ on de (~q, ~p), dados por pν = αν (ν = 1, 2, ...l − 1), pl = −t + αl , q ν = βν (ν = 1, 2, ...l) donde αν y βν son 2l constantes y se exige que Bl = h. Si no se toma a h coincidiendo con una ~ se obtendr´ a la solución en términos de de las βν sino que se deja en general h = H(β) ~ ~q = ~γ t + α ~ ~ ~p = β, ~ donde α ~ y β son las constantes de integraci´ on y ~γ son funciones de β. El formalismo de las variables acción-´ angulo se caracteriza por:

La ecuaci´ on de Hamilton-Jacobi con variables acción-´ angulo / 421 (a) Es aplicable a sistemas conservativos generalizados. (b) Se define para sistemas ligados. (c) Se identifican las l constantes pν con l invariantes adiabáticos del sistema. (d) Si existen las l constantes de movimiento se dice que el sistema es integrable. Los sistemas integrables se caracterizan por poseer un n´ umero de constantes de movimiento uniformes igual al n´ umero de grados de libertad:2 en un sistema no integrable el n´ umero de constantes de movimiento uniformes es menor que l, y la trayectoria fásica cubrirá (total o parcialmente) regiones de más de l dimensiones en el espacio fásico. Veremos que si el sistema posee más constantes de movimiento uniformes que el n´ umero de grados de libertad, entonces la trayectoria fásica cubre regiones de dimensi´ on menor que l y además la separación de variables es posible en más de un sistema de coordenadas. Las ecuaciones de movimiento de un sistema hamiltoniano de l grados de libertad son de la forma: x˙ i = fi (x1 , x2 , ...x2l , t) ;

i = 1, 2, ..,2l

(10.37)

Una integral primera del sistema (10.37) es una funci´ on constante que se obtiene a partir del mismo: d Φ(x1 , x2 , ...x2l , t) = 0 (10.38) dt La integral primera Φ = C es una superficie 2l dimensional en el espacio de 2l + 1 dimensiones, de coordenadas x1 , x2 , ...x2l , t, que posee la propiedad de que cada curva integral que tiene un punto com´ un con esta superficie est´ a enteramente contenida en ella. Si se han hallado k integrales primeras: Φi (x1 , x2 , ...x2l , t) = Ci ;

i = 1, 2, ...k

(10.39)

Y si todas estas integrales son independientes, o sea, si al menos un determinante: Φ1 , Φ2 , ...Φk 6= 0 (10.40) J xj1 , xj2 , ...xjk donde xj1 , xj2 , ...xjk son k funciones cualesquiera de las x1 , x2 , ...x2l , entonces a partir de las ecuaciones (10.39) se pueden expresar k funciones de t desconocidas xj1 , xj2 , ...xjk en funci´ on de las dem´ as y sustituyéndolas en (10.37), reducir el problema a la integraci´ on de un sistema de ecuaciones con menos inc´ ognitas que 2l. Si k = 2l y todas las integrales son independientes, entonces (10.39) es un sistema de 2l ecuaciones algebraicas con las 2l inc´ ognitas xi , que puede resolverse en el caso en que todas las funciones Φi sean uniformes. Sucede a veces que entre las Φi hay algunas que son funciones multiformes del estado del sistema y entonces las funciones Φ1 , Φ2 , ...Φ2l no determinan un´ıvocamente el estado cuando toman los valores constantes C1 , C2 , ...C2l . Para que un sistema de ecuaciones diferenciales (10.37) sea integrable es suficiente, pues, que existan l integrales primeras uniformes. Cuando el sistema permite la separación de variables en la forma: Z Fi (xi ) dxi = t; i = 1, 2, ..,2l (10.41) 2 Es

posible que un sistema sea integrable mas no separable, es decir, que no se puede desacoplar las ecuaciones de movimiento.

422 / Mec´ anica cl´ asica avanzada se dice que el sistema se integra por cuadraturas. Teorema de Liouville sobre los sistemas integrables. Recordemos que una funci´ on Φ es una integral primera de un sistema de hamiltoniano H si su corchete de Poisson con H es nulo: [H, Φ] = 0

(10.42)

Estamos excluyendo la constante t0 , conjugada canónica de H, y funciones de t0 . Dos funciones F1 y F2 del estado de un sistema hamiltoniano est´ an en involuci´ on si su corchete de Poisson es nulo. Liouville demostr´ o que si en un sistema de l grados de libertad se conocen l integrales primeras independientes y uniformes en involuci´ on entonces ese sistema se integra por cuadraturas. El enunciado exacto del teorema es: sean l funciones en involuci´ on: Φ1 , Φ2 , ...Φl ;

[Φµ , Φν ] = 0 ;

µ, ν = 1, 2, ...l

(10.43)

en un espacio f´ asico de dimensi´ on 2l. Consideremos los subespacios (hipersuperficies 2l − 1 dimensionales): Sν = {(q, p) : Φν (q, p) = Cν } ;

ν = 1, 2, ...l

(10.44)

y el producto directo de los mismos: Mc = {(q, p) : Φν = Cν ; ν = 1, 2, ...l}

(10.45)

Suponemos que sobre Mc las l funciones Φν son independientes (esto es, que los l gradientes de las hipersuperficies Sν son linealmente independientes en cada punto de Mc ). Entonces, recordando el teorema sobre simetr´ıas y leyes de conservaci´ on de la secci´ on 9.8, como los Φν son generadores infinitesimales de las transformaciones canónicas que dejan invariante a H, se cumple que: (i) Mc es un subespacio invariante bajo cada una de las transformaciones canónicas infinitesimales generadas por Φ1 = H, Φ2 , ...Φl . (ii) Si las funciones Φν son continuas y uniformes y tales que (q) y (p) siempre toman valores finitos, entonces el subespacio Mc corresponde con un toroide de dimensi´ on l: T l = {ϕ1 , ϕ2 , ...ϕl } mod 2π

(10.46)

donde ϕ1 , ϕ2 , ...ϕl son coordenadas angulares sobre el toroide invariante T l . (iii) El hamiltoniano H genera sobre Mc un movimiento que se denomina cuasiperi´ odico, definido en términos de las coordenadas angulares ϕ ~ = (ϕ1 , ϕ2 , ...ϕl ) sobre el toroide invariante T l : d ϕ ~=~ ω; dt

~ ω ~ =ω ~ (C)

(10.47)

(iv) Las ecuaciones canónicas de Hamilton se integran por cuadraturas.3 3 Una

demostraci´ on rigurosa del teorema puede verse en el libro de V. Arnold, Les m´ ethodes mat´ ematiques de la mec´ anique classique, Mir, Mosc´ u, 1976.

La ecuaci´ on de Hamilton-Jacobi con variables acción-´ angulo / 423 Ejemplo 10.2.1 Aplicar el teorema de Liouville al estudio del oscilador bidimansional. Seg´ un el teorema de Liouville sobre sistemas integrables, si en un sistema canónico de dos grados de libertad se conoce una integral primera F que no depende de H, entonces el sistema se integra por cuadraturas; el subespacio definido por H = h y F = f siendo f y h dos constantes, es un toro invariante sobre el cual el movimiento es cuasiperiódico. Para precisar, consideremos un oscilador bidimensional descrito por el hamiltoniano: H=

p2y 1 p2x + + m(ωx2 x2 + ωy2 y 2 ) 2m 2m 2

(10.48)

El sistema de ecuaciones diferenciales (10.37) para este caso es: x˙ =

px ; m

y˙ =

p˙ x = −mωx2 x ;

py m

(10.49)

p˙ y = −mωy2 y

Es f´ acil ver que: px py p˙x + mωx2 x x˙ = p˙ y + mωy2 y y˙ = 0 m m

(10.50)

Con lo cual se obtiene que las siguientes son integrales primeras: 1 p2x + mωx2 x = E1 ; 2m 2

p2y 1 + mωy2 y 2 = E2 2m 2

(10.51)

La hipersuperficie bidimensional ME1 E2 tiene intersecciones con los planos de fase (x, px ) y (y, py ) dadas por las elipses (10.51). Si se quiere, pueden tomarse como integrales primeras a H y una de las dos (10.51); dado que H = E1 + E2 . La hipersuperficie H = h es una esfera (o mejor elipsoide) en el espacio fásico; tal hipersuperficie es de dimensi´ on 3, en tanto que H1 = E1 es unidimensional siendo la hipersuperficie MEE1 bidimensional. El producto directo de las elipses definidas por (10.51) es un toroide de dimensi´ on 2, en tanto que los puntos del producto directo de las regiones H = h y H1 = E1 constituyen una superficie bidimensional, que se puede hacer corresponder topológicamente con un toroide bidimensional (véase figura 10.1). El movimiento cuasiperiódico generado por H sobre ME1 E2 se define en términos de las coordenadas angulares ϕ ~ = (ϕ1 , ϕ2 ) de los puntos de la superficie de un toro que se mueven uniformemente sobre las circunferencias ϕ1 = Constante y ϕ2 = Constante, con frecuencias angulares constantes que dependen de los valores de E1 y E2 : d~ ϕ =~ ω(E1 , E2 ) dt

(10.52)

Si ω1 y ω2 son inconmensurables, entonces la trayectoria de fases llena totalmente el toro cuando t → ∞, en tanto que cuando ω1 y ω2 son conmensurables la trayectoria de fases es cerrada y por lo tanto ocupa una región de dimensi´ on menor a la del toro, es


ϕ2 ϕ1

Figura 10.1 Toroide generado por H.

decir, unidimensional. Para que esto ocurra es necesario que exista una nueva constante de movimiento además de E1 y E2 . Por ejemplo, cuando ωx = ωy , existe otra constante de movimiento relacionada con la degeneraci´ on, que es el momento angular: A = xpy − ypx

(10.53)

Cuando ωy = 2ωx la constante es: A = (m2 ωx2 x2 − p2x ) y + xpx py

(10.54)

y cuando ωx = 2ωy , es constante: A = (m2 ωy2 y 2 − p2y ) x + ypx py

(10.55)

Para el caso ωx = ωy es fácil ver que hay otra constante dada por: B = px py + m2 ω 2 xy

(10.56)

y que se cumple: [E2 , B] = −mω 2 A ;

[E2 , A] =

B m

(10.57)

o sea que E2 con B1 y E2 con A no est´ an en involuci´ on. Tampoco A y B est´ an en involuci´ on puesto que su corchete de Poisson vale E2 − E1 . Pero a´ un es posible formar una combinaci´ on lineal de A y B que esté en involuci´ on con E1 y con E2 : C = B + mω tan(ϕ10 − ϕ20 ) A

(10.58)

donde ϕ10 − ϕ20 es la diferencia de fase de los dos movimientos oscilatorios. Resultados análogos se esperan cuando las frecuencias satisfacen la relación nωx = mωy donde n y m son n´ umeros enteros.

La ecuaci´ on de Hamilton-Jacobi con variables acción-´ angulo / 425 Vectores tangentes a Mc . Como las l funciones Φν son independientes, también serán linealmente independientes los l vectores gradientes 2l-dimensionales, perpendicu~ν . lares a las superficies Φν = Cν , que llamaremos V ∂Φν ∂Φν ∂Φν V~ν = (10.59) , , ... ∂q1 ∂q2 ∂pl ~ν no tiene componentes a lo largo de un vector E ˜V ~µ , donde la matriz Un vector V ˜ simplicial E fue definida en la secci´ on 9.9. En efecto:   ∂Φµ  ∂~q   ˜ V~µ = ∂Φν , ∂Φν E˜  (10.60) V~ν · E  = [Φµ , Φν ] = 0  ∂~q ∂~ p  ∂Φµ  ∂~p

Entonces concluimos que sobre el subespacio l-dimensional Mc existen l vectores linealmente independientes, tangentes a Mc en cada punto. En efecto, los V~ν son lineal˜ son todos diferentes se concluye que mente independientes, y como los autovalores de E ˜ ~ los E Vν son linealmente independientes. Se sigue entonces que en cada punto de Mc un vector tangente (por ejemplo la direcci´ on de la trayectoria de fases en ese punto) puede expresarse como combinaci´ on ˜V ~ν (ν = 1, 2, ...l). lineal de los l vectores E Si se realiza en un punto de Mc la transformaci´ on canónica infinitesimal generada por Φν , de acuerdo con la f´ ormula (9.349), el cambio experimentado por una variable dinámica f est´ a dado por: ∂f ∂f ˜V ~ν ∂ν f = ǫ [f, Φν ] = −ǫ ·E (10.61) , ∂~q ∂~p Se sigue entonces que el cambio  1 0 0    0 1 0    ~q   ∂ν   = −ǫ  . . .  .. .. .. p ~     0 0 0

experimentado por el vector de estado (~q, ~p) es:  . . . 0   . . . 0     ˜~ ˜ V~ν Vν = −ǫE (10.62) .. .. .. ..  E . . . .     . . . 1 

O sea que los desplazamientos producidos por cada una de las transformaciones canónicas infinitesimales generadas por Φ1 , Φ2 , ...Φl est´ an contenidos totalmente dentro del subespacio Mc . Con esto queda demostrada la proposición (i) del teorema de Liouville. En particular, para cuando Φ1 = H se tiene que:     q ~ −∂H/∂~p ∂H  ⇒ ~q˙ = ∂H ; ∂   = −ǫ  ~p˙ = − (10.63) ∂~p ∂~q p~ ∂H/∂~q

426 / Mec´ anica cl´ asica avanzada como debe ser. Hemos mostrado que cualquier desplazamiento sobre Mc se puede obtener por medio de las l transformaciones canónicas asociadas a las integrales primeras Φν en involuci´ on. Como en cada punto de Mc cada uno de los vectores tiene una direcci´ on bien definida, concluimos que a cada integral primera Φν se le puede asociar una familia de trayectorias “paralelas” sobre la superficie de Mc y que en consecuencia a las l integrales primeras en involuci´ on Φν se les puede asociar un sistema de coordenadas curvil´ıneas sobre Mc . En efecto, los l desplazamientos finitos asociados a los l grupos de transformaciones correspondientes a las Φν se pueden describir mediante l par´ ametros reales. Si fijamos sobre Mc un punto (~q, p~) ≡ x0 , entonces cualquier punto de Mc se puede obtener de éste por acción de los l grupos de transformaciones asociados a Φ1 , Φ2 , ...Φl : g(~r)x0 ≡ g1 (r1 ) g2 (r2 ) ...gl (rl )x0 = xr1 , r2 , ...rl ∈ Mc

(10.64)

donde gν (rν ) es la transformaci´ on finita asociada a Φν siendo rν el par´ ametro. Entonces los vectores ~r ≡ (r1 , r2 , ...rl ) definen un´ıvocamente los puntos de Mc . Correspondencia entre Mc y un toroide de dimensi´ on l. Por hipótesis la regi´ on Mc es acotada, ya que estamos tratando con sistemas ligados. Como consecuencia de esto, los vectores ~r = (r1 , r2 , ...rl ) que sirven para caracterizar los puntos de Mc tienen componentes acotadas. Para precisar, llamemos Rl al espacio eucl´ıdeo l-dimensional en el cual est´ an definidos los vectores ~r; en consecuencia, la región del espacio fásico Mc est´ a asociada a un subespacio l-dimensional acotado de Rl mediante la fórmula (10.64). Como la regi´ on Mc es acotada, ciertamente existen transformaciones g(~r) que retornan un punto arbitrario x0 de Mc en s´ı mismo: g(~r)x0 = x0

(10.65)

Podemos, por ejemplo, definir l transformaciones independientes que retornen a x0 en s´ı mismo de la siguiente manera: g1 (1)x0 = x0 ;

g2 (1)x0 = x0 ;

...gl (1)x0 = x0

(10.66)

Es decir, asociar el intervalo (0, 1) a cada una de las l´ıneas cerradas que se obtienen por desplazar el punto x0 mediante las transformaciones gν (rν ). Es claro entonces que gν (mν )x0 = x0 donde mν es un n´ umero entero. Por tanto podemos caracterizar el conjunto de todas las transformaciones de la forma (10.65) mediante los vectores enteros: ~r = (m1 , m2 , ...ml ) ;

mν = ... − 2, −1, 0, 1, ...

(10.67)

A su vez el intervalo (0, 1) corresponde con el intervalo (0, 2π), de modo que podemos hacer corresponder a la región Mc un toroide de dimensi´ on l, T l , definido como el producto cartesiano de l c´ırculos, siendo definidos los puntos de los l c´ırculos mediante coordenadas angulares ϕν mod 2π: T l = {(ϕ1 , ϕ2 , ...ϕl )} ;

ϕ ~ mod 2π

(10.68)

La ecuaci´ on de Hamilton-Jacobi con variables acción-´ angulo / 427 Existe una completa correspondencia entre T l y la región de Rl que representa los puntos de Mc . Por tanto es posible asociar a los puntos de Mc un toroide de dimensi´ on l. Toda la argumentación depende de la existencia de transformaciones sobre Mc de la forma (10.65) para cualquier punto de Mc . Existencia en Mc de movimientos cuasiperi´ odicos. La transformaci´ on canónica generada por H tiene por par´ ametro a t. Entonces la correspondencia entre Mc y T l permite asociar a cada valor de t un punto (ϕ1 , ϕ2 , ...ϕl ) mod 2π sobre T l . El movimiento generado por H en Mc se presenta uniforme sobre T l debido a que una variación ∆t en el par´ ametro t se traduce en variaciones ∆ϕ1 , ∆ϕ2 , ...∆ϕl en las coordenadas sobre T l . Como ciertamente la variaci´ on del par´ ametro t es uniforme, de igual manera serán uniformes las variaciones en las coordenadas angulares sobre T l . En consecuencia: ϕ˙ ν = ων ;

ων = ων (~c) ;

ϕ ~ (t) = ϕ ~ (0) + ~ω t

(10.69)

Hemos justificado las tres primeras proposiciones del teorema de Liouville. Las superficies de secci´ on de Poincar´ e. Asumamos que el espacio de fases es 4-dimensional (sistema aut´ onomo de dos grados de libertad). Escojamos una superficie bidimensional, que puede o no coincidir con uno de los planos de fase; para precisar tomemos el plano x − px en un valor de y determinado. Cada vez que la trayectoria de fases cruza el plano x − px en una direcci´ on dada, un punto en el valor de x y px es marcado sobre la superficie. Después de muchos ciclos de la trayectoria, en el plano quedará formada una figura de puntos. Si tomamos como referencia el oscilador armónico bidimensional (ejemplo 10.2.1), la figura tendrá forma el´ıptica (véase figuras 10.2 y 10.3). Cada elipse corresponde a una trayectoria. Un comportamiento similar ocurre en las intersecciones con el plano x = 0. Los planos x − px y y − py son ejemplos de superficies de secci´ on y las figuras de puntos formados permiten obtener conclusiones acerca de las frecuencias del movimiento. Si las frecuencias son conmensurables, las intersecciones de la trayectoria con las superficies de secci´ on se repiten debido a que la trayectoria es cerrada, en caso contrario, las intersecciones cuando t → ∞ forman una curva continua sobre la superficie de secci´ on, que no es otra cosa que la intersección del toroide invariante con la superficie de secci´ on. Que las intersecciones de la trayectoria con una superficie de sección est´ an localizadas sobre una curva u ńica es una consecuencia de la existencia de una constante de movimiento además de la energ´ıa. En efecto la conservaci´ on de la energ´ıa, H(x, y, px , py ) = E

(10.70)

permite expresar una variable en términos de las otras tres, py = py (x, y, px ). Entonces es suficiente considerar la proyección de la trayectoria sobre el volumen tridimensional (x, y, px ). Si hay una constante de movimiento además de H, I(x, y, px , py ) = C

(10.71)

entonces (10.70) y (10.71) se pueden combinar para darnos: px = px (x, y)

(10.72)

428 / Mec´ anica cl´ asica avanzada px

0

0

x

Figura 10.2 Superficies de sección de Poincaré en el plano x − px py

0

0

y

Figura 10.3 Superficies de sección de Poincaré en el plano y − py O sea que las intersecciones sucesivas de la trayectoria con la superficie de secci´ on y = 0 deben estar sobre la curva u ńica px = px (x, 0). Consideremos ahora el toroide asociado a las constantes de movimiento E y C, MEC . Las coordenadas angulares sobre MEC son ϕ1 y ϕ2 siendo ω1 y ω2 las frecuencias correspondientes. Ciertamente la relación de frecuencias es funci´ on de E y C: α(E, C) =

ω1 (E, C) ω2 (E, C)

(10.73)

Para α = r/S, con r y S enteros, la trayectoria sobre el toro es periódica, cerrándose al completarse r revoluciones en ϕ1 y S revoluciones en ϕ2 . En la superficie de secci´ on ϕ2 = Constante habr´ an S puntos fijos sobre una circunferencia de radio R que depende solamente de E y C. Las sucesivas intersecciones est´ an separadas por un tiempo

La ecuaci´ on de Hamilton-Jacobi con variables acción-´ angulo / 429 ∆t = 2π/ω2 . Durante este intervalo, ϕ1 avanza por ω1 ∆t = 2πα. La aplicaci´ on “twist” de Moser. Las ecuaciones que describen el movimiento de la N -ésima a la (N +1)-ésima intersección de la trayectoria con la superficie de secci´ on son: RN +1 = RN ;

ϕN +1 = ϕN + 2πα

(10.74)

La ecuaci´ on (10.74) constituye una aplicación (o mapeo discreto) de los puntos de la superficie de secci´ on en ella misma.

10.3.

Las variables acci´ on-´ angulo

~ ϕ Mostremos que es posible definir una transformaci´ on canónica (~q, p~) → (I, ~ ) de ~ que son los manera tal que hay l integrales primeras Φν dependientes u ńicamente de I, momentos can´ onicamente conjugados de las coordenadas angulares sobre el toroide T l correspondiente a Mc . ~ son coordenadas de los puntos de Mc en el espacio fásico 2lCiertamente (~ ϕ, Φ) dimensional y satisfacen las ecuaciones direrenciales ordinarias siguientes: ~ dΦ d~ ϕ ~ = 0; =ω ~ (Φ) dt dt que se integran inmediatamente para darnos: ~ ~ ~ t Φ(t) = Φ(0) ; ϕ ~ (t) = ϕ ~ (0) + ~ω Φ(0)

(10.75)

(10.76)

~ no son necesariamente canónicas, es posible construir l Aunque las variables (~ ϕ, Φ) ~ tales que (I, ~ ϕ funciones de las Φν , que llamaremos Iν = Iν (Φ), ~ ) sean variables canónicas. Las Iν , son llamadas las variables de acci´ on y junto con las variables angulares ϕν forman en la vecindad de Mc un sistema de variables canónicas acci´ on-´ angulo. Las cantidades Iν son integrales primeras del sistema de hamiltoniano H = Φ1 puesto que son funciones de integrales primeras. A su vez, las Φν pueden expresarse en funci´ on de las Iν . Entonces en las variables acción-´ angulo las ecuaciones canónicas con hamiltoniano que sólo depende de los “momentos” can´ onicos, son: ∂H dI~ =− = 0; dt ∂ϕ ~

d~ ϕ ∂H ~ = ~ω (I) (10.77) = dt ∂ I~ Las funciones ων est´ an restringidas por la condición que resulta de la continuidad ~ de la funci´ on H(I): ∂2H ∂2H ∂ων ∂ωµ = ⇒ = ∂Iν ∂Iµ ∂Iµ ∂Iν ∂Iµ ∂Iν

(10.78)

Variables acci´ on ´ angulo para l = 1. Debemos encontrar una transformaci´ on canónica (q, p) → (I, ϕ) que satisfaga las dos condiciones siguientes: I dϕ = 2π (10.79) I = I(h) y Mh

430 / Mec´ anica cl´ asica avanzada En este caso el “toro” es una l´ınea cerrada. Es claro que la función generatriz del tipo F2 para esta transformaci´ on es Σ(I, q), que satisface: p= H

∂Σ ; ∂q ∂Σ ,q ∂q

ϕ=

∂Σ ∂I

= h(I)

(10.80) (10.81)

siendo H(p, q) = h(I) el hamiltoniano del sistema. Como la relación h(I) es biun´ıvoca se sigue que cada curva Mh est´ a definida por un valor de I. Sobre una curva definida h por un valor de I, se sigue de (10.80) que: dΣ|I=Constante = p dq En la vecindad de un punto q0 la acción vale:4 Z q p dq = Area Σ(I, q) =

(10.82)

(10.83)

q0

La segunda condición en (10.79) depende del comportamiento global de Σ(I, q). La funci´ on Σ no es uniforme pues al dar un ciclo completo sobre la curva Mh cambia su valor por una constante igual al área encerrada por la curva. Esto no afecta el valor de ∂Σ/∂q pero s´ı el de ϕ = ∂Σ/∂I puesto que el área depende de I. Si llamamos ∆Σ(I) al ´ area, I p dq (10.84) ∆Σ(I) = Mh

Entonces (10.80) define a ϕ con la indeterminación de un m´ ultiplo entero de d∆Σ/dI. Para que se satisfaga la segunda condición de (10.79) es necesario entonces que: d∆Σ(I) ∆Σ A = 2π ⇒ I = = dI 2π 2π o sea que I debe valer: I 1 I= p dq 2π Mh

(10.85)

(10.86)

Si el ´ area A depende de h, entonces existe la funci´ on h(I) inversa de I(h). El per´ıodo del movimiento sobre la curva cerrada Mh en el plano de fases (q, p) est´ a dado por: T =

dA(h) dh

(10.87)

Hemos demostrado además que la variable de acción es un invariante adiab´ atico, de acuerdo con la definición dada por (10.18). 4 Esta

integral de l´ınea ciertamente est´ a sobre la trayectoria del sistema, pero no est´ a evaluada siguiendo el movimiento del sistema: es una propiedad intr´ınseca de los puntos q y q0 del “toro”.

La ecuaci´ on de Hamilton-Jacobi con variables acción-´ angulo / 431 Ejemplo 10.3.1 Resolver las ecuaciones de movimiento para el oscilador armónico unidimensional del ejemplo 10.1.1 usando las variables acción-´ angulo. ω0 ≡

De acuerdo con el ejemplo 10.1.1, para un oscilador armónico de constante k, con p k/m el ´ area encerrada por la elipse definida por H = E es: A=

E 2πE ⇒ I= ω0 ω0

(10.88)

La frecuencia del movimiento es entonces: ω=

∂E = ω0 ∂I

(10.89)

que en este caso particular resulta independiente del valor de I. Las f´ ormulas (10.80) permiten resolver las ecuaciones de movimiento usando el formalismo de las variables acción-´ angulo. En efecto: Z qq Z q 2mE − m2 ω02 q 2 dq p dq = Σ(I, q) = (10.90) q0

q0

entonces: ϕ=

∂Σ = ∂I

Z

q

q0

r

dq = sen−1 2I − q2 mω0

r

mω0 q 2I

lo cual nos dice que: r r 2I 2I q= sen ϕ = sen (ϕ0 + ω0 t) mω0 mω0

(10.91)

(10.92)

donde hemos absorbido en ϕ la constante de integraci´ on de (10.91). Resulta que la variable angular ϕ es la fase de las oscilaciones. Ejemplo 10.3.2 Aplicar el formalismo de las variables acción-´ angulo para hallar la solución a las ecuaciones de movimiento del péndulo plano y realizar un estudio del espacio fásico correspondiente. Las ecuaciones de movimiento son: p˙ = −F sen θ ;

θ˙ = Gp

(10.93)

donde F = mgL, G = 1/(mL2 ) siendo mg la fuerza gravitacional, L la longitud del péndulo, θ el ´ angulo respecto a la vertical y p el momento angular conjugado a θ. El hamiltoniano es: H=

1 2 Gp − F cos θ = E 2

(10.94)

El problema es completamente separable, como ocurre siempre cuando hay un grado de libertad. Una descripci´ on cualitativa del movimiento se obtiene a partir de un diagrama de energ´ıa y otro de las trayectorias de fase (véase figura 10.4). F es el mayor

432 / Mec´ anica cl´ asica avanzada valor de la energ´ıa potencial. Si E > F , entonces p es siempre diferente de cero y el movimiento es no acotado en θ (rotaci´ on). Para E < F , el movimiento es acotado (libración). Para E = F , tenemos el movimiento separatriz, en el cual el per´ıodo de oscilación se hace infinito. Hay dos puntos singulares en p = 0: el origen en θ = 0, que es estable o punto singular el´ıptico; y la intersección de las dos ramas de la separatriz en θ = ±π, que es inestable o punto singular hiperb´ olico. Una trayectoria de fases cerca a un punto singular el´ıptico permanece en su vencindad, en tanto que una trayectoria cerca a un punto hiperb´ olico diverge de él. El per´ıodo est´ a dado por: r I dθ 1 √ T = (10.95) 2G E + F cos θ Sobre la separatriz vemos de (10.93) que la fuerza restauradora y la velocidad son cero en θ = π, de modo que T es infinito.

p Punto elíptico

Rot. Sep. Lib.

E>F E=F E
–2π

–π

0

π

2π

θ

Punto hiperbólico

Figura 10.4 Curvas de fase para el péndulo Transformemos ahora el hamiltoniano a variables acción ángulo, usando la definici´ on (10.86): r Z 2 θmax 2 (E + F cos θ) dθ (10.96) I(E) = π 0 G y las expresiones (10.80) y (10.83): Z 1 dE θ ∂Σ dα r = φ(θ, E) = ∂I G dI 0 2 (E + F cos α) G

(10.97)

La ecuaci´ on de Hamilton-Jacobi con variables acción-´ angulo / 433 donde θmax = π/2 para rotación (E > F ) y cos θmáx = −H/F para libraci´ on (E < F ). El nuevo hamiltoniano se obtiene notando que H = H = E, con lo cual (10.96) permite en principio expresar a E en funci´ on de I. En (10.79) se supone que Mc representa una l´ınea cerrada. Sin embargo la definición es posible ampliarla para incluir no sólo libraci´ on sino rotación. Si en (10.96) y (10.97) efectuamos el cambio de variable siguiente: s 1 E θ 1+ sen η = sen (10.98) 2 F 2 obtenemos: I= y,

8 π

r

 E(k) − (1 − k 2 )K(k) , k < 1   F G  1 kE(k −1 ) , k>1 2

 F (η, k) /K(k) , k<1 π  ϕ= 2  2F (η/2, k −1) /K(k −1 ) , k > 1

(10.99)

(10.100)

siendo F (η, k) y E(η, k) las integrales el´ıpticas incompletas de primera y segunda especie respectivamente, en tanto que K(k) = F (π/2, k) y E(k) = E(π/2, k) son las integrales el´ıpticas completas de primera y segunda especie (véase secci´ on 8.4). Z η dξ p = sen−1 (sen η) F (η, k) = 2 2 1 − k sen ξ 0 (10.101) Z ηp E(η, k) = 1 − k 2 sen2 ξ dξ 0

k est´ a dada por:

E (10.102) F y es una medida de la energ´ıa normalizada del oscilador. k = 1 cuando E = 1 (la energ´ıa de la separatriz) y k < 1 para libraci´ on y k > 1 para rotación. De (10.95) obtenemos para la frecuencia normalizada:  1/K(k) , k<1 ω(k) π  = (10.103) ω0 2  2k/K(k −1 ) , k > 1 √ donde ω0 = F G es la frecuencia angular para el movimiento linealizado alrededor del punto singular el´ıptico. El valor asint´ otico de K cerca a k = 1 nos da una frecuencia normalizada cerca a la separatriz:  (π/2)/ln 4(1 − k 2 )−1/2 , k < 1  ω = (10.104) l´ım  k→1 ω0 π/2 ln 4(k 2 − 1)−1/2 , k>1 2k 2 = 1 +

que tiende a cero cuando k tiende a 1.

434 / Mec´ anica cl´ asica avanzada Ejercicio 10.3.1 Mostrar que para la trayectoria separatriz se cumple: p=±

2ω0 θ cos ; G 2

θ = 4tan−1 (eω0 t ) − π

(10.105)

Variables acci´ on ´ angulo para l grados de libertad. En el caso unidimensional, donde el toroide invariante se reduce a una l´ınea, la integral de l´ınea en (10.86) coincide con la trayectoria. En el caso l-dimensional esta coincidencia no es necesaria. Sean γ1 , γ2 , ...γl , l l´ıneas cerradas sobre el toroide Mc , topológicamente equivalentes a circunferencias. Sobre cada l´ınea especificamos un punto mediante una coordenada ϕν que en un circuito cerrado se aumenta por el valor 2π. Los γν no coinciden necesariamente con trayectorias, que seg´ un veremos en general no son cerradas; es decir, en el caso general ninguna de las l´ıneas γν coincide con la proyección de la trayectoria de fases del sistema sobre el plano qν − pν . Entonces definimos la Iν por: 1 Iν = 2π

Z

l Z 1 X p~ · d~q = pν dqµ 2π µ=1 γµ γν

(10.106)

Consideramos sobre Mc un “tubo de caracter´ısticas” que pasan por los puntos de γν en un tiempo dado (véase figura 10.5). En un tiempo posterior t′ los puntos del tubo de caracter´ısticas que en t estaban sobre γν pasar´ an a formar un contorno cerrado diferente γν′ . En la secci´ on 9.4 se demostr´ o que la integral de Poincaré I1 no cambia de valor al ser evaluada sobre contornos que envuelven el mismo tubo de caracter´ısticas y tales que los puntos de dichos contornos representen estados simult´ aneos.

γν

γ′ν

Figura 10.5 Tubo de caracter´ısticas sobre el toroide Se sigue entonces en virtud de la invariancia de la integral de Poincaré que: Z Z p~ · d~q = ~p · d~q (10.107) γν

γν′

Se sigue de (10.106) que el valor de la variable de acción Iν no var´ıa al deformar la curva cerrada γν . De la topolog´ıa de un toroide se sigue que no es posible por deformación hacer coincidir una curva γµ con otra γν independiente, o sea que la topolog´ıa del toroide determina de manera u ńica los l n´ umeros I1 , I2 , ...Il definidos por (10.106).

La ecuaci´ on de Hamilton-Jacobi con variables acción-´ angulo / 435 ~ ϕ Como (Φ, ~ ) son las coordenadas de los puntos de la vecindad de Mc , entonces si las Iν son independientes, o sea si I1 , I2 , ...Il J 6= 0 (10.108) C1 , C2 , ...Cl entonces en la vecindad del toroide se pueden tomar como coordenadas las variables ~ ϕ). (I, De acuerdo con el método de Hamilton-Jacobi, la siguiente es la funci´ on generatriz ~ ϕ de la transformaci´ on can´ onica (~ q, p ~) → (I, ~) 5 ~ ~ Σ(I, q) =

Z

q ~

q ~0

~ ~ p~(I, q ) · d~q

(10.109)

de acuerdo con las f´ ormulas: p~ =

∂Σ ; ∂~q

ϕ ~=

∂Σ ∂ I~

(10.110)

~ ~q), la cual en principio Como sabemos, (10.109) no permite evaluar la funci´ on Σ(I, se obtiene resolviendo la ecuaci´ on de Hamilton-Jacobi independiente del tiempo: ∂Σ ~ ,~ q = h(I) (10.111) H ∂~q Queda claro que el sistema es integrable si es posible encontrar l contornos cerrados independientes tales que existen las l cantidades I1 , I2 , ...Il , lo cual es posible independientemente de poder resolver la ecuaci´ on (10.111) por separaci´ on de variables. La funci´ on Σ es multivaluada sobre Mc . El cambio experimentado al realizarse un circuito sobre una l´ınea γν es igual a: I dΣ = 2πIν (10.112) ∆ν Σ = γν

Sin embargo en la vecindad de un punto ~q0 siempre es posible definir una funci´ on un´ıvoca que especifica la transformaci´ on canónica. Como en el caso unidimensional, la no uniformidad de Σ se traduce en la no uniformidad de las variables angulares. En efecto el cambio en la variable angular ϕν al realizarse un circuito sobre la l´ınea γµ est´ a dado por: ∆µ ϕν = ∆µ

∂Σ ∂ = ∆µ Σ = 2πδµν ∂Iν ∂Iν

(10.113)

Por otra parte, las variables de acción est´ an indeterminadas por una constante que no depende de las Iν , como se puede ver en (10.85), pero es una constante que no trae problemas como los provenientes de la no uniformidad de Σ. 5 La

integral (10.109) es una integral de l´ınea que no depende de la trayectoria seguida para llegar de ~ q0 a q~.

436 / Mec´ anica cl´ asica avanzada Sistemas separables. Hay casos en los cuales mediante una adecuada elección de las coordenadas resulta que la funci´ on Σ puede escribirse en la forma: ~ ~ Σ(I, q) =

l X

~ qν ) Σν (I,

(10.114)

ν=1

se dice entonces que el sistema es completamente separable. Para un sistema de este tipo las ecuaciones (10.110) toman la forma: pν =

∂ ~ qν ) ; Σν (I, ∂qν

ϕν =

l X ∂ ~ qµ ) Σµ (I, ∂I ν µ=1

(10.115)

ν = 1, 2, ...l En este sistema es posible escoger los ciclos de base γ1 , γ2 , ...γl en los planos de fase (q1 , p1 ), (q2 , p2 ), ...(ql , pl ) de modo que las variables de acción pueden definirse por las integrales: I 1 1 Iν = ∆ν Σν = pν dqν (10.116) 2π 2π donde cada integral es tomada sobre un ciclo de la coordenada qν . Ver la secci´ on 9.4. Sistemas multiplemente peri´ odicos degenerados. Cuando el sistema es separable, las variables angulares describen la proyección del punto representativo del sistema sobre el plano de fases correspondiente (pν , qν ) y ων es la frecuencia angular correspondiente al movimiento de tal proyección sobre la trayectoria cerrada. Entonces tanto qν como pν son funciones periódicas del tiempo. Puede ocurrir que todas las frecuencias sean conmensurables entre s´ı; entonces existen numeros ´ enteros m1 , m2 , ...ml tales que, si T1 , T2 , ...Tl son los per´ıodos sobre las proyecciones en los planos de fases se cumple: m1 T1 = m2 T2 = ... ml Tl = T

(10.117)

en este caso la trayectoria de fases es cerrada y el sistema como un todo es periódico. Se dice entonces que el sistema es completamente degenerado. Si el sistema es no degenerado o parcialmente degenerado, entonces (10.117) no se cumple y nunca retorna a su estado inicial, pero cuando T es suficientemente grande entonces pasa arbitrariamente cerca al estado inicial y se dice que el movimiento es cuasiperi´ odico sobre el toroide invariante. En este caso la trayectoria, independientemente de las condiciones iniciales, es uniformemente distribuida sobre el toroide. Este enunciado constituye el teorema erg´ odico. Podemos decir que si el sistema es no degenerado es erg´ odico. Si hay degeneración esto no se cumple. En las coordenadas en que el sistema es separable, qν y pν son funciones periódicas del tiempo con frecuencia angular ων . Entonces cualquier funci´ on uniforme F (~q, p~ ) del

La ecuaci´ on de Hamilton-Jacobi con variables acción-´ angulo / 437 estado del sistema es periódica respecto a las variables angulares y su per´ıodo respecto a cada una de ellas es 2π. Su expansi´ on de Fourier es de la forma: F (~ q , p~) =

∞ X

∞ X

...

n1 =−∞ n2 =−∞

∂E ∂E ∂E n1 + n2 + ... nl t An1 , n2 , ...nl exp i ∂I1 ∂I2 ∂Il n =−∞ ∞ X

(10.118)

l

Cada término de esta suma es periódico respecto al tiempo con frecuencia angular: ∂E ∂E ∂E n1 + n2 + ... nl ∂I1 ∂I2 ∂Il

(10.119)

pero como estas frecuencias no son conmensurables en general, la suma no es periódica. En particular, no serán periódicas las coordenadas y momentos (~q, p~) en las cuales el sistema no sea separable. En algunos casos particulares, dos o más de las frecuencias ων = ∂E/∂Iν son conmensurables para todos los valores de las Iµ . La existencia de degeneración conlleva una reducción del numero ´ de variables de acción independientes de las cuales depende de la energ´ıa. En efecto si ω1 y ω2 son tales que: n1

∂E ∂E = n2 ∂I1 ∂I2

(10.120)

donde n1 y n2 son enteros, se deduce entonces que E depende de I1 y I2 sólo en la combinaci´ on n2 I1 + n1 I2 : E(I~ ) = E(n2 I1 + n1 I2 , I3 , ...Il )

(10.121)

Cuando hay degeneraci´ on, el n´ umero de integrales de movimiento uniformes es mayor que l. En efecto, la siguiente cantidad es constante de movimiento: A = n1 ϕ1 − n2 ϕ2

(10.122)

la constancia de la cual es evidente de (10.120). Además est´ a constante de movimiento no depende de las Iν , que son las variables canónicamente conjugadas de las ϕν . Al realizarse un circuito sobre la l´ınea γν , el cambio en A est´ a dado, en virtud de (10.113), por: ∆ν A = (n1 δ1ν − n2 δ2ν ) 2π

(10.123)

o sea que A no es uniforme, pero su no uniformidad consiste en la adici´ on de un m´ ultiplo entero de 2π. Por tanto, tomando una funci´ on trigonométrica arbitraria de A se obtiene una nueva integral de movimiento uniforme. Ejemplo 10.3.3 Mostrar que las constantes (10.53) y (10.54) en el caso del oscilador armónico bidimensiohal son funciones respectivamente de ϕ1 − ϕ2 y de 2ϕ1 − ϕ2 .

438 / Mec´ anica cl´ asica avanzada Es simple mostrar que A(I1 , I2 , ϕ1 , ϕ2 ) en (10.53) vale: 2p A= I1 I2 sen(ϕ1 − ϕ2 ) m

y en (10.54) vale: p A = 2I1 mI2 ω1 sen(2ϕ1 − ϕ2 )

(10.124)

(10.125)

De (10.123) se sigue que estas constantes de movimiento son uniformes. En el c´ alculo hemos usado la f´ ormula (10.92) para cada uno de los grados libertad, en coordenadas cartesianas. Ejemplo 10.3.4 En la secci´ on 5.2 mostramos que el oscilador armónico bidimensional cuando ω1 = ω2 es separable en coordenadas cartesianas y en coordenadas polares. Resolver este problema en coordenadas polares usando las variables acción ángulo. La ecuaci´ on de Hamilton-Jacobi para el problema es: " 2 2 # 1 ∂Σ 1 ∂Σ 1 + mω02 r2 = E + 2 2m ∂r r ∂ϕ 2

(10.126)

Resolviendo a (10.126) por separación de variables obtendremos las dos ecuaciones diferenciales ordinarias siguientes: 2 l2 dΣr dΣϕ + 2 + m2 ω02 r2 = 2mE (10.127) = l; dϕ dr r donde l2 es la constante de separación. Salvo constantes de integraci´ on, las soluciones son: Z r l2 Σϕ = lϕ ; Σr = (10.128) 2mE − 2 − m2 ω02 r2 dr r Entonces las cuatro ecuaciones (10.115) toman la forma: r l2 pϕ = l ; pr = 2mE − 2 − m2 ω02 r2 r ϕr = ϕ

ϕϕ = ϕ

∂l + ∂Ir

Z

∂l + ∂Iϕ

Z

1 ∂l2 ∂E − 2 ∂Ir r ∂Ir r dr 2 l 2 2 2 2 2mE − 2 − m ω0 r r

(10.129)

2m

2m r

1 ∂l2 ∂E − 2 ∂Iϕ r ∂Iϕ

l2 2 2mE − 2 − m2 ω02 r2 r

dr

(10.130)

(10.131)

La variable de acción Iϕ vale: Iϕ = l

(10.132)

La ecuaci´ on de Hamilton-Jacobi con variables acción-´ angulo / 439 y la variable de acción Ir vale: Z rmax r 1 l2 Ir = ·2 2mE − 2 − m2 ω02 r2 dr 2π r rm´ın

(10.133)

donde rm´ın y rmax est´ an dados por la fórmula (5.76). Mediante la sustitución x = r2 , (10.133) toma la forma: I q 1 1 Ir = −m2 ω02 x2 + 2mEx − l2 dx (10.134) 2π x La integral se hace f´ acilmente usando la técnica de los residuos teniendo en cuenta que en el plano complejo el integrando es una funci´ on biforme (positivo en el intervalo (xm´ın , xmax ) y negativo entre (xmax , xm´ın )), present´ andose entonces una l´ınea de ramificaci´ on entre xm´ın y xmax . Por otra parte el integrando tiene singularidades en x = 0 y x = ∞, present´ andose polos en dichos puntos. El residuo en x = 0 vale −l/(2π) y el residuo en x = ∞ (que se obtiene con la sustitución y = 1/x) vale E/(2πω0 ). En consecuencia, usando (10.132): E = ω0 (Ir + Iϕ )

(10.135)

La técnica para evaluar este tipo de integrales puede verse en el apéndice II del libro de Born, The mechanics of the atom o en la secci´ on 9-7 del libro de Goldstein. Esto nos permite escribir entonces (10.130) y (10.131) como: Z dr r (10.136) ϕr = mω0 l2 2 2 2 2mE − 2 − m ω0 r r Z mω0 − l/r2 r ϕϕ = ϕ + dr (10.137) l2 2 2 2 2mE − 2 − m ω0 r r Estas integrales coinciden con las evaluadas en el cap´ıtulo 5, que aparecieron en las fórmulas (5.67) y (5.75): El resultado para r en funci´ on de ϕr se obtiene directamente de (5.81): ! r ω02 l2 E 2 (10.138) 1 + 1 − 2 sen 2ϕr = r02 (1 + e sen 2ϕr ) r = mω02 E La ecuaci´ on de la ´ orbita r(ϕ) depende de la diferencia ϕϕ − ϕr y de una constante de integraci´ on que se puede absorber por ϕϕ . Como seg´ un (10.135) el movimiento es degenerado (ωr = ωϕ = ω0 ), resulta que ϕϕ − ϕr es una constante. La integral en (10.131) es idéntica a (5.67). El resultado para ϕ en términos de las variables acción ´ angulo es: e + sen 2ϕr 1 (10.139) ϕ = ϕϕ − ϕr + sen−1 2 e sen 2ϕr + 1

440 / Mec´ anica cl´ asica avanzada La constante (10.122) que aparece cuando hay frecuencias degeneradas es: A = ϕr − ϕϕ

(10.140)

Los cambios en A al realizarse circuitos sobre las l´ıneas γr y γϕ respectivamente son ∆r A = 2π y ∆ϕ A = −2π. O sea que ϕ no es una funci´ on uniforme, lo cual introduce dificultades para tomar a (r, ϕ, pr , pϕ ) como variables de estado. Cuando Iϕ = 0, ϕ = π/4 − A y cuando Iϕ = Ir + Iϕ , ϕ = ϕϕ = ϕr − A. S´ olo una funci´ on que contenga funciones trigonométricas de A es uniforme. El toroide invariante en coordenadas polares est´ a definido por las ecuaciones H = E y pϕ = l. En este caso degenerado queda reducido a una curva cerrada: p2r +

l2 + m2 ω02 r2 = 2mE ; r2

pϕ = l

(10.141)

El potencial efectivo presenta dos puntos de retorno en r, en tanto que en ϕ no hay puntos de retorno. Las figuras 10.6 y 10.7 muestran las envolventes de las trayectorias en el plano de la ´ orbita y algunas órbitas, para l = 0 y para l 6= 0. Las ecuaciones paramétricas de la curva en el plano r − Pr son: r2 = r02 (1 + e sen 2ϕr ) ;

p2r = m2 ω02 r02 e2

cos2 2ϕr 1 + esen 2ϕr

(10.142)

l≠0 Figura 10.6 Envolventes de las trayectorias en el plano de la órbita para l 6= 0 La figura 10.8 muestra las curvas de fases representadas por (10.142) para diferentes valores de e. Cuando e → 1, las trayectorias cerca a rm´ın son muy “planas”, de modo que cuando e = 1, los puntos con pmax y pm´ın est´ an unidos por una l´ınea recta vertical levantada en rm´ın = 0.

La ecuaci´ on de Hamilton-Jacobi con variables acción-´ angulo / 441

l=0

Figura 10.7 Envolventes de las trayectorias en el plano de la órbita para l = 0

1

pr (mω0r0)

e=1

e = 0,8 e = 0,6

0,5

e = 0,4 e = 0,2 e=0

0

0,5

1

r/r 0 1,5

–0,5

–1

Figura 10.8 Curvas de fases para diferentes valores de e

Como r es positivo, la trayectoria para e = 1 es un arco de elipse con los extremos unidos por una l´ınea recta vertical, o sea que en r = 0, pr cambia abruptamente de signo. e = 1 corresponde a un movimiento pendular. En este caso el “toroide” se convierte

442 / Mec´ anica cl´ asica avanzada en un segmento de l´ınea, pues en cualquier movimiento real los puntos de la l´ınea recta vertical son recorridos a velocidad infinita. En coordenadas polares son constantes de movimiento E y l. Como consecuencia de la degeneraci´ on hay otra constante que es una funci´ on trigonométrica de A. Tal constante coincide con E1 o con E2 . En efecto, podemos tomarla como E1 . px puede expresarse en funci´ on de pr y pϕ mediante la fórmula: 1 px = pr cos ϕ − pϕ sen ϕ r

(10.143)

pϕ es una constante igual a l, cuyo valor tiene la siguiente expresión en funci´ on de e: p l = mω0 r02 1 − e2 (10.144)

remplazando pr de (10.142) en (10.143) obtenemos: p mω0 r0 e cos ϕ cos 2ϕr − 1 − e2 sen ϕ px = √ 1 + e sen 2ϕr

(10.145)

con lo cual E1 puede llevarse a la forma: E1 =

mω02 r02 1 [e (1 + cos 2ϕ)(e + sen 2ϕr ) 2 1 + e sen 2ϕr √ +1 − e2 − e 1 − e2 sen 2ϕ sen 2ϕr ]

De (10.139) obtenemos las siguientes expresiones para cos 2ϕ y sen 2ϕ: √ (e + sen 2ϕr ) sen 2A + 1 − e2 cos 2ϕr cos 2A cos 2ϕ = 1 + e sen 2ϕr √ (e + sen 2ϕr ) cos 2A − 1 − e2 cos 2ϕr sen 2A sen 2ϕ = 1 + e sen 2ϕr

(10.146)

(10.147)

La sustituci´ on de (10.147) en (10.146) nos conduce finalmente a: E1 =

1 mω02 r02 (1 + e sen 2A) 2

(10.148)

y en consecuencia: E2 =

1 mω02 r02 (1 − e sen 2A) 2

(10.149)

Sistemas no separables. Como una consecuencia del teorema de Liouville sobre los sistemas integrables, todo sistema de l grados de libertad que posea l constantes de movimiento uniformes admite un sistema de variables acción ángulo, siendo las variables de acción l constantes de movimiento uniformes y las variables agulares l funciones lineales del tiempo de la forma ϕν = ων t+ϕν0 siendo las ϕν0 l constantes de movimiento no uniformes. En un sistema no integrable, el n´ umero de constantes de movimiento uniformes es menor que l y por tanto la trayectoria de fases cubrirá regiones de más de l dimensiones.

La ecuaci´ on de Hamilton-Jacobi con variables acción-´ angulo / 443 Cuando hay un n´ umero de constantes de movimiento uniformes superior a l, se tiene un sistema integrable degenerado. Sistemas separables degenerados. En este caso es posible construir más de l constantes de movimiento uniformes en involuci´ on. Entonces hay diferentes maneras de escoger el conjunto de l variables de acción y por tanto hay diferentes transformaciones canónicas a variables acción ´ angulo. Sean (q, p) → (I, ϕ) y (q, p), (I ′ , ϕ′ ) dos de tales transformaciones, entonces las variables (q, p) en los dos casos deben ser diferentes. Llegamos a otra propiedad fundamental de los sistemas degenerados consistente en que las ecuaciones de movimiento son separables en diferentes sistemas de coordenadas. Ejemplo 10.3.5 Mostrar que en un oscilador armónico bidimensional cuando ωx = 2ωy (o ωy = 2ωx ) es posible la separación de variables en coordenadas parabólicas. En el ejemplo 10.2.1 hallamos que cuando ωy = 2ωx existen tres constantes de movimiento uniformes independientes, E1 , E2 y A (10.54), cuando la separación de variables se hace en coordenadas cartesianas. En términos de las coordenadas parabólicas ξ y η las coordenadas cartesianas x, y est´ an dadas por: p (10.150) x = ξ−η; y = ±2 ξη ; 0 ≤ (ξ, η) < ∞

En este sistema de coordenadas curvil´ıneas, las curvas de ξ constante son par´ abolas confocales con ejes a lo largo de x y abiertas hacia la izquierda. Las curvas de η constante son par´ abolas confocales con ejes a lo largo del eje x pero abiertas hacia la derecha y ortogonales a la familia ξ = constante. En ambos casos el foco est´ a en el origen. Las ecuaciones cartesianas de esas familias de curvas son: y 2 − 4ηx = 4η 2 (η = Constante)

y

y 2 + 4ξx = 4ξ 2

(ξ = Constante) (10.151)

La sustituci´ on de (10.150) en (10.151) hace triviales a estas u ´ltimas identidades, como debe ser. El lagrangiano en coordenadas cartesianas es: m m 2 L= x˙ + y˙ 2 − ωy2 (4x2 + y 2 ) (10.152) 2 2 cuando ωx = 2ωy . En coordenadas parabólicas es: ! 1 η˙ 2 ξ˙2 L = m(ξ + η) − 2mωy2 (ξ 2 + η 2 − ξη) (10.153) + 2 ξ η Por tanto el hamiltoniano en coordenadas parabólicas es: H=

1 ξp2ξ + ηp2η + 2mωy2 (ξ 2 + η 2 − ξη) 2m ξ + η

La ecuaci´ on de Hamilton-Jacobi es: " 2 2 # 1 1 ∂Σ ∂Σ ξ + 2mωy2 (ξ 2 + η 2 − ξη) = E +η 2m ξ + η ∂ξ ∂η

(10.154)

(10.155)

444 / Mec´ anica cl´ asica avanzada Haciendo Σ = Σξ (ξ) + Ση (η)

(10.156)

obtenemos las ecuaciones: 2 dΣξ 2ξ + 8mωy2 ξ 3 − 4mEξ = β dξ 2η

dΣη dη

2

(10.157)

+ 2mωy2 η 3 − 4mEη = −β

(10.158)

donde β es la constante de separación. Integrando estas ecuaciones hallamos: Z s Z s β β 2 2 2 Σ= − 4m ωy ξ dξ + − 4m2 ωy2 η 2 dη (10.159) 2mE + 2mE − 2ξ 2η La constante β tiene la siguiente expresión en términos de las variables de estado: β = 2ξη

p2ξ − p2η + 8m2 ωy2 ξη(ξ − η) ξ+η

(10.160)

y cumple un papel análogo al de la constante l cuando ωx = ωy . En efecto, cuando β 6= 0 los potenciales efectivos en los movimientos unidimensionales equivalentes tienen las siguientes expresiones: ξ Vef (ξ) =

β 1 4mωy2 ξ 2 − ; 2 4mξ

η Vef (η) =

1 β 4mωy2 η 2 + 2 4mη

(10.161)

De las gr´ aficas de energ´ıa potencial efectiva se deducen los valores de retorno en ξ y η y por tanto las par´ abolas que envuelven las trayectorias en el plano x − y. Tales curvas envolventes se denominan “cáusticas”. La figura 10.9 muestra las c´ austicas para diferentes signos de β y algunas de las trayectorias. La solución anal´ıtica en variables acción ángulo requiere evaluar las variables de acción y por medio de las ecuaciones (10.115) hallar las ecuaciones de la trayectoria. Al conocer la funci´ on E(Iξ , Iη ) se hallan las frecuencias ωξ , ωη que contendrán alguna relaci´ on racional de la forma (10.120) y luego se puede obtener una constante de movimiento adicional, de la forma (10.122). Es interesante notar que al separar el movimiento en coordenadas cartesianas hay una constante ligada a la degeneración que es (10.55). Tal constante es precisamente β. Para mostrar esto, notemos que las fórmulas de la transformaci´ on inversa a (10.150) son: p p x + x2 + y 2 −x + x2 + y 2 ξ= ; η= (10.162) 2 2 dado que los momentos est´ an conectados por las fórmulas:      pξ ∂x/∂ξ ∂y/∂ξ px  =   pη py ∂x/∂η ∂y/∂η

(10.163)

La ecuaci´ on de Hamilton-Jacobi con variables acción-´ angulo / 445 y

y

η2 η1

ξ1

ξ2

ξ2

y

η2

x

x

x

ξ2

η2

β>0

β=0

β<0

Figura 10.9 Curvas envolventes o “cáusticas” para distintos valores de β

se sigue que: pξ =

pη =

px +

s

−px +

p −x + x2 + y 2 p py x + x2 + y 2

s

p x + x2 + y 2 p py −x + x2 + y 2

(10.164)

Reemplazando a (10.164) y (10.162) en (10.160) se sigue que: β = 2[ypx py + x(m2 ωy2 y 2 − p2y )]

(10.165)

Similarmente, la constante ligada a la degeneración en coordenadas parabólicas puede tomarse como E1 : ! ξp2ξ − ηp2η 1 E1 = + 2mωy2 (ξ − η)2 (10.166) 2m ξ+η

10.4.

Problema de Kepler (coordenadas esf´ ericas)

El hamiltoniano para una part´ıcula de masa m sometida al efecto de un centro de fuerzas inmóvil que crea un potencial −k/r es: ! p2ϕ 1 p2θ k 2 H(r, θ, pr , pθ , pϕ ) = pr + 2 + 2 − (10.167) 2m r r sen2 θ r Este problema admite la separación completa de variables en la ecuaci´ on de HamiltonJacobi, en la forma: Σ(r, θ, ϕ) = Σϕ (ϕ) + Σθ (θ) + Σr (r)

(10.168)

446 / Mec´ anica cl´ asica avanzada obteniéndose las siguientes ecuaciones diferenciales: 2 dΣϕ = lz2 dϕ r

2

dΣr dr

dΣθ dθ

2

2

+

(10.169)

− 2mkr − 2mEr2 = −l2

(10.170)

lz2 = l2 sen2 θ

(10.171)

donde l y lz son las constantes de separación. Los puntos de retorno en θ y r, donde pθ = 0 y pr = 0, est´ an dados por: ! r k 2El2 rmax, min = − 1± 1+ ; 2E mk 2 sen θmax, min = ±

(10.172)

lz l

La variable de acción Iθ est´ a dada por: r Z θmax I r lz2 l2 2 2πIθ = 2 dθ = l − l2 − z2 dθ 2 sen θ sen θ θm´ın

(10.173)

donde se ha notado que pθ es positivo cuando θ se incrementa de θm´ın = sen−1 (lz /l) a θmax = π − θm´ın y es negativo cuando θ decrece de θmax a θm´ın , y que el integrando es una funci´ on par de θ. Con la sustituci´ on η = sen2 θ, Iθ toma la forma: s Z l 1 l2 η − lz2 2πIθ = 2 dη (10.174) 1−η lz /l2 η y con la sustituci´ on r −lz2 + l2 u x= 1−u

(10.175)

llegamos a:

2πIθ = 4 l2 − lz2

Z

∞ 0

(x2

x2 dx + lz2 )(x2 + l2 )

Descomponemos el integrando en fracciones parciales: Z ∞ Z ∞ dx dx 2 2 − lz 2πIθ = 4 l x2 + l2 x2 + lz2 0 0

(10.176)

(10.177)

para llegar finalmente a: Iθ = l − lz

(10.178)

La ecuaci´ on de Hamilton-Jacobi con variables acción-´ angulo / 447 Por otra parte, de (10.169) se sigue directamente: Iϕ = lz

(10.179)

Obteniendo las siguientes expresiones para las constantes l y lz en términos de las variables de acción: l = Iθ + Iϕ ; Ir est´ a dado por: Z 2πIr =

lz = lϕ

rmax

rm´ın

pr dr −

(10.180)

Z

rm´ın

pr dr = 2

Z

rmax

pr dr

(10.181)

rm´ın

rmax

Llamando a y b a: a=−

k ; 2E

l b= √ −2mE

(10.182)

Podemos escribir a p2r como: " 2 2 # b a a 2 pr = −2mE −1 + 2 − r a r

(10.183)

De tablas de integrales est´ andar como la de Schaum’s hallamos: √ Z √ Ar2 + Br + C Ar2 + Br + C dr = r B −2Ar − B + √ sen−1 √ 2 −A B 2 − 4AC

(10.184)

√ Br + 2C − −Csen−1 √ r B 2 − 4AC Por tanto: Z

√ √ r−a pr dr = −2mE −r2 + 2ar − b2 + a sen−1 √ a2 − b 2 ar − b2 −1 √ −b sen r a2 − b 2

y teniendo en cuenta que: p rmin, max = a ± a2 − b2

llegamos a: Z rmax rm´ın

pr dr =

√ −2mE (a − b)π

(10.185)

(10.186)

(10.187)

448 / Mec´ anica cl´ asica avanzada De donde se tiene la siguiente expresión para E en funci´ on de Ir , Iθ , Iϕ : E=−

mk 2 2(Ir + Iθ + Iϕ )2

(10.188)

Entonces a y b en términos de las variables de acción toman la forma: a=

(Ir + Iθ + Iϕ )2 ; mk

b=

(Iθ + Iϕ )(Iθ + Iϕ + Ir ) mk

Σr y Σθ pueden escribirse como: Z p 1 1 Σr = (Ir + Iθ + Iϕ ) −r2 + 2ar − b2 dr a r Z s Iϕ2 1 1− dθ Σθ = (Iθ + Iϕ ) 2 (Iθ + Iϕ ) sen2 θ

(10.189)

(10.190)

(10.191)

Soluci´ on para el movimiento radial. Seg´ un la ecuaci´ on (10.115), la variable angular ϕr es: ϕr =

∂Σr ∂Σ = ∂Ir ∂Ir

(10.192)

Al derivar la integral (10.190) usamos las expresiones auxiliares: 2a ∂a = ; I = Ir + Iθ + Iϕ ∂I I " 2 # 2(1 − ǫ2 )a2 Iθ + Iϕ ∂ a2 = ∂I I I ǫ2 = 1 − ∂ ∂I

Iθ + Iϕ I

1 I =− a a

Por tanto: ϕr =

2

(10.193)

(10.194)

(10.195)

Z p 1 1 −r2 + 2ar − (1 − ǫ2 )a2 dr a r Z dr +2 p 2 −r + 2ar − (1 − ǫ2 )a2 −

2

−(1 − ǫ )a

Z

r

p

−r2

(10.196)

dr + 2ar − (1 − ǫ2 ) a2

Cada una de estas integrales es elemental y puede hallarse en el manual citado.

La ecuaci´ on de Hamilton-Jacobi con variables acción-´ angulo / 449 El resultado, luego de simplificaciones, es: ϕr = −

1p 2 r−a −r + 2ar − (1 − ǫ2 )a2 + sen−1 a ǫa

(10.197)

A este resultado se puede llegar derivando respecto a I la expresión integrada Σr que se obtiene de (10.185). Definamos ahora una cantidad auxiliar y as´ı: y=

1 − r/a ⇒ r = a(1 − ǫy) ǫ

Con lo cual: p ϕr = −ǫ 1 − y 2 − sen−1 y

(10.198)

(10.199)

Como Σ es indeterminada bajo la adici´ on de una constante arbitraria, ϕr estar´ a igualmente indeterminada bajo la adici´ on de una constante, que llamaremos a. Introduciendo una nueva variable ψ, definida como: y = cos ψ y usando la circunstancia mencionada, obtenemos: π ϕr = −ǫ sen ψ − −ψ +α 2

(10.200)

(10.201)

Podemos escoger a α igual a π/2 con lo cual: ϕr = ψ − ǫ sen ψ

(10.202)

r = a(1 − ǫ cos ψ)

(10.203)

La ecuaci´ on (10.202) es la ecuaci´ on de Kepler, hallada en el cap´ıtulo 5. Vemos además que la variable angular ϕr coincide con la anomal´ıa media M , en tanto que ψ es la anomal´ıa excéntrica que, como sabemos, sirve para especificar la posición de la part´ıcula en el plano de la ´ orbita. En el ejemplo 5.3.1 se halló la solución anal´ıtica de la ecuaci´ on de Kepler en serie de Fourier. ϕr puede escribirse, de acuerdo con (10.77) en la forma: ϕr = ωr (t − t0 )

(10.204)

Vemos que cuando ϕr = 0, ψ = 0 y r = rm´ın ; cuando ϕr = π, ψ = π y r = rmax ; cuando ϕr = 2π, ψ = 2π y r = rm´ın y as´ı sucesivamente. ωr es la frecuencia angular del movimiento radial que es periódico. Ejemplo 10.4.1 Expresar a r, x, y en términos de ϕr por medio de series de Fourier, donde x, y son unos ejes cartesianos en el plano de la órbita, con x a lo largo del eje mayor de la ´ orbita y el origen es el centro de fuerzas. De la figura 5.14 se sigue que: x = r cos ϕv y y = r sen ϕv donde ϕv es la anomal´ıa verdadera (´ angulo entre r y x).

450 / Mec´ anica cl´ asica avanzada Por otra parte, la ecuaci´ on de la órbita en el plano de la misma cuando se toma a x en la direcci´ on del perihelio es: r=

a(1 − ǫ2 ) 1 + ǫ cos ϕv

(10.205)

Por tanto, combinando (10.205) y (10.203): a(1 − ǫ2 ) − r = a(cos ψ − ǫ) ǫ p p y = r2 − x2 = a 1 − ǫ2 sen ψ x=

(10.206) (10.207)

Vemos que x y r son funciones pares de ψ en tanto que y es una funci´ on impar. Entonces podemos escribir: ∞ X 1 r = B0 + Bn cos(nϕr ) a 2 n=1 ∞ X 1 x Cn cos(nϕr ) = C0 + a 2 n=1 ∞ X y p = 1 − ǫ2 Dn sen (nϕr ) a n=1

Los coeficientes de Fourier son: Z Z r −2 π 2 πr cos(nϕr ) dϕr = sen (nϕr ) d Bn = π 0 a nπ 0 a Z Z −2 π x 2 πx cos(nϕr ) dϕr = sen (nϕr ) d Cn = π 0 a nπ 0 a Z π 2 y √ Dn = sen (nϕr ) dϕr π 0 a 1 − ǫ2 Z π 2 y √ = cos nϕr d nπ 0 a 1 − ǫ2

(10.208)

(10.209)

(10.210)

(10.211)

(10.212)

(10.213)

donde se han realizado integraciones por partes. Usando (10.206), (10.207) y (10.203) llegamos a las siguientes expresiones con integrales sobre ψ. Z 2ǫ π sen [n(ψ − ǫ sen ψ)] sen ψ dψ (10.214) Bn = − nπ 0 Z π 2 Cn = sen [n(ψ − ǫ sen ψ)] sen ψ dψ (10.215) nπ 0

La ecuaci´ on de Hamilton-Jacobi con variables acción-´ angulo / 451 Dn =

2 nπ

Z

π

0

cos[n(ψ − ǫ sen ψ)] cos ψ dψ

(10.216)

Procediendo como en el ejemplo 5.3.1, usando la definición integral de las funciones de Bessel enteras, llegamos a: Bn =

ǫ 2ǫ [Jn+1 (ǫn) − Jn−1 (ǫn)] = − Jn′ (ǫn) n n

(10.217)

Cn =

1 2 [Jn−1 (ǫn) − Jn+1 (ǫn)] = Jn′ (ǫn) n n

(10.218)

Dn =

2 Jn (ǫn) ǫn

(10.219)

B0 y C0 deben calcularse por separado. El resultado es: B0 = 2 + ǫ 2 ;

C0 = −3ǫ

(10.220)

Entonces, finalmente: ∞ X 1 ǫ2 r =1+ +ǫ [Jn+1 (ǫn) − Jn−1 (ǫn)] cos(nϕr ) a 2 n n=1 ∞ X 1 3 x =− ǫ+ [Jn−1 (ǫn) − Jn+1 (ǫn)] cos(nϕr ) a 2 n n=1 ∞ X 2p y 1 1 − ǫ2 = Jn (ǫn) sen (nϕr ) a ǫ n n=1

(10.221)

(10.222)

(10.223)

Es interesante notar que el sistema formado por dos part´ıculas cargadas, ligado, emite radiaci´ on electromagnética. El momento de dipolo del sistema, d~ = Z1 e~r1 + Z2 e~r2 , donde Z1 y Z2 tienen signos opuestos, se puede escribir, usando las fórmulas (5.1), como: Z1 Z2 ~ d = µe ~r (10.224) − m1 m2 donde µ es la masa reducida. Las ecuaciones (10.221) a (10.223) muestran que el momento de dipolo se puede expandir en serie de Fourier y la intensidad radiada de frecuencia nω0 , donde ω0 = ϕ˙ r est´ a dada por la fórmula: In =

ω04 n4 ~ 2 dn 3c3

(10.225)

Como d~n es un vector en el plano de la órbita, se han de considerar las contribuciones de x y y a la radiacion de frecuencia nω0 . El resultado es: 2 1 − ǫ2 2 Z2 Z1 64n2 E 4 Jn′2 (ǫn) + − J (ǫn) (10.226) In = 3 2 2 n 3c Z1 Z2 m1 m2 ǫ2

452 / Mec´ anica cl´ asica avanzada ver Landau, Teor´ıa de campos, secci´ on 70. Soluci´ on para el movimiento en θ. La variable angular ϕθ es: ϕθ =

∂Σ ∂Σr ∂Σθ = + ∂Iθ ∂Iθ ∂Iθ

(10.227)

Notando que: p 2a2 p ∂ 1 − ǫ2 1 + 1 − ǫ2 [(1 − ǫ2 ) a2 ] = ∂Iθ I

(10.228)

r − (1 − ǫ2 )a ∂Σr = ϕr − sen−1 ∂Iθ ǫr

(10.229)

y mediante un c´ alculo similar al que conduce a (10.196) obtenemos:

Por otra parte, de (10.191) se sigue: Z ∂Σθ sen θ dθ s = 2 ∂Iθ Iϕ 2 sen θ − Iθ + Iϕ

(10.230)

y con el cambio de variable u = sen2 θ: Z ∂Σθ 1 du q = ∂Iθ 2 2 [u − Iϕ /(Iθ + Iϕ )2 ] (1 − u)

(10.231)

La f´ ormula (14.120) del manual citado nos conduce finalmente a: ∂Σθ cos θ = sen−1 q ∂Iθ 1 − Iϕ2 /(Iθ + Iϕ )2

si llamamos γ a: s γ=

1−

(10.232)

Iϕ2 (Iθ + Iϕ )2

(10.233)

obtenemos de (10.231), (10.229) y (10.227): " r [r − (1 − ǫ2 ) a ]2 cos θ 1− ϕθ − ϕr = sen−1 γ ǫ2 r 2 2

−

r − (1 − ǫ ) a ǫr

s

1−

2



(10.234)

cos θ  γ2

Donde hemos usado la fórmula: p p sen−1 A − sen−1 B = sen−1 A 1 − B 2 − B 1 − A2

(10.235)

La ecuaci´ on de Hamilton-Jacobi con variables acción-´ angulo / 453 Definamos las cantidades auxiliares siguientes: L=

r − (1 − ǫ2 ) a ; ǫr

M=

L ; γ

S = sen (ϕθ − ϕr )

(10.236)

Entonces (10.234) toma la forma: r p 1 S = cos θ − M 2 − M γ 2 − cos2 θ 2 γ

(10.237)

y despejando a cos θ obtenemos: p p cos θ = γS 1 − M 2 γ 2 ± γ 2 M 1 − S 2

(10.238)

Para hallar la dependencia de cos θ, notamos que L tiene la siguiente expresión en términos de ψ: L=

ǫ − cos ψ 1 − ǫ cos ψ

(10.239)

Entonces: √ sen (ϕθ − ϕr ) 1 − ǫ2 sen ψ − cos(ϕθ − ϕr )(ǫ − cos ψ) cos θ = γ (1 − ǫ cos ψ)

(10.240)

donde hemos tomado el signo negativo en (10.238) para hacer la expresión compatible con el caso en que la ´ orbita est´ a colocada completamente en el plano x − z. Despejando a M en términos de cos θ obtenemos: M =−

p Sp 2 1 cos θ γ − cos θ ± 1 − S2 γ2 γ2

(10.241)

y usando las definiciones (10.236), llegamos a la siguiente expresión para la ecuaci´ on de la órbita en términos de las variables acción-´ angulo: r (Iθ + Iϕ )2 ( 1− 1 1 I2 I2 1+ s = 2 r (Iθ + Iϕ ) a Iϕ2 1− (Iθ + Iϕ )2 (10.242) "

× sen (ϕθ − ϕr )

s

sen2 θ

Iϕ2 − ± cos(ϕθ − ϕr ) cos θ (Iθ + Iϕ )2

#)

Si la part´ıcula se mueve sobre un plano que contiene al eje z, no tendrá componente del momento angular en ese eje, o sea Iϕ = 0. En ese caso, seg´ un (10.172), θm´ın = 0 y θmax = π, y seg´ un (10.233), γ = 1. Entonces (10.242) toma la forma: ( ) r Iθ2 I2 1 1 1 ± 1 − 2 cos[θ ∓ (ϕθ − ϕr )] (10.243) = 2 r Iθ a I

454 / Mec´ anica cl´ asica avanzada Si tomamos el signo positivo y definimos a θ0 como: θ0 = ϕθ − ϕr

(10.244)

llegamos a la f´ ormula conocida: 1 1 + ǫ cos(θ − θ0 ) = r a(1 − ǫ2 )

(10.245)

Entonces θ0 es la direcci´ on del vector absidal del perihelio respecto al eje z, o sea la orientación de la elipse. Las frecuencias asociadas a los movimientos en r, ϕ y θ son iguales, pues (10.188) conduce a: mK 2 ∂E (10.246) = ∂I I3 Seg´ un (10.120) y (10.122), habr´ an dos constantes de movimiento asociadas a la degeneraci´ on: ωr = ωθ = ωϕ =

ϕr − ϕθ

y

ϕϕ − ϕθ

(10.247)

Cuando Iϕ = 0, la órbita est´ a colocada en el plano z − x′ , donde x′ hace un ángulo cualquiera con el eje x. θ0 es el ´ angulo entre los ejes x y z, como se muestra en la figura 10.10. x-

z y-

θ0 x′ θ

´ Figura 10.10 Orbita en el plano z − x′ Cuando Iϕ = 0 y θ0 = 0, la ecuaci´ on (10.240) da la siguiente relación entre θ y ψ: r 1−ǫ ψ θ cot (10.248) cot = 2 1+ǫ 2 En general, para una órbita con orientación arbitraria y con el plano de la órbita fuera del plano zx′ tenemos: θ0 = ϕθ − ϕr ;

cos θmin = γ ;

cos θmax = π − θmin

(10.249)

La ecuaci´ on de Hamilton-Jacobi con variables acción-´ angulo / 455 En términos de estos ´ angulos la ecuaci´ on general de la órbita es: 1 ǫ 1 1+ = r (1 − ǫ2 ) a cos θm´ın

√ cos θ0 cos θ + sen θ0 sen2 θ − sen2 θm´ın

(10.250)

Soluci´ on para el movimiento en ϕ. ϕϕ est´ a dada por: ϕϕ =

∂Σ ∂Σr ∂Σθ ∂Σϕ = + + ∂Iϕ ∂Iϕ ∂Iϕ ∂Iϕ

(10.251)

De (10.229) vemos que: r − (1 − ǫ2 ) a ∂Σr = ϕr − sen−1 ∂Iϕ ǫr

(10.252)

De (10.191) se sigue: ∂Σθ = ∂Iϕ

Z

s

1−

Iϕ 1 Iθ + Iϕ sen2 θ

Iϕ2 1 1− (Iθ + Iϕ )2 sen2 θ

dθ

(10.253)

El cambio de variable: s cos2 θ v= 2 sen θ − (1 − γ 2 ) nos lleva a: Z

dθ p sen4 θ − (1 − γ 2 ) sen2 θ

(10.254)

=−

Z

dv 1 + v 2 (1 − γ 2 )

p 1 −1 1 − γ2] tan [v =− 1 − γ2

(10.255)

Entonces (10.252), (10.253), (10.255) junto con (10.230) nos conducen a: p (10.256) ϕϕ = ϕθ + tan−1 [v 1 − γ 2 ] + ϕ Resolviendo para v hallamos:

1 v=p tan(ϕϕ − ϕθ − ϕ) 1 − γ2

(10.257)

que equivale a la siguiente ecuaci´ on cuadrática en cos θ: (1 − γ 2 ) cos2 θ + tan2 (ϕϕ − ϕθ − ϕ) cos2 θ −γ 2 tan2 (ϕϕ − ϕθ − ϕ) = 0

(10.258)

456 / Mec´ anica cl´ asica avanzada por tanto: cos θm´ın tan(ϕϕ − ϕθ − ϕ) cos θ = p sen2 θm´ın + tan2 (ϕϕ − ϕθ − ϕ)

(10.259)

o si se quiere:

sen θm´ın cos θ tan(ϕϕ − ϕθ − ϕ) = √ 2 cos θm´ın − cos2 θ

(10.260)

Usando (10.238) obtenemos esta expresión para la dependencia temporal de ϕ: tan(ϕϕ − ϕθ − ϕ) = sen θm´ın

√ − cos θ0 (ǫ − cos ψ) + sen θ0 1 − ǫ2 sen ψ √ sen θ0 (ǫ − cos ψ) + cos θ0 1 − ǫ2 sen ψ

(10.261)

Cuando la ´ orbita est´ a en el plano x − y, Iθ = 0, o sea γ = 0. Entonces θm´ın = θmax = π/2 = θ. En consecuencia, si tomamos θ0 = 0, −ǫ + cos ψ tan(ϕϕ − ϕθ − ϕ) = √ 1 − ǫ2 sen ψ

(10.262)

de donde: √

1 − ǫ2 sen ψ cos(ϕϕ − ϕθ − ϕ) = = 1 − ǫ cos ψ

r

1 − ǫ2 p 2 2 a ǫ − (a − r)2 ǫr

(10.263)

que nos conduce a una ecuaci´ on similar a la (10.245), pero esta vez para la órbita en el plano x − y. Entonces el ángulo que hace el vector absidal del perihelio respecto al eje x, cuando θ0 = 0, es: ϕ0 +

π 2

donde

ϕ0 = ϕϕ − ϕθ

(10.264)

Cuando la ´ orbita est´ a en el plano z − x′ , Iϕ = 0 y sen θm´ın = 0 entonces tan(ϕϕ − ϕθ − ϕ) = 0. Por tanto en este caso el ángulo ϕ es constante y vale ϕ0 , que es el ángulo que hace la l´ınea de intersección entre el plano vertical de la órbita y el plano x − y. En general, para Iϕ y Iθ arbitrarios, el plano de la órbita y el plano x − y se cortan en la l´ınea Ox′ , llamada l´ınea de nodos. La curva cruza el plano xy cuando θ = π/2 y cuando θ = 3π/2. En esos puntos, seg´ un (10.260), ϕ vale ϕ0 . En conclusi´ on, ϕ0 es el angulo de la l´ınea de nodos respecto al eje x. ϕ0 es el acimut de la part´ıcula cuando ´ θ = π/2 y π + ϕ0 es el acimut cuando θ = 3π/2. Como ϕ es una variable c´ıclica, pϕ es constante de movimiento, cuyo valor es igual al de Iϕ cuya variable canónica conjugada es ϕϕ . Por medio de una transformaci´ on canónica es posible hacer que las variables acción-´ angulo sean (Ir + Iθ + Iϕ , ϕr ), (Iθ + Iϕ , ϕθ − ϕr ) y (Iϕ , ϕϕ − ϕθ ), con lo cual vemos que l y θ0 son variables canónicas conjugadas, lo mismo que lz y ϕ0 . Como sabemos, θ0 y ϕ0 en tanto que variables angulares son no uniformes pues al completar un ciclo sobre las l´ıneas γθ0 y γϕ0 del toroide no regresan a su valor original

La ecuaci´ on de Hamilton-Jacobi con variables acción-´ angulo / 457 sino que aumentan en 2π, pero esto no tiene efecto sobre las fórmulas ya que aparecen en funciones trigonométricas. Los ejes x, y, z fijos a la ´ orbita, se pueden ubicar respecto a los ejes x, y, z mediante los ángulos de Euler que denotaremos ϕ′ , θ′ , ψ ′ definidos en la secci´ on 7.6. ϕ′ es el ángulo ′ ′ ′ ′ entre x y x, θ el ´ angulo entre z y z y el ψ ángulo entre x y x , donde el eje x′ coincide con la l´ınea de nodos. (Véase figura 10.11). ϕ′ , θ′ , ψ ′ est´ an relacionados con θ0 , ϕ0 mediante: ϕ′ = ϕ0 ;

θ′ =

π − θm´ın ; 2

ψ′ =

π − θ0 2

(10.265)

z

z θ′

θmin

y′ y

α θ0

x ψ′ y

ϕ′ x′

Figura 10.11 Los ejes x, y y z están fijos a la órbita y ubicados respecto a x, y y z mediante los ángulos de Euler. x, y están sobre el plano de la órbita. El ´ angulo entre el vector absidal del perihelio, eje x, y el eje z, es α, cuyo coseno es el elemento 1 − 3 de la matriz que conecta los ejes x, y, z con los ejes x, y, z: cos α = sen ψ ′ sen θ′ = cos θmin cos θ0

(10.266)

~ = ǫ~ex , por tanto Puede mostrarse que el vector de Runge-Lenz tiene la expresión A Az = ǫ cos α. I determina la longitud del semieje mayor de la órbita a, en tanto que I y Iθ + Iϕ determinan la excentricidad. Concluimos que las variables acción-´ angulo determinan la forma y tama˜ no de la órbita, lo mismo que su orientación en el espacio. I además determina la frecuencia y ϕr determina la posición de la part´ıcula sobre la órbita. ϕ0 , θ0 , ϕr , Iϕ , Iθ + Iϕ , I son conocidas como los elementos de Delaunay de la órbita en astronom´ıa. Ejemplo 10.4.2 Hallar las expansiones de Fourier para z y x ± iy.

458 / Mec´ anica cl´ asica avanzada De la matriz de rotación en términos de los ángulos de Euler se sigue: z = sen θ′ sen ψ ′ x + sen θ′ cos ψ ′ y

(10.267)

Entonces, usando (10.265): z = cos θm´ın (cos θ0 x + sen θ0 y)

(10.268)

x y y est´ an dados por (10.222) y (10.223). En consecuencia: ( ∞ −iϕr X e 3 Jn′ (nǫ) cos nϕr z = aγ − ǫ−iϕr + 4 n n=1 √ ) 1 − ǫ2 eiϕθ −i Jn (nǫ) sen nϕr ǫ

+aγ

(

∞ iϕr X e

3 − ǫeiϕr + 4 n n=1

(10.269)

Jn′ (nǫ) cos nϕr

√ ) 1 − ǫ2 e−iϕθ +i Jn (nǫ) sen nϕr ǫ Igualmente de la matriz de rotación obtenemos: x + iy = [(cos ψ ′ cos ϕ′ − cos θ′ sen ϕ′ sen ψ ′ ) +i(cos ψ ′ sen ϕ′ + cos θ′ cos ϕ ′ sen ψ ′ )] x (10.270) + [(−sen ψ ′ cos ϕ′ − cos θ′ sen ϕ′ cos ψ ′ ) +i(−sen ψ ′ sen ϕ′ + cos θ′ cos ϕ ′ cos ψ ′ )] y Usando nuevamente (10.265), (10.206) y (10.209) llegamos a: h p x + iy = a sen θ0 + i 1 − γ 2 cos θ0 (cos ψ − ǫ)

√ i p 1 − ǫ2 sen ψ ǫiϕ0 + − cos θ0 + i 1 − γ 2 sen θ0

Finalmente, usando (10.222) y (10.223) llegamos a: ! " ∞ −iϕr X p e 3ǫ Jn′ (nǫ) cos nϕr − e−iϕr + x + iy = i −1 + 1 − γ 2 4 n n=1 # ∞ −iϕr √1 − ǫ2 X p e 2 Jn (nǫ) sen nϕr eiϕϕ − −1 − i 1 − γ ǫ n n=1 " ! ∞ −iϕr X p 3ǫ e + i 1 + 1 − γ2 − e−iϕr + Jn′ (nǫ) cos nϕr 4 n n=1

(10.271)

La ecuaci´ on de Hamilton-Jacobi con variables acción-´ angulo / 459 p − 1 + i 1 − γ2

! ∞ # √ 1 − ǫ2 X e−iϕr Jn (nǫ) sen nϕr ei(ϕϕ −2ϕθ ) ǫ n n=1

(10.272)

Vemos que se anulan todos los coeficientes de Fourier para los cuales nϕ y nθ son diferentes de: nϕ = 0, 1, −1 ;

nθ = 0, ±2

En cuanto a n no hay ninguna restricción. Seg´ un la f´ ormula (10.225), para este caso se tiene: h i ω4 4 An, n , nϕ 2 + Bn, n , nϕ 2 In, nθ , nϕ = 03 τn, nθ , nϕ θ θ 3c

(10.273)

(10.274)

umero que describe el orden del armónico de ω0 radiado, y A y donde τn, nθ , nϕ es un n´ B son los coeficientes de Fourier de z y de x + iy respectivamente. Vemos que solamente es posible la radiaci´ on asociada a los nθ y nϕ dados por (10.273). Las f´ ormulas (10.269) y (10.272) pudieron también obtenerse directamente de (10.240) y de (10.256). Ejemplo 10.4.3 Mostrar que el vector de Runge-Lenz (o de Laplace) es una constante de movimiento asociada a la degeneración del movimiento en el problema de Kepler. ~ es constante: Es simple mostrar que el vector A ~ = p~ × ~l − mk ~r A r

(10.275)

~ · ~l = 0, se sigue que A ~ es un vector fijo en el plano de la órbita. Tomando Como A ~ con ~r obtenemos: el producto escalar de A Ar cos ϕv = l2 − mkr

(10.276)

Comparando con la ecuaci´ on de la órbita vemos que la magnitud de A es esencialmente ǫ: A = mkǫ

(10.277)

~ es independiente de las Se sigue entonces que sólo una de las componentes de A ~ ~ est´ constantes de movimiento E y l. De (10.276) se sigue también que A a en la direcci´ on del perihelio, de donde se concluye que salvo el factor mk: ~ = ǫ~ex ; A

Az = ǫ cos α

(10.278)

Como cos α tiene la expresión (10.266), se sigue que Az depende esencialmente de la constante θ0 = ϕθ − ϕr , que sabemos es constante debido a la degeneración del movimiento y además es independiente de ~l y E. También sabemos que la existencia de este tipo de constantes est´ a asociada a la posibilidad de separar las variables en otro sistema de coordenadas. En efecto, seg´ un veremos, A es precisamente la constante que aparece al separar variables en coordenadas parabólicas.

460 / Mec´ anica cl´ asica avanzada Ejemplo 10.4.4 Mostrar que las constantes de movimiento lx , ly est´ an asociadas a la degeneraci´ on del movimiento angular en un problema de fuerzas centrales. De las f´ ormulas (5.23) en la secci´ on 5.1 sabemos que: lx = −pθ sen ϕ − pϕ cot θ cos ϕ ;

(10.279)

ly = pθ cos ϕ − pϕ cot θ sen ϕ Que pθ y pϕ tienen las siguientes expresiones es válido en cualquier problema de fuerzas centrales: r l2 pθ = l2 − z2 ; pϕ = lz (10.280) sen θ donde l y lz son las constantes de separación en coordenadas esféricas. Para precisar, adoptemos los resultados en el movimiento kepleriano. Seg´ un (10.258) se cumple: p 1 − γ2 sen θ = p 2 1 − γ cos2 (ϕ − ϕ0 ) (10.281) −r sen (ϕ − ϕ0 ) cos θ = p 1 − γ 2 cos2 (ϕ − ϕ0 ) lx puede escribirse en la forma siguiente usando (10.260): p sen ϕ − lz cot θ cos ϕ lx = −l γ 2 − cos2 θ sen θ ! p l 1 − γ 2 sen ϕ = − lz cos ϕ cot θ tan (ϕ − ϕ0 )

(10.282)

Entonces, usando (10.281) llegamos a: lx = l cos θm´ın sen ϕ0

(10.283)

similarmente, ly = −l cos θm´ın cos ϕ0

(10.284)

Estos resultados son válidos para fuerzas centrales en general y no sólo en el caso kepleriano, ya que independientemente de la forma del potencial la energ´ıa depende de Iθ y Iϕ en la combinaci´ on Iθ + Iϕ , lo cual da lugar a que: ωθ = ωϕ

(10.285)

en cualquier problema de fuerzas centrales y por tanto ϕ0 = ϕϕ − ϕθ es una constante de movimiento, lo que a su vez implica que lx y ly sean constantes. l, lz y lx2 + ly2 = l2 cos2 θmin = l2 −lz2 son constantes de movimiento especiales de las coordenadas esféricas y por lo tanto sólo dependen de las variables de acción. lx y ly son constantes que

La ecuaci´ on de Hamilton-Jacobi con variables acción-´ angulo / 461 dependen de las variables angulares 6 ϕθ y ϕϕ a través de ϕ0 y est´ an asociadas a la posibilidad de separar el movimiento angular del radial en coordenadas esféricas donde el eje polar es reemplazado por x o por y. Que lx y ly dependan de las variables angulares es resultado de la propiedad general del vector momento angular consistente en que no existe una transformaci´ on canónica en que lx , ly , lz sean simult´ aneamente momentos generalizados. En efecto, en el ejemplo 9.8.4 se muestra que las componentes de ~l no est´ an en involuci´ on entre s´ı: [li , lj ] = ǫijk lk ;

i, j, k = x, y, z

(10.286)

Notemos que (10.286) es una propiedad de los li que sabemos son los generadores infinitesimales del grupo de rotaciones. Se dice que ~l tiene un ´ algebra de Lie cuyas constantes de estructura son ǫijk . Ejemplo 10.4.5 Mostrar la invariancia bajo el grupo O(4). ~ y ~l podemos formar los vectores J~ y K ~ definidos como: Con los vectores A 1 1 ~ ~ ; ~ = 1 ~l − √ 1 l+ √ J~ = A K (10.287) ~ 2 2 −2mE −2mE A Estos vectores est´ an en involuci´ on entre s´ı, mas no sus componentes: [Ji , Jj ] = ǫijk Jk ,

[Ki , Kj ] = ǫijk Kk ,

[Ji , Kj ] = 0

(10.288)

~ tienen cada uno un álgebra de Lie como la del grupo de rotaPor tanto J~ y K ciones. Concluimos que el hamiltoniano de una part´ıcula ligada en un potencial −k/r es invariante bajo dos grupos de rotaciones independientes. Estos grupos son subgrupos de un grupo más general, el de las rotaciones ortogonales O(6). La representación O(6) es reducible siendo una de sus representaciones irreducibles O(4). Como, seg´ un vimos en la secci´ on 7.8, existe un homomorfismo entre O(3) y SU (2), entonces podemos ver que hay un homomorfismo entre las representaciones O(4) y SU (2) ⊗ SU (2). Vemos que la degeneraci´ on del sistema que consideramos resulta del hecho de ser invariante el hamiltoniano bajo un grupo de simetr´ıa más amplio que el grupo de rotaciones. ~ K ~ y H sólo existen 5 constantes inEntre las siete constantes de movimiento J, 2 2 dependientes, que podemos tomar como J , K , Jz , Kz , H pues existen dos relaciones entre ellas, provenientes de:

~ · ~l = 0 ; J~ − K

2 ~ J~ − K = mkaǫ2

(10.289)

De (10.288) puede verse que estas cinco constantes no est´ an en involuci´ on. Por tanto si se halla un sistema de coordenadas en que J 2 y K 2 sean constantes de separación, necesariamente Jz y Kz dependerán de variables angulares. 6 Puede

verse que los “buenos n´ umeros cu´ anticos” est´ an asociados precisamente con las variables din´ amicas que no dependen de variables angulares.


10.5.

Problema de Kepler (coordenadas parab´ olicas)

Las coordenadas parabólicas en tres dimensiones son una generalizaci´ on de las definidas en el ejemplo 10.3.5. p p x = 2 ξn cos ϕ ; y = 2 ξn sen ϕ ; z =ξ−n (10.290) donde ϕ es el ´ angulo acimutal. Las fórmuIas inversas son: ξ=

1 θ (z + r) = r cos2 2 2

η=

θ 1 (−z + r) = r sen2 2 2

(10.291)

y x Con un procedimiento análogo al del ejemplo 10.3.5 llegamos a: s Z p2ϕ 2mK1 2mE + − 2 dξ Σ(ξ, η, ϕ; E, K, pϕ ) = ξ 4ξ ϕ = tan−1

+

Z

s

2mE +

2mK2 − η

p2ϕ 4η 2

dη + ϕpϕ

(10.292) (10.293)

Las constantes de separación K1 y K2 satisfacen: K1 + K2 = K ;

0 ≤ K1 ≤ K

Las variables de acción son definidas por: s I p2ϕ 2mK1 dξ 2πIξ = 2mE − 2 + 4ξ ξ s I p2ϕ 2mK2 2πIη = 2mE − 2 + dη 4η η 2πIϕ = 2πpϕ

(10.294)

(10.295)

(10.296) (10.297)

De la siguiente ecuaci´ on, dada en Goldstein, que se deduce similarmente a la integral de (10.134) en el ejemplo 10.3.4, I r √ C 2B B (10.298) − 2 dr = 2πi A+ −C + √ r r A obtenemos: Iξ , η = i

pϕ mK1,2 i +√ 2 2mE

(10.299)

La ecuaci´ on de Hamilton-Jacobi con variables acción-´ angulo / 463 que junto con (10.297) nos conduce a la siguiente expresión para la energ´ıa en términos de las variables de acción parabólicas: E=−

mk 2 2(Iξ + Iη + Iϕ )2

(10.300)

Si definimos a I como: I = Iξ + Iη + Iϕ

(10.301)

llegamos a la siguiente expresión para las constantes K1 y K2 en términos de las variables de acción: K1,2 = K

2Iξ,η + Iϕ 2I

(10.302)

Es conveniente definir una sola constante, pues K1 y K2 est´ an relacionadas por (10.294): β=

K1 − K2 Iξ − Iη = ; K I

−1 ≤ β ≤ 1

(10.303)

Veremos que β coincide con la componente z del vector de Runge-Lenz (véase en Mec´ anica cu´ antica de Laudau, secci´ on 37). Entonces K1 y K2 tienen la siguiente expresión en términos de β: K1 =

1+β K; 2

K2 =

1−β K 2

(10.304)

Ejercicio 10.5.1 Expresar a K1 y K2 en coordenadas parabólicas. Luego, usando las fórmulas de transformaci´ on expresar a β en coordenadas cartesianas y mostrar que coincide con la componente z del vector de Laplace. Variables angulares ϕξ y ϕη . De (10.293) se sigue que:

ϕξ

=

Z

m s

∂E m ∂K1 + ∂Iξ ξ ∂Iξ

p2ϕ 2mK1 − 2 2mE + ξ 4ξ

dξ

(10.305) +

Z

s

∂E m ∂K2 m + ∂Iξ η ∂Iξ

p2ϕ 2mK2 − 2 2mE + η 4η

dη

De (10.300) y (10.302) se siguen: ωξ = ωη = ωϕ =

2E mk 2 ∂E = 3 =− ∂I I I

(10.306)

464 / Mec´ anica cl´ asica avanzada y, ∂K1,2 K2 =± ; ∂Iξ I

K1 ∂K1,2 =∓ ; ∂Iη I

K1 − K2 ∂K1,2 =∓ ∂Iϕ I

(10.307)

Por tanto:

ϕξ

=

+

Z

Z

−

s

2mE mK1 + I ξI

p2ϕ 2mK1 2mE + − 2 ξ 4ξ

s

dξ

(10.308)

2mE mK 2 − − I ηI

p2ϕ 2mK2 2mE + − 2 η 4η

dη

ϕη tiene una expresión análoga, colocando η, en lugar de ξ y K1 en lugar de K2 . Definimos a y γ as´ı: a=

I2 ; mk

γ=

Iϕ I

(10.309)

los puntos de retorno en ξ y ϕ est´ an dados por: s ! 1+β γ2 1± 1− ; ξmax,min = a 2 (1 + β)2 ηmax,min = a

1−β 2

1±

s

1−

2

γ (1 − β)2

!

(10.310)

Las f´ ormulas 14.281 y 14.280 del Manual de f´ ormulas y tablas matem´ aticas de Spiegel nos dan para ϕξ : s 2 ξ ξ γ2 ϕξ = − − + (1 + β) − a a 4 r η 2 η γ2 − − + (1 − β) − + a a 4 −sen−1

2 ξ 1− 1+β a s γ2 1− (1 + β)2

ϕη tiene una expresión análoga intercambiando ξ con η y 1 + β con 1 − β.

(10.311)

La ecuaci´ on de Hamilton-Jacobi con variables acción-´ angulo / 465 Si definimos a θ1 , Lξ y Lη as´ı:

7

2ξ 1− (1 + β) a θ1 = ϕξ − ϕn ; Lξ = s ; γ2 1− (1 + β)2 2η 1− (1 − β) a Lη = s γ2 1− (1 + β)2

(10.312)

obtenemos: 2ξ 2η , = a a

1−

s

γ2 1− Lξ , η (1 ± β)2

!

(1 ± β)

(10.313)

y, θ1 = −sen−1 Lξ + sen−1 Lη

(10.314)

Además, q 1p (1 + β)2 − γ 2 1 − L2ξ 2 q 1p − (1 − β)2 − γ 2 1 − L2η − sen2 Lξ,η 2

ϕξ,η = −

(10.315)

Ahora definamos dos nuevas variables (anomal´ıas excéntricas): Lη = sen αη ;

Lξ = sen αξ

(10.316)

Entonces (10.314) y (10.315) se convierten en: θ1 = −αξ + αη ϕξ = −

1p (1 + β)2 − γ 2 cos αξ 2

(10.318)

1p (1 + β)2 − γ 2 cos(αη − θ1 ) 2

(10.319)

1p − (1 + β)2 − γ 2 cos(θ1 + αξ ) − αξ 2 ϕη = −

7 Como

(10.317)

1p − (1 + β)2 − γ 2 cos αη − αη 2

se cumple (10.306), se sigue que θ1 es una constante de movimiento asociada a la degeneraci´ on.

466 / Mec´ anica cl´ asica avanzada Las f´ ormulas (10.318) y (10.319) son ecuaciones trascendentales que permiten en principio expresar a αξ y αη en funci´ on de las variables angulares y en consecuencia de (10.313) expresar a ξ y η en funci´ on del tiempo, en efecto: ξ= η=

p 1 a 1 + β − (1 + β)2 − γ 2 sen αξ 2

(10.320)

p 1 a 1 − β − (1 − β)2 − γ 2 sen αη 2

(10.321)

De (10.314) se obtiene una ecuaci´ on que relaciona a ξ con η y que constituye la ecuaci´ on de la ´ orbita en coordenadas parabólicas. El resultado es: s ( 2η a (1 + β)2 − γ 2 1+β− cos θ1 1 − β − ξ= 2 (1 − β)2 − γ 2 a (10.322) #) r 2 4η 4η + −γ 2 + (1 − β) − 2 sen θ1 a a Relaci´ on con la soluci´ on en coordenadas esf´ ericas. Empecemos por expresar a ǫ en términos de γ, β y θ1 . Para ello basta hallar una expresión para r = ξ + η usando (10.320) y (10.321): r 1 + β2 − γ2 1p r (1 − β 2 )2 − 2γ 2 (1 + β 2 ) + γ 4 cos θ1 =1− + a 2 2 (10.323) (1)

× cos(αξ − αξ ) Donde: (1) tan αξ

p p (1 + β)2 + γ 2 + (1 − β)2 + γ 2 cos θ1 p = (1 − β)2 − γ 2 sen θ1

Comparando (10.323) con (10.203) cuando r = rmax , obtenemos: r 1 + β2 − γ2 1p (1 − β 2 )2 − 2γ 2 (1 + β 2 ) + γ 4 cos θ1 ǫ= + 2 2

(10.324) 8

(10.325)

Por otra parte, z, en coordenadas parabólicas y en esféricas es:

8 Esta

1p z 1p (1 + β 2 ) − γ 2 sen αξ + (1 − β)2 − γ 2 sen αη =β− a 2 2 r i z 1 − ǫ2 − γ 2 h p 2 sen ψ sen θ − (ǫ − cos ψ) cos θ − = 1 − ǫ 0 0 a 1 − ǫ2

(10.326)

(10.327)

f´ ormula nos muestra que los valores de β y γ no son arbitrarios: si β > 0, 0 ≤ |γ| ≤ 1 − β y si β < 0, 0 ≤ |γ| ≤ 1 + β.

La ecuaci´ on de Hamilton-Jacobi con variables acción-´ angulo / 467 Estas expresiones equivalen a: # " r 1+β 2 −γ 2 1 p (2) 2 2 2 2 4 z = a β+ (1−β ) −2γ (1+β )+γ cos θ1 cos(αξ −αξ ) (10.328) − 2 2 z=a

r

(2)

i p 1 − ǫ2 − γ 2 h 2 sen2 θ cos(ψ − ψ (1) ) 1 − ǫ −ǫ cos θ − 0 0 1 − ǫ2

y ψ (1) se definen as´ı: p p − (1 + β)2 − γ 2 + (1 − β)2 − γ 2 cos θ1 (2) p tan αξ = (1 − β)2 − γ 2 sen θ1 √ 1 − ǫ2 sen θ0 tan ψ (1) = cos θ0

(10.329)

donde αξ

De (10.328) se sigue que: máx 2 zm´ın 2 = 1 + β 2 − γ 2 − ǫ2 = β 2 + (1 − ǫ2 ) cos2 θm´ın −β a En tanto que de (10.329): p m´ ax 2 sen2 θ −ǫ cos θ ± zm´ = a cos θ 1 − ǫ 0 0 m´ ın ın

m´ ax De (10.332) y (10.333) obtenemos para β en términos de zm´ ın : 2 m´ın zm´ + (ǫ2 − 1) cos2 θm´ın ax /a β= m´ın /a 2zm´ ax

=

(10.330)

(10.331)

(10.332)

(10.333)

(10.334)

−ǫ cos θ0 cos θm´ın

Esto nos muestra que β es esencialmente la componente z del vector de Runge-Lenz: en coordenadas parabólicas depende sólo de variables de acción, pero en coordenadas esféricas depende además de variables angulares. Por otra parte, de (10.325) y (10.334) se tiene la siguiente expresión para cos θ1 en términos de γ, ǫ y cos θ0 , donde se ha llamado C a cos2 θmin : −C + ǫ2 (1 + C sen2 θ0 ) p C 2 − 2ǫ2 C(1 − 2 sen2 θ0 + C sen2 θ0 ) + ǫ4 (1 − C sen2 θ0 )2

(10.335)

Cuando la ´ orbita toca el eje z, sen θm´ın = 0. Entonces: cos θ1 =

−1 + 2ǫ2 − ǫ2 cos2 θ0 1 − ǫ2 cos2 θ0

(10.336)

esto nos permite llegar de (10.322), cuando γ = 0, al expresar a β, θ1 , ξ, η en funci´ on de las cantidades esféricas, a la f´ ormula (10.245). (10.322) es, pues, la ecuaci´ on de una elipse en el espacio expresada en coordenadas parabólicas (véase figura 10.12).

468 / Mec´ anica cl´ asica avanzada También de (10.334) y (10.325) se llega a una expresión para cos θ0 en términos de γ, β y cos θ1 . Las coordenadas ξ y η oscilan entre los l´ımites se˜ nalados por la ecuaci´ on (10.310). Cuando γ = 0, ξm´ın = ηm´ın = 0. Cuando β = 0, ξmáx = ηmáx y ξm´ın = ηm´ın . Cuando β = γ − 1, ξm´ın = ξmáx y cuando β = 1 − γ, ηm´ın = ηmáx . En general, la trayectoria est´ a confinada a una región en forma de anillo, definida por las paraboloides ξ = ξm´ın , ξ = ξmáx , η = ηm´ın , η = ηmáx . z

η = ηmín η = ηmáx

ξ = ξmáx ξ = ξmín

Figura 10.12 L´ımites del movimiento en coordenadas parab´ olicas En el caso β = 0, γ = 1, resulta que ηm´ın = ηmax = ξm´ın = ξmax = a/2 y por tanto el anillo queda reducido a una circunferencia de radio a colocada en el plano x − y. En este caso seg´ un (10.325) ǫ = 0, como debe ser. Cuando β = γ − 1 o β = −γ + 1, el movimiento sólo es posible a lo largo de curvas colocadas sobre la superficie de un casquete lateral. Las ´ orbitas compatibles con valores dados de E, β, γ se caracterizan por tener un vector de Runge-Lenz con componente z definida, por tener un momento angular con componente z definida y por tener un semieje mayor de longitud definida. El ensamble de ´ orbitas con valores de E, β, γ definidos no tienen una excentricidad definida, aunque la ecuaci´ on (10.325) fija el rango de excentricidades posibles. Puede mostrarse que Iβ /2 y θ1 son variables canónicamente conjugadas, en tanto que [Iϕ , θ1 ] = 0. Como de (10.287) se puede hallar que: 1 1 (Iϕ − Iβ ) = I(γ − β) (10.337) 2 2 se sigue que esencialmente Jz y θ1 son variables canónicamente conjugadas y que Jz es el generador infinitesimal de z, las rotaciones que dejan invariante la proyección del vector Jz =

La ecuaci´ on de Hamilton-Jacobi con variables acción-´ angulo / 469 de Laplace en el eje z. En una de estas rotaciones el valor de θ1 cambia y por ende el valor de ǫ. Por tanto las rotaciones generadas por Jz en el espacio de representación de O(4), no dejan r´ıgida la ´ orbita; θ1 no es un ángulo que especifique una orientación de una órbita r´ıgida, pues al variarse cambia necesariamente, o sea cambia el valor de l. Para precisar, asumamos que γ = 0. Entonces de (10.310) se sigue que ξm´ın = ηmin = 0, o sea que el anillo se convierte en una región llena, limitada por los paraboloides ξmax = a(1 + β) y ηmax = a(1 − β). Seg´ un la ecuaci´ on de la órbita (10.322) cuando η = ηm´ın , ξ vale: 1 ξ = (1 + β)(1 − cos θ1 ) (10.338) 2 cuando ξ = ξm´ın , η vale: 1 (10.339) η = (1 − β)(1 − cos θ1 ) 2 El punto de la ´ orbita (0, ξ) es x = 0, y = 0, r = z = ξ. El punto de la órbita (η, 0) es x = 0; y = 0, r = −z = η. En coordenadas esféricas estos puntos corresponden a las intersecciones de la ´ orbita vertical con el eje z, para los cuales: a(1 − ǫ2 ) (10.340) 1 ± ǫ cos θ0 expresión que se puede obtener de (10.338) y (10.339). ǫ y θ0 est´ an dados por: r 1 + β 2 + (1 − β 2 ) cos θ1 ǫ= (10.341) 2 s 2 (10.342) cos θ0 = −β 2 1 + β + (1 − β 2 ) cos θ1 r=

Cuando θ1 = 0, ǫ = 1 y cos θ0 = −β. Cuando β = 1, ǫ = 1 y cos θ0 = −1. Son dos casos de trayectoria rectil´ınea en un plano que pasa por el eje z. De (10.328) y (10.329) junto con (10.334) y (10.335) se siguen las relaciones entre las variables angulares y las anomal´ıas excéntricas: (2)

αξ = αξ + ψ − ψ (1) − π (1)

ϕr = −ϕξ − αξ (2)

(10.343) (10.344)

(1)

αξ = αξ + ψ (1) + π

(10.345)

La variable angular ϕϕ , est´ a dada por:

ϕϕ =

∂Σ = ϕ+ ∂Iϕ

Z

∂E m ∂K1 pϕ ∂pϕ m + − 2 ∂Iϕ ξ ∂Iϕ 4ξ ∂Iϕ q dξ 2 2 2mE − pϕ /(4ξ ) + 2mK1 /ξ

∂E m ∂K2 pϕ ∂pϕ Z m + − 2 ∂Iϕ η ∂Iϕ 4η ∂Iϕ + q dη 2 2 2mE − pϕ /(4η ) + 2mK2 /η

(10.346)

470 / Mec´ anica cl´ asica avanzada usando (10.305), (10.306) y (10.307) obtenemos: ϕϕ =

1 ϕ + (ϕξ + ϕη ) 2 Z dξ 1 q − pϕ 4 ξ 2mEξ 2 + 2mK1 ξ − p2ϕ /4

1 − pϕ 4

Z

(10.347)

dη q 2 η 2mEη + 2mK2 η − p2ϕ /4

calculando las integrales con la fórmula 14.283 del manual de Spiegel y expresando todas las constantes de movimiento en funci´ on de a, β y γ, hallamos:

ϕϕ =

1 1 ϕ + (ϕξ + ϕη ) − sen−1 2 2

2ξ γ2 − a 1+β s 2ξ γ2 1− a (1 + β)2 (10.348)

1 − sen−1 2

γ2 2η − a 1−β s 2η γ2 1− a (1 − β)2

debido a la degeneración se cumple que: 1 (ϕξ + ϕη ) = ωt + Constante 2

(10.349)

Por tanto podemos definir una nueva constante de movimiento que depende de las variables angulares y que debe su car´ acter de constante a la degeneración: 1 ϕ1 = ϕϕ − (ϕξ + ϕη ) 2

(10.350)

Cuando γ = 0, el plano de la órbita se corta perpendicularmente con el plano x − y en la l´ınea de nodos. En este caso ϕ vale ϕ1 ; luego ϕ1 es el ángulo que hace la l´ınea de intersección del plano de la órbita con el plano ecuatorial 9 . Cuando z = 0, ξ = η, y además ξ = ξmax , se cumple que ϕ = ϕ1 . Entonces ϕ1 es el ´ angulo de la l´ınea de nodos de aquella elipse que pasa por ξmax en el plano ecuatorial, para otros valores de ξ esto no se cumple. Ejemplo 10.5.1 Hallar la expansi´ on de Fourier para z y x + iy, en coordenadas parabólicas. Véase en Max Born The mechanics of the atom, secci´ on 36. 9 N´ otese

que (10.347) y (10.348) no son id´ enticas, pues las integrales indefinidas contienen constantes que se han omitido en (10.348)

La ecuaci´ on de Hamilton-Jacobi con variables acción-´ angulo / 471 De (10.326) y (10.317) se sigue que z depende de las variables angulares ϕξ y ϕη . De (10.317) vemos que αξ no es funci´ on par ni impar de ϕξ y que αη no es funci´ on par ni impar de ϕη . Por tanto la expansi´ on de fourier de z contiene la forma sen nξ ϕξ y cos nξ ϕξ y similarmente para la dependencia respecto a ϕη . Por esto es más conveniente la siguiente expansi´ on: z=

∞ X

∞ X

Anξ nη ei(nξ ϕξ +nη ϕη )

(10.351)

nξ =−∞ nη =−∞

como z = ξ − η, los coeficientes de Fourier son: Z 2π Z 2π 1 Anξ nη = (ξ − η)e−i(nξ ϕξ +nη ϕη ) dϕξ dϕη 4π 2 0 0

(10.352)

De (10.318), (10.319) se sigue que: p 1h 2 − (1 + β)2 − γ 2 sen αξ 2 i p − (1 − β)2 − γ 2 sen αη dαξ dαη

dϕξ dϕη

=

(10.353)

Reemplazando a (10.326) en (10.352), obtenemos: 1 4π 2

A00 =

Z

2π

0

Z

2π

0

h 1p (1 + β)2 − γ 2 sen αξ a β− 2

i 1p (1 − β)2 − γ 2 sen αη 2 p 1h × 2 − (1 + β)2 − γ 2 sen αξ 2 i p 3 − (1 − β)2 − γ 2 sen αη dαξ dαη = βa 2 +

(10.354)

En los coeficientes donde nξ y nη no son ambos cero, el término constante β en z se puede omitir, pues desaparece al efectuar la integral, seg´ un se ve en (10.352) directamente. Entonces, usando una notaci´ on obvia y una propiedad de los l´ımites de integraci´ on en (10.352): Anξ nη =

a 4π 2

Z

3π/2

−π/2

Z

3π/2

(−S sen αξ + R sen αη )

−π/2

(1 − S sen αξ − R sen αη )

(10.355)

×einξ (αξ +S

cos αξ +R cos αη )

e+inη (αη +S

cos αξ +R cos αη )

dαξ dαη

472 / Mec´ anica cl´ asica avanzada si llamamos n = nξ +nη , y expresamos las funciones sen αξ y sen αη en forma exponencial, obtenemos: −a 16π 2

Anξ nη =

Z

3π/2

−π/2

Z

3π/2

−π/2

(2R2 − 2S 2 − 2iSeiαξ + 2iSe−iαξ

+2iReiαη − 2iRe−iαη + S 2 ei2αξ

(10.356)

−R2 ei2αη + S 2 e−i2αξ − R2 e−i2αη ) ×einξ αξ +inS

cos αξ +inη αη +inR cos αη

dαξ dαη

Al sustituir αξ → 3π/2 − αξ y αη → 3π/2 − αη , cada una de las integrales resulta proporcional a una integral de la forma: 1 2π

Z

3π/2

eikα+ix cos α dα =

−π/2

=

ei3k/2 2π

Z

2π

e−ikα−ix sen α dα

0

eikπ/2 Jk (x)

(10.357)

donde Jk (x) es la funci´ on de Bessel entera de orden k. Expresando a (10.356) en términos de Jk y haciendo uso de las siguientes propiedades de las funciones Bessel: Jk−1 (x) + Jk+1 (x) =

2k Jk (x) x

Jk−1 (x) − Jk+1 (x) = 2Jk′ (x)

(10.358) (10.359)

obtenemos: Anξ nη = ei nπ/2

i ah RJnξ (nR)Jn′ η (nR) − SJnη (nR)Jn′ ξ (nS) n

(10.360)

Por tanto, la expansi´ on de Fouurier para z es: z=

3 βa 2 +a

nξ

×e

∞ i i nπ/2 h X ′ e RJnξ (nS)Jn′ η (nR) − SJnη (nR)Jn′ ξ (nS) n =−∞ n =−∞

∞ X

η

(nξ ϕξ +nη ϕη )

(10.361)

donde la prima en la sumatoria indica que se excluye el término nξ = nη = 0. Cuando nξ + nη = 0 no hay inconveniente porque Anξ nξ se anula. Para hacer la expansi´ on de x + iy, notemos que seg´ un (10.290): p x + iy = 2 ξηeiϕ

(10.362)

La ecuaci´ on de Hamilton-Jacobi con variables acción-´ angulo / 473 Reemplazando a (10.320) y (10.321) en (10.348) obtenemos: 1 ϕϕ = ϕ + (ϕξ + ϕη ) 2 p (1 + β 2 ) − γ 2 − (1 + β) sen αξ 1 p − sen−1 2 1 + β − (1 + β)2 − γ 2 sen αξ p (1 − β)2 − γ 2 − (1 − β) sen αη 1 −1 p − sen 2 1 − β − (1 − β)2 − γ 2 sen αη

(10.363)

√ Luego usamos la f´ ormula sen−1 x = i ln(−ix + 1 − x2 ) y notamos que en el numerador del argumento se puede formar un cuadrado perfecto para llegar a: 1 ϕϕ = ϕ + (ϕξ + ϕη ) 2 h αξ p α i2 2 ) − γ 2 + iγ cos ξ (1 + β) sen − (1 + β 1 2 2 − i ln p 2 C 1 + β − (1 + β)2 − γ 2 sen αξ h αη i2 αη p − (1 − β)2 − γ 2 + iγ cos (1 − β) sen 2 2 × p 1 − β − (1 − β)2 − γ 2 sen αη

C es una constante que depende de β y γ. Notemos que: p p (x + iy)ei(ϕη −ϕϕ ) = 2 ξη ei(ϕ+ϕη −ϕϕ ) = 2 ξηei(ϕη −ϕϕ )/2 h αξ i αξ p (1 + β 2 ) − γ 2 + iγ cos × (1 + β) sen − 2 2 h αη i αη p (1 − β)2 − γ 2 + iγ cos × (1 − β) sen − 2 2

(10.364)

(10.365)

y seg´ un (10.364),

a (x + iy)ei(ϕη −ϕϕ ) = √ ei(ϕη −ϕξ )/2 C h αξ i αξ p (1 + β)2 − γ 2 + iγ cos × (1 + β) sen − 2 2 h αη i αη p 2 2 (1 − β) − γ + iγ cos × (1 − β) sen − 2 2

(10.366)

Cuando αξ = αη = 0 entonces r = ξ + η = a. Por tanto, salvo un factor de fase constante, el valor de C es 1 − β 2 . Born presenta en lugar de (10.366) una expresión que se origina en sus fórmulas (17) de la secci´ on 36. 10 Esto da lugar a una expansi´ on de Fourier con valores erróneos para los coeficientes. 10 Comparar

dichas f´ ormulas con las f´ ormulas 15.45 y 14.360 del manual de Spiegel.

474 / Mec´ anica cl´ asica avanzada La expansi´ on de Fourier de (10.366) la escribimos como: (x + iy)ei(ϕη −ϕϕ ) =

∞ X

∞ X

Bnξ nη einξ ϕξ +(nη +1)ϕη

(10.367)

nξ =−∞ nη =−∞

a dado por: El coeficiente Bnξ nη est´ Bnξ nη =

a p 4π 2 1 − β 2

Z

3π/2 Z 3π/2

−π/2

−π/2

(1 − S sen αξ − R sen αη )

h αξ i αξ − (2S + iγ) cos × (1 + β) sen 2 2 h αη i αη − (2R + iγ) cos (1 − β) sen 2 2 ×ei(nξ +1/2)αξ +i(nη +1/2)αη +inS

cos αξ +inR cos αη

(10.368)

dαξ dαη

donde n = nξ + nη + 1. Al expresar las funciones trigonométricas en forma exponencial, las integrales que aparecen son del tipo de (10.357). En las simplificaciones debe usarse (10.358). El resultado para n 6= 0 es: Bnξ nη = AJnξ +1 (nS) Jnη +1 (nR) + BJnξ (nS) Jnη (nR) ×

ei(n+1)π/2 n

(10.369)

donde A y B est´ an dados por: a A= p (1 + β + γ − 2iS)(1 − β + γ − 2iR) 4 1 − β2

a B= p (−1 − β + γ − 2iS)(−1 + β + γ − 2iR) 4 1 − β2

(10.370) (10.371)

Para n = 0, las integrales en (10.368) son de tipo exponencial y son diferentes de cero solamente cuando nξ = −1 y nη = 0 o nξ = 0 y nη = −1 ai (2ixy ′ − Syy ′ + Rxx′ ) B−1,0 = p 8 1 − β2

donde:

ai (2iyx′ − Ryy ′ + Sxx′ ) B0,−1 = p 8 1 − β2 x = 1 + β + γ − 2iS ;

y = −1 + β + γ − 2iS

y x′ y y ′ se obtienen de éstas reemplazando a β por −β.

(10.372)

(10.373)

(10.374)

La ecuaci´ on de Hamilton-Jacobi con variables acción-´ angulo / 475 En definitiva: x + iy = B−1,0 e−iϕξ +iϕϕ + B0,−1 e−iϕη +iϕϕ +

∞ X

∞ X

′

Bnξ nη einξ ϕξ +inη ϕη +iϕϕ

(10.375)

nξ =−∞nη =−∞

donde la prima en la sumatoria indica que n no es cero. Este c´ alculo fue usado en el contexto de la vieja mecánica cuántica para hallar las intensidades de las l´ıneas espectrales del hidrógeno en presencia de un campo eléctrico (efecto Stark). En presencia de un campo eléctrico el problema del átomo de hidrógeno clásico es soluble en coordenadas parabólicas, y cuando el campo eléctrico es muy débil la solución que hemos hallado en este numeral constituye la aproximación cero a este sistema. Para hallar las intensidades se aplica la fórmula (10.225), del ejemplo 10.4.1. Notamos que habr´ an dos contribuciones diferentes; una proveniente de z 2 , fórmula (10.361) y otra proveniente de x2 +y 2 , fórmula (10.375). Para las componentes de Fourier de z, nϕ = 0 y nξ + nη = n. Las amplitudes de las componentes z corresponden a la radiaci´ on polarizada paralelamente al campo eléctrico homogéneo. Para las componentes de Fourier de x ± iy, nϕ = ±1 y nξ + nη + 1 = n. Las amplitudes de las componentes x + iy corresponden a la radiaci´ on polarizada perpendicularmente al campo eléctrico homogéneo. Born presenta el análisis que hace Kramers del desdoblamiento de Stark de la l´ınea Hα del hidrógeno, o sea de las transiciones entre los niveles de n´ umeros cuánticos principales 2 y 3. Ejemplo 10.5.2 Analizar las reglas de selecci´ on que se deducen de las expansiones de Fourier (10.269), (10.272), (10.359) y (10.368). En la vieja teor´ıa cuántica y en el l´ımite clásico de la moderna teor´ıa cuántica las variables de acción est´ an cuantizadas. As´ı, para el átomo de hidrógeno tenemos: 11 1 1 h ; Iθ = l − m + ¯ ¯h ; Iϕ = m¯h Ir = nr + 2 2 |m| − m 1 Iξ = n1 + (10.376) + ¯h ; 2 2 Iη =

|m| − m 1 ¯h ; I = m¯h + n2 + 2 2

El n´ umero cuántico principal est´ a asociado a I = Ir + Iθ + Iϕ = Iξ + Iη + Iϕ y vale nr + l + 1 = n1 + n2 + |m| + 1. As´ı por ejemplo, los estados esféricos y parabólicos para cuando el n´ umero cuántico principal vale 2 son: n, l, m = 2, 0, 0; 2, 1, −1; 2, 1, 0; 2, 1, 1 n1 , n2 , m = 0, 0, 1; 0, 1, 0; 1, 0, 0; 0, 0, −1 11 Esta

versi´ on de las reglas de cuantizaci´ on es consistente con la moderna teor´ıa cu´ antica.

(10.377)

476 / Mec´ anica cl´ asica avanzada Los n´ umeros enteros que aparecen en las expansiones de Fourier (10.361) y (10.375) del problema anterior corresponden a las transiciones entre estados (véase Mec´ anica cu´ antica de Laudau, secci´ on 48). As´ı, en (10.361), nϕ = ∆m = 0 y en (10.375), nϕ = ∆m = 1 y en la compleja conjugada de (10.375), nϕ = ∆m = −1. En esta forma el desarrollo de Fourier del momento de dipolo eléctrico da las reglas de selecci´ on clásicas: respecto a n1 y n2 la regla de selecci´ on es ∆n1 + ∆n2 + 1 = nξ + nη + 1 6= 0, (∆n1 = 0, ∆n2 = −1), o (∆n1 = −1, ∆n2 = 0). Respecto a l y m, de (10.269) y (10.271) se sigue que nθ + nϕ = ±1. Por otra parte, de (10.351) se sigue: ∆l − ∆m = nθ

(10.378)

Entonces vemos que cuando nϕ = ∆m = ±1, nθ = ∆l ∓ 1 y cuando nϕ = ∆m = 0, nθ = ∆l. Cuando, de acuerdo con (10.273), nθ = ∓2 y nϕ = ±1, nθ + nϕ = ∓1. Se sigue entonces que ∆l = ±1 cuando nθ = ±2, nϕ = ∓1, y ∆l = 0 cuando nθ = 0, nϕ = 0, o cuando nθ = ∓1, nϕ = ±1. En conclusi´ on, del desarrollo de Fourier de ~r en coordenadas esféricas se sigue que: ∆l = 0, ±1

y

∆m = 0, ±1

(10.379)

lo cual es consistente con la mecánica cuántica. En todas las expansiones de Fourier que hemos hallado, ejemplos 10.4.1, 10.4.2 y 10.5.1, se cumple que los coeficientes de Fourier se corresponden con elementos de matriz cuánticos en el l´ımite clásico (véase, Landau, Mec´ anica cu´ antica, secci´ on 48). Para detalles acerca de las reglas de cuantización semicl´ asicas véase el art´ıculo de I.C. Percival y las referencias all´ı contenidas.12 , y la secci´ on 13.4 del cap´ıtulo 13 del presente texto. El toroide invariante. En coordenadas esféricas es tridimensional y consiste en el lugar geométrico de los puntos del espacio fásico tales que Ir , Iθ , Iϕ tienen valores bien definidos. A partir de la figura 10.11 podemos hallar fácilmente algunas proyecciones del toroide invariante sobre planos del espacio de configuración. La proyección del toroide sobre el plano de la ´ orbita a lo largo de la l´ınea ϕ0 = Constante y θ0 = Constante es una elipse. ϕ0 = Constante define sobre el toroide una superficie bidimensional, cuya proyecci´ on sobre el plano de la órbita es una región circular que se obtiene rotando la elipse alrededor del eje z. θ0 = Constante define sobre el toroide una superficie bidimensional cuya proyección sobre el plano ecuatorial es una región circular que se obtiene rotando la proyección de la elipse sobre el plano x − y alrededor del eje z; esta proyección es un c´ırculo de radio rmax . La proyección del toroide sobre el espacio tridimensional es el volumen obtenido al rotar el c´ırculo del plano x − y, de radio rmax , alrededor del eje z, y es un elipsoide de revoluci´ on con ejes de longitudes rmax y rmax cos θm´ın es claro que ambas dimensiones de este elipsoide dependen de las constantes de movimiento E, l, lz . En coordenadas parabólicas el toroide invariante es completamente diferente (véase figura 10.13). La excentricidad de la órbita depende de las variables angulares a través de θ1 . 12 Semiclassical

theory of Bound States. I.C. Percival. Adv. Chem. Phys. Vol. 36, 1977.

La ecuaci´ on de Hamilton-Jacobi con variables acción-´ angulo / 477 Seg´ un (10.325), en el toroide en coordenadas parabólicas son posibles elipses de excentricidades diferentes dentro de un rango definido, que para γ = 0 var´ıan entre β y 1. También para γ = 0, cos θ0 var´ıa entre −1 y −β. Entonces, para θ1 = 0 la trayectoria es rectil´ınea que hace un ´ angulo cos−1 (β) con respecto al eje z y para θ1 = π es una elipse de excentricidad β cuyo perihelio est´ a en π. Al barrer θ1 entre 0 y π genera un ensamble de ´ orbitas el´ıpticas con perihelio en el tercer cuadrante y envueltas por las par´ abolas ξmax y ηmax . La rotación de esta región alrededor de z genera la proyección del toroide invariante sobre el espacio tridimensional, que es diferente de la proyección en coordenadas esféricas. z η = (1 – β) a

θ1 = π

θ1 = 0

ξ = (1 – β) a

x

Figura 10.13 Toroide invariante en coordenadas parab´ olicas


11 Teor´ıa de perturbaciones

Son muy pocos los problemas mecánicos que poseen soluciones anal´ıticas exactas. Por eso son necesarios diferentes métodos de aproximación para afrontar la mayor parte de los problemas realistas. En astronom´ıa, donde se consideran sistemas de muchos cuerpos interactuando gravitacionalmente, son indispensables los métodos numéricos y los aproximados, para obtener los cambios en los par´ ametros de una órbita kepleriana o en los per´ıodos, causados por peque˜ nos efectos debidos a la presencia de los otros planetas. En el siglo XIX hubo gran interés en el problema de la estabilidad del sistema solar, que llev´ o al estudio del movimiento de muchos cuerpos interactuando entre s´ı mediante fuerzas gravitacionales, siendo el más simple el famoso problema de los tres cuerpos, tema que a´ un es objeto de investigaciones. Los avances han sido notables, en parte como consecuencia de los trabajos matemáticos de Kolmogorov, Arnold y Moser, quienes han obtenido las condiciones de estabilidad de un sistema m´ ultiplemente periódico. Antes del surgimiento de la moderna teor´ıa cuántica, la teor´ıa clásica de perturbaciones fue muy aplicada a sistemas atómicos, especialmente para el c´ alculo de efectos debidos a la interacci´ on con campos electromagnéticos. Es notable el trabajo de Max Born (noviembre de 1924).1 Esos esfuerzos no fueron estériles ni in´ utiles, pues dieron lugar a la teor´ıa de perturbaciones de la mecánica cuántica. Hoy esos estudios se aplican con pocas variaciones a c´ alculos sobre la estructura vibracional en sistemas moleculares, y al análisis de los ´ atomos en estados altamente excitados. La teor´ıa cl´ asica de perturbaciones con sus modernos desarrollos se aplica en campos tan dis´ımiles como la f´ısica de las altas energ´ıas (estabilidad de haces en un ciclotr´ on, estabilidad del plasma en una máquina Tokamak, etc.), y la óptica (estabilidad de una cavidad láser, propagación de la radiaci´ on láser en una fibra óptica, comportamientos multiestables y caóticos en ´ optica cuántica, etc.), por ejemplo.

1 V´ ease

el texto The mechanics of the atom de Max Born.

479


11.1.

Teor´ıa de perturbaciones dependiente del tiempo

En los problemas perturbativos el punto de partida es un sistema para el cual es conocida la solución anal´ıtica exacta, que se denomina no perturbado, descrito por un hamiltoniano H0 (p, q). El sistema de interés difiere del no perturbado por una peque˜ na perturbación. Puede asumirse que la magnitud de la perturbación est´ a determinada por cierto par´ ametro que cuando vale cero hace que el hamiltoniano sea igual a H0 . Entonces el hamiltoniano exacto admite la siguiente expansi´ on en serie de potencias de λ: H(q, p, t; λ) = H0 (q, p, t) + λH1 (q, p, t) + λ2 H2 (q, p, t) + ...

(11.1)

Por simplicidad denotaremos todos los términos de perturbación con H ′ , H = H0 + H ′ . La teor´ıa dependiente del tiempo se caracteriza por encontrar mediante aproximaciones la funci´ on generatriz de la transformaci´ on canónica de evoluci´ on temporal que satisface la ecuaci´ on de Hamilton-Jacobi dependiente del tiempo. La transformaci´ on se realiza en dos pasos: F (q, q0 , t) = F0 (q, q ′ , t) + F ′ (q ′ , q0 , t)

(11.2)

donde F0 conecta las variables (q, p) con las (q ′ , p′ ) y es una solución completa de la ecuaci´ on de Hamilton-Jacobi dependiente del tiempo del problema no perturbado, o sea que en ausencia de perturbación las (q ′ , p′ ) son constantes. Al aplicar la perturbación, las (q ′ , p′ ) no serán constantes sino funciones que var´ıan lentamente con el tiempo, si λ es peque˜ na. F ′ conecta las variables (q ′ , p′ ) con las constantes (q0 , p0 ) del problema perturbado. Al realizar la transformaci´ on (q, p) → (q ′ , p′ ), el hamiltoniano será H + ′ ′ ∂F0 /∂t = H0 + H + ∂F0 /∂t = H , pues por hipótesis H0 + ∂F0 /∂t = 0, y las ecuaciones de movimiento serán: q˙ν′ =

∂H ′ ; ∂p′ν

p˙ ′ν = −

∂H ′ ∂qν′

(11.3)

Estas ecuaciones son rigurosas pues a´ un no se ha hecho ninguna aproximación, pero usando la peque˜ nez de H ′ podemos adoptar un esquema de aproximaciones sucesivas. Cuando λ = 0, (q ′ , p′ ) son ciertas constantes que llamaremos (q0′ , p′0 ). Entonces al reemplazar (q ′ , p′ ) en (11.3) al lado derecho por sus valores no perturbados obtenemos: q˙ν′ 1 =

∂H ′ (q0′ , p′0 ) ; ∂p′ν0

p˙′ν1 = −

∂H ′ (q0′ , p′0 ) ∂qν′ 0

(11.4)

donde (q1′ , p′1 ) son las soluciones de (11.3) al primer orden en λ. Las ecuaciones (11.4) pueden ahora integrarse expl´ıcitamente para darnos a (q1′ , p′1 ) en funci´ on del tiempo, al primer orden en la perturbación. La corrección de segundo orden se halla usando la solución de primer orden en el lado derecho de (11.3), y as´ı sucesivamente. Podemos encontrar sistem´ aticamente las correcciones a cualquier orden de aproximaci´ on escribiendo en vez de (11.2) una expansi´ on de F en potencias de λ: F (q, q, t) = F (0) (q, q, t) + λF (1) (q, q, t) + λ2 F (2) (q, q, t) + ...

(11.5)

Teor´ıa de perturbaciones / 481 Las funciones F (n) no pueden considerarse como funciones generatrices de una serie de transformaciones can´ onicas, como F0 y F ′ , por la disposición de los argumentos. Se cumple que H(q, p, t) = H(q, p, t) + ∂F/∂t. Entonces: H(q, −∂F/∂q, t) = H(q, ∂F/∂q, t) + ∂F/∂t

(11.6)

Ahora expandimos los dos lados de (11.6) en potencias de λ usando (11.5) y, H = H0 + λH1 + λ2 H2 + ...

(11.7)

La expansi´ on de H0 es: ∂F ∂F (0) ∂H0 ∂F (1) H0 q, , t = H0 q, ,t + λ · ∂q ∂q ∂~p ∂~q (1) (2) 2 1 ∂F ∂ H0 ∂F (1) ∂H0 ∂F 2 + ... · + · · +λ ∂~ p ∂~q 2 ∂~q ∂~p∂~q ∂~q La expansi´ on de H1 es: ∂F (0) ∂F ∂H1 ∂F (1) , t = λH1 q, , t + λ2 · + ... λH1 q, ∂q ∂q ∂~p ∂~q

(11.8)

(11.9)

Esto nos conduce a: H = H0 +

+λ2

h i ∂F (1) ∂F (0) + λ F (1) , H0 + H1 + ∂t ∂t

F (2) , H0 + F (1) , H1

ii h 1h ∂F (2) + F (1) , F (1) , H0 + H2 + 2 ∂t

(11.10) !

+ ...

Si H = 0, entonces F es la solución de la ecuaci´ on de Hamilton-Jacobi del problema exacto. Podemos hallar las aproximaciones sucesivas igualando a cero los coeficientes de cada λn : H0 + h

h

∂F (0) =0 ∂t

i ∂F (1) = −H1 F (1) , H0 + ∂t

i ∂F (2) ii i 1h h h F (2) , H0 + F (1) , F (1) , H0 − H2 = − F (1) , H1 − ∂t 2

(11.11) (11.12) (11.13)

Las ecuaciones (11.11) y (11.12) forman un conjunto de ecuaciones diferenciales para las F (n) , que se caracteriza porque en cada ecuaci´ on el lado derecho depende sólo de cantidades que se han evaluado en una aproximación anterior.


11.2.

Teor´ıa de perturbaciones independiente del tiempo

Esta teor´ıa se aplica fundamentalmente a sistemas conservativos y ligados que poseen soluciones m´ ultiplemente periódicas. El punto de partida es la descripción del sistema no perturbado en términos de las variables acción-´ angulo. Luego se adopta un esquema de aproximaciones sucesivas a las variables acción-´ angulo del sistema perturbado. Est´ a impl´ıcita la suposición de convergencia del procedimiento, o sea la existencia de toroides invariantes del sistema perturbado; en general lo anterior no es cierto. El método se basa en hallar una expansi´ on en potencias de λ para la funci´ on generatriz de la transformaci´ on can´ onica que lleva a las variables acción-´ angulo del sistema perturbado. Se supone conocida la solución para el sistema no perturbado y que éste es no degenerado. Es decir, que no existen n´ umeros enteros n1 , n2 , ...nl tales que: n1 ω10 + n2 ω20 + ...nl ωl0 = 0

(11.14)

donde las ων0 son las frecuencias del sistema no perturbado, y que esta condición se cumple para cualquier conjunto de valores de las variables acción-ángulo no perturbadas. Las variables canónicas (I 0 , ϕ0 ) son variables acción-´ angulo sólo para el sistema no perturbado; al aplicar la perturbación siguen siendo canónicas pero dejan de ser variables acción-´ angulo. Esto se sigue de las ecuaciones de movimiento: ∂H I˙ν0 = − 0 ; ∂ϕν

ϕ˙ 0ν =

∂H ∂Iν0

(11.15)

Las Iν0 dependen del tiempo y las ϕ0ν no son funciones lineales del tiempo. Para λ = 0, H = H0 y en ese caso se cumple que H0 sólo es funci´ on de las Iν0 . H, sin embargo, tiene la expresión: H(I 0 , ϕ0 , t) = H0 (I 0 ) + λH1 (I 0 , ϕ0 , t) + λ2 H2 (I 0 , ϕ0 , t) + ...

(11.16)

Mediante una transformaci´ on canónica es posible, si el sistema perturbado es integrable, pasar a unas variables canónicas (I, ϕ) tales que H sea funci´ on sólo de las Iν .2 0 Llamaremos F (ϕ , I) a la funci´ on generatriz de esa transformaci´ on, del tipo F2 . Las siguientes son las f´ ormulas de transformaci´ on: Iν0 =

∂F ; ∂ϕ0ν

ϕν =

∂F ∂Iν

(11.17)

Las nuevas variables deben satisfacer las siguientes condiciones: (a) Las coordenadas del sistema (q, p) deben ser funciones periódicas de las ϕν con per´ıodo 2π. (b) H debe transformarse en una funci´ on que depende sólo de las Iν . (c) Las variables (ϕ0 , I 0 ) han de ser funciones periódicas de las ϕν con per´ıodo 2π. Las coordenadas (q, p) son funciones periódicas tanto de las ϕ0ν como de las ϕν . Esto implica que una celdilla fundamental en el espacio ϕ0ν se transforma en otra del espacio ϕν . Entonces debe cumplirse que ϕν es igual a ϕ0ν más una funci´ on periódica de las ϕ0ν con per´ıodo 2π. 2 Esta

teor´ıa fue desarrollada por H. Poincar´ e (1892) y H. von Zeipel (1916).

Teor´ıa de perturbaciones / 483 La funci´ on F (ϕ0 , I) puede expandirse en una serie de potencias de λ. Cuando λ = 0, F se convierte en la funci´ on generatriz de la transformaci´ on canónica identidad, de ah´ı que deba ser del tipo F2 : F (ϕ0 , I) =

l X

ϕ0ν Iν + λF (1) (ϕ0 , I) + λ2 F (2) (ϕ0 , I) + ...

(11.18)

ν=1

Entonces (11.16) y (11.18) nos conducen a: Iν0 = Iν + λ

(2) ∂F (1) 2 ∂F + λ + ... ∂ϕ0ν ∂ϕ0ν

ϕν = ϕ0ν + λ

(11.19)

∂F (1) ∂F (2) + λ2 + ... ∂Iν ∂Iν

(11.20)

F (1) , F (2) , ... deben ser funciones periódicas de las ϕ0ν con per´ıodo 2π. La ecuaci´ on de Hamilton-Jacobi del problema perturbado es: ∂F 0 ∂F 0 ∂F 2 + λH1 ϕ , + λ H2 ϕ , + ... = H(I) H0 ∂ϕ0 ∂ϕ0 ∂ϕ0

(11.21)

Ahora reemplazamos (11.19) en (11.21) y expandimos cada término de (11.21) en potencias de λ. Llamamos λn H (n) (I) al n-ésimo término de la expansi´ on de H(I). En seguida igualamos los coeficientes de cada λn y obtenemos una secuencia de ecuaciones diferenciales, as´ı: H0 (I) = H (0) (I)

(11.22)

X ∂H0

(11.23)

ν

∂Iν

·

∂F (1) + H1 (ϕ0 , I) = H (1) (I) ∂ϕ0ν

1 X X ∂ 2 H0 ∂F (1) ∂F (1) X ∂H0 ∂F (2) · · · + 2 µ ν ∂Iν ∂Iµ ∂ϕ0ν ∂ϕ0µ ∂Iν ∂ϕ0ν ν +

X ∂H1 ∂F (1) · + H2 (ϕ0 , I) = H (2) (I) 0 ∂I ∂ϕ ν ν ν

(11.24)

.................................... n−1 X n−s X

l X

X

s=0 k=1 ν1 ,ν2 ,...νk =1 i1 +i2 +...ik (i2 )

·

1 ∂ k Hs ∂F (i1 ) · k! ∂Iν1 ∂Iν2 ...∂Iνk ∂ϕ0ν1 =s

(ik )

∂F ∂F ... + Hn (ϕ0 , I) = H (n) (I) ; ∂ϕ0ν2 ∂ϕ0νk

n = 0, 1, 2, ...

(11.25)

484 / Mec´ anica cl´ asica avanzada Todas estas ecuaciones son de la forma: l X ∂H0 ∂F (n) · + Φn (ϕ0 , I) = H (n) (I) 0 ∂I ∂ϕ ν ν ν=1

(11.26)

donde Φn es una funci´ on que depende sólo de F (1) , F (2) , ...F (n−1) . La ecuaci´ on (11.23) permite determinar a la vez a H (1) (I) y a F (1) . Como F (1) es funci´ on periódica de las ϕ0ν , el valor medio de (11.23) sobre una celdilla fundamental en el espacio de las ϕ0ν , o sea sobre el toroide invariante del movimiento no perturbado, es cero. Por tanto: H (1) (I) = hH1 (ϕ0 , I)i donde h(...)i denota: 1 (2π)l

h(...)i =

Z

2π 0

dϕ01

(11.27) Z

0

2π

dϕ02 ...

Z

0

2π

dϕ0l (...)

(11.28)

La energ´ıa del movimiento perturbado es, en la primera aproximación, igual a la energ´ıa del movimiento no perturbado más una corrección dada por el promedio de la funci´ on de perturbación sobre el toroide invariante del movimiento no perturbado. Este promedio, cuando se cumpla la hipótesis erg´ odica, también es igual al promedio temporal de H1 sobre el movimiento no perturbado. Para calcular a F (1) , es necesario resolver la ecuaci´ on diferencial: l X ∂H0 ∂F (1) . = − H1 (ϕ0 , I) 0 ∂I ∂ϕ ν ν ν=1

(11.29)

donde el signo {H1 } denota la parte oscilante de H1 , o sea la diferencia H1 − hH1 i, que puede representarse por una serie de Fourier de la forma: XX X 0 0 0 ′ An1 n2 ...nl (I)ei(n1 ϕ1 +n2 ϕ2 +...nl ϕl ) (11.30) ... {H} = n1

n2

nl

donde la tilde en la sumatoria denota la omisión del término con n1 = n2 = ...nl = 0. F (1) tiene una expansi´ on similar: XX X 0 0 0 ′ F (1) = ... Bn1 n2 ...nl (I)ei(n1 ϕ1 +n2 ϕ2 +...nl ϕl ) (11.31) n1

n2

nl

Los coeficientes de Fourier de F (1) se obtienen directamente de los de {H1 } al reemplazar a (11.30) y (11.31) en (11.29): B~n (I) =

−A~n (I) i~n · ~ ω 0 (I)

(11.32)

En la aproximación de primer orden se sigue de (11.20): ϕν = ϕ0ν + λ

∂F (1) (ϕ0 , I) ∂Iν

(11.33)

Teor´ıa de perturbaciones / 485 lo cual nos dice que las variables angulares perturbadas presentan peque˜ nas oscilaciones con amplitud del orden de λ. El cambio en las frecuencias se obtiene de: ων0 (I) =

∂H(I) ∂H (1) (I) = ων0 (I) + λ ∂Iν ∂Iν

(11.34)

y resulta ser peque˜ no. De (11.19) se obtiene para las Iν0 : Iν = Iν + λ

∂F (1) (ϕ0 , I) ∂ϕ0ν

(11.35)

lo cual muestra que las Iν0 que en el movimiento no perturbado son constantes, ahora est´ an sometidas a oscilaciones de amplitud del orden de λ. Que no haya degeneraci´ on es una exigencia necesaria para que (11.32) tenga sentido. As´ı no haya degeneraci´ on pueden presentarse los llamados peque˜ nos divisores, o sea valores de n1 , n2 , ...nl tales que ~n · ~ω 0 toma valores peque˜ nos. De (11.24) se sigue que la parte oscilante en el lado izquierdo debe anularse, lo cual nos da una ecuaci´ on diferencial para F (2) : ∂F (1) ∂F (1) 1 X X ∂ 2 H0 · · 2 µ ν ∂Iν ∂Iµ ∂ϕ0ν ∂ϕµ (11.36) X ∂H0 ∂F (2) X ∂H1 ∂F (1) + H2 (ϕ0 , I) = 0 + · + 0 0 ∂I ∂ϕ ∂I ∂ϕ ν ν ν ν ν ν En tanto que la corrección de segundo orden a la energ´ıa viene dada por: X ∂H1 ∂F (1) 0 H2 (I) = hH2 (ϕ , I)i + · ∂Iν ∂ϕ0ν ν 1 X X ∂ 2 H0 + 2 µ ν ∂Iµ ∂Iν

∂F (1) ∂F (1) · ∂ϕ0µ ∂ϕ0ν

(11.37)

Podemos ahora usar (11.31) y (11.32) en (11.37) para obtener: H (2) = hH2 i −

l X X n nν A−~ n ′ ∂A~ 0 ∂I ~ n · ω ~ ν ν=1 ~ n

+

l l 1 X X ∂ωµ0 X ′ A~n A−~n nν nµ 2 µ=1 ν=1 ∂Iν (~n · ~ω 0 )2

(11.38)

~ n

donde se ha usado la f´ ormula: ~ hei(~n+m) · ϕi = δ~n,−m ~

(11.39)

486 / Mec´ anica cl´ asica avanzada H (2) puede también escribirse en la forma: H (2) = hH2 i −

l |A~n |2 ∂ 1 X′ X nν 2 ∂Iν ~n · ω ~0 ν=1

(11.40)

~ n

que equivale también a: H

(2)

= hH2 i −

l X X

~ n·~ ω 0 >0

∂ nν ∂Iν ν=1

|A~n |2 ~n · ~ω 0

(11.41)

Para la corrección de orden n, se sigue de (11.26) que: H (n) (I) = hΦn (ϕ0 , I)i

(11.42)

en tanto que F (n) es solución de la ecuaci´ on: l X

ων0

ν=1

∂F (n) = − {Φn } ∂ϕ0ν

Podemos expresar a {Φn } como una serie de Fourier: X (n) ′ im· ~ ϕ ~0 {Φn } = Am ~ (I) e

(11.43)

(11.44)

m ~

de donde se sigue que los coeficientes de Fourier de F (n) son: (n)

Bm ~ (n) =

−Am ~ im ~ ·ω ~0

(11.45)

Esto nos dice que a cada orden es necesaria la condición de no degeneración del movimiento no perturbado. Poincaré mostró que las series de Fourier para las F (n) son convergentes en sentido asint´ otico. Por esto pueden truncarse a partir de valores razonables de los nν y obtenerse resultados precisos, independientemente de la presencia de los “peque˜ nos divisores” que necesariamente aparecen para nν grandes al tomar la serie completa. Ejemplo 11.2.1 Encontrar las correcciones de primero y segundo orden para un oscilador armónico con perturbación anarm´ onica. El oscilador anarm´ onico con correcciones c´ ubicas y cuárticas es soluble exactamente por cuadraturas. Pero es ilustrativa la manera de aplicar la teor´ıa de perturbaciones para obtener las variables acción-´ angulo del problema perturbado. El hamiltoniano no perturbado es: H0 =

1 p2 + m(ω 0 )2 q 2 2m 2

(11.46)

y la perturbación: H1 = aq 3 ;

H2 = bq 4

(11.47)

Teor´ıa de perturbaciones / 487 De acuerdo con el ejemplo 9.5.5, las variables acción-´ angulo del problema no perturbado se hallan mediante la transformaci´ on canónica con función generatriz F1 , dada por: F (q, ϕ0 ) =

1 mω02 cot ϕ0 2

(11.48)

que da lugar a la transformaci´ on: 0 1/2 2I sen ϕ0 ; p = (2mI 0 ω 0 )1/2 cos ϕ0 q= mω 0

(11.49)

Expresando a H0 , H1 y H2 en términos de I 0 y ϕ0 , obtenemos: H0 = I 0 ω 0

(11.50)

H1 = a

2I 0 mω 0

3/2

H2 = b

2I 0 mω 0

2

sen3 ϕ0

(11.51)

sen4 ϕ0

(11.52)

De (11.27) obtenemos directamente: H (1) = hH1 i = 0

(11.53)

Como ∂H0 /∂I 0 = ω 0 , se sigue de (11.29) que F (1) obedece la ecuaci´ on: ∂F (1) a =− 0 ∂ϕ0 ω

2I mω 0

3/2

sen3 ϕ0

(11.54)

Es decir, el término c´ ubico en la perturbación no da lugar a cambio en la energ´ıa del oscilador. Pero como F (1) es diferente de cero, las expresiones (11.49) para p y q s´ı resultan modificadas al primer orden. Al introducir la perturbación, I 0 deja de ser constante, pues de (11.35) y (11.54) se sigue que presenta oscilaciones de frecuencias w0 y 3w0 . Ahora, usemos (11.24) para hallar a H (2) : ∂H1 ∂F (1) (2) 0 (11.55) · H (I) = hH2 (ϕ , I)i + ∂I ∂ϕ0 El c´ alculo nos da: H (2) = −

15a2 I2 I2 3b + 3 0 4 2 4 m (ω ) 2 m (ω 0 )2

(11.56)

De (11.54) se sigue la siguiente expresión para F (1) : F (1) =

a 3ω 0

2I mω 0

3/2

sen2 ϕ0 cos ϕ0 + 2 cos ϕ0

(11.57)

488 / Mec´ anica cl´ asica avanzada 0por tanto: ∂F λa ϕ= = ϕ0 + ∂I 2Iω 0

2I mω 0

3/2

sen2 ϕ0 cos ϕ0 + 2 cos ϕ0

(11.58)

Ahora resolvemos esta ecuaci´ on para ϕ0 en términos de ϕ, al primer orden en λ: 3/2 λa 2I 0 ϕ =ϕ− sen2 ϕ cos ϕ + 2 cos ϕ (11.59) 2Iω 0 mω 0 A este mismo orden, I 0 en funci´ on de (I, ϕ) es: 3/2 λa 2I I0 = I − 0 sen3 ϕ ω mω 0

(11.60)

Al reemplazar (11.59) y (11.60) en la expresión (11.49) para q, que sigue siendo válida en el sistema perturbado, obtenemos: 1/2 λaI 2I sen ϕ − 2 0 3 (3 + cos 4ϕ) (11.61) q= mω 0 m (ω ) Ejercicio 11.2.1 Aplicar la teor´ıa de perturbaciones al péndulo simple, tomando como par´ ametro peque˜ no la relación entre la energ´ıa de libraci´ on y la energ´ıa de la separatriz (peque˜ nas oscilaciones). Mostrar que: H(I) = ω 0 I − F (1)

λGI 16

2

(11.62)

GI 2 =− (8 sen ϕ − sen 4ϕ) 192ω 0

ver el ejemplo 10.3.2.

11.3.

Multiplicidad de conjuntos de variables acci´ on´ angulo en los sistemas degenerados

Los ejemplos 10.3.5 y 10.4.4 ilustran la propiedad general de los sistemas degenerados consistente en que la separación de variables de la ecuaci´ on de Hamilton-Jacobi es posible en diferentes sistemas de coordenadas, lo que a su vez conlleva a la posibilidad de definir diferentes conjuntos de variables acción-´ angulo. Entonces un sistema m´ ultiplemente periódico con degeneración se caracteriza por poseer diferentes conjuntos de per´ıodos, correspondientes a los diferentes conjuntos de variables acción-´ angulo. Si f denota alguna coordenada o momento generalizado, cuando el sistema es degenerado existen varios conjuntos de variables acción-´ angulo (I,ϕ), (I ′ ,ϕ′ ), ..., con lo cual f posee la propiedad: f (I1 , I2 , ...Il ; ϕ1 + 2π, ϕ2 + 2π, ...ϕl + 2π) = (11.63) f (I1 , I2 , ...Il ; ϕ1 , ϕ2 , ...ϕl )

Teor´ıa de perturbaciones / 489 f (I1′ , I2′ , ...Il′ ; ϕ′1 + 2π, ϕ′2 + π, ...ϕ′l + 2π) = (11.64) f (I1′ , I2′ , ...Il′ ; ϕ′1 , ϕ′2 , ...ϕ′l , ), etc. Es decir, las diferentes expresiones de f en variables acción-´ angulo poseen propiedades de periodicidad similares. Como ilustraci´ on, ver las f´ ormulas (10.269) ejemplo 10.4.2, y (10.361) ejemplo 10.5.1, mediante las cuales se expresa a z en términos de las variables acción-´ angulo esféricas y parabólicas en el caso de una part´ıcula en un potencial 1/r. Se ve que la relaci´ on entre los diferentes conjuntos de variables no es trivial y que las variables de acción esféricas dependen no sólo de las variables de acción parabólicas sino también de las variables angulares parabólicas. La ecuaci´ on (10.344) nos da la relación entre ϕr y las variables acción-´ angulo parabólicas: −1 A + B cos(αη − αξ ) ϕr = −ϕξ − tan (11.65) B sen (αη − αξ ) que nos muestra que ϕr es igual a una funci´ on lineal de las variables angulares parabólicas más una funci´ on periódica de esas variables. Teorema 11.3.1 Todos los sistemas de variables angulares en que una funci´ on f (I, ϕ) tiene per´ıodo fundamental 2π, est´ an conectados entre s´ı por las fórmulas: ϕν =

l X

nνµ ϕ′µ + ψν (ϕ′1 , ϕ′2 , ...ϕ′l , I1′ , I2′ , ...Il′ ) (11.66)

µ=1

ν = 1, 2, ...l donde las nνµ forman una matriz de elementos enteros y determinante ±1 y las ψν son funciones periódicas de las ϕ′ν con per´ıodo 2π. Seg´ un el teorema, buscamos una transformaci´ on: ϕν = fν (ϕ′ , I ′ )

(11.67)

para la cual es preservada la periodicidad de cualquier variable dinámica F (como la z citada anteriormente): F (ϕ, I) = F ′ (ϕ′ , I ′ )

(11.68)

Ahora llamemos ϕν a: ϕν = fν (I ′ ; ϕ′1 + 2π, ϕ′2 , ...ϕ′l )

(11.69)

Entonces: F (I; ϕ1 , ϕ2 , ...ϕl ) = F ′ (I ′ ; ϕ′1 + 2π, ϕ′2 , ...ϕ′l ) = (11.70) F ′ (I ′ ; ϕ′1 , ϕ′2 , ...ϕ′l ) = F (I; ϕ1 , ϕ2 , ...ϕl )

490 / Mec´ anica cl´ asica avanzada Lo cual significa que ϕν y ϕν difieren por un m´ ultiplo de 2π entero que llamaremos 2πnν1 : fν (I ′ ; ϕ′1 + 2π, ϕ′2 , ...ϕ′l ) = fν (I ′ ; ϕ′1 , ϕ′2 , ...ϕ′l ) + 2πnν1

(11.71)

De manera similar se cumple:

fν I ′ ; ϕ′1 , ϕ′2 , ...ϕ′µ + 2π, ...ϕ′l = fν (I ′ ; ϕ′1 , ϕ′2 , ...ϕ′l ) + 2πnνµ ;

ν, µ = 1, 2, ...l

(11.72)

esto sólo es posible si fν es de la forma: fν (I ′ , ϕ′ ) =

l X

nνµ ϕ′µ + ψν (ϕ′ , I ′ )

(11.73)

µ=1

donde ψν es funci´ on periódica de las ϕ′µ con per´ıodo 2π. Claramente vemos que (11.65) es una realizaci´ on de la fórmula (11.66). Evidentemente la expresión para ϕ′ν en términos de (ϕ) es de la forma (11.66). Esto requiere que la matriz inversa de (nνµ ) tenga igualmente elementos enteros. La condición necesaria para esto es que det (nνµ ) = ±1. Funci´ on generatriz de la transformaci´ on (ϕ, I)→ (ϕ′ , I ′ ). La transformaci´ on (11.66) se puede escribir como: ϕν =

l X

nνµ ϕ′µ + ψν (ϕ′ , I) ;

ν = 1, 2, ...l

(11.74)

µ=1

Lo cual indica que la transformaci´ on canónica se puede obtener mediante una funci´ on generatriz de la forma G(ϕ′ , I), del tipo F3 : ϕν = −

∂G ; ∂Iν

Iν′ = −

∂G ; ∂ϕ′ν

ν = 1, 2, ...l

(11.75)

Con lo cual G es de la forma: G(ϕ′ , I) = −

l X

nνµ Iν ϕ′µ + ψ (ϕ′ , I)

(11.76)

ν,µ=1

lo cual implica que las ψν deben ser derivadas parciales de ψ y por tanto se debe cumplir: ∂ψµ ∂ψν = ∂Iµ ∂Iν

(11.77)

Las f´ ormulas de transformaci´ on para las Iν′ son: Iν′ =

l X

µ=1

nνµ Iν −

∂ψ ∂ϕ′ν

La funci´ on ψ debe ser periódica en las ϕν y en las ϕ′ν . Por tanto: X ψ= C~n (I)ei~n·ϕ~ ~ n

(11.78)

(11.79)

Teor´ıa de perturbaciones / 491 Entonces (11.74) y (11.78) toman la forma: ϕν =

l X

nνµ ϕ′µ −

X ∂C~n (I)

nνµ Iν − i

X

µ=1

Iν′

=

l X

µ=1

∂Iν

~ n

ei~n·ϕ~

′

C~n (I)nν ei~n·ϕ~

(11.80)

′

(11.81)

~ n

Como tanto las (I, ϕ) como las (I ′ , ϕ′ ) son variables acción-´ angulo, las (I, I ′ ) deben ′ ser constantes y las (ϕ, ϕ ) deben ser funciones lineales del tiempo. Esto implica una de las dos condiciones siguientes: C~n (I) = 0

para

~n 6= 0

(11.82)

o que en el exponente de la serie de Fourier sólo aparecen combinaciones de las ϕ′ν tales que: n1 ϕ′1 + n2 ϕ′2 + ...nl ϕ′l = (n1 ω1′ + n2 ω2′ + ...nl ωl′ ) t (11.83) +n1 δ1′ + n2 δ2′ + ... + nl δl′ = constante Claramente la condición (11.83) requiere que el sistema sea degenerado, ~n · ω ~ ′ = 0. En conclusi´ on, para un sistema no degenerado, hay varios conjuntos de variables acción-´ angulo, conectados entre s´ı mediante las fórmulas: ϕν =

l X

µ=1

nνµ ϕ′µ −

∂ψ ; ∂Iν

Iν′ =

l X

nνµ Iν

(11.84)

µ=1

con funci´ on generatriz: G(ϕ′ , I) = −

l X l X

nνµ Iν ϕ′µ + ψ(I)

(11.85)

ν=1 µ=1

donde nνµ es una matriz de elementos enteros y determinante ±1. En el caso degenerado, asumimos que entre las ων′′ existen l − s relaciones de conmensurabilidad: l X

nν ων′′ = 0

(11.86)

ν=1

Es posible realizar una transformaci´ on canónica auxiliar a nuevas variables acciónańgulo (I ′ , ϕ′ ) tal que l − s de las frecuencias ων′ sean idénticamente cero y las s restantes sean no nulas e independientes entre s´ı: ωα′ ;

α = 1, 2, ...s

(Inconmensurables) (11.87)

ωρ′ = 0 ;

ρ = s + 1, s + 2, ...l

492 / Mec´ anica cl´ asica avanzada La funci´ on generatriz de tal transformaci´ on es de la forma: F =−

l X

Cνµ Iν′′ ϕ′µ

(11.88)

ν,µ=1

De donde: ϕ′′ν =

l X

Cνµ ϕ′µ ;

Iν′ =

l X

Cνµ Iµ′′

(11.89)

µ=1

µ=1

donde las ων′′ satisfacen las relaciones (11.86). Claramente: ϕ′ν =

l X

Cνµ ϕ′′µ

(11.90)

µ=1

lo cual implica que para satisfacerse (11.87) es necesario: l X

Cµρ ϕ′′µ = 0

para

ρ = s + 1, s + 2, ...l

(11.91)

µ=1

Es decir, las Cµρ se obtienen de los nµ que aparecen en las l − s relaciones de conmensurabilidad (11.86). Ejemplo 11.3.1 Considerar el movimiento de una part´ıcula en un potencial 1/r. Este problema es degenerado. Realizar una transformaci´ on a variables acción-´ angulo tales que las frecuencias satisfagan las condiciones (11.87). En coordenadas esféricas las dos condiciones de degeneración pueden escribirse como: ωr − ωθ = 0 ;

ωϕ − ωθ = 0

(11.92)

De la funci´ on generatriz F = (ϕϕ − ϕθ )I1 + (ϕr − ϕθ )I2 + ϕr I3 se sigue que las variables acción-´ angulo buscadas son: ϕ1 = ϕϕ − ϕθ ;

ϕ2 = ϕr − ϕθ ;

ϕ3 = ϕr

(11.93)

y, I1 = Iϕ ;

I2 = Iθ + Iϕ ;

I3 = Ir + Iθ + Iϕ

(11.94)

mk 2 I33

(11.95)

Las nuevas frecuencias son: ω1 = 0 ;

ω2 = 0 ;

ω3 =

En coordenadas parabólicas la transformaci´ on buscada puede obtenerse con la funci´ on generatriz: ϕξ + ϕη − ϕ I1 + (ϕξ − ϕη )I2 − ϕξ I3 (11.96) F = 2

Teor´ıa de perturbaciones / 493 que da lugar a la transformaci´ on: I1 = Iϕ ;

I2 = Iη +

ϕ1 = ϕϕ −

ϕξ + ϕη ; 2

Iϕ ; 2

I3 = Iξ + Iη + Iϕ

ϕ2 = ϕη − ϕξ ;

ϕ3 = ϕξ

(11.97) (11.98)

En tanto que ω1 , ω2 y ω3 est´ an dadas por las fórmulas (11.95). Con esta transformaci´ on, los resultados del cap´ıtulo 10 referentes a las constantes de movimiento que resultan de la degeneraci´ on se expresan como: θ1 = −ϕ2 ;

φ1 = ϕ1

(11.99)

La clasificación dada en (11.87) nos permite llamar a las ϕ′α y Iα′ variables acciónángulo propias, y a las ϕ′ρ , Iρ′ , variables impropias o degeneradas; las ϕ′ρ permanecen constantes en el curso del movimiento. El n´ umero s de frecuencias ωα′ no nulas e independientes se llama el grado de periodicidad del sistema y el n´ umero l − s se llama el grado de degeneraci´ on. Consideraremos ahora las f´ ormulas de transformaci´ on (11.80) y (11.81) en el caso degenerado. Con el fin de que la divisi´ on entre variables degeneradas y no degeneradas persista, requerimos que las ϕρ no dependan de las ϕ′α y que las ϕ′ρ no dependan de las ϕα . Esto implica que los elementos nρα se anulen. Las fórmulas de transformaci´ on que toman en cuenta lo anterior y además que las ϕα y las ϕ′α son funciones lineales del tiempo, y que las ϕρ , ϕ′ρ , Iν , Iν′ , son constantes, son: ϕα =

l X

nαµ ϕ′µ + ψα (ϕ′σ , I)

(11.100)

µ=1

ϕρ =

l X

nρσ ϕ′σ + ψρ (ϕ′σ , I)

(11.101)

σ=s+1

Iα′ =

s X

nβα Iβ

l X

nνρ Iρ − i

(11.102)

β=1

Iρ′ =

ν=1

X

C~nσ (I)nρ ei~nσ ·ϕ~ σ

(11.103)

~ nσ

donde el sub´ındice σ se coloca a los vectores para indicar que solamente tienen componentes degeneradas. Como los nνµ son enteros y los nρα son nulos, entonces se cumple que: det nνµ = ±1

y

det nαβ = ±1

(11.104)

En conclusi´ on, las variables de acción no degeneradas est´ an determinadas un´ıvocamente, aparte de una transformaci´ on lineal entera homogénea de determinante ±1. Por

494 / Mec´ anica cl´ asica avanzada su parte, las variables de acción degeneradas no necesitan transformarse integralmente y pueden depender de variables angulares degeneradas; los nνρ no necesitan ser enteros. Esto podemos ilustrarlo con el ejemplo 11.3.1 y las fórmulas de la secci´ on 10.5, referentes al problema de Kepler. Las variables angulares no degeneradas son ϕ′3 = ϕξ y ϕ3 = ϕr , las variables angulares degeneradas son ϕ′2 = ϕη − ϕξ , ϕ′1 = ϕϕ − (ϕξ + ϕη )/2, ϕ2 = ϕr − ϕθ y ϕ1 = ϕϕ − ϕθ . Vemos la correspondencia entre las fórmulas (11.65) y (11.100). Por otra parte, I3′ = Iξ + Iη + Iϕ y I3 = Ir + Iθ + Iϕ , o sea que I3′ = I3 , que corresponde a (11.102). Una fórmula del tipo (11.103) es la que expresa a I2 = Iθ + Iϕ en términos de I3′ , I2′ , I1′ , ϕ′2 , que se obtiene fácilmente de la fórmula (10.325), secci´ on 10.5. h i p I22 = 12 I3′2 1 − β 2 + γ 2 − (1 − β 2 )2 − 2γ 2 (1 + β 2 ) + γ 4 cos ϕ′2 (11.105)

11.4.

Teor´ıa de perturbaciones de sistemas degenerados

En la secci´ on 11.2 obtuvimos las fórmulas para las correcciones a la energ´ıa y a la funci´ on generatriz cuando un sistema no degenerado se somete a una perturbación. Ya en la f´ ormula (11.45) encontramos un resultado que no se puede aplicar cuando hay degeneraciones. En la fórmula (11.42), para las correcciones a la energ´ıa, aparece un promedio sobre todas las variables angulares, pero hemos visto que en un sistema degenerado hay l − s nuevas constantes de movimiento, las l − s variables angulares que permanecen constantes, con valores dependientes sólo de las condiciones iniciales. Por esto la trayectoria de fases no ocupa una región l-dimensional sino una de sólo s dimensiones. Un promedio sobre las variables angulares degeneradas es más bien un promedio sobre todos los movimientos que resultan de cambiar las condiciones iniciales, o sea un promedio sobre un ensamble, lo cual es inadmisible cuando se considera un solo sistema. En conclusi´ on, en (11.42) no tiene sentido promediar sobre las ϕ0ρ , quedando H (n) dependiente de las variables angulares ϕ0ρ : (11.106) H (n) Iα ; ϕ0ρ , Iρ

Esto tiene una raz´ on f´ısica más profunda: las variables (ϕ0 , I 0 ) que se obtienen de las variables del problema perturbado (ϕ, I) al hacer λ = 0 no est´ an determinadas por el movimiento no perturbado sino por la perturbación. Es decir, no podemos partir de cualquier conjunto de variables acción-´ angulo del sistema no perturbado sino que antes debemos encontrar un conjunto de variables acción-´ angulo “exactas en la aproximación cero”. Este comportamiento se refleja en la teor´ıa cuántica de perturbaciones de sistemas degenerados, donde se deben formar combinaciones lineales de las funciones de onda degeneradas para obtener las funciones de onda exactas en la aproximación cero, que son las funciones que se obtienen de las perturbadas al hacer λ = 0. Esto en mecánica cuántica equivale a buscar una combinaci´ on lineal de las funciones degeneradas que diagonalice la perturbación, en teor´ıa de perturbaciones degeneradas de primer orden.3 3 V´ ease

la secci´ on 12.5, cap´ıtulo 12.

Teor´ıa de perturbaciones / 495 Debido a su car´ acter degenerado, otras variables de acción degeneradas, conectadas con las Iρ0 por relaciones de la forma (11.103), deben introducirse en lugar de las Iρ0 mediante una adecuada elección de las coordenadas. Tal elección, obviamente, est´ a determinada por la perturbación (o más exactamente, por las simetr´ıas que tenga la perturbación). Debemos realizar una transformaci´ on canónica preliminar, escogida de tal manera que, al primer orden, H1 dependa sólo de variables de acción. La transformaci´ on es (I 0 , ϕ0 ) → (I 0 ′ , ϕ0 ′ ), con funci´ on generatriz: G(ϕ0 , I 0 ′ ) =

l X

Iν0 ′ ϕ0ν + V (ϕ0ρ , I 0 ′ )

(11.107)

ν=1

La f´ ormulas de transformaci´ on son: Iα0 =

∂G = Iα0 ′ ; ∂ϕ0α

ϕ′α =

∂G ∂V = ϕ0α + 0 ′ ; ∂Iα0 ′ ∂Iα

Iρ0 =

∂G ∂V = Iρ0 ′ + ∂ϕ0ρ ∂ϕ0ρ ′ ϕ0ρ ′ =

∂G ∂V = ϕ0ρ + 0 ′ ∂Iρ0 ′ ∂Iρ

(11.108) (11.109)

G en (11.107) tiene una parte que depende solamente de las variables ϕ0ρ e Iρ0 ′ , la cual se halla resolviendo la ecuaci´ on de Hamilton-Jacobi siguiente: ∂G = H (1) (I 0 ′ ) (11.110) H1 Iα0 , ϕ0ρ , ∂ϕ0ρ En este punto est´ a garantizando que la perturbación no dependerá de variables angulares al promediar sobre las variables angulares no degeneradas y que se cumple siempre la condición m ~ ·~ ω 0 6= 0. Ahora expresamos a H en términos de (I ′ , ϕ′ ): H = H0 (Iα′ ) + λH1 (ϕ0 ′ , I 0 ′ ) + λ2 H2 (ϕ0 ′ , I 0 ′ ) + ...

(11.111)

y, como en la secci´ on 11.2, buscamos una transformaci´ on canónica (I ′ , ϕ′ ) → (I, ϕ), lo cual dar´ a lugar nuevamente a las fórmulas (11.22), ... (11.25), escribiendo (ϕ0 , I 0 ) en lugar de (ϕ0 ′ , I 0 ′ ). Como H no depende de Iρ′ , ahora en lugar de (11.26) se tiene: s X ∂H0 ∂F (n) · = H (n) (I) − Φn (ϕ0 , I) 0 ∂I ∂ϕ α α α=1

(11.112)

Al primer orden, en vez de (11.29) tenemos: s X ∂H0 ∂F (1) · = − H1 (ϕ0 , I) 0 ∂Iα ∂ϕα α=1

(11.113)

donde {H1 } = H1 − hH1 i y h...i denota un promedio sobre las variables angulares ϕ0α .4 Es claro que la ecuaci´ on (11.113) no permite determinar completamente a F (1) , pues 4 La

soluci´ on de la forma (11.32) a´ un existe, siendo bien definida salvo posibles divergencias debidas 0 ≈ 0. a la presencia de peque˜ nos denominadores en los arm´ onicos altos, ~ nα · ~ ωα

496 / Mec´ anica cl´ asica avanzada cualquier solución de (11.113) est´ a indeterminada por la adici´ on de una funci´ on de Iν y ϕ0ρ . Llamaremos G(1) a la parte de F (1) determinada por (11.113), de modo que: F (1) = G(1) + R(1)

(11.114)

donde R(1) deber´ a quedar determinada en la siguiente aproximación. Ahora, la ecuaci´ on (11.24) puede escribirse como: s

s

1 X X ∂ 2 H0 ∂G(1) ∂G(1) · 2 α=1 ∂Iα ∂Iβ ∂ϕ0α ∂ϕ0β β=1

+

l X ∂H 0

α=1

∂Iα

(2)

·

l X ∂H1

(11.115) (1)

∂F ∂F + · + H2 (ϕ0 , I) = H (2) (I) 0 ∂ϕ0α ∂I ∂ϕ ν ν ν=1

De esta ecuaci´ on podemos determinar a H (2) (I), a R(1) y a una parte G(2) de F (2) . Indicaremos con h...i los promedios sobre las ϕ0α y los promedios sobre las ϕ0ν completas por hh...ii. Entonces: H (2) (I) = hhΦ2 ii

(11.116)

donde Φ2 es completamente conocida: s

Φ2 =

s

1 X X ∂ 2 H0 ∂G(1) ∂G(1) · · 2 α=1 ∂Iα ∂Iβ ∂ϕ0α ∂ϕ0β β=1

+

s X ∂H1

α=1

∂Iα

(11.117)

∂G(1) · + H2 (ϕ0 , I) ∂ϕ0α

R(1) es solución a la ecuaci´ on: l X ∂H1 ∂R(1) . = −{hΦ2 i} ∂Iρ ∂ϕ0ρ ρ=s+1

(11.118)

donde: {hΦ2 i} = hΦ2 i − hhΦ2 ii

(11.119)

F (2) es solución a: s X ∂H0 ∂F (2) · = −{Φ2 } ∂Iα ∂ϕ0α α=1

(11.120)

pero (11.120) determina sólo una parte G(2) , quedando por determinar una funci´ on R(2) 0 que depende de ϕρ y Iν , en la aproximación siguiente. La ecuaci´ on secular. Consideremos primero el cambio en los coeficientes de Fourier de una variable dinámica al pasar de un sistema de variables acción-´ angulo a otro, (I, ϕ) → (I, ϕ). Asumamos que la transformaci´ on canónica es del tipo G(I, ϕ),

Teor´ıa de perturbaciones / 497 de modo que (I, ϕ) pueden tomarse independientes, y con funciones de (I, ϕ). Sean las expansiones de Fourier de f (I, ϕ) = f (I, ϕ): X X im· ~ ϕ ~ f (I, ϕ) = f~n (I)ei~n·ϕ~ = f (I, ϕ) = fm (11.121) ~ (I)e ~ n

m ~

on de f~n (I), as´ı: Entonces, claramente f m ~ (I) pueden expresarse en funci´ I I I X 1 ~ f~n (I)ei~n·ϕ~ e−i~n·ϕ~ dl ϕ ... fm (11.122) ~ (I) = (2π)l ~ n

Llamaremos i~ α ·~ a e ϕ: ′

gα~⋆ α~ ′ (I)

a los coeficientes de la expansi´ on de Fourier de ei~α·ϕ~ respecto

~′ ~

ei~αϕ~ = gα~⋆ α~ ′ (I) eiα ·ϕ

(11.123)

donde se supone que ϕ puede expresarse en términos de (I, ϕ). Ahora en (11.122) sea ~n = α ~ −α ~′ y m ~ = β~ − β~ ′ . Entonces (11.122) y (11.123) nos conducen fácilmente a: XX f β− gα~⋆ β~ (I) fα~ −~α′ (I) gα~ ′ β~′ (I) ~ β ~ ′ (I) = α ~

=

α ~

XX α ~

α ~′

(11.124)

g+ ~ −~ α′ (I) gα ~ ′ (I) ~ (I) fα ~ ′β β~ α

⋆ donde g + ~ . Si formamos matrices con los coeficientes de Fourier, entonces (11.124) ~ α = gα ~β β~ nos dice que f~n y fm an conectados por medio de una transformaci´ on unitaria. ~ est´ Ahora examinemos las expansiones de Fourier de hH1 (I 0 , ϕ0ρ )i respecto a las variables can´ onicas (Iρ0 , ϕ0ρ ) y (Iρ0 ′ , ϕ0ρ ′ ) conectadas por las fórmulas (11.108) y (11.109). La transformaci´ on can´ onica buscada, por definición, conduce a una expresión que no depende de las ϕ′ρ . Si llamamos f (Iρ0 , ϕ0ρ ) a hH1 (Iρ0 , ϕ0ρ , Iα )i y f ′ a la correspondiente expresión en términos de (Iρ0 ′ , ϕ0ρ ′ ), podemos hacer corresponder la ecuaci´ on de Hamilton-Jacobi (11.110) con la (11.124). La transformaci´ on canónica buscada debe dar lugar a coeficientes de Fourier de la forma: ′ 0′ (1) 0 ′ fβ− (I )δβ, ~β ~′ ~ β ~ ′ (I ) = H

Por tanto (11.124) para este caso puede escribirse as´ı: i h XX 0 0 (1) 0 g+ (I )δα~ α~ ′ gα~ ′ β~ ′ (I 0 ) = 0 ~ −~ α′ (I ) − H ~ (I ) fα β~ α

α ~

(11.125)

(11.126)

α ~′

donde hemos usado la f´ ormula X + gβ~ ~ ′ = δβ, ~β ~′ ~ α gα ~β

(11.127)

α ~

En otras palabras, la transformaci´ on canónica es tal que diagonaliza la matriz fα~ −~α′ (I 0 ) formada con los coeficientes de Fourier de hH1 (I 0 , ϕ0ρ )i respecto a las variables angulares degeneradas. H (1) (I 0 ′ ) se obtienen resolviendo la ecuaci´ on secular: i h (11.128) det fα~ −~α′ (I 0 ) − H (1) (I 0 ′ )δα~ α~ ′ = 0

498 / Mec´ anica cl´ asica avanzada en tanto que la transformaci´ on canónica se obtiene a partir de los vectores propios de la matriz fα~ −~α′ (I 0 ), suministrando la conexión entre las variables angulares ϕ0ρ y ϕ0ρ ′ . Debe notarse que las matrices que aparecen en este desarrollo son de dimensi´ on infinita; por tanto (11.128) debe entenderse como el paso al l´ımite de una secuencia de determinantes. Vemos que encontrar las variables acción-´ angulo exactas en la aproximación cero equivale a diagonalizar la matriz formada con los coeficientes de Fourier de la perturbaci´ on. También encontramos que resolver la ecuaci´ on de Hamilton-Jacobi independiente del tiempo, equivale, siempre, a diagonalizar la matriz de los coeficientes de Fourier del respectivo hamiltoniano. Ejemplo 11.4.1 Encontrar las variables de acción perturbadas en el efecto Stark del ´tomo de hidrógeno clásico, en coordenadas esféricas. a El hamiltoniano para este problema es de la forma H = H0 + λH1 , donde: H0 = −

m(Ze2 )2 2(I30 )2

(11.129)

es la energ´ıa del movimiento kepleriano en ausencia del campo y: λH1 = eEz

(11.130)

es la perturbación. z est´ a dada por la fórmula (10.268), " 0 2 #1/2 I1 z = 1− (x0 cos ϕ02 − y 0 sen ϕ02 ) I20

(11.131)

x0 y y0 son las coordenadas cartesianas del electrón en el plano de la órbita, y el eje menor es x. La u ńica variable angular no degenerada es ϕ03 , de la cual dependen x0 y y 0 , seg´ un las f´ ormulas (10.222) y (10.223). Por tanto: 3 hx0 i = − ǫ0 a0 ; 2

hy 0 i = 0

(11.132)

En consecuencia, tomando a E como λ: hH1 (I30 , ϕ02 , I10 , I20 )i = " 0 2 #1/2 " 0 2 #1/2 I1 I2 3 0 . 1− cos ϕ02 − ea 1 − 0 2 I2 I30

(11.133)

a0 es igual a: a0 =

(I30 )2 mZe2

(11.134)

En esta expresión no aparecen ni ϕ01 ni ϕ03 . Por tanto I10 y I30 son constantes durante el movimiento perturbado y aparecen como par´ ametros. Las u ´ nicas variables son entonces ϕ02 y I20 , indicando que en el movimiento perturbado la órbita no permanece

Teor´ıa de perturbaciones / 499 r´ıgida sino que presenta oscilaciones de la excentricidad y del perihelio en el plano de la órbita, el cual a su vez gira uniformemente alrededor del eje z y oscila alrededor de la l´ınea de nodos (Véase la figura 10.11). La ecuaci´ on de Hamilton-Jacobi (11.110) que nos determina la variable de acción I20 exacta en la aproximación cero para este caso es: " 0 2 0 2 0 2 #1/2 0 3ea E I2 I1 I1 − cos ϕ02 1− = H (1) (I 0 ′ ) (11.135) − + 2 I30 I20 I30 la cual nos da expl´ıcitamente a I20 = ∂G/∂ϕ02 y entonces a G. Las integrales resultan bastante dif´ıciles. Si sólo queremos hallar a H (1) (I 0 ′ ), notemos que (11.108) al ser integrada sobre un per´ıodo de ϕ02 , nos da: I I ∂V1 1 1 0′ 0 0′ dϕ02 (11.136) I2 dϕ2 − I2 = 2π 2π ∂ϕ02 y que seg´ un (11.109) V1 es una funci´ on periódica de ϕ02 , con lo cual: I 1 I20 ′ dϕ02 I20 ′ = 2π

(11.137)

lo cual nos suministra la expresión para H (1) que buscamos. Llamemos (I30 )2 = A, (I10 )2 = B, [2H (1) /(3ea0 E)]2 = C y (I20 )2 = x. Por tanto 0 2I2 dI20 = dx, o sea: √ 2 x dI20 = dx (11.138) lo cual nos permite escribir: I I √ dϕ02 1 1 ∂ϕ0 x I20 ′ = dx I20 02 dI20 = 2π dI2 2π dx

(11.139)

De (11.135) se sigue que: cos2 ϕ02 =

C x B B 1− − + A x A

Por tanto: d(sec

2

ϕ02 )

1 = C

1 B − + 2 dx A x

(11.140)

(11.141)

En consecuencia:

√ dϕ02 (x2 − AB) AC = √ dx 2 x(A − x)(x − B)[(A − x)(x − B) − ACx]1/2

Entonces (11.139) nos da: √ I (x2 − AB) dx AC I20 ′ = 4π (A − x)(x − B)[(A − x)(x − B) − ACx]1/2

(11.142)

(11.143)

500 / Mec´ anica cl´ asica avanzada La integral se hace usando el método de los residuos, teniendo en cuenta que en el plano complejo el integrando es una funci´ on biforme (positivo entre xm´ın y xmáx y negativo entre xmáx y xm´ın ), presentando una l´ınea de ramificaci´ on. Por otra parte el integrando posee singularidades en x = A, x = B y x = ∞, con polos en esos puntos. El residuo en x = A vale −2π/C 1/2 , el residuo en x = B vale 2π[B/(AC)]1/2 y el residuo en x = ∞ vale 2π (el cual se obtiene con la sustitución y = 1/x). En consecuencia: √ √ 1 √ I20 ′ = A − B − CA (11.144) 2 que es lo mismo que: " (1) # 1 0′ 0′ 0′ 0 ′ 22 H I2 = I2 − I3 − (I2 ) (11.145) 0 2 3ea Por tanto H (1) vale: H (1) (I 0 ′ ) = ±

3eEa0 ′ 0 ′ (I1 − I30 ′ − 2I20 ′ ) 2I10 ′

(11.146)

Este ejemplo ilustra el método de las perturbaciones seculares, que hacen que las variables angulares degeneradas, que en el problema no perturbado son constantes, pasen a ser funciones lineales del tiempo dando lugar a oscilaciones en los par´ ametros de la orbita que aumentan con la intensidad de la perturbación. ´ En efecto, las frecuencias perturbadas son: ω30 ′ = ω30 + λ ω20 ′ = λ

∂hH1 i ∂I30 ′

∂hH1 i ; ∂I20 ′

(11.147)

ω10 ′ = λ

∂hH1 i ∂I10 ′

(11.148)

Las frecuencias que en el movimiento no perturbado son nulas, en el perturbado pasan a ser “frecuencias lentas”, en tanto que las frecuencias no degeneradas son “frecuencias rápidas”. Ejemplo 11.4.2 Calcular las correcciones de segundo orden en el átomo de Hidrógeno cl´ asico en un campo eléctrico uniforme (efecto Stark cuadrático). Si trabajamos con coordenadas parabólicas, H (0) y las frecuencias est´ an dadas por (10.300) y (10.306). Entonces la ecuaci´ on (11.37) para la corrección de segundo orden de la energ´ıa toma la forma: H (2) (I) = 1 ∂ 2 H0 2 ∂I32

*

∂F (1) ∂ϕ03

2 +

+

∂ω ∂F (1) . ∂I2 ∂ϕ02

+

∂ω ∂F (1) . ∂I3 ∂ϕ03

(11.149)

y F (1) es solución a la ecuaci´ on: ω0

∂F (1) + W (I, ϕ0 ) = 0 ∂ϕ03

(11.150)

Teor´ıa de perturbaciones / 501 siendo W igual a: 3 W = H1 − hH1 i = eEz − eEaβ (11.151) 2 Podr´ıamos partir de la expresión para W en coordenadas parabólicas para calcular a F (1) y luego a H (2) . Sin embargo usaremos el siguiente procedimiento equivalente: como en coordenadas parabólicas el promedio de eEz sobre las variables angulares es igual al promedio temporal, debido a que heEzit no contendrá variables angulares, podemos realizar inicialmeste los promedios temporales en coordenadas esféricas. Luego, antes de promediar sobre la otra variable angular pasamos de coordenadas esféricas a coordenadas parabólicas usando las ecuaciones (10.326) y (10.327). El resultado será el mismo que si se calculan los promedios temporales en coordenadas parabólicas. Finalmente, promediando sobre θ1 obtenemos a H (2) en coordenadas parabólicas. heEzit y eEz est´ an dados por: heEzit =

3 eEaǫ cos θm´ın cos θ0 2

(11.152)

eEz = eF a cos θm´ın

−(1 − ǫ2 )1/2 sen θ0 sen ψ + ǫ cos θ0 − cos θ0 cos ψ

Por tanto W en coordenadas esféricas es: W = eF a cos θm´ın 1 × −(1 − ǫ2 )1/2 sen θ0 sen ψ + ǫ cos θ0 − cos θ0 cos ψ 2

(11.153)

La ecuaci´ on (11.150) toma la forma: ∂F (1) eF a = cos θm´ın 0 ∂ϕ3 2ω 0 h i × 2(1 − ǫ2 )1/2 sen θ0 sen ψ + ǫ cos θ0 + 2 cos θ0 cos ψ

(11.154)

Usando la ecuaci´ on de Kepler se cumple:

∂F (1) ∂ψ ∂F (1) 2π ∂F (1) = = · · 0 0 ∂ϕ3 ∂ψ ∂ϕ3 ∂ψ 1 − ǫ cos ψ

(11.155)

por tanto tenemos que: ∂F (1) = ∂ψ

h eF a cos θ 2(1 − ǫ2 )1/2 sen θ0 sen ψ m´ ın 4πω 0 +ǫ cos θ0 + 2 cos θ0 cos ψ −2ǫ(1 − ǫ2 )1/2 sen θ0 sen ψ cos ψ −ǫ2 cos θ0 cos ψ − 2ǫ cos θ0 cos2 ψ

(11.156) i

502 / Mec´ anica cl´ asica avanzada Integrando respecto a ψ hallamos la siguiente expresión para F (1) , luego de omitir una constante de integraci´ on que no contribuir´ a a H (2) ya que W tiene media cero: F (1) =

h eF a − 2(1 − ǫ2 )1/2 sen θ0 cos ψ cos θ m´ ın 4πω 0 + cos θ0 sen ψ − ǫ(1 − ǫ2 )1/2 sen θ0 sen2 ψ −ǫ2 cos θ0 sen ψ − ǫ cos θ0 sen ψ cos ψ

(11.157)

i

Esta funci´ on satisface el requisito de la teor´ıa canónica de perturbaciones de ser una funci´ on periódica de θ1 y ϕξ , como puede verse fácilmente usando (10.328), (10.329), (10.341) a (10.345). Si quisiéramos aplicar la fórmula (11.149) directamente en coordenadas esféricas, deber´ıamos haber tomado hH1 i = 0 lo cual dar´ıa lugar a la aparici´ on en F (1) y ∂F (1) /∂ϕ02 de un término proporcional a ψ, que se incrementa linealmente con el tiempo (llamado secular); esto evidencia que la fórmula (11.36) sólo puede aplicarse en coordenadas en las cuales la perturbación sea “diagonal”, es decir, que no contenga variables angulares. Usando la propiedad: ∂F (1) ∂F (1) = − ∂ϕ02 ∂θ0

(11.158)

Llegamos a la siguiente expresión para ∂F (1) /∂20 : ∂F (1) = ∂ϕ02

h eF a cos θm´ın 2(1 − ǫ2 )1/2 cos θ0 cos ψ 0 2ω +(2 − ǫ2 )sen θ0 sen ψ 2 1/2

+ǫ(1 − ǫ )

(11.159) 2

cos θ0 sen ψ

−ǫ sen θ0 sen ψ cos ψ

i

Por otra parte, usando las siguientes relaciones: ∂ cos θm´ın = ∂I2

γ2 I3 (1 − ǫ2 )3/2 cos θm´ın

∂ǫ = ∂I2

−(1 − ǫ2 − γ 2 ) I3 (1 − ǫ2 )1/2 ǫ cos2 θm´ın

∂ψ = ∂I2

−

I2 sen ψ I32 ǫ (1 − ǫ cos ψ)

(11.160)

Teor´ıa de perturbaciones / 503 donde γ = I1 /I3 , obtenemos al hacer todos los c´ alculos: n h ∂W −eEa γ 2 ǫ cos θ0 = 2 3/2 ∂I2 2I3 (1 − ǫ ) cos θm´ın +2(1 − ǫ2 )1/2 sen θ0 sen ψ + 2 cos θ0 cos ψ

i

h +(1 − ǫ2 )(1 − ǫ2 − γ 2 ) − ǫ−1 cos θ0 + 2(1 − ǫ2 )−1/2 ×sen θ0 sen ψ − +

(11.161)

2(1 − ǫ2 )1/2 ǫ−1 sen θ0 cos ψ sen ψ 1 − ǫ cos ψ

2ǫ−1 cos θ0 sen2 ψ io 1 − ǫ cos ψ

Usando la siguiente relaci´ on: Z 2π 1 ∂W ∂F (1) ∂W ∂F (1) · · (1 − ǫ cos ψ) dψ = 0 ∂I2 ∂ϕ2 t 2π 0 ∂I2 ∂ϕ02

(11.162)

obtenemos usando (11.159), (11.161) y (11.162) después de un c´ alculo largo pero directo: h (eEa)2 ∂W ∂F (1) (9 − 13ǫ2 − γ 2 + 4ǫ4 + ǫ2 γ 2 ) . = − ∂I2 ∂ϕ02 t 16ω 0 I3 (1 − ǫ2 ) (11.163) i +(−4 + 3ǫ2 + 4γ 2 + ǫ4 + ǫ2 γ 2 ) cos2 θ0 Por otra parte podemos escribir los otros dos términos de la ecuaci´ on (11.149) as´ı: * 2 + 1 ∂ 2 H0 ∂W ∂F (1) ∂F (1) · 2 ∂I32 ∂ϕ03 ∂I3 ∂ϕ03 t t

3ω 0 =− 2I3 =−

1 2ω 0

*

W ω0

2 +

3 ∂ + I3 ∂I3

+ t

∂W · ∂I3

−W ω0

(11.164)

t

hW 2 it

De (10.268) se sigue que: 1 hW 2 it = (eE)2 a cos2 θm´ın (1 − ǫ2 + 5ǫ2 cos2 θ0 ) 2

(11.165)

Con este resultado (11.164) puede escribirse como: −

(eEa)2 [20(1 − ǫ2 ) + (4 + 10ǫ2 ) cos2 θ0 ] (1 − ǫ2 − γ 2 ) · 16I3 ω 0 1 − ǫ2

(11.166)

504 / Mec´ anica cl´ asica avanzada Resumiendo los resultados dados por las ecuaciones (11.163) y (11.166) llegamos a:

∂W ∂F (1) · ∂I2 ∂ϕ02

t

+

∂W ∂F (1) · ∂I3 ∂ϕ03

1 ∂ 2 H0 + 2 ∂I32 t

*

∂F (1) ∂ϕ03

2 +

t

(11.167)

2

=−

(eEa) [(29 − 24ǫ2 − 21γ 2 ) + 9ǫ2 cos2 θm´ın cos2 θ0 ] 16I3 ω 0

Si ahora pasamos a coordenadas parabólicas mediante las ecuaciones (10.325), (10.341) a (10.345), llegamos a la siguiente expresión para el lado derecho de (11.167): (eEa)2 h − · 17 − 3β 2 − 9γ 2 16I3 ω 0 i p − 12 [(1 + β 2 ) − γ 2 ][(1 − β 2 ) − γ 2 ] cos θ1 (11.168) El promedio sobre la variable angular ϕ2 (θ1 = −ϕ2 ) nos conduce a la expresión final para H (2) : H (2) (I) = −

(eEa)2 (17 − 3β 2 − 9γ 2 ) 16I3 ω 0

(11.169)

que expresada en términos de las Iν es: H (2) (I) = −

(eE)2 I 4 [17I 2 − 3(Iξ − Iη )2 − 9Iϕ2 )] 16m3 (Ze2 )4

(11.170)

Este es el mismo resultado de Epstein en (1916) usando un método de aproximaciones sucesivas, expuesto por Born (Op. cit., p. 591). El método de aproximaciones descrito en la secci´ on 11.2 puede también fallar cuando el sistema no perturbado no posee degeneración intr´ınseca pero ocurre que las frecuencias se tornan conmensurables para ciertas condiciones iniciales. Cuando esto ocurre se habla de degeneraci´ on accidental. En este sentido es incorrecta la distinción que algunos textos de mecánica cuántica hacen al referirse a la degeneración presente en los niveles de energ´ıa del átomo de hidrógeno respecto al n´ umero cuántico orbital l como “accidental”. En astronom´ıa se presenta este tipo de degeneración, como en el caso del movimiento de algunos planetas menores (Aquiles, Patroclo, Héctor y Néstor) que tienen casi el mismo per´ıodo de revoluci´ on que J´ upiter. En la mayor´ıa de los sistemas la degeneración accidental es más frecuente que la degeneración intr´ınseca.

11.5.

Perturbaciones adiab´ aticas

Perturbaciones peque˜ nas y perturbaciones lentas. Veamos la diferencia en una expansi´ on de perturbaciones para perturbaciones peque˜ nas y para perturbaciones adiabáticas. En el primer caso hay un par´ ametro peque˜ no en el sistema determinado por la intensidad de la perturbación. El par´ ametro peque˜ no de una perturbación lenta est´ a dado por la relación entre la frecuencia de la perturbación y las frecuencias

Teor´ıa de perturbaciones / 505 rápidas del sistema. Cuando el par´ ametro toma el valor cero, el sistema posee solamente oscilaciones rápidas, y a medida que aumenta el valor del par´ ametro, aparecen las contribuciones de las frecuencias lentas. Asumamos que el sistema posee sólo una frecuencia rápida y que el hamiltoniano se puede separar en la forma: H = H0 (I, λ~y , λt) + λH1 (I, ϕ, λ~y , λt)

(11.171)

donde I y ϕ son las variables acción-´ angulo del movimiento no perturbado (λ = 0) del grado de libertad rápido, y ~ y = (q, p) son las variables canónicas de los restantes grados de libertad, no necesariamente expresadas en variables acción-´ angulo. Debido a que cuando λ = 0 el sistema es de un grado de libertad, entonces es integrable. Construcci´ on de invariantes adiab´ aticos can´ onicos. Para calcular el efecto de la perturbación buscamos una transformaci´ on canónica de (I, ϕ, ~y ) a (I, ϕ, ~y) tal que on generatriz el nuevo hamiltoniano no dependa de la variable angular rápida ϕ. La funci´ es de la forma: F = Iϕ + ~p~q + λF (1) I, ϕ, ~p, ~q, t + ... (11.172) y las f´ ormulas de transformaci´ on de primer orden son: I =I +λ

∂F (1) ; ∂ϕ (1)

∂F p~ = ~p + λ ; ∂~q

ϕ=ϕ−λ

∂F (1) ∂I

(11.173)

(1)

∂F ~q = ~q − λ ∂~p

(11.174)

Ahora reemplazamos a (11.173) y (11.174) en (11.171) y expandimos al primer orden en λ para obtener: ∂F (1) H0 (I, λ~y , λt) = H0 I, λ~y, λt + λω ∂ϕ

siendo ω = ∂H0 /∂I la frecuencia rápida. Con la transformaci´ on can´ onica el nuevo hamiltoniano total será: ∂F (1) I, ϕ, λ~y, λt H I, ϕ, λ~y, λt = H(I, ϕ, λ~y , λt) + λ ∂(λt)

(11.175)

(11.176)

En esta expresión ahora retenemos sólo los términos de primer orden en λ: ∂F (1) H I, ϕ, λ~y , λt = H0 (I, λ~y , λt) + λω + λH1 I, ϕ, λ~y , λt ∂ϕ

Al orden cero (11.177) nos da: H 0 I, λ~y , λt = H0 (I, λ~y , λt)

(11.177)

(11.178)

y al primer orden:

∂F (1) + H1 I, ϕ, λ~y , λt H 1 I, ϕ, λ~y , λt = ω ∂ϕ

(11.179)

506 / Mec´ anica cl´ asica avanzada Como por definición la transformaci´ on canónica elimina en H la dependencia de ϕ, se debe cumplir que F (1) satisfaga la ecuaci´ on diferencial: ω

∂F (1) = −{H1 } ∂ϕ

(11.180)

En tanto que la energ´ıa al primer orden satisface la expresión: H I, λ~y, λt = H0 I, λ~y, λt + λhH1 i

(11.181)

donde {...} y h...i denotan aqu´ı la parte oscilante y el promedio respectivamente, respecto a la variable angular ϕ. En (11.180) vemos que no hay complicaciones, como en (11.29) y (11.32), debidas a posibles resonancias entre ω y armónicos superiores de las frecuencias lentas. La ecuaci´ on (11.173) nos da los invariantes adiabáticos a orden cero en λ e I, y a primer orden en λ e I: I (I, ϕ, λ~y , λt) = I − λ

∂F (1) ∂ϕ

(11.182)

o equivalentemente: I =I+

λ {H1 } ω

(11.183)

Realmente cualquier funci´ on de I puede escogerse como un invariante adiabático. Mediante la construcci´ on de un invariante adiabático, si existe, se reduce el sistema de l grados de libertad a l − 1 grados de libertad. Esto se logra al encontrar la transformaci´ on can´ onica que elimina en H la dependencia respecto a ϕ, con lo cual I queda como un par´ ametro constante. Si uno de los restantes l − 1 grados de libertad sufre una oscilaci´ on rápida en comparaci´ on a los dem´ as grados de libertad, podemos introducir un segundo par´ ametro peque˜ no, transformar a variables acción-´ angulo el grado de libertad rápido y hallar un segundo invariante adiabático. El proceso puede continuarse para obtener una secuencia de invariantes adiabáticos, hasta que el sistema es reducido a un grado de libertad, que puede integrarse para obtener el invariante final. Esto significa que todo sistema posee l invariantes adiabáticos aproximados obtenidos mediante promedios, as´ı no sea integrable (es decir que no posea l constantes de movimiento en involuci´ on). Ejemplo 11.5.1 Este ejemplo se refiere a un sistema hamiltoniano no autónomo de un grado de libertad, que por tanto posee un comportamiento análogo al de un sistema de dos grados de libertad. Se trata de un oscilador lineal sometido a una variación adiabática de sus par´ ametros: Ho.l. =

1 1 G(λt) p2 + F (λt) q 2 2 2

(11.184)

Podemos hallar las variables acción ángulo mediante la funci´ on generatriz: 1/2 1 F q 2 tan ϕ (11.185) F1 = − 2 G

Teor´ıa de perturbaciones / 507 Entonces el hamiltoniano transformado toma la forma siguiente: H = ω0 I −

λR′ I sen 2ϕ 2R

(11.186)

p √ donde R(λt) = F/G, ω0 (λt) = F G y la prima denota derivada respecto a λt. La ecuaci´ on (11.186) tiene ahora la forma (11.171) y podemos aplicar los resultados de la teor´ıa de los adiabáticos can´ onicos. Al orden cero el invariante adiabático es: I=

H0 = constante ω0

(11.187)

La ecuaci´ on (11.183) nos da el invariante de primer orden: I = I (1 + λP sen 2ϕ)

(11.188)

donde P (λt) = −R′ /(2ω0 R). O sea que al primer orden I tiene una peque˜ na componente que oscila con una frecuencia el doble de la frecuencia rápida ω0 . De (11.188) se sigue: I˙ = λP˙ I sen 2ϕ + 0(λ2 )

(11.189)

Como P˙ = λP ′ , vemos que efectivamente I˙ es del orden de λ2 , siendo I un invariante al primer orden. Veamos las posibles resonancias entre ω0 y los armónicos de las frecuencias asociadas a los cambios adiabáticos de los par´ ametros. Para ello expandamos a P˙ en una serie de Fourier: X ′ P˙ = λ an einω1 λt (11.190) n

siendo ω1 λ la frecuencia de la oscilación lenta y ω1 /ω2 del orden de la unidad. Entonces, seg´ un (11.189) y (11.190), I˙ tendrá la siguiente expansi´ on de Fourier: i I X′ h i(nω1 λt+2ϕ) I˙ = λ2 an e − ei(nω1 λt−2ϕ) 2i n

(11.191)

a: Ahora, integremos a I˙ sobre un per´ıodo de la oscilación lenta. Esto nos dar´ " λ2 X′ ∆I e2i(2πω0 /(λω1 )+ϕ0 ) − e2iϕ0 = an 2i n i(nω1 λ + 2ω0 ) I # e−2i(2πω0 /(λω1 )+ϕ0 ) − e−2iϕ0 (11.192) − i(nω1 λ − 2ω0 ) Vemos que ∆I/I será del orden de λ2 , a no ser que haya una conmensurabilidad entre las oscilaciones en t y en ϕ: s ω0 = (11.193) λω1 2

508 / Mec´ anica cl´ asica avanzada donde s es un entero del orden de 1/λ. En este caso los términos con n = ±s en (11.192) serán constantes en t, y ∆I/I será del orden de λ: 2π ∆I ≈ λ|as | I ω1

(11.194)

O sea que si la resonancia es mantenida por tiempos del orden de un per´ıodo de la oscilaci´ on lenta, 2π/(λω1 ), el invariante de primer orden es destruido.

11.6.

Sistema de osciladores lineales con acoplamiento no lineal

Consideremos l osciladores lineales con frecuencias propias ω10 , ω20 , ...ωl0 acoplados anarm´ onicamente. El hamiltoniano es de la forma H = H0 + λH1 + λ2 H2 + ..., donde: X p2 1 ν (11.195) + m(ων0 )2 qν2 H0 = 2m 2 ν H1 =

X

aν qν3 +

ν

H2 =

XX µ

X

bν qν4 +

ν

+

′

XXX µ

XX µ

ν

aµν qµ2 qν +

ν

XXX µ

′

′

ν

′

aµνλ qµ qν qλ

(11.196)

λ

(bµν qµ2 qν2 + b′µν qµ3 qν )

ν

bµνλ qµ2 qν qλ +

XXXX µ

λ

ν

λ

(11.197) ′

bµνλρ qµ qν qλ qρ

ρ

donde µ, ν, λ y ρ var´ıan entre 1 y l. Los coeficientes a y b presentan en sus ´ındices las mismas propiedades de simetr´ıa que los productos de los qν que multiplican. La prima en la sumatoria significa que se omiten los términos con ´ındices iguales. Caso no degenerado. Cuando las ων0 son inconmensurables se dice que son no degeneradas. En las variables acción-´ angulo (ϕ0 , I 0 ), H0 es: H0 =

l X

ων0 Iν0

(11.198)

ν=1

H1 y H2 en funci´ on de (ω 0 , I 0 ) se obtienen sustituyendo: qν = Qν sen ϕν ;

Qν =

2Iν0 mων0

1/2

;

ϕν = ϕ0ν

(11.199)

Como en H1 sólo entran productos de sen ϕν un n´ umero impar de veces, se sigue que: H (1) = hH1 i = 0

(11.200)

Teor´ıa de perturbaciones / 509 Para hallar a H (2) aplicamos la fórmula (11.40), lo cual requiere hallar los coeficientes de Fourier A~n de H1 . Para escribir a H1 como una serie de Fourier usamos la identidad trigonométrica: 4 sen α sen β sen γ =

−sen (α + β + γ) + sen (−α + β + γ)

(11.201)

+sen (α − β + γ) + sen (α + β − γ) la cual nos da: 1X aν Q3ν [−sen (3ϕν ) + 3sen ϕν ] 4 ν

H1 =

+

1X aµν Q2µ Qν [−sen (2ϕµ + ϕν ) 4 µν

+2 sen ϕν + sen (2ϕµ − ϕν )] +

(11.202)

1X aµνλ Qµ Qν Qλ [−sen (ϕµ + ϕν + ϕλ ) 4 µνλ

+3 sen (ϕµ + ϕν − ϕλ )] La ecuaci´ on (11.202) tiene la forma de una serie de Fourier seno: X H1 = B~n sen (~n · ϕ ~)

(11.203)

~ n

donde todos los coeficientes de Fourier B (ν) (nν ) son cero excepto: 1X 3 aµν Q2µ Qν B1ν = aν Q3ν + 4 2 µ

(11.204)

1 B3ν = − aν Q3ν 4

(11.205)

1 νµ B21 = − aνµ Q2ν Qµ 4

(11.206)

µν B2−1 =

1 aνµ Q2ν Qµ 4

3 νµλ B111 = − aνµλ Qν Qµ Qλ 2 νµλ B11−1 =

3 aνµλ Qν Qµ Qλ 2

(11.207) (11.208) (11.209)

En (11.40) aparecen |A~n |2 = A~n A−~n , donde A~n est´ an relacionadas con los B~n por: A~n =

B~n − B−~n 2i

(11.210)

510 / Mec´ anica cl´ asica avanzada entonces: |A~n |2 =

1 (B~n − B−~n )2 4

(11.211)

con lo cual los |A~n |2 diferentes de cero son: 1 |Aν1 |2 = Cν = 64

3aν Q3ν + 2

X

aµν Q2µ Qν

µ

!

(11.212)

1 2 6 a Q 64 ν ν

|Aν3 |2 = Cν′ =

2 |Aνµ 21 | = Cνµ =

(11.213)

1 2 4 2 a Q Q 64 νµ ν µ

(11.214)

9 2 a Q2 Q2 Q2 16 νµλ ν µ λ

2 |Aνµλ 111 | = Cνµλ =

(11.215)

luego (11.40) toma la forma: 1XX 3X bν Q4ν + bνµ Q2ν Q2µ 8 ν 4 ν µ

H (2) =

−

X 1 ∂ (Cν + Cν′ ) 0 ∂I ω ν ν ν

− −

XX ν

µ

2 0 ∂Cνµ 0 ∂Cνµ − ω 4ω µ ν 4(ων0 )2 − (ωµ0 )2 ∂Iν ∂Iµ

XXX ν

µ

λ

(11.216)

∂Cνµλ 1 ων0 + ωµ0 + ωλ0 ∂Iν

1 + 0 ων + ωµ0 − ωλ0

∂Cνµλ ∂Cνµλ ∂Cνµλ + − ∂Iµ ∂Iµ ∂Iλ

Seg´ un (11.199) y (11.212) a (11.215) las cantidades C son de tercer grado en las Iν , de modo que todos los términos de H (2) son cuadráticos en las Iν . La energ´ıa total tiene entonces la siguiente dependencia de las variables de acción: X 1 XX 0 ω Iν Iµ (11.217) H(I) = ων0 Iν + 2 ν µ νµ ν Es claro que la condición de inconmensurabilidad de las frecuencias queda reducida a excluir los casos: 2ων0 = ωµ0 ;

ων0 + ωµ0 = ωλ0

para todos los valores de ν, µ, λ.

(11.218)

Teor´ıa de perturbaciones / 511 Ejemplo 11.6.1 Aplicar la teor´ıa de perturbaciones de estados degenerados al sistema construido por dos osciladores lineales con frecuencias conmensurables, sometidos a una perturbación anarm´ onica del tipo (11.196). Las trayectorias en el espacio de configuración para el movimiento no perturbado son las figuras de Lissajous. H0 es: H0 =

1 2 px + p2y + m(ωx0 )2 x2 + m(ωy0 )2 y 2 2m

(11.219)

donde rωx0 = sωy0 , siendo r y s enteros. La perturbación es de la forma:

H1 = ax x3 + ay y 3 + axy x2 y + ayx y 2 x

(11.220)

La solución al movimiento no perturbado en variables acción-´ angulo est´ a dada por (11.198) y (11.199). Para tratar la degeneraci´ on es conveniente separar la frecuencia no degenerada mediante una transformaci´ on can´ onica de la forma (11.89), que para este caso es: ϕ01 = ϕ′x ;

ϕ02 = −rϕ′x + sϕ′y

Ix′ = I10 − rI20 ;

Iy′ = sI20

(11.221) (11.222)

donde las primas denotan las variables de acción originales. H0 en términos de las I 0 es: H0 (I 0 ) = ω10 I10

(11.223)

donde las frecuencias est´ an dadas por: ω10 = ωx0 ;

ω20 = 0

(11.224)

La solución al movimiento no perturbado es: x=

2(I10 − rI20 ) mω10

y=

2s2 I20 rmω10

1/2

1/2

sen ϕ01 (11.225)

(rϕ01 + ϕ02 ) sen s

El promedio de H1 sobre un ciclo de la variable angular ϕ01 es: 1/2 s I10 − rI20 2I20 ϕ0 = − axy sen 2 δr,2s 0 0 2 mω1 rmω1 s 1/2 2s2 I20 I10 − rI20 ϕ0 sen 2 2 δs,2r 0 0 rmω1 mω1 s

hH1 (I10 , I20 , ϕ02 )i 1 + ayx 2

(11.226)

512 / Mec´ anica cl´ asica avanzada Si r 6= 2s o s 6= 2r el procedimiento falla porque hH1 i = 0, pero el resultado (11.218) es válido en ese caso, mostrando que sólo hay correcciones de orden superior al primero. Para precisar asumamos que 2ωx0 = ωy0 . Entonces: q 0 −axy 0 0 I2 sen ϕ02 hH1 (I10 , I20 , ϕ02 )i = I − 2I (11.227) 1 2 2(mω10 )3/2 La ecuaci´ on de Hamilton-Jacobi para este problema es: q A x C=− x3 − I10 + C = 0 ; x = I20 ; 2 sen ϕ02 Las ra´ıces dependen del signo del discriminante: 0 3 0 3 2 I1 I A2 C =− 1 D= − + + 6 2 6 4 sen2 ϕ02

(11.228)

(11.229)

que depende esencialmente de la magnitud de H (1) , o sea de la energ´ıa. Si D > 0, una ra´ız es real y dos son complejo conjugadas. Si D = 0, todas las ra´ıces son reales, siendo dos de ellas iguales entre s´ı; esto ocurre para valores de H (1) (I) y ϕ02 bien determinados. Si D < 0, todas las ra´ıces son reales y diferentes entre s´ı. Para D > 0, la ra´ız real es: 3/2 2/3 I10 C √ C √ 0 + (11.230) I2 = + − + D + D 3 2 2 Cuando D = 0 las ra´ıces son: I10 I10 I0 ; I20 = 2 1 ; 3 6 6 Cuando D < 0 las ra´ıces son: I10 2θ I10 2θ 2π 0 I2 = 1 + cos ; 1 + cos + 3 3 3 3 3 I10 2θ 4π 1 + cos + 3 3 3

(11.231)

(11.232)

donde cos θ = (6/I10 )3/2 C/2. La figura 11.1 muestra el comportamiento de las ra´ıces reales en funci´ on de C −1 . CT es el valor de C para el cual D = 0, que ocurre cuando: 0 3/2 0 3/2 I (1) ′ (mω1 ) =2 1 (11.233) −C = H (I ) axy sen ϕ02 6 √ Para A muy grande tenemos que D ≈ C/2. En ese caso se cumple que: I20 ≈ C 2/3 = A2/3 (sen ϕ02 )−2/3 ;

A2 ≫ (I10 )3

(11.234)

De (11.108) vemos que I20 ′ es igual al valor medio de I20 sobre un per´ıodo de ϕ02 . Entonces: H (1) (I ′ ) =

axy (I20 ′ )3/2 0 3/2 (mω1 ) h(sen ϕ02 )−2/3 i3/2

(11.235)

Teor´ıa de perturbaciones / 513 I 20/ 3

2 I 10 / 3 I 10/ 3

1/CT

1/C

Figura 11.1 Ra´ıces reales en función de C −1

11.7.

Movimiento cerca de una resonancia aislada

Para precisar, sea un sistema de dos grados de libertad sometido a una perturbación peque˜ na. Si se presenta una resonancia entre las frecuencias no perturbadas: r ω2 = ω1 s

(11.236)

entonces debemos usar la teor´ıa de perturbaciones de sistemas degenerados. Primero realizamos una transformaci´ on canónica del tipo (11.88) para aislar una de las frecuencias. Una funci´ on generatriz adecuada es: F2 = (rϕ1 − sϕ2 )I 1 + ϕ2 I 2

(11.237)

que da lugar a las f´ ormulas de transformaci´ on: I1 = rI 1 ;

I2 = I 2 − sI 1

ϕ1 = rϕ1 − sϕ2 ;

ϕ2 = ϕ2

(11.238) (11.239)

Cuando se aplica la perturbación, como vimos en el efecto Stark lineal, ϕ˙ 1 pasa a on de Fourier de ser una frecuencia lenta y ϕ˙ 2 es una frecuencia rápida. Si en la expansi´ H1 en las variables acción-´ angulo iniciales, (I, ϕ), efectuamos la transformaci´ on (11.238) y (11.239), obtenemos: H1 =

XX l

m

Hl,m (I)ei[lϕ1 +(ls+mr)ϕ2 ]/r

(11.240)

514 / Mec´ anica cl´ asica avanzada Ahora, en vez de “diagonalizar” a H1 como en la secci´ on 11.4, podemos usar la teor´ıa de las perturbaciones adiabáticas teniendo en cuenta que en resonancia, ϕ˙ 2 ≫ ϕ˙ 1 . La f´ ormula (11.181) nos da para este caso: H = H 0 (I) + λhH 1 i

(11.241)

donde hH 1 i es el promedio sobre ϕ2 . Como el promedio da lugar al factor δm,−sp : X (11.242) hH 1 i = H−pr,ps (I)e−ipϕ1 p

Como H no depende de ϕ2 , se cumple que I 2 = constante = I 20 . Notemos que I 2 = I2 + (s/r)I1 ; por tanto la resonancia modifica sustancialmente las constantes de ultiplo de I1 , o sea que la modificación movimiento. Si s ≫ r, I 2 es simplemente un m´ más importante ocurre para las resonancias con s peque˜ nos. Con I 2 constante, el movimiento en el plano I 1 − ϕ1 es el de un sistema de un grado de libertad, que es integrable. Chirikov5 ha mostrado que para cualquier sistema ese movimiento es aproximadamente como el de un péndulo o como el de un oscilador armónico, seg´ un la degeneración sea accidental o intr´ınseca. Como el movimiento no perturbado es degenerado, en la superficie de secci´ on I 1 −ϕ1 , con ϕ2 = constante, habr´ an s puntos formando una circunferencia de radio I 1 (ver secci´ on 10.2). Para λ 6= 0 la perturbación altera el toroide y las intersecciones de la trayectoria con la superficie de secci´ on modificando por tanto las soluciones periódicas. Si existen, los puntos fijos sobre la superficie de secci´ on, que llamaremos P0 (I 10 , ϕ10 ), son solución al sistema de ecuaciones: ∂H ∂H =0 (11.243) = 0 ; ∂ϕ1 P0 ∂I 1 P0 que representan las soluciones periódicas para el hamiltoniano perturbado. Cuando λ = 0, todas las soluciones son periódicas, pero para λ 6= 0 sólo quedan las soluciones periódicas dadas por (11.243). Las amplitudes de Fourier en (11.242) generalmente decaen cuando p aumenta. Entonces podemos describir el movimiento en las variables integrables (I 1 − ϕ1 ) usando solamente los términos con p = 0, ±1: H = H 0 (I) + λH00 (I) + 2λHr,−s (I) cos ϕ1

(11.244)

notando que los coeficientes con p = 1 y p = −1 sólo difieren en la fase, de modo que puede hacerse H−r,s = Hr,−s con la simple adici´ on a ϕ1 de una constante. Las f´ ormulas (11.243) y (11.244) nos dan las siguientes ecuaciones para la localización de los puntos fijos: ∂H00 (I) Hr,−s (I) ∂H 0 (I) +λ + 2λ cos ϕ10 = 0 ∂I 10 ∂I 10 ∂I 10 2λHr,−s (I) sen ϕ10 = 0 5 Chirikov,

B.V., 1979, en Physics Reports, pp. 265-379.

(11.245)

Teor´ıa de perturbaciones / 515 Entonces los puntos fijos est´ an localizados en ϕ10 = 0, nπ. Como ∂I1 /∂I 1 = r y a determinado ∂I2 /∂I 1 = −s, vemos que ∂H 0 /∂I 1 = sω1 − rω2 = 0. Por tanto I 10 est´ por: Hr,−s ∂H00 ±2 =0 ∂I 10 ∂I 10

(11.246)

Para puntos de la superficie de secci´ on diferentes a los puntos fijos, se cumple que: I˙ 1 = −2λHr,−s sen ϕ1

(11.247)

∂H00 ∂Hr,−s ∂H 0 +λ + 2λ cos ϕ1 ϕ˙ 1 = ∂I 1 ∂I 1 ∂I 1

(11.248)

O sea que los desplazamientos de I 1 respecto a un punto fijo son del orden de λ. En cuanto a ϕ1 , el comportamiento es diferente seg´ un la degeneración sea accidental o intr´ınseca. Si la degeneraci´ on es accidental, entonces H 0 = H 0 (I 1 , I 2 ) y por esto la amplitud de las oscilaciones de ϕ1 es del orden de la unidad. Si la degeneración es intr´ınseca, entonces H 0 (I 1 , I 2 ) = H0 (sI1 + rI2 ) = H 0 (I 2 ) y, entonces, ∂H 0 /∂I 1 = 0 y las oscilaciones de ϕ1 son del orden de λ. Degeneraci´ on accidental. En este caso I 1 permanece en las cercan´ıas del punto fijo, pero ϕ1 puede alejarse del mismo. Entonces podemos escribir: I 1 = I 10 + ∆I 1

(11.249)

Esto nos permite expandir a H(I) en las cercan´ıas de I 10 . Para ello usamos en (11.244) las expresiones: H 0 (I) = H 0 (I 0 ) +

∂H 0 1 ∂2H 0 ∆I 1 + (∆I 1 )2 + ... 2 ∂I 2 ∂I 10 10

(11.250)

H00 (I) = H00 (I 0 ) +

∂H00 1 ∂ 2 H00 ∆I 1 + (∆I 1 )2 + ... 2 ∂I 2 ∂I 10 10

(11.251)

Hrs (I) = Hrs (I 0 ) +

∂Hrs 1 ∂ 2 Hrs (∆I 1 )2 + ... ∆I 1 + 2 ∂I 2 ∂I 10 10

(11.252)

Reteniendo los términos de orden más bajo en λ y ∆I 1 obtenemos: ∆H = H − H 0 (I 0 ) − λH00 (I 0 ) =

1 ∂2H 0 (∆I 1 )2 + 2λHr,−s cos ϕ1 2 ∂I 2 10

(11.253)

∆H describe el movimiento en las cercan´ıas de la resonancia, y puede escribirse como: ∆H =

1 G(∆I 1 )2 − F cos ϕ1 2

(11.254)

516 / Mec´ anica cl´ asica avanzada donde: G(I 0 ) =

∂ 2H 0 2

∂I 10

;

F (I 0 ) = −2λHr,−s (I 0 )

(11.255)

Este resultado nos muestra que el movimiento cerca a cualquier resonancia, para cualquier sistema, es aproximadamente similar al de un péndulo (el diagrama de fases presenta rotación, separatriz y vibración, ver ejemplo 10.3.2). Si GF > 0, el punto fijo estable est´ a en ϕ1 = 0 y el punto fijo inestable en ϕ1 = ±π. on cerca al punto estable es baja: La frecuencia del movimiento en I 1 − ϕ1 para la libraci´ !1/2 √ ∂2H 0 ω1 = F G = λ1/2 −2Hr,−s · (11.256) 2 ∂I 10 y, seg´ un la f´ ormula (10.104), se hace cero en la separatriz. El máximo desplazamiento en ∆I 1 est´ a dado en la mitad de la separatriz y vale: 1/2  r   −2H F  r,−s  (11.257) = λ1/2  2 máx ∆I 1 = 2  G  ∂ H0  2

∂I 10

Degeneraci´ on intr´ınseca. En este caso, de (11.247) y (11.248), se sigue que tanto I 1 como ϕ1 permanecen cerca del punto fijo porque ∂H 0 /∂I 1 = 0. En las proximidades del punto el´ıptico ϕ10 escribimos ϕ1 = ∆ϕ1 , y por tanto:

1 cos ϕ1 = 1 − (∆ϕ1 )2 + ... ; ϕ1 ≈ 0 (11.258) 2 En las proximidades del punto hiperb´ olico ϕ10 = π (o ϕ10 = −π) escribimos ϕ1 = ±π + ∆ϕ1 y por lo tanto: 1 cos ϕ1 = −1 + (∆ϕ1 )2 + ... ; 2

ϕ1 ≈ ±π

(11.259)

En este caso ∆H en vez de (11.254) toma la forma: ∆H =

1 1 G(∆I 1 )2 + F (∆ϕ1 )2 2 2

(11.260)

donde: G=

∂2H 0 2

∂I 10

+λ

∂ 2 H00 2

∂I 10

+λ

∂ 2 Hr,−s

(11.261)

2

∂I 10

F = ∓2λHr,−s

(11.262) 2

Como para degeneración intr´ınseca ∂ 2 H 0 /∂I 10 = 0, se sigue que F y G son del orden de λ. Cerca del punto fijo el´ıptico la frecuencia de oscilación es: " !#1/2 √ ∂ 2 H00 ∂ 2 Hr,−s ω1 = F G = λ −2Hr,−s (11.263) + 2 2 ∂I 10 ∂I 10

Teor´ıa de perturbaciones / 517 y la relaci´ on de semiejes de la elipse es:

∆I = ∆ϕ1

r

1/2



  F −2Hr,−s   = 2  G  ∂ (H00 + Hr,−s ) 

(11.264)

2

∂I 10

Cerca del punto fijo hiperb´ olico no hay oscilaciones. Las órbitas no son el´ıpticas sino hiperb´ olicas, siendo el ´ angulo entre las as´ıntotas: r F (11.265) tan χ = G Vemos que no hay gran diferencia cualitativa entre las trayectorias de fase en los casos con degeneraci´ on intr´ınseca y accidental, sólo que en el segundo caso las oscilaciones en ∆I 1 tienen amplitud muy peque˜ na en comparaci´ on con las de ϕ1 . Lo anterior suponiendo que G 6= 0. Ejemplo 11.7.1 Analizar el movimiento cerca a la resonancia del sistema de dos osciladores con acoplamiento no lineal del ejemplo 11.6.1. En este caso la degeneraci´ on es intr´ınseca, con r = 2, s = 1. H1 est´ a dado por (11.227), de modo que, reemplazando sen ϕ02 por cos ϕ02 y haciendo λ = axy : hH1 i =

−1 (I 0 − 2I20 )(I20 )1/2 cos ϕ02 2(mω10 )3/2 1

(11.266)

Entonces: 2H2,−1 =

−1 (I 0 − 2I20 )(I20 )1/2 2(mω10 )3/2 1

(11.267)

en tanto que H0 (I0 ) = ω10 I10 . Por tanto: 2

∂ 2 H2,−1 2

∂I 20

=

i h 1 −3/2 −1/2 I (I ) + 6(I ) 10 20 20 2(mω10 )3/2

(11.268)

En cercan´ıas del punto el´ıptico F y G serán: F =

λ (I 10 − 2I 20 )(I 20 )1/2 (mω10 )3/2

(11.269)

G=

h i λ −3/2 −1/2 I (I ) + 6(I ) 10 20 20 4(mω10 )3/2

(11.270)

ω1 será: ω1 =

1/2 λ (I 10 − 2I 20 )(I 10 + 6I 20 ) 2(mω10 )3/2 I 20

(11.271)

518 / Mec´ anica cl´ asica avanzada Libración

Rotación Resonancia:

Separatriz

I20 = I20 ϕ02 = ϕ20 I20

ϕ20

λ=0 Punto hiperbólico a

Punto elíptico b

Figura 11.2 Movimiento cerca a la resonancia del sistema de dos osciladores con acoplamiento no lineal. Superficie de sección I20 − ϕ02 . La relaci´ on entre las oscilaciones máximas en I20 y ϕ02 est´ a dada por: 1/2 ∆I20 = 2I 20 (I 10 − 2I 20 )(I 10 + 6I 20 ) 0 ∆ϕ2

(11.272)

La figura 11.2 muestra la superficie de secci´ on I20 − ϕ02 , en coordenadas polares, con y sin perturbación. Resonancias de orden superior. Si λ no es demasiado peque˜ na, el hamiltoniano (11.240) puede dar lugar a contribuciones seculares que modifiquen o destruyan el invariante adiabático I 2 . Tales resonancias son entre armónicos de la oscilación pendular I 1 − ϕ1 , de frecuencia ω1 , y la frecuencia fundamental ω2 . En el l´ımite adiabático esas resonancias dan lugar a cadenas de “islas”, o sea, a movimientos pendulares alrededor de los puntos fijos en el plano J1 − χ1 de las variables acción-´ angulo del movimiento pendular I 1 − ϕ1 [ver ecuaciones (10.99) y (10.100)]. Nuevamente se debe efectuar una transformaci´ on canónica que elimine la frecuencia degenerada, o sea, pasar a las variables angulares χ1 y χ2 dadas por χ1 = pχ1 − qϕ2 ; χ2 = ϕ2 , donde p y q son los n´ umeros enteros de la resonancia de segundo orden. El paso siguiente consiste en encontrar los par´ ametros que describen el movimiento pendular alrededor de los puntos fijos de J1 − χ1 . El hamiltoniano que describe la resonancia primaria es de la forma (11.254) o (11.260), que en las cercan´ıas del punto el´ıptico se comportan similarmente, y para peque˜ nas libraciones puede expandirse, de acuerdo con la ecuación (10.105), en la forma: 1 λGJ12 + ... (11.273) 16 donde J1 y χ1 son las variables acción-´ angulo del movimiento pendular en el plano ∆I 1 − ϕ1 alrededor de un punto el´ıptico, dadas en el ejemplo 10.3.2. Si el movimiento K0 (J1 , J2 ) = H 0 (I 10 , J2 ) + ω1 J1 −

Teor´ıa de perturbaciones / 519 es “exactamente” pendular, J1 es constante. Cuando hay resonancias secundarias, el movimiento en el plano ∆I 1 − ϕ1 no es exactamente pendular, sino como el mostrado en la figura 11.3, que muestra la cadena de islas asociada a la resonancia cuando 5ω1 = ω2 , donde ω1 = χ˙ 1 . A la resonancia secundaria le corresponden cinco puntos fijos el´ıpticos, en cada uno de los cuales es generado un movimiento pendular secundario. ∆I1 cos ϕ1

J1 sen χ1

∆I1 cos ϕ1

a

b

Figura 11.3 Cadena de islas asociada a la resonancia: a. Aparecen las separatrices y las curvas de libraci´ on; b. Cadena de islas formadas en la resonancia secundaria.

En la figura 11.3a, aparecen las separatrices y las curvas de libraci´ on. Las l´ıneas punteadas corresponden a la resonancia primaria y las l´ıneas continuas corresponden a las “islas” formadas en la resonancia secundaria. En la figura 11.3b, se han llevado las “islas” de la resonancia secundaria a variables acción-´ angulo. En un paso siguiente, uno podr´ıa transformar las variables (J, χ) a unas nuevas variables (J, χ) donde sea removida la resonancia 5ω1 = ω2 , dando lugar nuevamente a curvas de tipo pendular como las de la figura 11.2b. Para tener en cuenta la forma como una resonancia secundaria modifica la solución, ′ reintroducimos los términos de H 1 ignorados al promediar sobre ϕ2 , al ir de (11.240) a (11.242): ′

H 1 (I, ϕ) = H 1 (I, ϕ) − hH 1 (I, ϕ1 )i

(11.274)

que tiene la expansi´ on de Fourier: ′

H 1 (I, ϕ) =

XX l

′

H lm (I)eilϕ1 /r+i(ls+mr)ϕ2 /r

(11.275)

m

donde la prima indica que se suprimen los términos d.c. en ϕ2 , ls + mr = 0. En las cercan´ıas del punto el´ıptico ϕ10 = 0: ′

H1 =

XX l

m

′

H lm (I 10 + ∆I 1 , I 2 )eil∆ϕ1 /r+i(ls+mr)ϕ2 /r

(11.276)

520 / Mec´ anica cl´ asica avanzada Ahora transformemos esta expresión a variables acción-´ angulo, mediante la fórmula: ∆ϕ1 =

2J1 R

1/2

sen χ1 ;

R=

F R

1/2

(11.277)

Si estamos en las cercan´ıas de punto el´ıptico, con movimiento de libraci´ on, ∆I 1 y ∆ϕ1 son peque˜ nas, por lo que J1 /R ha de ser peque˜ no. Entonces (11.276) al orden más bajo en ∆I 1 y ∆ϕ1 nos da para el nuevo hamiltoniano, tomando χ2 = ϕ2 y J2 = I 2 : √ XX i(l/r) 2J1 /R sen χ1 +i(ls/r+m)χ2 ′ K1 = (11.278) H lm (I 10 , J2 )e l

m

Usando la f´ ormula: eix sen θ =

∞ X

Jn (x) einθ

(11.279)

n=−∞

donde Jn son las funciones Bessel enteras de orden n, podemos escribir a K1 como: XXX ′ (11.280) K1 = Γlmn (I 10 , J2 )einχ1 +i(ls/r+m)χ2 l

donde:

m

n

" 1/2 # l 2J1 Γlmn (I 10 , J2 ) = H lm (I 10 , J2 )Jn r R

(11.281)

En (11.280) resulta claro que pueden existir resonancias entre χ1 y χ2 cuando: ls χ˙ 2 r+m √ √ o sea, cuando ω 1 = χ˙ 1 = F G = 0( λ) y ω 2 = 0(1) son conmensurables, nχ˙ 1 = −

p ω2 = ; ω1 q

p, q : enteros

(11.282)

(11.283)

Resulta ahora que la frecuencia χ˙ 1 = pχ˙ 1 − q χ˙ 2 es mucho menor que χ˙ 2 . Entonces χ˙ 2 puede ser eliminada con una transformaci´ on canónica mediante: F2 = (pχ1 − qχ2 )J 1 + χ2 J 2 lo cual nos da para para K 1 : XXX ′ K1 = Γlmn ei[nχ1 +p(nq+p(ls/r+m))χ2 ]/p l

m

(11.284)

(11.285)

n

on Ahora la variable angular χ2 puede ser eliminada mediante una transformaci´ can´ onica adecuada, que equivale a promediar sobre χ2 . Introduciendo un nuevo par´ ametro peque˜ no λ1 , (11.273) y (11.285) nos conducen a: K = K 0 (J 1 , J 2 ) + λ1 K 1 (J 1 , J 2 , χ1 )

(11.286)

Teor´ıa de perturbaciones / 521 en K 1 sólo aparecen los términos con n dados por: ls +m =0 nq + p r

(11.287)

siendo nq, ls/r y mp enteros. Esto equivale a dejar en (11.280) sólo los términos con: nχ1 +

ls + mr χ2 = −jpχ1 + (ks + jq − ks)χ2 = j(qχ2 − pχ1 ) r

(11.288)

o sea, con: l = k ; m = jq − ks ; j, k : enteros r Entonces la expansi´ on (11.280) toma la forma: X K−jp,jq e−ijχ1 K1 = n = −jp ;

(11.289)

(11.290)

j

donde: K−jp,jq =

X

Γkr,jq−ks,−jp

(11.291)

k

Ahora, como K no depende de χ2 , J 2 es constante: q J 2 = J2 + J1 = constante p

(11.292)

que es el invariante adiabático para las oscilaciones que dan lugar a las “islas”. El movimiento en J 1 − χ1 es integrable, siendo las oscilaciones de ∆J 1 y χ1 alrededor del punto fijo el´ıptico, como en (11.254), de forma pendular y por tanto aplicables los resultados para este tipo de movimiento. Como K 1 proviene de la parte oscilante de H 1 , el armónico más bajo en (11.290) se obtiene para j = ±1. Asumamos que q = 1, que corresponde a la resonancia con el fundamental de la oscilación χ2 = ϕ2 . Entonces el coeficiente de Fourier del término dominante en (11.290) es: ! r X l 2J1 H kr,±1−ks J−p (11.293) K−p,±1 = r R k p o sea, proporcional a Jp [(l/r) 2J1 /R]. De (11.256) se sigue que ω1 = 0(λ)1/2 y de (11.283) que ω2 = pω1 . Como ω2 = O(1), se cumple que p espun entero del orden de λ−1/2 . De (11.257) se sigue que máx ∆I 1 = 2R, por lo tanto 2J1 /R es del orden de la unidad. El desarrollo asint´ otico de Jn (x) para n grande es: x n (11.294) Jn (x) ≈ (2πn)1/2 en 2n como λ es peque˜ no, p es grande y podemos escribir: ! !p r r 2J1 l 2J1 l −1/2 p Jp ≈ (2πp) e r R 2rp R h √ √ i (11.295) = O (e λ)1/ λ

522 / Mec´ anica cl´ asica avanzada lo cual nos muestra la peque˜ nez del término dominante en K 1 . F , el término de interacción en el movimiento pendular secundario es, de acuerdo con (11.255), proporcional a Kp,±1 , o sea a Jp . De (11.256) se sigue que las oscilaciones pendulares en las “islas” es muy baja, en tanto que de (11.257) se concluye que la amplitud de las oscilaciones √ 1/(2√λ) 1/(4√λ) √ J1 , que son muy peque˜ nas y además “islas” es proporcional a λ1 (e λ) decrecen rápidamente cuando J1 decrece. Para λ peque˜ no, las oscilaciones “islas” son despreciables, pero para λ relativamente grande, se sigue de (11.295) que pueden llegar a ser importantes, incluso comparables a las de la resonancia primaria. La rápida reducción del tama˜ no de las cadenas de “islas” de orden superior cerca a los puntos fijos nos indica que dichos puntos son relativamente estables cuando las perturbaciones no son muy grandes. Pero para perturbaciones grandes aparecerán muchos nuevos puntos fijos el´ıpticos y cadenas de “islas” de orden superior de tama˜ no apreciable, as´ı como frecuencias de libraci´ on, que alteran drásticamente los invariantes adiabáticos o sea los toroides invariantes.

11.8.

Movimientos regulares e irregulares

Se denomina irregular, caótico o estoc´ astico al movimiento de un sistema de varios grados de libertad en que por aumento de una perturbación desaparecen constantes de movimiento uniformes, alterando la topolog´ıa de los toroides invariantes. El teorema de Kolmogorov, Arnold y Moser establece que para perturbaciones suficientemente peque˜ nas existen a´ un toroides invariantes (movimientos regulares), si el sistema satisface ciertas condiciones. La existencia de toroides invariantes usualmente se cuantifica por medio de la medida de la región del espacio fásico ocupada por toroides invariantes. La estocasticidad global se presenta cuando la región ocupada por toroides invariantes tiene una medida suficientemente peque˜ na, o sea que el movimiento esencialmente es caótico, y se puede caracterizar por el valor del par´ ametro de perturbación. Aplicaciones de una superficie de secci´ on en s´ı misma. Sobre el toroide invariante de un sistema de dos grados de libertad, el movimiento puede ser parametrizado por las variables angulares ϕ1 , ϕ2 , o por el tiempo, as´ı: ϕ1 = ω1 t + ϕ10 ;

ϕ2 = ω2 t + ϕ20

(11.296)

Como ω1 y ω2 son funciones de las variables de acción I1 , I2 , que para un sistema integrable son constantes de movimiento uniformes, se sigue entonces que la raz´ on entre ω1 y ω2 es igualmente una constante: ~ = α(I)

~ ω1 (I) ~ ω2 (I)

(11.297)

Para α = r/s, con r y s n´ umeros enteros, ω1 y ω2 son conmensurables y el movimiento degenera en una curva bidimensional, que se repite después de r giros en ϕ1 y s giros en ϕ2 . Como r y s pueden ser grandes, y entre cualquier par de n´ umeros racionales siempre hay muchos racionales, se sigue que las órbitas periódicas son arbitrariamente próximas entre s´ı en el espacio fásico.

Teor´ıa de perturbaciones / 523 El concepto de movimiento sobre un toro puede generalizarse a más de dos grados de libertad. Si se toma t = 0 cuando la trayectoria cruza la superficie de secci´ on en el punto x0 , en t = 2π/ω2 cruzará en el punto x1 , en t = 4π/ω2 cruzará en x2 y as´ı sucesivamente. Entre dos intersecciones consecutivas ϕ1 avanza por ω1 ∆t = 2πα, donde α es el n´ umero r/s. Como la energ´ıa E es funci´ on de I1 e I2 , para E fija, α puede asumirse funci´ on de I1 solamente. Los puntos de las sucesivas intersecciones con la superficie de secci´ on est´ an relacionados entre s´ı mediante cierto mapeo o aplicación discreta, llamada aplicación canónica. Llamando x al conjunto (I, ϕ): xn+1 = C(xn )

(11.298)

o expl´ıcitamente: x1,n+1 = I1,n ;

ϕ1,n+1 = ϕ1,n + 2πα(I1,n+1 )

(11.299)

donde escribimos a α como una funci´ on de I1,n+1 . La anterior es la aplicación “twist”, que aplica c´ırculos en c´ırculos, pero con un n´ umero de rotación α que en general depende del radio. La figura 11.4 muestra la aplicación para α irracional (l´ıneas continuas) y para α racional (l´ıneas a trazos) con s = 6. Trayectoria de fases

Puntos fijos con r entero y s = 6 I1 x0 x1

ϕ1

I2 x2 ϕ2

ϕ2 = constante a

α irracional b

Figura 11.4 Toroide invariante de un sistema de dos grados de libertad ϕ1 y ϕ2 . A la izquierda, curva bidimensional que se repite después de r giros en ϕ1 y s giros en ϕ2 . Al lado derecho, mapa de Poincaré formado por puntos xi donde la trayectoria cruza la superficie de sección. Directamente de (11.299) se sigue que: I1,n+1 , ϕ1,n+1 =1 J I1,n , ϕ1,n

(11.300)

o sea que la aplicación transforma una región arbitraria de la superficie de secci´ on en otra conservando el ´ area.

524 / Mec´ anica cl´ asica avanzada Lo anterior es válido para sistemas integrables. Si este sistema es perturbado ligeramente, el hamiltoniano será ahora funci´ on de los ángulos: ~ ϕ ~ + λH1 (I, ~ ϕ H(I, ~ ) = H0 (I) ~)

(11.301)

En la superficie de secci´ on I1 − ϕ1 definida por ϕ2 = constante (m´ odulo 2π), esperamos que la aplicación “twist” cambie en una aplicación “twist” perturbada: In+1 = In + λf (In+1 , ϕn ) (11.302) ϕn+1 = ϕn + 2πα(In+1 ) + λg(In+1 , ϕn ) donde se ha omitido el sub´ındice 1. f y g son funciones periódicas de ϕn . Como la transformaci´ on de n a n + 1 es generada por las ecuaciones de Hamilton, la aplicación (11.302) debe conservar el área. Esta aplicación puede tomarse como una transformaci´ on can´ onica con funci´ on generatriz: F2 (In+1 , ϕn ) = In+1 ϕn + 2πA(In+1 ) + λB(In+1 , ϕn )

(11.303)

donde: α=

∂A ; ∂In+1

f =−

∂B ; ∂ϕn

g=

∂B ∂In+1

(11.304)

La condición de conservaci´ on del área (11.300) implica ahora que: ∂f ∂g + =0 ∂In+1 ∂ϕn

(11.305)

Cuando f no depende de I y g = 0, entonces de (11.302) se obtiene la aplicación “twist” radial perturbada: In+1 =

In + λf (ϕn )

ϕn+1 =

ϕn + 2πα(In+1 )

(11.306) Cuando f = sen ϕn esta aplicación se llama la aplicación est´ andar (o aplicación de Chirikov). Una involuci´ on C = i es una aplicación canónica tal que al repetirse dos veces reproduce las condiciones iniciales. Entonces: xn+2 = i(xn−1 ) = i2 (xn ) = xn

(11.307)

La aplicación “twist” radial es un producto de involuciones si f (−ϕ) = −f (ϕ). Las dos involuciones que dan lugar a la aplicación “twist” radial son: I = In + f (ϕ)n ;

ϕ = −ϕn

(11.308)

ϕn+1 = −ϕ + 2πα(I)

(11.309)

y, In+1 = I ;

La factorización en involuciones ayuda a determinar los puntos fijos, pues los puntos fijos de las involuciones son de per´ıodo 1. Por ejemplo, (11.308) tiene los puntos fijos

Teor´ıa de perturbaciones / 525 dados por ϕ1 = 0, π para todo I1 , y (11.309) tiene puntos fijos dados por 2ϕ2 = 2πα(I2 )− 2πm con m entero. A partir de las ecuaciones de Hamilton podemos hallar la correspondiente aplicación sobre una superficie de secci´ on. Las ecuaciones de Hamilton del hamiltoniano (11.301) son: dIi ∂H1 ; = −λ dt ∂ϕi

dϕi ∂H1 ∂H0 +λ = dt ∂Ii ∂Ii

(11.310)

La ecuaci´ on para I1 sobre la superficie de secci´ on ϕ2 = constante = ϕ20 , entre la n y la n + 1-ésima iteraci´ on, es: ∂H1 dI1 (In+1 , I2 , ϕn + ω1 t, ϕ20 + ω2 t) = −λ dt ∂ϕ1

(11.311)

donde I2 , ω1 y ω2 son funciones de In+1 . En la n-ésima iteraci´ on en (11.311) t = 0 y en la n + 1-ésima iteraci´ on t = T2 . Luego el salto en la acción I1 en una iteraci´ on es: Z T ∂H1 ∆I1 = −λ dt (In+1 , I2 , ϕn + ω1 t, ϕ20 + ω2 t) (11.312) ∂ϕ1 0 Entonces de (11.302) se sigue que: λf (In+1 , ϕn ) = ∆I1 (In+1 , ϕn+1 )

(11.313)

La funci´ on g que define el cambio en ϕn se obtiene de la condición de conservaci´ on del área, (11.305): Z ϕ ∂f g(I, ϕ) = − dϕ (11.314) ∂I El problema inverso consiste en hallar el hamiltoniano asociado a la aplicación canónica. Para la aplicación (11.306), podemos asumir que el ´ındice n hace las veces del par´ ametro “tiempo”. La funci´ on delta periódica permite seleccionar los tiempos de cruce de la trayectoria con la superficie de secci´ on: δ1 (n) =

∞ X

m=−∞

δ(n − m)

(11.315)

Entonces (11.306) toma la forma: dI = λf (ϕ)δ1 (n) ; dn

dϕ = 2πα(I) dn

(11.316)

donde In y ϕn son I(n − ǫ) y ϕ(n − ǫ). Estas ecuaciones son de forma hamiltoniana con: Z I Z θ H(I, ϕ, n) = 2π α(I ′ )dI ′ − λδ1 (n) f (ϕ′ )dϕ′ (11.317) que es un hamiltoniano no aut´ onomo de un grado de libertad.

526 / Mec´ anica cl´ asica avanzada Ejemplo 11.8.1 Construir un hamiltoniano para la aplicación est´ andar (11.306). Dicha aplicación es: In+1 =

In + K sen ϕn

ϕn+1 =

ϕn + In+1

(11.318) Las ecuaciones de movimiento seg´ un (11.316) son: dI = K sen ϕ δ1 (n) ; dn

dϕ =I dn

(11.319)

y el hamiltoniano seg´ un (11.317) es: H=

1 2 I + Kδ1 (n) cos ϕ 2

(11.320)

Es conveniente usar la expansi´ on de Fourier de la funci´ on delta periódica, (11.315): δ1 (n) = 1 + 2

∞ X

cos 2πqn

(11.321)

q=1

entonces: H=

∞ X 1 2 I + K cos ϕ ei2πnm 2 m=−∞

(11.322)

donde el n´ umero de iteraci´ on n es una variable temporal, resultando H no autónomo. H puede también escribirse en la forma: H = H 0 + H1

(11.323)

donde: H0 =

1 2 I + K cos ϕ 2

(11.324)

y, H1 = 2K cos ϕ

∞ X

cos 2πqm

(11.325)

q=1

Como se ve, H0 es el hamiltoniano de un péndulo y H1 es una perturbación consistente en una serie de impactos periódicos en el tiempo. Ejemplo 11.8.2 Construir la aplicación correspondiente al movimiento en las cercan´ıas de la separatriz, en una superficie de secci´ on, para un sistema de dos grados de libertad.

Teor´ıa de perturbaciones / 527 Por aplicar la teor´ıa de las perturbaciones seculares a una resonancia dada en un sistema cuasi-integrable y promediando sobre las variables angulares rápidas, el hamiltoniano que describe el movimiento cerca a la resonancia toma la forma (11.254): 1 H = H0 (I) + Gp2 − λF cos q 2

(11.326)

Como este hamiltoniano describe un movimiento cuasiperiódico, con una parte rápida: I = constante ;

ϕ = ωϕ (I)t + ϕ0

(11.327)

y una parte lenta correspondiente al movimiento integrable de un péndulo, la aplicación en cualquier superficie de secci´ on, ϕ = constante o q = constante, es la aplicación canónica (11.299). Para hallar la aplicación perturbada, correspondiente a (11.302), debemos considerar los términos resonantes que fueron despreciados al promediar la resonancia ω2 /ω1 = r/s sobre la variable angular rápida ϕ como en (11.242). Entonces, de (11.240), el hamiltoniano completo, que contiene resonancias entre ϕ y el movimiento lento q, y movimiento caótico en cercan´ıas de la separatriz, es: 1 H = H0 (I) + Gp2 2 − λF cos q + λ

X

l>1,m6=0

Hlm cos

lϕ mq − + ∆lm r r

(11.328)

donde G, F , Hlm y ∆lm dependen sólo de I. Ahora podemos aplicar la f´ ormula (11.312) para hallar a f de la aplicación perturbada en una superficie de secci´ on, que depende sólo de los términos reintroducidos en (11.328). La figura 11.5 muestra el movimiento en las superficies de secci´ on p − q y I − ϕ, donde la parte rayada representa el movimiento en la separatriz junto con la componente estoc´ astica. Ver más adelante. Por conveniencia, buscamos la aplicación sobre la superficie de secci´ on I − ϕ con q ≈ ±π. Como los coeficientes de Fourier decaen al aumentar l y m, retendremos sólo el término dominante con l = m = 1. Entonces (11.328) y (11.312) nos dan: Z ∞ ϕ q i ∂ h f (In+1 , ϕn ) = − dt H11 cos (11.329) − + ∆11 ∂ϕ r r −∞ Seg´ un la ecuaci´ on (10.105), para la trayectoria separatriz se cumple: q = 4 tan−1 (eω0 t ) − π donde ω02 = λF G. f toma la forma: Z ωϕ (In+1 )t ϕn A(In+1 ) +∞ q dt − − f (In+1 , ϕn ) = sen r r r r −∞

(11.330)

(11.331)

donde A es H11 y ∆11 ha sido incluido en ϕn que mide a ϕ en el n-ésimo cruce por la superficie de secci´ on colocada en la separatriz, q ≈ ±π. Teniendo en cuenta que

528 / Mec´ anica cl´ asica avanzada p

q

ωq +π

–π Superficie de sección ϕ = constante

a Iy

ϕ Ix

ωϕ

Superficie de sección q = constante b

Figura 11.5 Movimiento en las superficies de sección para un sistema de dos grados de libertad: a. Secci´ on p − q; b. Secci´ on I − ϕ.

q(−ω0 t) = −q(ω0 t), expandiendo la funci´ on seno y notando que sólo la parte simétrica contribuye a la integral, obtenemos: f (In+1 , ϕn ) =

A −ϕn α2 (Q0 ) sen ω0 r r

(11.332)

donde:

mq(s) αm (Q0 ) = cos − Q0 s ds 2r −∞ Z

∞

(11.333)

es la integral de Arnold-Melnikov, y: Q0 =

ωϕ rω0

(11.334)

Teor´ıa de perturbaciones / 529 La integral (11.333) es impropia pero consta de una parte oscilante que promedia a cero durante el movimiento sobre la separatriz y una parte constante que viene de la región con s ≤ 1/Q0 . Melnikov la evalu´ o, siendo para Q0 ≫ m:6 αm (Q0 ) =

4π (2Q0 )m−1 e−πQ0 /2 (m − 1)!

(11.335)

Como ω02 = λF G, entonces Q0 ≈ λ1/2 y vale la expansi´ on asint´ otica (11.335). Entonces podemos escribir: f = f0 sen ϕn ;

f0 =

8πA 2 −πQ0 /2 Q e ωϕ 0

(11.336)

De acuerdo con el ejemplo 10.3.1, para las oscilaciones de un péndulo en las cercan´ıas de la separatriz se cumple que el per´ıodo vale:    T = ω0−1 ln 

32  ωϕ I  1+ λF

(11.337)

El cambio en ϕ durante este tiempo es ωϕ T , lo cual conduce al n´ umero de rotación de la aplicación “twist”: 2πα =

32 ωϕ ln ω0 |W |

(11.338)

donde: W = −F −

ωϕ I λF

(11.339)

Si escogemos a ωϕ independiente de I, con lo cual el problema no se altera esencialmente, resulta que f no depende de I, y seg´ un (11.314) podemos tomar g ≡ 0. Es conveniente cambiar de variables de I a W . En las variables W , ϕ, la aplicación separatriz es: Wn+1 = Wn − W0 sen ϕn ϕn+1 = ϕn + Q0 r ln

32 |Wn+1 |

(11.340)

donde: W0 =

8πA 2 −πQ0 /2 ωϕ I0 = Q0 e F F

(11.341)

No degeneraci´ on y no degeneraci´ on isoenerg´ etica. Tratemos de explorar las consecuencias debidas a la dependencia lineal de las frecuencias sobre los movimientos en una superficie de secci´ on.7 6 V´ ease 7 V´ ease

1976.

el ap´ endice A, en Chirikov, Op. cit. el texto de V. Arnold, Les m´ ethodes math´ ematiques de la m´ ecanique classique, Mir, Mosc´ u,

530 / Mec´ anica cl´ asica avanzada Asumamos que hay una relación entre las frecuencias, para dos grados de libertad, de la forma: f (ω1 , ω2 ) = 0

(11.342)

Diferenciando hallamos de df = 0:   ∂ω1 ∂ω2 ∂f  ∂I1 ∂I1   ∂ω1   ω ˜ I f~ω =    ∂ω ∂ω2   ∂f 1 ∂I2 ∂I2 ∂ω2

Si f es de la forma:

f = m1 ω 1 + m2 ω 2 = 0



  =0 

(11.343)

(11.344)

con m1 y m2 enteros, f~ω es un vector con componentes m1 y m2 . Entonces (11.343) se satisface solamente si se cumple la condición necesaria: det ω ˜I = 0

(11.345)

det ω˜I 6= 0 es la condición necesaria de no degeneraci´ on de las frecuencias (o de no dependencia lineal de las frecuencias). En el caso no degenerado los movimientos son cuasiperiódicos con un n´ umero de frecuencias igual al n´ umero de grados de libertad, con lo cual existen toroides invariantes l-dimensionales. Las curvas de fase son hélices sobre los toroides y las frecuencias de revoluci´ on cambian de un toroide a otro. En el caso general no sólo las dos frecuencias sino su relación α var´ıa de un toroide a otro. Si la derivada de α respecto a la variable de acción que numera los toros es diferente de cero para un valor dado de la energ´ıa, diremos que el sistema es isoenergéticamente no degenerado. La condición de no degeneración isoenergética se escribe como:   ∂ω1 ∂ω2 ω1   ∂I1 ∂I1       ∂ω ∂ω2 1 6= 0 (11.346) det  ω2      ∂I2 ∂I2   ω1

ω2

0

la cual se deduce f´ acilmente de las expresiones dα(I1 , I2 ) 6= 0 y dE = ω1 dI1 +ω2 dI2 = 0. Las condiciones de no degeneración y de no degeneración isoenergética son independientes, es decir, la una no implica la otra. Consideremos la aplicación “twist” sobre el punto de intersección de una curva de fases con la superficie de secci´ on. Esa aplicación deja invariantes los c´ırculos meridianos concéntricos de intersección de los toros invariantes con la superficie de secci´ on. Cada c´ırculo gira un ´ angulo igual a 2πα. Si el sistema no es isoenergéticamente degenerado, el angulo de rotación de los c´ırculos invariantes sobre la superficie de secci´ ´ on cambiará de un c´ırculo a otro, es decir, α necesariamente cambia al pasar de un c´ırculo a otro. Como α es una funci´ on continua de I1 , con E constante, al ir variando I1 , α tomará tanto

Teor´ıa de perturbaciones / 531 valores racionales como irracionales, de modo que en ciertos c´ırculos habr´ a puntos fijos discretos y en otros no. Una y otra clase de c´ırculos forman un conjunto denso, pero en casi todos los c´ırculos el ´ angulo de rotación no será un m´ ultiplo racional de 2π. Si ahora la aplicación es perturbada, como en (11.306), la propiedad de un c´ırculo con α racional de tener puntos fijos debe desaparecer. La trayectoria sobre un toro resonante no perturbado es cerrada y no llega sino a muy pocos puntos del mismo, pero al aplicar una peque˜ na perturbación llenará todos los puntos del toro. En tanto que si el toro es no resonante, una perturbación peque˜ na no ocasiona un cambio grande en las trayectorias de fase y en la topolog´ıa misma del toro. En una resonancia particular, ω1 /ω2 = r/s, la condición de no degeneración isoenergética (11.346) se convierte en: r2

∂ 2 H0 ∂ 2 H0 ∂ 2 H0 + s2 − 2rs 6= 0 2 2 ∂I1 ∂I2 ∂I1 ∂I2

(11.347)

Esta condición a la vez es una condición de no linealidad del movimiento alrededor de un punto fijo. Al analizar el movimiento cerca a una resonancia aislada encontramos que es descrito por un hamiltoniano de la forma (11.253): ∆H =

∂2H 0 2

∂I 1

(∆I 1 )2 + 2λHr,s cos ϕ1

(11.348)

2

tomando a Hrs real. Si ∂ 2 H 0 /∂I = 0, entonces la no linealidad aparece solamente al orden λ2 y el ancho de la separatriz no estar´ a restringido a ser del orden de λ1/2 , seg´ un (11.256). Entonces la condici´ on de no linealidad es, de (11.255): G=

∂2H 0 2

∂I 1

6= 0

(11.349) 2

Esta condición separa los sistemas con degeneración accidental (∂ 2 H 0 /∂I 6= 0) o 2 fuertemente no lineales, de los sistemas con degeneración intr´ınseca (∂ 2 H 0 /∂I = 0) o débilmente no lineales. Para ver la equivalencia de (11.349) y (11.347), pasamos de las on canónica (11.238) y (11.239): variables (I 1 , I 2 ) a las (I1 , I2 ) mediante la transformaci´ ∂2H 0 ∂ ∂H0 ∂I1 ∂H0 ∂I2 = . . 6= 0 (11.350) + ∂I12 ∂I2 ∂I 1 ∂I 1 ∂I1 ∂I 1 y como seg´ un (11.238), ∂I1 /∂I 1 = r y ∂I2 /∂I 1 = s, obtenemos inmediatamente a (11.347). O sea que la condición de no degeneración isoenergética es a la vez una condición de no linealidad del movimiento en proximidades de una resonancia aislada. El teorema de K. A. M. Si un sistema integrable es perturbado, hemos visto en (11.45) que las resonancias entre los grados de libertad pueden destruir la convergencia de las expansiones en series de potencias alrededor del sistema no perturbado. Sin embargo el teorema de K. A. M. dice que “si un sistema hamiltoniano es no degenerado, entonces la mayor parte de los toroides invariantes no resonantes no desaparecen bajo una perturbación hamiltoniana lo suficientemente peque˜ na, sino que se deforman ligeramente de modo que en el espacio de fases del sistema perturbado existen igualmente

532 / Mec´ anica cl´ asica avanzada toroides invariantes, o sea adherencias de las curvas de fase que son hélices cuasiperiódicas con un n´ umero de frecuencias igual al n´ umero de grados de libertad. Tales toroides son la mayor´ıa en el sentido que la medida del complemento de su unión es del orden de λ”. Las condiciones a ser satisfechas son: (i) No linealidad suficiente. O sea que en cierto rango de valores de I~ las frecuencias son independientes: ~ 6= 0 m.~ ~ ω(I)

(11.351)

donde ω ~ = ∂H0 /∂ I~ y m ~ es un vector de componentes enteras. (ii) La perturbación es funci´ on de clase C M , o sea que posee derivadas continuas hasta de orden M . (iii) El estado del sistema es lo suficientemente alejado de una resonancia para satisfacer que: |m ~ ·~ ω| ≥ C|m| ~ −τ

(11.352)

para todo m, ~ donde τ depende de l y M , y C depende de λ, de la magnitud del hamiltoniano de perturbación H1 , y de la no linealidad G del hamiltoniano no perturbado H0 . Como (11.352) no puede satisfacerse para C muy grande y C se incrementa con λ, |H1 | y 1/G, hay una condición de “perturbación suficientemente peque˜ na” para que existan toros de K. A. M. (i) y (iii) también implican una condición de no linealidad moderada. Este teorema fue probado por Arnold (1961) para H1 anal´ıtica y por Moser (1962) para cuando H1 es de clase C M , basados en una conjetura de Kolmogorov (1954). La dificultad de la prueba del teorema radica en los peque˜ nos denominadores que aparecen en todo el procedimiento de expansi´ on en series de potencias. Las pruebas utilizan los métodos de convergencia rápida (superconvergentes), análogos al método de Newton para resolver numéricamente una ecuaci´ on algebraica, que permite neutralizar el efecto de los peque˜ nos divisores que aparecen en cada aproximación. Para ilustrar esto, consideremos la aplicación “twist” perturbada con dos grados de libertad, (11.302), correspondiente a las intersecciones de la trayectoria con la superficie de secci´ on: I1 (ϕ1 + 2πα) = I1 (ϕ1 ) + λf (ϕ1 ) Usemos expansiones de Fourier respecto a ϕ1 : X X bk eikϕ1 I1 (ϕ1 ) = ak eikϕ1 ; λf (ϕ1 ) =

(11.353)

(11.354)

Entonces:

I1 (ϕ1 + 2πα) − I1 (ϕ1 ) =

X

ak eik2πα − 1 eikϕ1

(11.355)

con lo cual se obtiene la siguiente relación entre los coeficientes: ak =

bk ik2πα e

−1

(11.356)

Teor´ıa de perturbaciones / 533 Los módulos de estos coeficientes se relacionan por: |bk | (11.357) 2 sen πkα Vemos que ak no tiende a cero tan rápido como bk y que son indefinidos cuando α es racional. El anterior es el problema de los denominadores nulos que impide la convergencia de las series de perturbaciones. Pero como α es funci´ on de I1 , el valor de I1 puede escogerse de modo que el denominador nunca sea resonante. Básicamente el método de c´ alculo consiste en variar las condiciones iniciales en cada paso del procedimiento de expansi´ on para asegurarse de estar lo suficientemente lejos de las resonancias y poder proseguir la expansi´ on al paso siguiente. En una expansi´ on superconvergente la aproximación n + 1-ésima se realiza alrededor de los valores de las variables obtenidos de la n-ésima aproximación y no alrededor de los valores no perturbados, como se hace en una expansi´ on ordinaria. Como hemos visto, si hay una resonancia entre los dos grados de libertad del sistema no perturbado, la perturbación induce un cambio en las trayectorias del espacio de fases, lo mismo que en las frecuencias. Si la acción perturbada I1 es próxima a la no perturbada I0 , pueden existir curvas invariantes de K. A. M. “cercanas” a las curvas invariantes no perturbadas. El anterior es el significado de la condición de independencia lineal m ~ ·~ ω 6= 0, que garantiza que I1 → I0 cuando λ → 0. Para un valor fijo de λ, la no linealidad necesaria en G puede estimarse de la condición ∆I1 ≪ I0 , siendo I0 la acción no perturbada y ∆I1 el máximo valor de la diferencia I1 − I0 . De (11.238) se sigue que: |ak | =

(11.358)

∆I1 = r∆I 1 Para un sistema con degeneración accidental, (11.257) nos dice que: 1/2 2λHrs ∆I 1 = 4 G

(11.359)

Por tanto ∆I1 ≪ I0 impone la condición: G≫

32r2 λHrs I02

(11.360)

La condición de suavidad de la perturbación, (ii), puede asociarse con la propiedad de las curvas de K. A. M. de existir solamente separadas de todas las “islas” de perturbaciones. Si las “islas” entre dos resonancias de orden bajo llenan todo el espacio de fases entre ellas, podemos razonablemente esperar que no haya una curva de K. A. M. ¿Cómo relacionar esto con la condición (ii) del teorema?. Asumamos que ω1 /ω2 = s y que H0 depende linealmente de I2 , de modo que ω2 es una constante independiente de I1 e I2 . En la siguiente resonancia, ω1 /ω2 = s + 1, de modo que la diferencia en ω1 entre dos resonancias sucesivas es δω1 = ω2 , como puede verse en la figura 11.6. Entre dos resonancias primarias hay una serie de resonancias secundarias en ω1 /ω2 = s+p/q (p, q enteros y p < q). El hamiltoniano tiene la expresión: X H = H0 + λ Hlm ei(lϕ1 −mϕ2 ) (11.361) l,m

534 / Mec´ anica cl´ asica avanzada Tomemos en la sumatoria los valores de l que dan lugar a resonancias secundarias, l = q, 8

ω 1 /ω 2 = s ω 1 /ω 2 = s + 1

a 4 2λG′H 1m 4 2λG′H 1m

4 2λG′H 1m

0

1/4 1/3

1/2

2/3 3/4

b

1

G′∆I 1 ω2

Figura 11.6 Intervalos que muestran resonancias.

m(p, q) = p + sq

(11.362)

y analicemos el movimiento en las cercan´ıas de una resonancia secundaria. De (11.359) el ancho de la separatriz en cada resonancia es:

∆I 1 = 4

2λHqm G

1/2

(11.363)

8 Condiciones de validez del teorema de K. A. M.: (i) Las curvas perturbadas son cercanas a las curvas no perturbadas no resonantes. (ii) Las resonancias son lo suficientemente separadas, de acuerdo con la condici´ on de suavidad de la perturbaci´ on. (iii) En la figura 11.6b los intervalos rayados muestran resonancias secundarias. La suavidad de la perturbaci´ on exige que las resonancias secundarias sean aisladas.

Teor´ıa de perturbaciones / 535 y de las expresiones ∆I1 = q∆I 1 y g = q 2 ∂ 2 H0 /∂I12 = q 2 G′ , obtenemos para la contribuci´ on de todas las resonancias secundarias sobre el valor de ∆I1 : 1/2 X X 2λ 1/2 Hqm (11.364) ∆I1 = 4 G′ p,q y para el ensanchamiento de las frecuencias: X X ∂ω1 X ∆I1 = G′ ∆I1 ∆ω1 = ∂I1 1/2 X 2λ 1/2 = 4 Hqm G′ p,q

(11.365)

La relaci´ on entre la suma de los anchos de las islas secundarias y la separación entre las resonancias primarias es: P X ∆ω1 1/2 = 4(2λG′ )1/2 ω2−1 Hqm (11.366) δω1 p,q Si H1 tiene M derivadas continuas respecto a ϕ1 y ϕ2 , las derivadas altas tienen la forma: X (11.367) Hqm (iq)k1 (−im)M−k1 ei(qϕ1 −mϕ2 ) p,q

Las cuales serán continuas a condición de que Hqm sean lo suficientemente peque˜ nas para q y m grandes. Para que la serie converja, es necesario que para q y m grandes los términos se comporten como 1/q 2 por lo menos, ya que m es lineal en q de acuerdo con (11.362). Entonces las amplitudes de Fourier para q grandes han de comportarse como: Hqm ≈

A q M+2

(11.368)

con el fin de que λH1 sea de clase C M . Seg´ un (11.362) y la desigualdad p < q, hay q coeficientes de Hqm con el mismo valor de q y diferentes valores de p. Estos coeficientes corresponden a resonancias y son todos grandes y de magnitud comparable. Por tanto: X 1/2 1/2 Hqm ≈ qHqm′ (11.369) donde m′ es un valor de m convenientemente escogido. De (11.366), (11.368) y (11.369) se sigue entonces que: √ P ∞ X ∆ω1 4 2ω1 σ ≈ 4(2λG′ A)1/2 ω2−1 (11.370) q −M/2 = δω1 ω2 q=1

donde: σ=ζ

M 2

,

ω1 = (λAG′ )1/2

(11.371)

536 / Mec´ anica cl´ asica avanzada y ζ es la funci´ on zeta de Riemann. ζ(1) = ∞, ζ(2) = 1, 64493, ζ(3) = 1, 20205 y ζ(x) → 1 para x → ∞. Entonces (11.370) existe si M > 2. De modo que independientemente del valor del coeficiente de la sumatoria, obtenemos la importante condición para la existencia de una superficie de K. A. M.: que el n´ umero de derivadas continuas de la perturbación satisfaga que M >2

(11.372)

Podemos comparar este resultado con la condición (iii) de K. A. M., (11.352), escrita para dos dimensiones como: ω1 r ′ τ −1 (11.373) ω2 − s > C s

El lado izquierdo es el ancho de una resonancia secundaria aislada. Tomando el ancho total a ser examinado como la distancia entre dos resonancias de orden inferior, o sea el intervalo unidad, hay a lo sumo s valores de r en tal intervalo que deben ser excluidos seg´ un la condición (i) del teorema. La medida de Lebesgue M de las resonancias excluidas se obtiene multiplicando a (11.373) por s y sumando sobre s: M = C′

∞ X

s−τ = C ′ ζ(τ )

(11.374)

s=1

Comparando a (11.374) con (11.370) vemos que: C′ ≈

ω1 ; ω2

ω1 =

√ λAG′ ;

τ=

M 2

(11.375)

Entonces τ > 1 es suficiente para que exista una superficie de K. A. M. Chirikov ha determinado la condición necesaria correspondiente a (11.372) para l grados de libertad: M ≥ 2l − 2

(11.376)

y Moser la condición suficiente: M ≥ 2l + 2

(11.377)

suponiendo que C tiende a cero con λ y es tomada suficientemente peque˜ na. Asumiendo que la suma en (11.370) converge a σ, vemos que las superficies de K. A. M. no existen si α = ω1 /ω2 cae dentro de una de las regiones rayadas en la figura 11.6b. Como el ancho de esas regiones es proporcional a (λG)1/2 y decrece con el incremento de q, α debe estar lo suficientemente lejos de un n´ umero racional p/q. Para λ peque˜ no es f´ acil cumplir esto, pero cuando λ se incrementa, solamente aquellos irracionales que son más dif´ıciles de aproximar por racionales pueden dar lugar a √ superficies de K. A. M. El n´ umero “m´ as irracional” en este sentido es la media dorada ( 5 − 1)/2. La condición sobre el valor de λ se obtiene de (11.370) haciendo el lado izquierdo igual a uno: λG′ ≤

ω22 32Aσ 2

(11.378)

Teor´ıa de perturbaciones / 537 Por otra parte (11.360) y (11.378) dan la condición de λ no linealidad moderada: ω22 32λA < G′ < 2 I0 32Aσ 2 λ

(11.379)

usando r2 Hrs /q 2 ≈ A. El teorema de Poincar´ e-Birkhoff. Cualquier punto del c´ırculo con α(I) = r/s es un punto fijo de la aplicación “twist” no perturbada (11.299) con per´ıodo s. El teorema dice que para alg´ un m´ ultiplo par de s, 2ks con k = 1, 2, ..., permanecen 2ks puntos fijos al colocarse una perturbación, siendo ks de ellos el´ıpticos y ks hiperb´ olicos. Asumamos que α(I) aumenta al aumentar I. Entonces hay una curva de K. A. M. por fuera de la curva racional, que se mueve en sentido contrario a las agujas del reloj (flechas externas), α > r/s, y una curva de K. A. M. dentro de la curva racional que se mueve en sentido de las agujas reloj, para s iteraciones de la aplicación “twist” perturbada (11.302). Por tanto entre estas dos debe haber una curva cuya coordenada angular ϕ no cambia después de s iteraciones de la aplicación (curva sólida, que no es una curva de K. A. M). Iy Curva estacionaria

Circunferencia K.A.M. α > r/s

Circunferencia α = r/s

Ix Circunferencia K.A.M. α < r/s

s = 3, k = 1

Figura 11.7 La figura muestra una curva de K. A. M. (por fuera de la curva racional) que se mueve en sentido contrario al del reloj, una curva racional que se mueve en sentido del reloj y una curva s´ olida que no es de K. A. M. Ahora mediante una aplicación que preserve el área llevamos los puntos de la curva sólida radialmente a alguna curva rayada como lo muestra la figura 11.7. Las curvas continua y rayada deben encerrar la misma área. Esto es posible sólo si las curvas se cruzan entre s´ı un n´ umero par de veces. Cada intersección cuando es iterada s veces retorna a

538 / Mec´ anica cl´ asica avanzada su posición inicial, es un punto fijo. De modo que para un n´ umero par de intersecciones, debe haber 2ks de tales puntos, que son los puntos fijos de Poincaré-Birkhoff. El teorema no da el valor de k, que en la figura se ha tomado k = 1. Los puntos son alternativamente de naturaleza el´ıptica e hiperb´ olica. Los puntos con α 6= r/s cercanos a un punto el´ıptico tienden a girar alrededor de él, en tanto que los puntos cercanos a un punto hiperb´ olico mediante repetidas aplicaciones tienden a alejarse indefinidamente del punto fijo. En la secci´ on 11.7 mediante transformaci´ on a un sistema de coordenadas fijo en un punto el´ıptico estudiamos el comportamiento de los puntos cercanos a él y encontramos que tienen un movimiento pendular. Luego encontramos que las resonancias de orden superior dan lugar a la aparici´ on de nuevos puntos fijos en las cercan´ıas del punto el´ıptico, alrededor de los cuales nuevamente se presentan oscilaciones pendulares de amplitud mucho más peque˜ na, seg´ un (11.295) proporcional a (1/s)s+1/2 . Hasta aqu´ı vemos un cuadro lleno de curvas de K. A. M. de gran complejidad. Sin embargo, veremos que el comportamiento estoc´ astico no resulta de las resonancias de orden superior, sino que puede ocurrir en resonancias de orden bajo como resultado de la bifurcaci´ on de las separatrices. Hablando a grosso modo podemos decir que los punto el´ıpticos est´ an asociados a la estructura de islas del espacio fásico y los puntos hiperb´ olicos al comportamiento estoc´ astico de la regi´ on entre toroides de K. A. M. En el apéndice 9 del libro de Arnold hay una serie de proposiciones referentes a los puntos fijos de las aplicaciones canónicas.9 Bifurcaci´ on de las separatrices. Sabemos que un péndulo tiene una separatriz que une suavemente las órbitas hiperb´ olicas que pasan por los puntos de equilibrio inestable en π y −π. El teorema de Poincaré-Birkhoff nos dice que hay ks puntos hiperb´ olicos en un sistema integrable. Hay una separatriz suave que une un punto hiperb´ olico a sus vecinos próximos para tales sistemas. En un sistema cuasi-integrable con dos o más grados de libertad la situaci´ on es más compleja. Basta recordar que en los hamiltonianos usados para obtener la estructura de islas, (11.244) o (11.286), hay una serie de términos que han sido despreciados al construir los correspondientes invariantes. La estructura de islas corresponde pues a un sistema truncado. En cualquier singularidad hiperb´ olica convergen cuatro curvas, correspondientes a las dos trayectorias separatrices incidentes Γ+ y a las dos trayectorias separatrices salientes Γ− . Un punto x pertenece a Γ+ si la transformaci´ on repetida T n x cuando n → ∞ − trae a x a la singularidad, y pertenece a Γ si la transformaci´ on inversa T −n x cuando n → ∞ trae a x a la singularidad. Como el per´ıodo sobre la separatriz del sistema truncado es infinito, lo mismo será sobre la separatriz del sistema verdadero, y el movimiento de x hacia la singularidad resulta más y más lento mientras x esté más cerca del punto fijo hiperb´ olico. Ahora consideremos la separatriz Γ− que sale del punto singular hiperb´ olico adyacente. En vez de llegar suavemente coincidiendo con Γ+ , como sucede con el péndulo o con cualquier separatriz de un sistema integrable, la curva Γ− que sale de un punto hiperb´ olico se cruza con la curva Γ− que sale de un punto hiperb´ olico vecino desplazado 2π/(ks). Esta intersección se llama un punto homocl´ınico. Las intersecciones entre trayectorias de resonancia vecinas diferentes se llaman puntos heterocl´ınicos. En esto consiste la bifurcaci´ on de las separatrices, en que una curva Γ+ no coincide con − una curva Γ . Esto establece una diferencia fundamental entre el comportamiento de 9 V´ ease

V. Arnold, Op. cit.

Teor´ıa de perturbaciones / 539

Curva K.A.M. x′′′

x′′ x′

Curva K.A.M. Punto elíptico

x

Γ+

Γ– Γ–

Γ+

Curva K.A.M. Curva K.A.M.

Figura 11.8 Bifurcaci´ on de las separatrices Γ. Las l´ıneas punteadas indican la separatriz del sistema truncado integrable. Las l´ıneas continuas indican la separatriz del sistema completo no integrable.

las trayectorias del sistema truncado y del sistema completo integrable. Si hay una intersección, entonces hay un n´ umero infinito de intersecciones, todas puntos homocl´ınicos. La intersección en el punto homocl´ınico x implica el cruce en x′ y luego en x′′ , con x′′ más próximo a x′ que x′ a x. Como las áreas encerradas por las intersecciones (´ areas sombreadas en la figura 11.8) son aplicaciones unas de otras, son conservadas, de modo que Γ− oscila más y más, siendo las intersecciones sucesivas más próximas entre s´ı y las oscilaciones de amplitud mayor en virtud de la conservaci´ on de las áreas. En la figura 11.8 se muestran sólo las primeras intersecciones. Los puntos homocl´ınicos por s´ı solos no describen completamente el comportamiento de la regi´ on próxima a las separatrices. Como el n´ umero α(I) local en las cercan´ıas de los puntos singulares el´ıpticos tiende a infinito en la separatriz debido a que el per´ıodo del movimiento sobre ésta es infinito, entonces en las cercan´ıas de la separatriz hay un n´ umero infinito de resonancias secundarias correspondientes a valores grandes de α. Cada uno tiene su propio conjunto de puntos singulares hiperb´ olicos y el´ıpticos que alternan, con la correspondiente bifurcaci´ on de separatrices y con m´ ultiples puntos he-

540 / Mec´ anica cl´ asica avanzada terocl´ınicos. Todas esas trayectorias llenan densamente el espacio accesible a ellas, para dos grados de libertad limitado por dos superficies de K. A. M. La intersección de las trayectorias en puntos homocl´ınicos demuestra que un toroide de K. A. M. no puede existir en tales puntos puesto que hay un drástico cambio de topolog´ıa. Cuando la perturbación aumenta, seg´ un el teorema de K. A. M., la medida de la región de toroides disminuye y aumenta la de la región estoc´ astica. La magnitud de la bifurcaci´ on de las separatrices para λ peque˜ no es exponencialmente peque˜ na, raz´ on por la cual pasa desapercibida en las diferentes formas de la teor´ıa de perturbaciones. Su sola existencia genera las divergencias que ocurren en las series de perturbaciones. Si esas series fueran convergentes, el sistema no tendr´ıa bifurcaci´ on de las separatrices ni estados de movimiento irregular. Aplicaci´ on completa sobre una superficie de secci´ on para un sistema no integrable de dos grados de libertad. Asumamos que en la superficie de secci´ on al aumentar I1 disminuye la frecuencia ω1 y que en I1 = 0 el n´ umero de rotación es irracional, por ejemplo α(0) = 1/π. Al aumentar I1 , ω1 decrece hasta alcanzar la primera resonancia de orden bajo en ω1 = ω2 /4, dando lugar como en la figura 11.3, a una cadena de islas; es decir hay cuatro puntos fijos que como resultado de la perturbación y seg´ un el teorema de Poincaré-Birkhoff pasan a ser ocho, alternándose los el´ıpticos e hiperb´ olicos, con una isla alrededor de cada punto el´ıptico. Cerca de los cuatro puntos fijos hiperb´ olicos la presencia de puntos homocl´ınicos y heterocl´ınicos est´ a asociada a una regi´ on de movimiento caótico limitada por dos superficies de K. A. M. “rotacionales”. Al aumentar I1 , la siguiente resonancia de orden bajo aparece en ω1 = ω2 /5, que da lugar a cinco puntos el´ıpticos y a una cadena de cinco islas. Al aumentar I1 aparecen nuevas resonancias. Hay además infinidad de resonancias intermedias cuya amplitud es peque˜ na. Por ejemplo, entre ω1 = ω2 /4 y ω1 = ω2 /5 hay una resonancia en ω1 = 2ω2 /9. De acuerdo con (11.257) la amplitud de una resonancia es del orden de:  1/2  λH   r,−s  ∆I1 ≈  2   ∂ H0 

(11.380)

2

∂I 1

Seg´ un (11.293) el coeficiente de Fourier dominante en el hamiltoniano que describe el movimiento en las islas es aproximadamente: máx Hr,−s ≈ Js (π)

(11.381)

de modo que la relaci´ on de amplitudes en s = 5 y s = 9 es aproximadamente: J9 (π) ∆I1 (s/r = 9/2) ≈ 0, 1 (11.382) ≈ ∆I1 (s/r = 5) J5 (π) Además, en cada punto hiperb´ olico de las resonancias secundarias se genera una regi´ on de movimiento caótico. La figura 11.9 muestra esquem´ aticamente la apariencia de la superficie de secci´ on. Las l´ıneas sólidas son superficies de K. A. M. Las que rodean el origen, I1 = 0, son distorsión de los c´ırculos no perturbados y corresponden al nuevo invariante I1 = constante,

Teor´ıa de perturbaciones / 541 el cual es calculado aplicando el teorema de la media, descrito en la secci´ on 11.5. Las l´ıneas sólidas que rodean los puntos singulares el´ıpticos no se pueden calcular con este método sino con el de las perturbaciones seculares (sección 11.7). Para las trayectorias cercanas a las separatrices no hay un invariante y las trayectorias llenan toda el ´ area comprendida entre dos l´ıneas de K. A. M. “rotacionales”.

Figura 11.9 Superficie de sección de resonancias secundarias

En cada una de las “islas” alrededor de un punto el´ıptico podemos transformar de las variables I 1 , ϕ1 a unas variables acción-´ angulo J1 , χ1 . Esto transforma la cadena de islas en un conjunto de c´ırculos concéntricos como en la figura 11.3b. Las resonancias entre la frecuencia del movimiento alrededor del punto fijo y las frecuencias fundamentales crean cadenas de islas de segundo orden, similares a las de primer orden. An´ alisis de la estabilidad. En los sistemas hamiltonianos no integrables la estabilidad lineal parece ser una condición necesaria y suficiente para la estabilidad no lineal, en el sentido que la estabilidad lineal garantiza la existencia de superficies de K. A. M. cerca a un punto fijo. El análisis de la estabilidad de un estado de movimiento en un sistema hamiltoniano se reduce al análisis de la estabilidad de la correspondiente aplicación can´ onica en una superficie de secci´ on de Poincaré. Un punto fijo x0 de una aplicación que preserve el ´ area T se dice que es estable si para cada vecindad U de x0 existe una subvecindad V ⊆ U tal que para todo k siempre se cumple que T k (V ) ⊆ U . Poniendo el or´ıgen de coordenadas en x0 y linealizando T alrededor de ese punto, halla˜ que es simplicial. mos que su parte lineal es una matriz 2 × 2 de coeficientes reales, A, ˜ entonces 1/λ también lo es, y por ser real, λ y Debido a esto, si λ es un autovalor de A, λ⋆ son autovalores. De modo que los autovalores λ, λ⋆ , 1/λ, 1/λ⋆ , est´ an determinados ˜ Si los autovalores son por la ecuaci´ on λ2 − λ tr A˜ + 1 = 0 donde tr es la traza de A. complejo conjugados, λ1,2 = e±iσ , representan soluciones estables con tr A˜ = 2 cos σ y ˜ < 2. Si son reales y rec´ıprocos, por ejemplo λ1,2 = e±σ , con |tr A| ˜ = |2 cosh σ| > 2, |trA| se tienen soluciones creciente y decreciente. El caso inestable puede dividirse en dos posibilidades, tr A˜ > 2 (λ1 > 1) y tr A˜ < −2 (λ1 < −1). Las ra´ıces pueden ser iguales con

542 / Mec´ anica cl´ asica avanzada λ1 = λ2 = ±1, y corresponden a la transición exacta entre los casos estable e inestable. El movimiento linealizado presenta entonces tres clases de órbitas: el´ıpticas, hiperb´ olicas y rectil´ıneas. Un punto fijo hiperb´ olico es inestable y las órbitas cercanas a él se separan exponencialmente. Un punto fijo el´ıptico es estable y las órbitas cercanas a él se separan linealmente. Si en un punto el´ıptico hay resonancias de orden bajo, sabemos, el análisis de estabilidad lineal no es suficiente pues pueden presentarse nuevos puntos fijos hiperb´ olicos, de acuerdo con el teorema de Poincaré-Birkhoff. Ejemplo 11.8.3 Hacer el análisis de estabilidad de la aplicación separatriz (11.340): Wn+1 =

Wn − W0 sen ϕn

ϕn+1 =

ϕn + Q0 r ln

32 |Wn+1 |

(11.383)

Los puntos fijos de per´ıodo 1, o sea de una sola iteraci´ on, est´ an en: Q0 r ln o sea:

32 = 2πm |W1 |

(11.384)

W1 =

±32e−2πm/(Q0r) ,

ϕ1 =

0, π

m : entero (11.385)

Si llamamos x1 = (W1 , ϕ1 ) y T la aplicación, estos puntos satisfacen x1 = T x1 . Linealizando alrededor de x1 obtenemos xn = x1 + ∆xn : ∆xn+1 = A˜ ∆xn

(11.386)

siendo A˜ la matriz jacobiana de la aplicación:  ∂W  ∂W n+1

 ∂Wn  A˜ =   ∂ϕn+1 ∂Wn

n+1

∂ϕn

∂ϕn+1 ∂ϕn

   

(11.387)

˜ Para evaluar la estabilidad se requiere la traza de A: tr A˜ = 2 +

W0 Q0 r cos ϕ W1

(11.388)

Para estabilidad se requiere que tr A˜ < 2, de modo que para W1 > 0 los puntos fijos con ϕ1 = 0 son todos inestables. Para ϕ1 = π hay estabilidad cuando: W1 > Ws = W0

Q0 r 4

(11.389)

o sea: W1 >

2πrA 3 −πQ0 /2 Q0 e F

(11.390)

Teor´ıa de perturbaciones / 543 Es de esperarse que el valor de Ws que marca el l´ımite entre los puntos con ϕ1 = π estables e inestables represente un importante par´ ametro indicativo de estocasticidad cuando W < Ws . La aplicación separatriz es de importancia para comprender el comportamiento caótico de los sistemas cuasi-integrables, pues las separatrices siempre rodean las resonancias de esos sistemas. La aplicación separatriz, que describe el comportamiento en las cercan´ıas de la separatriz, claramente exhibe comportamiento caótico para W → 0. Ejercicio 11.8.1 Hallar los puntos fijos de per´ıodo 1 y analizar la estabilidad de la aplicación de Fermi: Un+1 =

|Un + sen ϕn |

ϕn+1 =

ϕn +

2πM Un+1

(177)

(11.391)

donde M es una constante. Ejercicio 11.8.2 Hallar los puntos fijos de per´ıodo 1 y analizar la estabilidad de la aplicación est´ andar (11.318). Ejercicio 11.8.3 Mostrar que la aplicación est´ andar es una aproximación a la aplicación de Fermi y a la aplicación separatriz linealizadas. Irregularidad global. La existencia de regiones caóticas est´ a asociada con las resonancias y se da aun para valores peque˜ nos del par´ ametro λ. No hay una transición brusca entre los reg´ımenes regular e irregular en alg´ un valor cr´ıtico de λ. Sin embargo es u ´til poder cuantificar el grado de “estocasticidad” y decir cuando el movimiento es dominantemente estoc´ astico. Chirikov (1979) ha observado que al aumentar la perturbación ocurre en alg´ un valor más o menos definido que las superficies de K. A. M. rotacionales que encierran una regi´ on estoc´ astica de un sistema de dos grados de libertad se “rompen”, permitiendo que las trayectorias estoc´ asticas ocupen una región más grande del espacio f´ asico. Con esta idea elaboró el concepto de sobreposici´ on de las separatrices y definió un par´ ametro de estocasticidad. Hay muchos otros criterios pero este es de los más usados, al menos como un indicador del orden de magnitud de la perturbación para el cual el sistema se comporta de modo esencialmente irregular. Si (∆Imáx )1 y (∆Imáx )2 son los anchos de las separatrices vecinas separadas por una l´ınea de K. A. M. rotacional, y δI12 es la distancia entre las resonancias correspondientes, o sea entre los puntos fijos centrales de las “islas”, el criterio de estocasticidad global puede formularse como: (∆Imáx )1 + (∆Imáx )2 2 ≥ δI12 3

(11.392)

Cuando existen las superficies de K. A. M. que limitan las regiones estoc´ asticas se habla de estocasticidad local o aislada y cuando tales superficies desaparecen se habla de estocasticidad global o conectada. En el ejemplo 11.8.3 hallamos un par´ ametro cr´ıtico para el cual se pierde la estabilidad lineal de las principales resonancias en la aplicación separatriz; este par´ ametro también da una burda estimaci´ on de la estocasticidad, pero por no ser una condición necesaria para la estocasticidad conectada resulta ser un criterio

544 / Mec´ anica cl´ asica avanzada demasiado fuerte. Greene (1979)10 halló que aunque la pérdida de estabilidad lineal de las islas de per´ıodo 1 es una condición muy fuerte, tal criterio aplicado a islas de per´ıodo alto cercanas a una superficie de K. A. M. puede dar una mejor descripción. Este es un criterio alterno al de Chirikov y más exacto en muchos casos. Ejemplo 11.8.4 Analizar diferentes criterios de irregularidad global para la aplicación est´ andar (11.318). (a) Pérdida de estabilidad de los puntos fijos el´ıpticos de per´ıodo 1. Tales puntos est´ an en: I1 = 2πm ,

m : entero ;

La matriz A˜ es:   1 ±K  A˜ =  1 1±K

ϕ1 = 0, 1

(11.393)

(11.394)

donde el signo más corresponde a ϕ1 = 0 y el menos a ϕ1 = π. La condición de estabilidad: |2 ± K| < 2

(11.395)

nos dice que el punto ϕ = 0 es siempre inestable. No hay puntos fijos el´ıpticos de per´ıodo 1 si: K>4

(11.396)

(b) Sobreposición de separatrices de resonancias primarias. Es conveniente considerar el hamiltoniano de la aplicación, obtenido en el ejemplo 11.8.1. Si asumimos que ϕ var´ıa lentamente con el tiempo, dϕ/dn ≪ 2π, entonces esperamos que en H1 , ecuaci´ on (11.325), contribuir´ a sólo el término de variación más lenta, de modo que: 1 2 I + K cos ϕ + 2K cos ϕ cos 2πn (11.397) 2 La parte correspondiente a H0 , ecuaci´ on (11.324), describe un movimiento pendular, siendo la frecuencia de libraci´ on alrededor del punto el´ıptico ϕ = π: √ ω0 = K (11.398) H=

El máximo desplazamiento de I es hallado de H0 tomando cos ϕ = 1 en I = 0, o sea H0 = K. Entonces el valor máximo de I est´ a en cos ϕ = −1: √ ∆Imáx = 2 K (11.399) De acuerdo con (11.393), la distancia entre las resonancias primarias δI es igual a 2π, y por tanto la relación entre el ancho total de la separatriz y la distancia entre dos resonancias consecutivas es: 2∆Imáx 4ω0 = (11.400) δI 2π 10 V´ ease

el texto de Lichtenberg A. J. y M. A. Lieberman, Regular and stochastic motion, SpringerVerlag, Nueva York, 1983.

Teor´ıa de perturbaciones / 545 La frecuencia de H1 es 2π, de modo que el n´ umero de rotación local cerca al punto el´ıptico de libraci´ on α0 = ω0 /2π. Entonces: 2∆Imáx = 4α0 (11.401) δI La observaci´ on numérica dice que la transición a la estocasticidad global ocurre aproximadamente cuando aparecen las islas de sexto orden, con α ≈ 1/6, entonces (11.401) nos conduce a la “regla de los dos tercios”, 2∆Imáx /δI ≈ 2/3. Sin embargo, un estimado de K puede obtenerse directamente de (11.400) tomando simplemente 2∆Imáx /δI ≈ 1 como un indicativo de la sobreposición de las separatrices: √ 4 K = 2π , K ≈ 2, 47 (11.402) Con la regla de los dos tercios se obtiene: K ≈ 1, 46

(11.403)

(c) Sobreposición del primero y del segundo armónicos. Definimos la condición de sobreposición del primero y del segundo armónicos como: ∆I1 máx + ∆I2 máx = δI12 = π

(11.404)

donde los sub´ındices indican resonancias de per´ıodos 1 y 2 respectivamente. Para calcular el ancho ∆I2 necesitamos el segundo armónico de Fourier en la expansi´ on de H en potencias de K ya que en (11.397) K cos ϕ contiene sólo el primer armónico. El hamiltoniano describe un sistema no autónomo de un grado de libertad, que equivale a uno de dos grados de libertad seg´ un la secci´ on 9.2. Como la regi´ on del espacio f´ asico en que aparece el segundo armónico est´ a alejada de las resonancias primarias, la teor´ıa de perturbaciones ordinaria puede usarse para hacer la expansi´ on de H hasta el segundo orden en K donde esperamos que aparezca el segundo armónico. El hamiltoniano (11.323) puede escribirse como: H=

+∞ X 1 2 I + λK cos(ϕ − 2πmn) 2 m=−∞

(11.405)

El término de orden cero I 2 /2, describe un movimiento en I − ϕ cuya solución es ϕ = In + ϕ0 , I = constante, siendo ϕ0 una constante. Seg´ un (11.393) los puntos fijos de la aplicación est´ andar est´ an en I = 2pπ para las resonancias primarias. Entonces la perturbación dar´ a lugar a puntos fijos de las resonancias secundarias en: I = (1p + 1)π ;

p : entero

(11.406)

que se encuentran entre dos resonancias primarias. La frecuencia del movimiento de orden cero es (2p + 1)π y la frecuencia de la fuerza impulsora externa es 2πm, presentando resonancias de la forma r/s = (2p + 1)/m. Los punto fijos en 0 y π de (11.393) corresponden a m = 0, o sea al movimiento pendular, con lo cual las resonancias secundarias vienen de r = 2p + 1 y s = 1 y basta tomar a H como (11.397), escrito en la forma: 1 H = Iχ + Iϕ2 + K cos ϕ + 2K cos ϕ cos χ 2

(11.407)

546 / Mec´ anica cl´ asica avanzada Realicemos una transformaci´ on canónica para obtener una variable angular rápida y una lenta: Iχ =

rI χ ;

Iϕ = I ϕ − sI χ

ϕ = rχ − sϕ ;

(11.408)

χ=χ

Entonces: 2 1 I ϕ − sI χ 2 rχ − ϕ rχ − ϕ + K cos + 2K cos cos χ s s

H + = rI χ +

(11.409)

Ahora ϕ es una variable angular lenta y podemos aplicar la teor´ıa de perturbaciones adiabáticas, secci´ on 11.5, válida aqu´ı por no haber divisores nulos. Para buscar una expansi´ on en potencias de K, al orden cero aplicamos (11.178): H 0 = rI χ +

2 1 I ϕ − sI χ 2

(11.410)

Al primer orden promediamos la perturbación sobre la variable angular rápida χ: H1 = 0

(11.411)

Entonces, seg´ un (11.180): 2π

∂F (1) = − cos(rχ − ϕ) − 2 cos(rχ − ϕ) cos χ ∂χ

(11.412)

y por tanto: −2πF (1) =

1 1 sen (rχ − ϕ) + sen [(r − 1)χ − ϕ] r r−1 1 sen [(r + 1)χ − ϕ] + r+1

(11.413)

y, 2π

∂F (1) = ∂χ

1 1 cos(rχ − ϕ) + cos[(r − 1)χ − ϕ] r r−1

(11.414)

1 + cos[(r + 1)χ − ϕ] r+1 Para hallar a H 2 , aplicamos la fórmula (11.37) con los promedios tomados sobre χ: H2 =

(1) 2 2 ∂F ∂F (1) 1 X X ∂ 2 H0 2 µ=1 ν=1 ∂I ν ∂I µ ∂ϕν ∂ϕµ

(11.415)

Teor´ıa de perturbaciones / 547 Con el resultado, al segundo orden: 2 K 1 2 cos 2ϕ H= I − 2 4

(11.416)

donde se ha omitido una constante y regresado a la notaci´ on inicial. ϕ es la variable angular lenta, dada por (11.408): ϕ = −ϕ + (2p + 1)πn

(11.417)

y describe el movimiento alrededor de las islas de resonancias secundarias. Seg´ un la ecuaci´ on (11.416) la máxima oscilación de I es ∆I2 máx = K/2, con lo cual y con (11.399) y (11.404) toma la forma: √ K = π K ≈ 1, 46 (11.418) 2 K+ 2 que es el resultado obtenido por Chirikov, y que además justifica la regla de los “dos tercios”. Experimentalmente, o sea resolviendo numéricamente la aplicación (11.318), se obtiene que la transición a la estocasticidad global seg´ un Chirikov ocurre cuando K ≈ 0, 99. Chirikov mejor´ o el resultado (11.418) tomando el espesor de la capa estoc´ astica en cercan´ıas de la separatriz. Ejemplo 11.8.5 Calcular el efecto del espesor de la separatriz sobre el valor de K a partir del cual ocurre la transición a la estocasticidad global. El c´ alculo se basa en el ejemplo 11.8.2. La funci´ on W en (11.339) proviene de 1 − κ2 del ejemplo 10.3.2, que se puede escribir como: E − Es (11.419) 1 − κ2 = − 2Es notando que la energ´ıa de la separatriz es precisamente F . Entonces W es: W =

E − Es Es

(11.420)

o sea la desviaci´ on de la energ´ıa respecto a la separatriz dividida por la energ´ıa de la separatriz. Seg´ un el ejemplo 11.8.1, la aplicación separatriz (11.340) linealizada toma la forma de la aplicación est´ andar si: In = −

Q0 ∆Wn W1

y

K=

Q0 W0 W1

(11.421)

siendo seg´ un (11.334) Q0 igual a: 2π Q0 = √ K

(11.422)

Hemos tomado r = 1 (resonancia de orden 1) y √ tomado las frecuencias impulsora y de la aplicación seg´ un (11.398) y (11.393) iguales a K y 2π respectivamente.

548 / Mec´ anica cl´ asica avanzada Como en (11.341) A es H11 que para nuestro caso podemos tomar igual a F . De (11.421) y (11.341) podemos obtener el par´ ametro de estocasticidad K en funci´ on de Q0 y W1 : K=

8πQ30 −πQ0 /2 e W1

(11.423)

donde K est´ a asociado al ancho de las separatrices de las “islas” de segundo orden. Tal ancho, seg´ un (11.420), est´ a descrito por W , o sea por W1 en (11.423), que seg´ un (11.422) puede expresarse en funci´ on de K: W1 = 4(2π)4 K −5/2 e−π

2

√ / K

(11.424) √ De (11.399) se sigue que el valor de I en la separatriz es I0 = 2 K. La energ´ıa del l´ımite exterior de la capa estoc´ astica cercana a la separatriz es igual a la energ´ıa de la separatriz, K, más el ancho de la capa, dado seg´ un (11.420) por ∆E = W F , o sea que: K + ∆E = K(1 + W1 )

(11.425)

es la energ´ıa del l´ımite exterior de la capa estoc´ astica. Como E = I 2 /2 + K cos ϕ para 2 el péndulo, en ϕ = π es igual a I /2 − K, encontramos que: 1 2 I − K = K(1 + W1 ) , 2

I 2 = 2K(2 + W1 )

(11.426)

y como W ≪ 1:

√ W1 I =2 K 1+ 4

(11.427)

De modo que el ancho de la separatriz respecto a la acción es: ∆Is = I − I0 =

√ 1 W1 K 2

(11.428)

Si sumamos este ancho en (11.418) obtenemos un criterio de sobreposición mejorado: h √ i √ 2 K 1 + (2π)4 K −5/2 e−π / K 2 K + =π 2

(11.429)

K ≈ 1, 2

(11.430)

del cual se obtiene el valor:

que coincide un poco más con el valor experimental K ≈ 0, 99.

12 Correspondencia con la mec´ anica cu´ antica de Heisenberg

En este cap´ıtulo presentaremos la mecánica clásica con una notaci´ on similar a la usada en la mecánica cuántica de Heisenberg, conocida también como mecánica matricial. Las f´ ormulas no tendrán suposiciones cuánticas y serán válidas clásicamente. Con esto podremos hacer énfasis en las diferencias y correspondencias que existen entre los formalismos cl´ asico y cuántico, y a la vez retomar las ideas originales de Werner Heisenberg expuestas en su trabajo famoso de julio de 1925.1 Veremos que la representación de las variables dinámicas por medio de matrices y la asignación de valores propios a las variables dinámicas son posibles dentro de un formalismo puramente cl´ asico. Veremos también el punto exacto donde la mecánica clásica admite el reemplazo de los corchetes de Poisson por conmutadores y la no conmutatividad de las matrices. Finalmente se˜ nalaremos d´ onde est´ an las verdaderas diferencias entre las mecánicas cl´ asica y cuántica. Para ilustrar la correspondencia entre la mecánica cuántica y la mecánica clásica mostraremos c´ omo el procedimiento de diagonalización de la matriz hamiltoniana corresponde con el de resolver la ecuaci´ on de Hamilton-Jacobi, y presentaremos las fórmulas de la teor´ıa cl´ asica de perturbaciones con la notaci´ on matricial. Se corrobora as´ı la idea expresada por Dirac en su art´ıculo de noviembre de 1925: “En un reciente art´ıculo Heisenberg planteó una nueva teor´ıa donde sugiere que no son erróneas las ecuaciones de la mecánica clásica, sino más bien que son las operaciones matemáticas mediante las cuales se extraen resultados f´ısicos a partir de ellas las que requieren modificación. Toda la información sumunistrada por la teor´ıa clásica puede ser usada en la nueva teor´ıa”.2

1 Traducido al ingl´ es por B. L. van der Waerden en Sources of quantum mechanics, Dover, Nueva York, 1968. 2 Reproducido por van der Waerden, Op. cit.

549


12.1.

Representaci´ on matricial de variables din´ amicas

Consideraremos un sistema acotado l-dimensional en un estado de movimiento regular, es decir, integrable y que por tanto se puede describir mediante variables acci´ on-´ angulo. Tal sistema es m´ ultiplemente periódico y cualquier variable dinámica puede expresarse como una serie de Fourier. El formalismo podr´ıa extenderse a estados no acotados mediante la sutituci´ on de las series por integrales de Fourier. Representaci´ on de variables din´ amicas por matrices herm´ıticas infinitas. Sea f una variable dinámica y (I, ϕ) un conjunto de variables acción-´ angulo del sistema, entonces: X f (I, ϕ) = f~n (I) ei~n·ϕ~ (12.1) ~ n

donde ~n son vectores l-dimensionales de componentes enteras. Es conveniente escribir a ~n como la diferencia entre dos vectores de componentes enteras, ~n = α ~ −α ~ ′ . El vector ~ α ~ puede escribirse de modo que I = α ~ ∆I, donde ∆I es un n´ umero lo suficientemente peque˜ no con las dimensiones de acción;3 por tanto las componentes de α ~ son n´ umeros enteros muy grandes, si I~ es grande. Sumar en (12.1) sobre todos los valores de las I~ (que var´ıan entre cero e infinito) equivale a sumar sobre α ~ , o sea: X XX ′ fα~ −~α′ (~ α ∆I)ei(~α−~α )·ϕ~ (12.2) f (~ α ∆I, ϕ ~) = α ~

α ~

α ~′

Por ser f real, se cumple que fα~⋆−~α′ (I) = fα~ ′ −~α (I). La suma sobre α ~ en (12.2) puede ser divergente, lo cual ha de tenerse en cuenta en los desarrollos que siguen. Esto corresponde con las dificultades de normalizaci´ on de las ondas planas en la mecánica cuántica. Si formamos el producto de dos variables dinámicas, sus coeficientes de Fourier dependen de los coeficientes de Fourier de cada variable, as´ı: X (f g)β− fβ−~ (12.3) ~ β ~ ′ (I) = ~ α (I)gα ~ ′ (I) ~ −β α ~

La convergencia de la expansi´ on (12.1) exige que los coeficientes para ~n altos sean peque˜ nos, por tanto sólo son de interés los ~n bajos. Por otra parte, si ∆I es peque˜ no, siempre los α ~ en I~ = α ~ ∆I serán grandes, es decir que |~n| es del orden de la unidad y: |~n| ≪ |~ α|

(12.4)

Entonces se cumple para toda funci´ on de I~ que: F (~ α ∆I) = F (~ α′ ∆I) + (~ α−α ~ ′) · 3 Puede

∂F ∆I ∂ I~

considerarse a ∆I como la resoluci´ on en las medidas de las Iν .

(12.5)

Corespondencia con la mecánica cuántica de Heisenberg / 551 Esto nos permite definir matrices clásicas aproximadamente herm´ıticas, as´ı: fα~ ,~α′ ≡ fα~ −~α′ (~ α ∆I)

(12.6)

entonces es claro que: fα~⋆′ ,~α = fα~⋆′ −~α (~ α′ ∆I) = fα~ ,~α′ + (~ α′ − α ~) ·

∂fα~ −~α′ ∆I ∂ I~

(12.7)

es aproximadamente autoadjunta. Como α ~ y α ~ ′ pueden recorrer todos los vectores de ′ componentes enteras resulta que las fα~ ,~α son matrices infinitas. Correspondencia con las matrices cu´ anticas. En mecánica cuántica I~ y ϕ ~ son operadores cuyos vectores propios los denotaremos respectivamente por |~ αi y |~ ϕi. En el conjunto de estados |~ αi deben incluirse, si existen, los estados del continuo para tener un conjunto completo. La transformaci´ on de la representación I~ a la representación ϕ ~ es: X X ′ |~ ϕi = |~ α′ ih~ α′ |~ ϕi = |~ α′ i e−i~α ·ϕ~ (12.8) α ~′

α ~′

El valor esperado de una variable dinámica f en el estado |~ ϕi est´ a dado por: XX ′ h~ ϕ|f |~ ϕi = h~ α|f |~ α′ i ei(~α−~α )·ϕ~ (12.9) α ~

α ~′

Comparando (12.2) con (12.9) resulta clara la correspondencia de los coeficientes de Fourier fα~ −~α′ y las matrices cl´ asicas fα~ ,~α′ , con las matrices cuánticas h~ α|f |~ α′ i. e−i~α·ϕ~ son las funciones de onda de la representación ϕ ~ con valores definidos de α ~, ~ i∂/∂ ϕ o sea funciones propias del operador herm´ıtico asociado a I, ~: −

1 ∂ −i~α·ϕ~ e =α ~ e−i~α·ϕ~ i ∂ϕ ~

(12.10)

Ciertamente hay algunas dificultades en la definición de las variables acción-´ angulo en mecánica cuántica, analizadas en el art´ıculo de August´ın y Rabitz (1979).4 En la secci´ on §48 del libro de mecánica cuántica de Landau-Lifshitz (ver bibliograf´ıa) est´ a demostrada la correspondencia entre los elementos de matriz de un operador cuántico y los coeficientes de Fourier de la correspondiente variable dinámica clásica. No tenemos hasta ahora ninguna justificación para relacionar la matriz clásica fα~ ,~α′ con transiciones entre estados cuantizados descritos por α ~ yα ~ ′ . El ejemplo 10.5.2 sobre radiaci´ on dipolar da una evidencia de la asociaci´ on entre emisión de radiaci´ on y transiciones en mecánica cl´ asica. Cambio de representaci´ on. Si por medio de una transformaci´ on canónica pasamos de un conjunto de variables acción-´ angulo (I, ϕ) a otro (I, ϕ), por medio de una 4 Action-angle

variables in quantum mechanics, Journal of Chemical Physics, 71 (12), 4956, (1979).

552 / Mec´ anica cl´ asica avanzada funci´ on generatriz G3 (I, ~ϕ), las variables angulares y de acción se deben transformar ~ I~ = −∂G3 (I, ϕ)/∂ ϕ, ~ las funciones e−i~α·ϕ~ como: como ϕ ~ = −∂G3 (I, ϕ)/∂ I, X ′ ~ (12.11) gα~ ,~α′ (I)e−i~α ·ϕ e−i~α·ϕ~ = α ~′

y las amplitudes de Fourier de las variables dinámicas como: XX fβ− g+ ~ β ~ ′ (I) = ~ −~ α′ (I) gα ~ (I) ~ (I) fα ~ ′ ,β β,~ α

α ~

(12.12)

α ~′

⋆ donde g + ~ (I). ~ α (I) = gα ~ ,β β,~ Podemos tomar los resultados de la secci´ on 11.3, referentes a los cambios de sistemas de variables acción-´ angulo. Para sistemas no degenerados, las fórmulas (11.84) y (11.85) de tal secci´ on establecen que: l X

∂ ψ(I) ; ϕν = nνµ ϕµ − ∂I ν µ=1

Iν =

l X

nµν Iµ

(12.13)

µ=1

donde nνµ es una matriz n ˜ de elementos enteros y determinante ±1 y ψ depende sólo de las variables de acción. Entonces: ~

~

e−i~α·ϕ~ = e−i~α·(ñϕ)−i~α·δ

(12.14)

siendo α ~ ·~δ una fase que sólo depende de I~ y de α ~ . Por tanto para sistemas no degenerados: ~

gα~ ·~α′ = e−i~α·δ δα~ ′ ,~αn˜

(12.15)

Para sistemas degenerados rigen las fórmulas (11.100) a (11.103): ϕβ =

l X

nβν ϕν + ψβ (ϕσ , I) ;

ν=1

ϕτ =

l X

Iβ =

s X

nγβ Iγ

γ=1

nτ σ ϕσ + ψτ (ϕσ , I)

(12.16)

ν=s+1

Iτ =

l X

nντ Iτ − i

ν=1

X σ σ C~nσ (I) nτ ei~n ·ϕ~ ~ nσ

Las variables no degeneradas tienen sub´ındices β = 1, 2, ...s, y las degeneradas σ = s + 1, s + 2, ...l. El super´ındice σ indica vectores de l − s componentes. Las variables angulares ϕστ son constantes y los n´ umeros nτ σ no necesitan ser enteros. ψν (ϕσ , I) son funciones periódicas de las variables angulares degeneradas. Entonces, usando el convenio de la suma: α ~ ·ϕ ~ = αβ nβν ϕν + ατ nτ σ ϕσ + αν ψν (ϕσ , I)

(12.17)

Corespondencia con la mecánica cuántica de Heisenberg / 553 ei~α·ϕ~ puede escribirse en la forma: eα~ ·ϕ~ = eiαβ nβτ ϕτ h(ϕσ , I)

(12.18)

donde las ϕτ son no degeneradas y h es una funci´ on periódica de las gα~ ,~α′ = hα~ σ ,~ασ′ δα~ τ ′ ,~ατ n˜ τ

ϕστ .

En consecuencia: (12.19)

siendo α ~ = (~ ασ , α ~ τ ). Notemos que: X g+ ~β ~ ′ = δβ, ~′ ~ gα ~ ,β

(12.20)

β,~ α

α ~

y por tanto: X h+ ~σ α ~σ

β ,~ ασ

hα~ σ ,β~ ′ σ = δβ~σ ,β~ ′ σ

(12.21)

o sea que g y h son matrices unitarias de dimensi´ on infinita. Las matrices unitarias de cambio de representación son no conmutativas. Si se ˜ se cumple: realizan dos transformaciones sucesivas, descritas por las matrices g˜ y k, ~

~

~

~

gα~ ,~α′ kα~ ′ ,β~ =

e−i~α·(δg +ñg δk ) δβ,~ ~ αn ˜g n ˜k

kα~ ,~α′ gα~ ′ ,β~ =

e−i~α·(δk +ñk δg ) δβ,~ ~ αn ˜kn ˜g

(12.22)

Como puede verse, las matrices unitarias que describen las transformaciones canónicas satisfacen una ´ algebra no conmutativa. Aqu´ı estamos considerando solamente transformaciones canónicas entre diferentes conjuntos de variables acción-´ angulo, que cambian expansiones de Fourier en expansiones de Fourier. Es claro que al pasar a variables canónicas que no sean de acción-´ angulo una expansi´ on de Fourier se cambia por una expansi´ on en otro conjunto de funciones ortogonales igualmente válida; en la formulaci´ on de la mecánica cuántica este trabajo fue hecho por Born, Jordan y Heisenberg entre septiembre y noviembre de 1925. Valores propios y vectores propios de una variable din´ amica. Dada una variable din´ amica f , ¿existe alg´ un conjunto de variables acción-´ angulo para el cual la funci´ on dependa sólo de las variables de acción?. Si existe, en tales variables se debe cumplir: (12.23) f I(I, ϕ), ϕ(I, ϕ) = f (I)

Esto significa que en la expansi´ on de Fourier de f sólo aparece la componente constante o d.c.: f β− ~ β ~ ′ = f 0 (I) δβ, ~β ~′

(12.24)

o en términos de las matrices cl´ asicas (12.6): ~ f β, ~β ~ ′ = f 0 (β ∆I) δβ, ~β ~′

(12.25)

554 / Mec´ anica cl´ asica avanzada Los n´ umeros f 0 son los valores propios de la matriz f. De (12.12) y (12.20) se sigue que: XX + gβ,~ ~ ,~ α′ gα ~ ′ ,~ α =0 ~ ,~ α′ (I) − f 0 (I)δα ~ α fα α ~

(12.26)

α ~′

Esta expansi´ on se satisface sólo si f 0 (I) son las ra´ıces de la ecuaci´ on secular: det fα~ ,~α′ − f 0 (~ α ∆I) δα~ ,~α′ = 0 (12.27)

En conclusi´ on, encontrar las variables acción-´ angulo en las cuales una variable din´ amica no dependa de las variables angulares equivale a diagonalizar la matriz clásica formada con los coeficientes de Fourier. Los vectores propios de la matriz son a su vez los elementos de la matriz de la transformaci´ on unitaria g que conecta las dos representaciones: X (12.28) fα~ ,~α′ gα~ ′ ,β~ (I) = f 0 (I) gα~ ,β~ (I) α ~′

De lo anterior resulta que si el hamiltoniano es diagonal, entonces toda constante de movimiento, cuando no hay degeneración, es igualmente diagonal. Por ser matemáticamente válida la correspondencia entre matrices infinitas y operadores lineales, concluimos que en mecánica clásica es posible hacer corresponder a cada variable din´ amica un operador lineal.

Ejemplo 12.1.1 Hallar las matrices clásicas para q, p y H de un oscilador armónico lineal. Las expresiones de q y p en variables acción-´ angulo dadas en el ejemplo 10.3.1, permiten obtener f´ acilmente los coeficientes de Fourier: 1/2 I qα−β (I) = i (−δα,β+1 + δα,β−1 ) 2mω (12.29) 1/2 Imω (δα,β+1 + δα,β−1 ) pα−β (I) = 2 Usando la definición (12.6) se sigue que: 1/2 α ∆I qα,β = i (−δα,β+1 + δα,β−1 ) 2mω

pα,β =

α ∆Imω 2

1/2

(δα,β+1 + δα,β−1 )

Las matrices adjuntas correspondientes son: 1/2 1/2 (α + 1) ∆I (α − 1) ∆I ⋆ qβ,α = i δα,β−1 − i δα,β+1 2mω 2mω p⋆β,α

1/2 1/2 (α − 1) ∆Imω (α + 1) ∆Imω δα,β−1 + δα,β+1 = 2 2

(12.30)

(12.31)

Corespondencia con la mecánica cuántica de Heisenberg / 555 Vemos claramente que si α ≫ 1 las matrices de q y p son autoadjuntas. La matriz hamiltoniana es: Hα,β = α ∆I ωδα,β

(12.32)

Esta matriz es autoadjunta sin aproximaciones. Los valores propios son los diferentes valores de la energ´ıa del oscilador armónico. Por ser H positivo, resulta que: Hα,β = 0

para

α<0

(12.33)

Además por ser ∆I peque˜ no, los valores propios de H son muy próximos entre s´ı, formando un continuo en el l´ımite ∆I → 0.

12.2.

Corchetes de Poisson y conmutadores de matrices cl´ asicas

En contradicción con lo corrientemente aceptado, la mecánica clásica admite la representación de las variables dinámicas mediante matrices no conmutativas aproximadamente herm´ıticas. Esta representación permite asociar conmutadores de matrices clásicas con los corchetes de Poisson. Los resultados cuánticos se obtienen formalmente colocando ∆I = ¯h. Conmutadores cl´ asicos. El conmutador de las matrices de dos variables dinámicas f y g es: X (fβ,~ (12.34) ~ α gα ~ α fα ~ ′ − gβ,~ ~′ ) ~ ,β ~ ,β α ~

En términos de las amplitudes de Fourier de f y g, (12.34) toma la forma: i Xh ~ ~ ∆I) f ~ ′ (~ fβ−~ (~ α ∆I) − g ( β α ∆I) (12.35) ′ ~ α (β ∆I) gα ~ ~ ~ −β β−~ α α ~ −β α ~

Notemos que la siguiente expresión vale cero: i Xh ~ ~ ~ ~ fβ−~ ( β ∆I) g ( β ∆I) − g ( β ∆I) f ( β ∆I) =0 ~ α ~′ ~ α ~′ α ~ −β β−~ α ~ −β

(12.36)

α ~

En efecto, cada αν toma valores entre −∞ y +∞. Si cambiamos en los términos ~ ′ , entonces cada δν negativos de (12.36) a α ~ por ~δ mediante la fórmula β~ − α ~ = ~δ − β ′ ′ tomará valores entre βν + βν − ∞ y βν + βν + ∞, o sea entre −∞ y +∞. Entonces por cada término en (12.36) con signo + hay uno con signo −. Matrices de corchetes de Poisson. El corchete de Poisson de dos variables dinámicas es: [f, g] =

∂f ∂g ∂f ∂g · − · ∂ϕ ~ ∂ I~ ∂ I~ ∂ ϕ ~

(12.37)

556 / Mec´ anica cl´ asica avanzada La serie de Fourier del corchete de Poisson es: X X ∂gm ∂fm ~ ~ ~ ϕ ~ [f, g] = i ~n · f~n ei(~n+m)· − g ~ ~ ~n ∂ I ∂ I m ~ ~ n

(12.38)

Las componentes de Fourier de [f, g] pueden escribirse en términos de las de f y g as´ı: [f, g]~l = i

X ~ n

∂g~l−~n ∂f~l−~n ~n · f~n − g~n ∂ I~ ∂ I~

~−β ~ ′ y a ~n por β~ − α Cambiando a ~l por β ~ , se sigue: X ∂gα~ −β~ ′ ∂fα~ −β~ ′ ~ [f, g]β− = i( β − α ~ ) · f − g ~ β ~ α ~ α ~′ β−~ β−~ ∂ I~ ∂ I~ α ~

(12.39)

(12.40)

En esta expresión el corchete de Poisson depende de I~ = β~ ∆I; por tanto las ~ componentes de Fourier de f y g serán también funciones de β∆I. Si se realiza un ~ ∆I, se sigue que: cambio infinitesimal en I~ dado por (~ α − β) gα~ −β~ ′ ~ ∆I = g ~ ′ (~ ~ · (~ α − β) ~ ′ (β ∆I) α ~ −β α ∆I) − gα ~ −β ∂ I~

(12.41)

~ ≪ |~ ~ debido a que |~ α − β| α|, |β|. Entonces el corchete de Poisson puede escribirse en la forma: [f, g]β− ~ β ~′ = i −i X h ~ ~ fβ−~ α ∆I) − gβ−~ α ∆I) ~ α (β ∆I)gα ~ ′ (~ ~ α (β ∆I)fα ~ ′ (~ ~ − β ~ − β ∆I

(12.42)

α ~

aqu´ı hemos usado la identidad (12.36). ~ ∆I, siendo por tanto [f, g] ~ ~ ′ Notemos que en el lado derecho de (12.42) I~ = β β−β ~ ∆I. Entonces la definición (12.6) nos permite identificar el lado izquierdo funci´ on de β de (12.42) con [f, g]β, ~β ~ ′ . Comparando a (12.35) con (12.42) obtenemos el resultado: [f, g]β, ~β ~′ =

−i ˜ (f g˜ − g˜f˜)β− ~ β ~′ ∆I

(12.43)

Vemos que la matriz del corchete de Poisson de dos variables dinámicas puede expresarse como el conmutador de las correspondientes matrices clásicas, multiplicado por −i/∆I: gg] = [f,

−i ˜ (f g˜ − g˜f˜) ∆I

(12.44)

En conclusi´ on, en la mecánica clásica es posible asociar a las variables dinámicas un ´ algebra no conmutativa que coincide con el álgebra de los corchetes de Poisson. Ejemplo 12.2.1 Evaluar directamente el conmutador de q y p, y el corchete de Poisson, para un oscilador armónico.

Corespondencia con la mecánica cuántica de Heisenberg / 557 De (12.30) se sigue: X i ∆I p qβ,α pα,β ′ = β (12.45) 2 α i p h p p p β ′ + 1 − β ′ − 1 δβ,β ′ + β ′ − 1 δβ,β ′ −2 × − β ′ + 1 δβ,β ′ +2 +

con una expresión análoga al permutar a p con q. El valor del conmutador es: X (qβ,α pα,β ′ − pβ,α qα,β ′ ) = α

i ∆I

p p p β β + 1 − β − 1 δβ,β ′ ≈ i ∆I δβ,β ′

(12.46)

donde la segunda relaci´ on resulta de la suposición β ≫ 1. Seg´ un (12.43) y (12.46) la matriz de los corchetes de Poisson debe ser: (12.47)

[q, p]β,β ′ = δβ,β ′

Si se aplica directamente (12.40) y se usa el siguiente resultado: 1/2 X X ∂pα−β ′ I i(β − α) qβα = i(β − α) i ∂I 2mω α α 1 mω 1/2 ×(−δβ,α+1 + δβ,α−1 ) (δα,β ′ +1 + δα,β ′ −1 ) (12.48) 2 2I y la expresión análoga con q y p intercambiados, se obtiene igualmente (12.47). Obviamente, la matriz de [q, p] = 1 tiene sólo unos en la diagonal siendo ceros los dem´ as elementos. Ejemplo 12.2.2 Evaluar la matriz del corchete de Poisson de H con q para un oscilador armónico.

y,

La matriz hamiltoniana est´ a dada por (12.32). En consecuencia: 1/2 X β ∆I ′ (−δβ,β ′ +1 + δβ,β ′ −1 ) Hβ,α qα,β = β ∆I ωi 2mω α X α

qβ,α Hα,β ′ = i

β ∆I 2mω

1/2

β ′ ∆I ω(−δβ,β ′ +1 + δβ,β ′ −1 )

El conmutador es entonces: 1/2 X βω ∆I (−δβ,β ′ +1 − δβ,β1′ ) (Hβ,α qα,β ′ − qβ,α Hα,β ′ ) = i ∆I 2m α Seg´ un (12.43) y (12.51), el corchete de Poisson es: 1/2 Iω [H, q]β−β ′ = − (δβ,β ′ +1 + δβ,β ′ −1 ) 2m

que, como debe ser, coincide con la matriz de q. ˙

(12.49)

(12.50)

(12.51)

(12.52)


12.3.

Problemas mec´ anicos a la manera de Heisenberg

En su trabajo de julio de 1925 Heisenberg se˜ nala que la dinámica de un problema en la vieja mecánica cuántica comprende dos aspectos: (i) La integraci´ on de las ecuaciones de movimiento, y¨ + f (y) = 0. (ii) La determinacióHn de las constantes de movimiento a través de la cuantización de la variable de acción, p dq = 2πα¯h = 2πI. La condición (ii) se puede expresar en la forma: I X mx˙ dx = 2πm xn (I) x−n (I) n2 ω(I) = 2πI (12.53) n

siendo xn los coeficientes de Fourier de x. Como x es real, x−n = x⋆n . Una forma más compacta de la condición (ii) es entonces: m

X n

n

∂ nω(I) |xn (I)|2 = 1 ∂I

(12.54)

llamada en la vieja mecánica cuántica regla de suma de Kuhn-Thomas. La generalizaci´ on a varios grados de libertad es inmediata: X ∂ m (12.55) ~n · ~n · ~ω (I) |x~n (I)|2 = 1 ∂ I~ ~ n

La matriz de la forma (12.6) asociada con x es: xα~ ,~α′ = xα~ −~α′ (~ α ∆I)

(12.56)

Entonces (12.55) se puede escribir como: i X ∂ h (~ α − α~′ ) · ω ~ (I) |xα~ ,~α′ (I)|2 = 1 (~ α−α ~ ′) · m ∂ I~ ′

(12.57)

Usando una expresión análoga a (12.41) podemos escribir también: X 2m (~ α−α ~ ′ ).~ω (~ α ∆I) |xα~ ,~α′ |2 = ∆I

(12.58)

α ~

α ~′

Notemos que la regla de suma de Thomas-Kuhn no es otra cosa que el corchete de Poisson de x y p. De la relación general (12.43), y del hecho de ser x y p variables can´ onicamente conjugadas, se sigue que: X (xβ,~ (12.59) ~ α pα ~ ′ − pβ,~ ~ α xα ~ ′ ) = i ∆I δβ, ~β ~′ ~ ,β ~ ,β α ~

Teniendo en cuenta que: ~ ·ω pα~ β~ = mi(~ α − β) ~ α~ xα~ ,β~ ′ Las ecuaciones (12.59) y (12.60) nos dan, para β~ = β~ ′ , la relación (12.58).

(12.60)

Corespondencia con la mecánica cuántica de Heisenberg / 559 Entonces seg´ un Heisenberg, la ecuaci´ on de movimiento y¨ + f (y) = 0 y la condición sobre el conmutador de x y p dan lugar a un sistema de ecuaciones que determina un´ıvocamente las componentes de la matriz de x y los valores de energ´ıa del sistema. Las f´ ormulas que hemos obtenido son idénticas a las de Heisenberg, reemplazando a ∆I por h ¯. ¿En d´ onde est´ an entonces las diferencias de fondo entre las mec´ anicas cu´ antica y cl´ asica?: (i) En la identificaci´ on de las matrices fα~ ,β~ con transiciones entre los estados cuánticos ~ caracterizados por α ~ y β. (ii) En se˜ nalar que ∆I no puede ser arbitrariamente peque˜ no sino que toma el valor ¯h, o sea que I~ est´ a necesariamente cuantizada. (iii) En reemplazar a (~ α−α ~ ′) · ~ ω (~ α ∆I) ≈ (~ α−α ~ ′ ) · ~ω (~ α′ ∆I) por la frecuencia de Bohr ωα~ ,~α′ = (Eα~ − Eα~ ′ )/¯ h asociada a la transición entre los estados cuantizados caracterizados por α ~ yα ~ ′ . Esto equivaldr´ıa a asociar al “estado clásico α ~ ” la energ´ıa Eα~ = ∆I α ~ ·ω ~ de modo que (Eα~ − Eα~ ′ )/∆I = (~ α−α ~ ′ ) · ~ω ser´ıa un armónico. Esta asociaci´ on es acorde con la regla de combinaci´ on de frecuencias de Bohr, pero no predice las energ´ıas correctas, pues, por ejemplo, para un oscilador armónico deber´ıan ser Eα = ∆I (α + 1/2)ω; por esto Heisenberg propuso no asumir a priori una expresión para las ωα~ ,~α′ , sino más bien obtenerlas como un resultado. (iv) En se˜ nalar que debe existir un estado base del cual no puede salir el sistema emitiendo radiaci´ on; xα0 ,α0 −1 = 0 si α0 caracteriza el estado base. Con sólo estas cuatro condiciones el formalismo cl´ asico desarrollado en este cap´ıtulo da lugar al formalismo de la mecánica cuántica seg´ un Heisenberg. Las reflexiones acerca del álgebra de operadores no conmutativos caben perfectamente dentro del esquema clásico. Ejemplo 12.3.1 Resolver el oscilador armónico lineal en la mecánica cuántica de Heisenberg.5 La ecuaci´ on de movimiento x ¨ + ω02 x = 0 conduce a una solución para los elementos de la matriz de x de la forma: xα,β cos(ωα,β t)

(12.61)

donde los elementos de la matriz x ˜ y las frecuencias ωα,β son cantidades a determinar. La condición adicional (12.58) nos da: X 2m (12.62) ωα,α′ |xα,α′ |2 = ¯h α′

La ecuaci´ on de movimiento nos da: 2 (ωα,β − ω02 ) xα,β = 0

(12.63)

ωα,β est´ an asociadas a las transiciones α → β: hωα,β = Eα − Eβ ¯ 5 V´ ease,

van der Waerden, Op. cit.

(12.64)

560 / Mec´ anica cl´ asica avanzada siendo Eα y Eβ las energ´ıas de los estados α y β. Esta ecuaci´ on nos dice que para cada α debe existir al menos un β ′ para el cual xα,β ′ 6=0 . Para este β ′ , (12.63) nos dice que necesariamente: (Eα − Eβ ′ )2 = ¯h2 ω02

(12.65)

Esta es una ecuaci´ on cuadrática en Eβ ′ , con las soluciones: hω 0 Eβ ′ = Eα ± ¯

(12.66)

lo cual nos indica que hay dos β ′ para los cuales xα,β ′ 6= 0, que llamaremos β ′ y β ′′ . Para éstos dos β ′ las frecuencias satisfacen la relación: (12.67)

ωα,β ′ = −ωα,β ′′ Entonces (12.62) nos dice que: ¯ 2mωα,β ′ |xα,β ′ |2 − |xα,β ′′ |2 = h

(12.68)

Los elementos de la matriz energ´ıa son: Hα,β

= =

(p2 )α,β mω02 (x2 )α,β + 2m 2 X pα,β ′ pβ,β ′ ω02 mxα,β ′ xβ ′ ,β + 2m 2 ′

(12.69)

β

De (12.60) se sigue que: X xα,β ′ xβ ′ ,β Hα,β = m ω02 − ωα,β ′ ωβ ′ ,β 2 ′

(12.70)

En particular para α = β tenemos: Hα,α = mω02 |xα,β ′ |2 + |xα,β ′′ |2

(12.71)

β

Hay dos posibilidades, que β ′′ exista o que no exista. Si β ′′ no existe y ωβ ′ ,α = ω0 , de (12.68) se sigue que: 2mω0 |xα,β ′ |2 = ¯h

(12.72)

y de (12.71) se sigue que: Eα = Hα,α = mω02 |xα,β ′ |2 =

¯hω0 2

(12.73)

Como Eα 6= Eβ si α 6= β, se sigue que hay a lo sumo un ´ındice α = α0 para el cual se cumple (12.73). Si tal α0 existe, podemos formar la secuencia de n´ umeros α0 , α1 , α2 , ...αk , αk+1 , ... tales que α′k = αk+1 y α′′k = αk−1 . Estos n´ umeros describen los estados para los cuales Ek+1 > Ek . Claramente, α′0 = α1 y α′′0 no existe. De (12.30) podemos adelantar que αk+1 = αk + 1. Para k > 0, (12.71) y (12.68) nos dan: (12.74) Hαk ,αk = mω02 |xαk ,αk+1 |2 + |xαk ,αk−1 |2

Corespondencia con la mecánica cuántica de Heisenberg / 561 h = 2mω0 |xαk ,αk+1 |2 − |xαk ,αk−1 |2 ¯

(12.75)

La ecuaci´ on (12.75) es una f´ ormula de recurrencia que permite a partir de |xα0 ,α1 |2 2 ¯ /(2mω0 ) y |xα0 ,α−1 |2 = 0: obtener cualquier |xαk ,αk+1 | . As´ı que, al usar |xα0 ,α1 |2 = h |xαk ,αk+1 |2 =

h(k + 1) ¯ 2mω0

(12.76)

También esto nos permite identificar la secuencia α0 , α1 , α2 , ... con los n´ umeros enteros 0, 1, 2, ... Entonces la relación de recurrencia nos dice que: |xk,k+1 |2 =

h(k + 1) ¯ ; 2mω0

|xk,k−1 |2 =

¯hk 2mω0

Por tanto (12.74) nos da, en vez del resultado clásico (12.32): 1 Ek = h ¯ ω0 k + 2

(12.77)

(12.78)

Como puede verse, lo espec´ıfico del tratamiento cuántico de este problema estriba en: (i) Tomar a ∆I como h ¯ . (ii) Tomar en vez de (α − α′ )ω0 a ωα,α′ = (Eα − Eα′ )/¯h. (iii) Suponer la existencia de un estado base.

12.4.

Ecuaci´ on de Hamilton-Jacobi y diagonalizaci´ on de la matriz hamiltoniana

Para un sistema m´ ultiplemente periódico la matriz hamiltoniana clásica puede obtenerse de los coeficientes de Fourier de la funci´ on hamiltoniana H(q, p). La ecuaci´ on de Hamilton-Jacobi (sección 9.6), se caracteriza por definir la función de Hamilton caracter´ıstica mediante la cual se realiza la transformaci´ on canónica que lleva a unas nuevas veriables, donde todas las coordenadas son c´ıclicas, esto es: α ∆I) δα~ ,β~ H(q, p) = H(I) ⇒ H α~ ,β~ = H(~

(12.79)

como en la ecuaci´ on (12.32). Entonces la transformaci´ on canónica buscada diagonaliza la matriz hamiltoniana, cuyos elementos son Hα~ −β~ (~ α ∆I) = Hα~ ,β~ . Las cantidades H(~ α ∆I), donde α ~ recorre todos los vectores l-dimensionales de componentes enteras, son los valores propios de la matriz infinita Hα~ ,β~ , que se obtiene resolviendo la ecuaci´ on secular (12.27). Los vectores propios de la matriz hamiltoniana son las cantidades gα~ ,~α′ , que seg´ un (12.11) realizan la transformaci´ on de las variables angulares ϕν a las ϕν . O sea que las gα~ ,~α′ definen la funci´ on de Hamilton caracter´ıstica de la transformaci´ on canónica, para el tipo F3 , dada por: ϕ ~ =−

∂ Σ(I, ϕ) ; ∂ I~

Como gα~ ,~α′ (I) es: gα~ ,~α′ (I) =

1 (2π)l

I

~I = − ∂ Σ(I, ϕ) ∂ ~ϕ

′

~

~ α ·ϕ l ~ dϕ e−i~α.ϕ+i~

(12.80)

(12.81)

562 / Mec´ anica cl´ asica avanzada de (12.80) se sigue que: gα~ ,~α′ (I) =

1 (2π)l

I

∂

′

~

ei~α· ∂ I~ Σ(I,ϕ)+i~α ·ϕ dl ~ϕ

Además, la f´ ormula inversa es: # " X ∂Σ ϕ −i~ α′ ·~ i~ α· = ln gα~ ,~α′ e ∂ I~ α ~′

(12.82)

(12.83)

Estas f´ ormulas muestran la conexión entre las transformaciones canónicas y las matrices unitarias que realizan los cambios de representación de las matrices clásicas, con clara correspondencia con la mecánica cuántica. Ejemplo 12.4.1 Estudiar la diagonalización de la matriz hamiltoniana de un oscilador armónico sometido a una fuerza constante. F´ısicamente el problema es muy simple porque el u ńico efecto de la fuerza constante es cambiar la posición de equilibrio y desplazar el valor de la energ´ıa sin alterar la frecuencia de las oscilaciones. Sin embargo es ilustrativo de la conexión entre la solución de la ecuaci´ on de Hamilton-Jacobi y la diagonalización de la matriz hamiltoniana. Si H0 es el hamiltoniano del oscilador no perturbado, el hamiltoniano de este problema será: H = H0 + λx y en las variables acción-´ angulo de H0 toma la forma: 1/2 2I sen ϕ H = Iω + λ mω

(12.84)

(12.85)

Queremos pasar a las variables acción-´ angulo I − ϕ del hamiltoniano H mediante una transformaci´ on canónica. La ecuaci´ on de Hamilton-Jacobi del problema es, seg´ un las f´ ormulas (9.286): 1/2 2I ∂Σ Iω − λ −E (12.86) sen mω ∂I Entonces: ϕ=−

mω 1/2 −1 ∂Σ λ (E − Iω) = sen−1 ∂I 2I

Si llamamos A = λ21/2 /(mω)1/2 , y notamos que: 2 2 A ∂Σ A E(I) = Iω − = −ω − 2ω ∂ϕ 2ω entonces la ecuaci´ on de Hamilton-Jacobi para Σ es: 2 ωI 1/2 ∂Σ A ∂Σ = I −1/2 + ωI −1/2 + sen ∂I A ∂ϕ 2ω

(12.87)

(12.88)

(12.89)

Corespondencia con la mecánica cuántica de Heisenberg / 563 Esta ecuaci´ on resulta complicada, raz´ on por la cual desistiremos de la funci´ on generatriz del tipo F3 . Notemos que la funci´ on generatriz del tipo F3 para la transformaci´ on inversa se obtiene cambiando en −F3 las variables I, ϕ por I, ϕ (ver secci´ on 9.5). Entonces las fórmulas para la transformaci´ on inversa son: ϕ=

∂F3 (I, ϕ) ; ∂I

I=

∂F3 ∂ϕ

(12.90)

que coinciden con las f´ ormulas de la transformaci´ on original mediante una funci´ on generatriz del tipo F2 . F2 es solución a la ecuaci´ on: 1/2 ∂F2 ∂F2 ω sen ϕ − E(I) = 0 (12.91) +A ∂ϕ ∂ϕ o sea: 1/2 2 ∂F2 Eω E A2 A 2 2 I= sen ϕ sen ϕ + 4 sen ϕ + (12.92) = − ∂ϕ 2ω 2 ω ω A2 Notemos que:

sen ϕ 1 1 ∂ ∂Σ · = − ∂ϕ ∂E ω ω (1 + 2mEω 2 λ−2 − cos2 ϕ)1/2

(12.93)

y en consecuencia:

" −1/2 # 2mEω 2 ϕ 1 ∂Σ2 −1 cos ϕ 1 + = + sen ∂E ω ω λ2 H De la expresión para I, 2πI = I dϕ se deduce que: E = Iω −

λ2 2mω 2

(12.94)

(12.95)

un (12.82) y (12.94), la matriz asociada a esta transforde donde ω −1 dE/dI = 1, y, seg´ maci´ on, que es la inversa de gα,β , es: I ′ −1 1 ei(α−α )ϕ−iα sen (cos ϕ/C) dϕ (12.96) Γα,α′ = 2π donde C = (1 + 2mEω 2 /λ2 )1/2 . Notemos que: e−iα sen

−1

x

= e−iαπ/2 [−iUα (x) + Tα (x)]

(12.97)

donde T y U son polinomios de Chevishev de primera y segunda clase respectivamente. En consecuencia: I cos ϕ ′ 1 Γα,α′ = ei(α −α) ϕ−i απ/2 Tα dϕ 2π C (12.98) I cos ϕ ′ 1 dϕ ei(α −α) ϕ−i(α+1)π/2 Uα + 2π C

564 / Mec´ anica cl´ asica avanzada No es simple hallar una expresión general para la transformada de Fourier de Tα (cos ϕ/C) y de Uα (cos ϕ/C). Aun conociendo la forma anal´ıtica de Γα,β , resulta dif´ıcil obtener una expresión cerrada para las sumatorias infinitas en (12.12). Por esto lo más c´ omodo es realizar los c´ alculos en forma numérica. En este caso es necesario truncar las matrices para hacerlas finitas y proceder a realizar las integraciones mediante un algoritmo como el de Gauss. Una vez obtenida la matriz Γ el proceso de diagonalización es simple. Como puede verse, el método para obtener la matriz gα~ ,β~ a partir de la ecuaci´ on de Hamilton-Jacobi puede ser u ´til en problemas cuánticos realistas en que sea especialmente dif´ıcil diagonalizar directamente la matriz hamiltoniana.

12.5.

Teor´ıa de perturbaciones con matrices cl´ asicas

Veremos que las fórmulas de la teor´ıa clásica de perturbaciones, de primero y segundo orden, pueden escribirse en forma análoga a las correspondientes fórmulas de la mecánica cuántica para las correcciones a la energ´ıa. Perturbaciones de primer orden. Para el caso no degenerado la corrección de primer orden a la energ´ıa est´ a dada por la fórmula (11.27): H (1) (I) = hH1 (ϕ0 , I)i

(12.99)

Si la funci´ on H1 se expresa como una serie de Fourier, la corrección de primer orden est´ a determinada por los elementos diagonales de la matriz correspondiente: H (1) (~ α ∆I) = H1 α~ ,~α

(12.100)

que corresponde en mecánica cuántica con h~ α|H1 |~ αi. Para el caso degenerado, antes de hallar la corrección de primer orden, es necesario encontrar las variables acción-´ angulo “correctas” o “estabilizadas” en la aproximación cero. Para ello es necesario buscar entre los posibles conjuntos de variables acción-´ angulo degeneradas Iσ0 − ϕ0σ de orden cero, aquel con el cual la perturbación no depende de las variables angulares. A su vez esto se consigue resolviendo la ecuaci´ on de HamiltonJacobi (11.110). En términos de matrices esto se logra diagonalizando la matriz formada con los coeficientes de Fourier de la perturbación respecto a las variables degeneradas. Simult´ aneamente se hallan los valores propios perturbados al primer orden y la transformaci´ on can´ onica que lleva a las variables “correctas” de orden cero, mediante la fórmula: h i (1) det H1 ~σ,σ~′ − H~σ δ~σ ,~σ′ = 0 (12.101)

donde ~σ y ~σ ′ son vectores de l − s componentes enteras, y: XX (1) g~σ+,~σ′ H~σ′ ,~σ′′ g~σ′′ ,~τ = H~σ δ~σ ,~τ ~ σ′

(12.102)

~ σ′′

En mecánica cuántica, la matriz que diagonaliza la perturbación proporciona los coeficientes con los cuales se forman las funciones de onda exactas de la aproximación cero como combinaciones lineales de las funciones de onda degeneradas. Ver la secci´ on

Corespondencia con la mecánica cuántica de Heisenberg / 565 §39 del libro de mecánica cuántica de Landau-Lifshitz, Op. cit. Perturbaciones de segundo orden. Seg´ un la fórmula (11.40), la corrección de segundo orden a la energ´ıa est´ a dada por: H (2) (~ α ∆I) = −

|Aα~ ,β~ |2 1X ~ · ∂ (~ α − β) ~ · ~ω 2 ∂ I~ (~ α − β) ~

(12.103)

β6=α ~

donde Aα~ ,β~ est´ a dada por el coeficiente de Fourier de la expansi´ on de H1 en las variables acción-´ angulo no perturbadas. Tanto ω ~ como A ~ tienen como argumento a I~ = α ~ ∆I. α ~ ,β

Como en (12.41), podemos escribir: |Aα~ ,β~ |2 ∆I ~ · ∂ (~ α − β) = ~ ·ω 2 ∂ I~ (~ α − β) ~ |Aα~ ,β~ |2 |Aα~ ,β~ |2 − ~ · ~ω ~ · ~ω (~ α − β) (~ α − β) ~ ∆I/2 α ~ ∆I (~ α+β)

(12.104)

~−α El primer término de (12.104) cambia de signo al cambiar a α ~ − β~ por β ~ . Por tanto en la sumatoria (12.103) las contribuciones provenientes del primer término de (12.104) se cancelan. En el denominador del segundo término de (12.104), ~ω est´ a evaluada ~ ∆I/2. Si reemplazamos al denominador de la siguiente manera: en (~ α + β) " # ~ ∆I (~ α + β) ~ ·~ ~ · ~ω (β ~ ∆I) (~ α − β) ω →α ~ · ~ω(~ α ∆I) − β (12.105) 2 ~ ∆I|2 en la expresión para H (2) , con lo cual cometemos un error del orden de |(~ α − β) llegamos a la f´ ormula: H (2) (~ α ∆I) =

X

~ =α β6 ~

|Aα~ ,β~ |2

~ ∆I) ∆I α ~ ·ω ~ (~ α ∆I) − ∆I β~ · ~ω(β

(12.106)

Si llamamos: α ~ ∆I · ~ ω (~ α ∆I) = Eα~ ′

(12.107)

~ ∆I|2 como: La ecuaci´ on (12.103) puede escribirse con un error del orden de |(~ α − β) H (2) (~ α ∆I) =

X |Aα~ ,β~ |2 ′ ~ β

Eα~ − Eβ~

(12.108)

que coincide formalmente con la fórmula cuántica de la teor´ıa de perturbaciones de segundo orden.


13 Correspondencia con la mec´ anica cu´ antica de Schr¨ odinger Este cap´ıtulo trata de mostrar la conexión de los trabajos de Hamilton y Jacobi con la formulaci´ on de Schrödinger de la mecánica cuántica. Se har´ a énfasis en la relación existente entre la acción principal de Hamilton y la fase de la funci´ on de onda, y entre las soluciones de la ecuaci´ on de Liouville y la amplitud de la funci´ on de onda. Al pasar de la mecánica cl´ asica a la formulaci´ on de Schrödinger son necesarios cambios conceptuales más drásticos respecto a la formulaci´ on de Heisenberg, pues se requiere postular la existencia de comportamientos ondulatorios. También presentaremos algunos desarrollos modernos de las ideas de Einstein, Bohr y Sommerfeld acerca de la cuantización de un sistema clásico, debidos a Brillouin, Maslov y Keller. Finalmente obtendremos las fórmulas de la aproximación de W.K.B.

13.1.

Ideas de Hamilton acerca de las transformaciones can´ onicas

Hamilton present´ o en 1824 un trabajo a la Academia Irlandesa de Ciencias acerca de la conexión entre la din´ amica y la óptica. Desde el punto de vista moderno, tal formalismo presenta una conexión entre la dinámica y el l´ımite clásico de la mecánica ondulatoria, y no es aplicable a la óptica por las dificultades resultantes de ser cero la masa del fotón. Seg´ un el principio de Fermat las ecuaciones paramétricas de la trayectoria de un rayo de luz, x(l), y(l), z(l), son tales que la siguiente integral es una extremal: Z n(~r(l)) dl (13.1) siendo n el ´ındice de refracci´ on del medio en el punto ~r. El principio de m´ınima acción aplicado a una part´ıcula sometida a un potencial V , ecuaci´ on (9.49), expresa que: Z [E − V (~r)]1/2 dl (13.2) 567

568 / Mec´ anica cl´ asica avanzada tiene un valor estacionario para la trayectoria real. En los dos casos se deben tomar variaciones “∆”. La trayectoria de una part´ıcula y la de un rayo de luz coinciden haciendo: n(~r) = A [E − V (~r)]1/2

(13.3)

En un medio inhomogéneo y anisotr´ opico n depende no sólo de la posición sino de la direcci´ on de los rayos, esto es, de ~r y ~r˙ . Lo anterior permitir´ıa asociar propiedades corpusculares a la luz. Hamilton se propuso elaborar esta conexión dentro de un modelo ondulatorio de la luz teniendo en cuenta que la relaci´ on (13.3) es válida independientemente del modelo usado. Es natural partir del concepto de “frente de ondas”, introducido por Huygens en 1690. Cada punto ~r de un frente de ondas en el tiempo t genera una onda secundaria que alcanzar´ a otro punto ~r ′ del frente de ondas en un tiempo posterior t′ . El tiempo empleado por la luz en ir de ~r a ~r ′ dependerá solamente de ~r y ~r ′ . El lugar geométrico de los puntos alcanzados por la luz en el tiempo t′ es una superficie de ondas secundarias, definida por una funci´ on Σ(~r, ~r ′ ), donde ~r hace de par´ ametro, mediante la fórmula: Σ(~r, ~r ′ ) = t − t′

(13.4)

Σ describe el camino óptico entre ~r y ~r ′ y fue llamada por Hamilton funci´ on caracter´ıstica del medio. Seg´ un el principio de Huygens, la envolvente de las ondas secundarias en el tiempo t′ es el frente S ′ que se ha propagado en el espacio, como se ilustra en la figura 13.1.

α′′

α′ α

r′

N

r″

T

Σ′

r

Σ S″ S′ S

Figura 13.1 Propagación en el espacio de la envolvente S Denotemos por α ~ = (α1 , α2 , α3 ) a los cosenos directores de la normal a S en el punto ~r y por α ~ ′ a los cosenos directores de la normal a S ′ en el punto ~r ′ . Decimos que ~r ′ corresponde con ~r si la onda secundaria que emerge de ~r toca a la envolvente S ′ en ~r ′ . La l´ınea descrita por los vectores α ~, α ~ ′, α ~ ′′ , ..., que llamamos N , es ortogonal a los

Corespondencia con la mecánica cuántica de Schrödinger / 569 frentes de onda. Como S ′ es la envolvente de las superficies Σ correspondientes a los puntos de S, las superficies Σ también son ortogonales a la l´ınea N en los puntos ~r, ~r ′ , ~r ′′ , ... Si denotamos por d~r ′ a un vector tangente a la superficie S ′ en ~r ′ , se cumple que: ∂Σ(~r, ~r ′ ) · d~r ′ = 0 ∂~r ′

(13.5)

Como α ~ ′ son los cosenos directores de N en el punto ~r ′ , también serán ortogonales a d~r . Se sigue entonces que: ∂Σ(~r, ~r ′ ) ′ ′ · d~r ′ = 0 (13.6) − λ α ~ ∂~r ′ ′

donde λ′ es cierta funci´ on de ~r ′ . La ecuaci´ on (13.6) implica que: 1 ∂Σ 1 ∂Σ 1 ∂Σ = ′ = ′ α′1 ∂x′ α2 ∂y ′ α3 ∂z ′

(13.7)

Similarmente, en el punto ~r se debe cumplir: 1 ∂Σ 1 ∂Σ 1 ∂Σ = = α1 ∂x α2 ∂y α3 ∂z

(13.8)

Además: α′1 2 + α′2 2 + α′3 2 = 1

(13.9)

Las ecuaciones (13.4) y (13.7) a (13.9) permiten expresar las seis cantidades (x′ , y , z , α′1 , α′2 , α′3 ) en términos de (x, y, z, α1 , α2 , α3 ). Entonces, dada una funci´ on caracter´ıstica del medio Σ, las seis ecuaciones (13.4) y (13.7) a (13.9) describen un´ıvocamente la l´ınea de las normales N en el medio óptico anisotr´ opico. Es necesario aclarar que la l´ınea N no necesariamente coincide con la l´ınea T de un rayo luminoso que pasa por ~r; esta coincidencia ocurre solamente en un medio óptico isotrópico, en el cual los vectores ~r˙ , ~r˙ ′ , ~r˙ ′′ , ... son respectivamente paralelos a los vectores α ~, α ~ ′, α ~ ′′ , ... La funci´ on Σ determina una transformaci´ on en el espacio que cambia cualquier superficie S en una nueva S ′ . Si dos superficies Σ y S ′ se tocan en un punto ~r ′ , entonces las correspondientes superficies transformadas Σ′ y S ′′ se tocan en un punto ~r ′′ correspondiente a ~r ′ . Sophus Lie por esta raz´ on llama a las transformaciones (~r, α ~ ) → (~r ′ , α ~ ′) 1 transformaciones de contacto. Entonces cada funci´ on Σ define una transformaci´ on de contacto, que transforma un frente de ondas S en el frente de ondas S ′ envolvente de todas las ondas secundarias emergentes de S, en el intervalo de tiempo t′ − t. De (13.7) y (13.8) se sigue que: ′

′

∂Σ(~r, ~r ′ ) = λ~ α; ∂~r 1 En

∂Σ(~r, ~r ′ ) = λ′ α ~′ ∂~r ′

(13.10)

din´ amica hamiltoniana se usa el nombre de transformaciones can´ onicas para designar a estas transformaciones.

570 / Mec´ anica cl´ asica avanzada Entonces bajo desplazamientos arbitrarios d~r y d~r ′ , Σ cambia de valor en: dΣ = λ~ α · d~r + λ′ α ~ ′ · d~r ′

(13.11)

De acuerdo con (13.4), dΣ = dt′ − dt. Si tomamos el punto ~r fijo y consideramos dos frentes de onda próximos, en los puntos ~r ′ y ~r ′ + d~r ′ , entonces dt′ será la diferencia de tiempo entre esos frentes de onda, dada por: dt′ =

dl′ ′ n c

(13.12)

donde c es la velocidad de la luz en el vac´ıo, dl′ la distancia normal entre los dos frentes de onda finales y n′ es el ´ındice de refracci´ on del medio en el punto ~r ′ en la direcci´ on α′ ′ normal a S . De (13.11) y (13.12) se sigue entonces: dl′ ′ n = λ′ α ~ ′ · d~r ′ c

(13.13)

Como para el desplazamiento de ~r ′ que consideramos se cumple que d~r ′ = α ~ ′ dl′ , ′ ′ ′ podemos escribir dl = α ~ .d~r . Obtenemos entonces el resultado: λ′ =

n′ ; c

λ=−

n c

(13.14)

donde la segunda expresión se sigue de argumentos similares, tomando a ~r ′ fijo y variando el punto inicial ~r. En conclusi´ on: dΣ =

n n′ ′ α ~ · d~r ′ − α ~ · d~r c c

(13.15)

donde n′ y n son funciones respectivamente de (~r ′ , α ~ ′ ) y (~r, α ~ ), o equivalentemente de (~r ′ , ~r˙ ′ ) y (~r, ~r˙ ), porque debe existir una relación definida entre α ~ y ~r˙ , y α ~ ′ y ~r˙ ′ . También dΣ puede escribirse como: dΣ = ~ p ′ · d~r ′ − p~ · d~r

(13.16)

los vectores ~ p y p~ ′ tienen dimensiones de T L−1 y su magnitud es menor en los puntos donde la velocidad de la luz es mayor y viceversa. Si tomamos ahora los tiempos t y t′ infinitesimalmente próximos, también lo serán los puntos ~r y ~r ′ , lo mismo que α ~ yα ~ ′ , y n y n′ . Decimos en este caso que la transformaci´ on de contacto es infinitesimal: ~r ′ = ~r + ~r˙ ∆t ;

~ ′ = p~ + ~p˙ ∆t p

Como Σ(~r, ~r) = 0, también se cumple que, al orden más bajo en ∆t: ∂Σ(~r, ~r ′ ) ′ · ~r˙ ∆t Σ(~r, ~r ) = ∂~r ′ ~r ′ =~r Definimos la funci´ on M (~r, ~r ′ ) como: ∂Σ(~r, ~r ′ ) ˙ ˙ M (~r, ~r˙ ) = · ~ r ′ = ~p · ~r ∂~r ′ ~ r =~ r

(13.17)

(13.18)

(13.19)

Corespondencia con la mecánica cuántica de Schrödinger / 571 Entonces se sigue que: ∂M (~r, ~r˙ ) ∂Σ(~r, ~r ′ ) = ~p = ∂~r ′ ~r ′ =~r ∂~r˙

(13.20)

Seg´ un (13.18) y (13.19), cuando ~r y ~r ′ son infinitesimalmente cercanos: Σ(~r, ~r ′ ) = M (~r, ~r˙ ) ∆t

(13.21)

Por tanto, para una separación finita entre ~r y ~r ′ se cumple: Z ~r ′ Z t′ ′ ˙ ~p · d~r M (~r, ~r) dt = Σ(~r, ~r ) =

(13.22)

~ r

t

La longitud del camino ´ optico entre ~r y ~r ′ también puede escribirse, usando (13.15) y (13.16), como: Z ~r ′ Z ′ n 1 ~r ′ Σ(~r, ~r ) = α ~ · d~r = n dl (13.23) c c ~r ~ r Entonces, el principio de Fermat, (13.1), equivale a la condición de que Σ sea una extremal. La condición ∆Σ = 0 determina la forma de la l´ınea de los rayos T de la figura 13.1. Comparando a (13.23) con (13.2) vemos que M es proporcional a la energ´ıa cinética del problema mecánico equivalente. La transformaci´ on de contacto (13.10), cuya funci´ on generatriz es Σ, puede expresarse como una transformaci´ on canónica libre de primera clase: p~ = −

∂Σ(~r, ~r ′ ) ; ∂~r

~′ = p

∂Σ(~r, ~r ′ ) ∂~r ′

(13.24)

donde (~r ′ , p~ ′ ) son las “viejas” variables canónicas y (~r, p~) las “nuevas”. Comparando con los resultados de la secci´ on 9.3, fórmula (9.44), encontramos que Σ coincide formalmente con la acción de Lagrange y M con ~p · ~q. Sin embargo hay una discrepancia dimensional a través de un factor constante B con dimensiones de energ´ıa. O sea que BΣ es la acción de Lagrange y B~ p es el momento mecánico. La acción de Lagrange BΣ obedece la ecuaci´ on de Hamilton-Jacobi independiente del tiempo, que para una part´ıcula de masa m en un potencial V es: 2 ∂Σ V E 1 + 2 = 2 (13.25) 2m ∂~r B B Usando la conexión dada por (13.3), podemos escribir a (13.25) como: 2 ∂Σ 2m 1 = 2 2 n2 = 2 n2 ∂~r A B c

(13.26)

donde c es una constante con dimensiones de velocidad: c=

AB (2m)1/2

(13.27)

572 / Mec´ anica cl´ asica avanzada Formalmente (13.26) es la ecuaci´ on de la eiconal de la óptica,2 que permite encontrar a Σ si se conocen las propiedades ópticas del medio expresadas a través de n. N´ otese que la relación (13.27) aparentemente no permite el concepto de fotón entendido como una part´ıcula de masa cero. Sin embargo el formalismo resulta perfectamente adaptado a la descripción de propiedades ondulatorias de part´ıculas de masa diferente de cero. Podemos concluir que a la acción de Lagrange de un sistema mecánico se le puede asociar la onda secundaria emergente de un punto en cierto movimiento de propagación de ondas. Este resultado sirvi´ o a Schrödinger para hallar la conexión entre la mecánica y la ´ optica cl´ asicas por una parte, y la mecánica ondulatoria (mecánica cuántica) por otra. Sin embargo, la ecuaci´ on de la eiconal (13.26) no coincide con la ecuaci´ on de ondas más que en el l´ımite asint´ otico de peque˜ nas longitudes de onda, en el cual la óptica ondulatoria coincide con la óptica geométrica. Frecuencia y vector de propagaci´ on. Para una onda plana monocrom´ atica la amplitud tiene la forma: ~

C = aei(k·~r−ωt+α)

(13.28)

y para una onda arbitraria: C = aeiϕ

(13.29)

donde ϕ es la eiconal que obedece la ecuaci´ on (13.26) sólo en el l´ımite de ondas cortas. Desarrollando a ϕ en potencias de ~r y t, para ~r y t peque˜ nos se obtiene: ϕ=α+t

∂ϕ ∂ϕ + ~r · ∂t ∂~r

(13.30)

Como es de esperarse, el frente de ondas emergente de un punto es en las cercan´ıas del mismo casi plano, con: ~k = ∂ϕ ; ∂~r

ω=−

∂ϕ ∂t

(13.31)

Por otra parte, expandiendo a S cerca a ~r = 0 obtenemos: S = −Et + BΣ ≈ −Et + B~r ·

∂Σ = −Et + B~r · p~ ∂~r

(13.32)

Si admitimos que S = Dϕ, donde D es otra constante, encontramos que p~ es proporcional a ~k y E proporcional a ω: E = Dω ;

p ~=

D~ k B

(13.33)

La funci´ on M , seg´ un (13.19) puede escribirse como: n(~r, α ~) M (~r, ~r˙ ) = α ~ · ~r˙ c 2 Eiconal

viene del griego, icono = imagen. La funci´ on eiconal permite localizar im´ agenes.

(13.34)

Corespondencia con la mecánica cuántica de Schrödinger / 573 y se denomina la indicatriz del medio óptico en el punto ~r. La velocidad del frente de ondas en el punto ~r en la direcci´ on α ~ tiene magnitud v(~r, α ~ ) = c/n(~r, α ~ ). Por tanto: α ~ · ~r˙ M (~r, ~r˙ ) = ; v(~r, α ~)

p~ =

α ~ ~v (~r, α ~) = v(~r, α ~) v(~r, α ~ )2

(13.35)

Por esto el vector p~, que es proporcional a ~k cuando la onda es plana monocrom´ atica, se llama el vector de lentitud normal del frente de ondas en el punto ~r en la direcci´ on α ~. ~ en un punto Los vectores ~r˙ y ~p. Exploremos la relación entre los vectores ~r y α dado ~r. Para ello usamos la noci´ on matemática de homotecia, o sea la transformaci´ on de cambio de escala. Si realizamos a la superficie M (~r, ~r˙ ) una transformaci´ on de homotecia con par´ ametro ǫ respecto a ~r˙ , en un punto ~r, obtenemos: M (~r, ǫ~r˙ ) = ǫ~ p · ~r˙

(13.36)

al notar que p~ depende de la direcci´ on de ~r pero no de su magnitud. Por otra parte, consideremos el desplazamiento del frente de ondas S durante un tiempo infinitesimal ǫ (véase figura 13.2). La onda secundaria que emerge del punto ~r, en el tiempo ǫ, será, seg´ un (13.18): Σ(~r, ~r ′ ) = p~ · ~r˙ ǫ

(13.37)

Comparando a (13.36) y (13.37) se sigue que Σ y M son iguales al orden de ǫ2 . Cuando el tiempo entre S(t) y S(t + ǫ) es infinitesimal, la onda secundaria emergente de ~r que toca a S(t + ǫ) y la indicatriz del medio óptico en ~r son homotéticas. Si ahora hacemos tender ǫ a cero, obtenemos que en cada punto ~r los vectores α ~ y ~r tienen una relaci´ on bien definida. La direcci´ on del plano tangente a la indicatriz en ~r˙ se llama conjugada de la direcci´ on de ~r˙ . O sea que ~r˙ y ~ p son dos vectores conjugados en cada punto ~r. En general ~r˙ no es perpendicular al plano tangente a la indicatriz en ~r˙ . Si el medio es isotrópico, en cada punto ~r la indicatriz será una superficie esférica; en el caso contrario n dependerá de ~r y ~r˙ , con lo cual Σ y p~ dependerán igualmente de ~r˙ , dando lugar a que M no sea esférica (véase figura 13.2).

13.2.

Funci´ on de distribuci´ on de probabilidades

Para una part´ıcula, la contraparte cuántica de la proyección de un toroide invariante sobre el espacio tridimensional es |ψ|2 , siendo ψ una funci´ on propia de tres operadores que conmutan (para un problema de fuerzas centrales, por ejemplo, tales operadores pueden ser H, l2 y lz ). La densidad que describe el ensamble de trayectorias sobre el toroide invariante es ρ, que satisface la ecuaci´ on de Liouville (sección 4.8): ∂ρ + [ρ, H] = 0 ∂t

(13.38)

574 / Mec´ anica cl´ asica avanzada T

Punto de tangencia r r

p Plano tangente a la indicatriz en r

Σ(r, r ′) M(r, r ′)

S(t)

S(t + ε)

Figura 13.2 Desplazamiento del frente de ondas S durante un tiempo infinitesimal ǫ.

Como H no depende de las variables angulares, esta ecuaci´ on toma la forma, ∂ρ ∂ρ ∂ρ ∂ρ + ω2 + ω3 =0 + ω1 ∂t ∂ϕ1 ∂ϕ2 ∂ϕ3

(13.39)

Como las ων son las “velocidades” sobre el toroide, esta ecuaci´ on tiene la forma de una ecuaci´ on de continuidad para la densidad ρ: 3

∂ρ X ∂ (ων ρ) = 0 + ∂t ν=1 ∂ϕν

(13.40)

Cuando el sistema es estacionario, t no aparece en ρ expl´ıcitamente y por tanto: 3 X ∂ (ων ρ) = 0 ∂ϕ ν ν=1

(13.41)

Seg´ un esta expresión, el flujo de probabilidad sobre el toroide no tiene divergencia. Por tanto, al aplicar el teorema de Gauss a un tubo de trayectorias: Z (~ ω ρ) · d~σ = 0 (13.42) Como consecuencia, conociendo a ρ en un punto se puede calcular a ρ en cualquier otro punto de la misma trayectoria: ρω = ρ0 ω

dσ0 dσ

(13.43)

donde ω = |~ ω |, y dσ0 es el área de cruce normal al tubo de caracter´ısticas en el punto (~ p0 , ~r0 ). Realmente (13.43) vale en el l´ımite cuando dσ0 tiende a cero, en cuyo caso

Corespondencia con la mecánica cuántica de Schrödinger / 575 dσ/dσ0 denota el jacobiano de la aplicación de los puntos de una secci´ on de cruce en otra por medio de las trayectorias: p~0 , ~r0 ρ(~ p, ~r) = ρ(~ p0 , ~r0 ) J (13.44) p~, ~r Una posible solución de (13.41) es una funci´ on arbitraria de las variables de acción. Sin embargo no es la más interesante. Funci´ on de distribuci´ on en el espacio de configuraci´ on. Si por alg´ un procedimiento se obtiene una ρ particular, entonces la densidad en el espacio de configuración x − y − z será: Z Q(~r) = ρ(~ p, ~r) d3 p~ (13.45) En el espacio de configuración hay igualmente un flujo de probabilidad, descrito por la ecuaci´ on de continuidad para Q: ∂ ∂Q + · (~r˙ Q) = 0 ∂t ∂~r

(13.46)

donde ~r˙ = ∂H/∂~ p. Cuando Q no depende expl´ıcitamente del tiempo, obedece ecuaciones análogas a (13.41) y (13.42). La ecuaci´ on análoga a (13.43) es: Qv = Q0 v0

dA0 dA

(13.47)

siendo dA un elemento de ´ area en el espacio ordinario, y v = |~r˙ |. Si se conoce a Q sobre una superficie dA0 que corta un tubo de trayectorias caracter´ısticas en el espacio de configuración, (13.47) permite hallar a Q en cualquier otra superficie que corte el mismo tubo de trayectorias. El formalismo de las variables acción-´ angulo permite encontrar la densidad de probabilidad Q(~r), en una forma alterna a (13.47) que hace más transparente la conexión con Σ y con la proyección del ensamble de trayectorias en el espacio de fases sobre el espacio de configuración. ~ ϕ Como en ~r(I, ~ ) las I~ son constantes, se sigue que las posibles posiciones de la part´ıcula en el espacio de configuración, ~r, est´ an determinadas por las ϕ ~. Entonces el promedio de una funci´ on de ~r sobre el toroide invariante puede expresarse como un promedio sobre el espacio de configuración. En efecto: I 1 ~ ϕ f (~r(I, ~ )) d3 ϕ ~ (13.48) hf (~r)i = (2π)3 ~ ϕ La funci´ on ~r(I, ~ ), con I~ = constante, puede interpretarse como un cambio de coordenadas de ϕ ~ a ~r. Por tanto (13.48) puede escribirse como: Z ϕ ~ 1 d3~r (13.49) f (~ r ) J hf (~r)i = 3 (2π) ~r

576 / Mec´ anica cl´ asica avanzada En términos de Q este mismo promedio es: Z hf (~r)i = Q(~r) f (~r) d3~r

(13.50)

de donde concluimos que Q es esencialmente el jacobiano de la transformaci´ on de ϕ ~ a ~r con I~ fijo: −1 ϕ ~ ~r 3 (2π) Q(~r) = J (13.51) =J ~r ϕ ~ Podemos igualmente hallar la funci´ on de distribuci´ on en el espacio de los momentos: ϕ ~ (13.52) (2π)3 Qp (~ p) = J p~ El lugar geométrico de los puntos para los cuales Q = ∞ se denomina “superficie c´ austica”. Para esos puntos, o bien v = 0, o bien las trayectorias se cruzan haciendo que dA = 0. Si la secci´ on de cruce se convierte un una l´ınea, diremos que m1 = 1 y si se convierte en un punto, que m1 = 2. El n´ umero de veces que un momento canónico cambie de signo en alguna c´ austica lo notaremos m2 . El n´ umero m = m1 +m2 determina la fase de la funci´ on de onda semicl´ asica construida con Q y Σ. La fórmula (13.51) permite también interpretar las c´ austicas como el lugar geométrico de las singularidades de la aplicación del espacio de fases sobre el espacio de configuración ϕ ~ → ~r. Tales singularidades se denominan lagrangianas. Ejemplo 13.2.1 Hallar la funci´ on Q para el problema de Kepler en coordenadas esféricas. En este caso Ir , Iθ e Iϕ son constantes. De las fórmulas que expresan a r, θ y ϕ en términos de las variables angulares ϕr , ϕθ y ϕϕ , dadas en la secci´ on 10.4, se sigue que: (2π)3 Q(~r) =

∂ϕr ∂ϕθ ∂ϕϕ 1 r2 sen θ ∂r ∂θ ∂ϕ

(13.53)

De la ecuaci´ on (10.192) se sigue: ∂ϕr I 1 = 2 ∂r a pr

(13.54)

La separación de variables en la ecuaci´ on de Hamilton-Jacobi para el problema conduce a: ~ r, θ, ϕ) = Σr (Ir , Iθ , Iϕ , r) + Σθ (Iθ , Iϕ , θ) + Σϕ (Iϕ , ϕ) Σ(I,

(13.55)

de donde se sigue: ∂pθ ∂ϕθ ; = ∂θ ∂Iθ

∂ϕϕ ∂pϕ = ∂ϕ ∂Iϕ

(13.56)

Como pθ y pϕ est´ an dados por: p2θ = l2 −

lz2 ; sen2 θ

pϕ = lz

(13.57)

Corespondencia con la mecánica cuántica de Schrödinger / 577 obtenemos: l ∂ϕθ ; = ∂θ pθ

∂ϕϕ =1 ∂ϕ

(13.58)

De donde obtenemos finalmente: Q(~r) =

mk 1 (1 − ǫ2 )1/2 2 (2π)3 a r sen θ pr pθ

(13.59)

Esta es la densidad de probabilidad para un ensamble de sistemas con los mismos valores de E, l, lz , donde cada sistema posee un valor distinto de las ϕν . La región descrita por Q(~r) se obtiene también a partir de una órbita individual mediante estas tres operaciones: primero, dejando la o´rbita fija se toma el conjunto de todas las posiciones de la part´ıcula sobre la misma; segundo, dejando fijo el plano de la órbita, se toma el conjunto de puntos del plano obtenido al rotar el anterior conjunto alrededor del foco, obteniéndose as´ı una corona sobre el plano de la órbita; finalmente, se toma el conjunto de puntos del espacio obtenido al rotar la corona alrededor del eje z. La región as´ı obtenida resulta ser un elipsoide de revoluci´ on con ejes de longitudes rmáx y rmáx cos θm´ın , colocado con el eje menor sobre el eje z, y que además posee en el centro un agujero elipsoidal con ejes de longitudes rm´ın y rm´ın cos θm´ın . Q(~r) vale cero fuera del elipsoide y dentro del agujero, es infinita sobre las superficies de los elipsoides, y en los dem´ as puntos est´ a dada por (13.59). N´ otese que los elipsoides interior y exterior son las superficies c´ austicas. La región que hemos descrito es, para el caso del átomo de hidrógeno, el l´ımite clásico de la densidad de probabilidad cuántica |ψnlm |2 . Vemos que no presenta los nodos angulares 2 caracter´ısticos de |Ylm |2 , ni los nodos de la densidad de probabilidad radial Rnl (r). Además, la densidad de probabilidad cuántica no es cero para r mayor que rmáx ni para r menor que rm´ın , aunque decae exponencialmente en estas regiones, y tampoco presenta superficies c´ austicas. Ejemplo 13.2.2 Estudiar la funci´ on de distribuci´ on en el caso lz = l = 0. Comparar con la correspondiente densidad cuántica para el átomo de hidrógeno. En este caso rm´ın = 0, las órbitas son rectil´ıneas y la intersección del toroide invariante con el espacio de configuración es una esfera. Q(r) es cero para r > 2a, infinito en r = 0 y r = 2a, y en los dem´ as puntos est´ a dada por: Q(r) =

1 (2π)2 ar(2ar − r2 )1/2

(13.60)

Esta expresión no se obtiene directamente de (13.59) porque para l = 0, pθ no est´ a definido. En (13.53), ∂ϕθ /∂θ es indeterminada pero hemos asumido que es una constante que se halla por normalizaci´ on. Q(r) es isotrópica y corresponde a los estados s de la mecánica cuántica. Q(r) diverge en r = 0 y r = 2a, que son los puntos de retorno, y tiene un m´ınimo en r = 3a/2. El valor medio de r calculado con esta Q es 3a/2 y coincide exactamente con el valor medio cuántico. Si bien en este caso no se cumplen las condiciones de validez de la aproximación cl´ asica,3 el problema ilustra la correspondencia entre las dos descripciones. 3 V´ ease

la secci´ on 49 del libro de Mec´ anica cu´ antica de Landau-Lifshitz, Op. cit.


2

2πϕ21s

1

2πQr

1

2

2 Figura 13.3 Función de distribuci´ on 2πQ(r) en el caso lz = l = 0 y densidad cuántica 2πψ1s para el átomo de hidrógeno

En la figura 13.3, la curva discontinua corresponde a la distribuci´ on en mecánica cuántica para el estado 1s del átomo de hidrógeno, que es exponencial. Las unidades son atómicas. Como puede verse, la mayor discrepancia se presenta cerca al punto de retorno r = 0 y a la superficie c´ austica r = 2, donde la part´ıcula tiene energ´ıa cinética muy peque˜ na, estando por tanto all´ı más expuesta a los efectos de tipo cuántico. La distribuci´ on clásica tiene la forma de una esfera con densidad que var´ıa radialmente, de radio 2a, en tanto que la distribuci´ on en mecánica cuántica decae exponencialmente y existe para r entre 0 y 2a, as´ı como entre 2a e ∞. La densidad en el espacio de momentos se halla fácilmente de la relación Qr r2 dr = Qp p2 dp. En unidades atómicas el resultado es: Qp (p) =

1 1 2π 2 p2 (1 + p2 )2

(13.61)

El resultado cuántico es:4 ϕ21s (p) =

8 1 π 2 (1 + p2 )4

(13.62)

Ejemplo 13.2.3 Demostrar que la funci´ on de distribuci´ on Q(r) definida por (13.51) satisface la ecuaci´ on de continuidad (13.46). En este caso Q no depende expl´ıcitamente del tiempo. El jacobiano est´ a dado por: ∂ϕλ ∂ϕσ ∂ϕρ ϕ ~ = ǫλσρ (13.63) J ~r ∂x ∂y ∂z 4 V´ ease

la secci´ on 36 del libro de Landau-Lifshitz, Op. cit.

Corespondencia con la mecánica cuántica de Schrödinger / 579 donde ǫλσρ es el tensor de Levi-Civita. Por otra parte la velocidad tiene la expresión: ~r˙ =

X ∂~r ωµ ∂ϕµ µ

(13.64)

Entonces (convenio de suma): ∂ ∂ϕλ ∂ϕµ ∂ϕρ ∂ ∂xi (x˙ i J) = ωµ ǫλσρ ∂xi ∂xi ∂ϕµ ∂x ∂y ∂z

(13.65)

ésta expresión es nula porque: ∂ ∂xi ∂ 2 xi = =0 ∂xi ∂ϕµ ∂ϕµ ∂xi

(13.66)

∂xi ∂ 2 ϕρ ∂ ∂ϕρ ∂ = = δµρ = 0 ∂ϕµ ∂xi ∂xi ∂ϕµ ∂xj ∂xi

(13.67)

y,

Ejemplo 13.2.4 Expresar la funci´ on de distribuci´ on Q(~r) en términos de la acción de Lagrange Σ. Recordando que: ϕν =

~ ~r) ∂Σ(I, ∂Iν

(13.68)

se sigue de (13.63) que: (2π)3 Q(~r) = ǫλσρ

∂2Σ ∂2Σ ∂2Σ ∂x∂Iλ ∂y∂Iσ ∂z∂Iρ

(13.69)

~ ~r), Se sigue entonces que a cada solución de la ecuaci´ on de Hamilton-Jacobi, Σ(I, le corresponde una funci´ on de distribuci´ on. No es necesario resolver por separado la ecuaci´ on de continuidad en el espacio de configuración. En otras palabras, los campos ~ ~r) y Q(I, ~ ~r) no son independientes. En mecánica cuántica esto implicar´ıa que la Σ(I, funci´ on de onda compleja queda determinada simplemente por una funci´ on real. Relaci´ on con la teor´ıa erg´ odica y con el teorema K.A.M. Si el sistema es no degenerado y asumimos que los efectos cuánticos son una perturbación peque˜ na, sabemos que los toroides invariantes han de resultar ligeramente distorsionados. Entonces el problema cuántico no difiere esencialmente del clásico. Como las frecuencias son inconmensurables la trayectoria cl´ asica, cuando t → ∞, llena completamente el toroide y se cumple que el promedio temporal de una variable dinámica coincide con el promedio tomado sobre las coordenadas del toroide: Z I 1 T 1 l´ım f (q, p)dt = f (q, p) dl ϕ ~ (13.70) T →∞ T 0 (2π)l Si el sistema es degenerado, las frecuencias son conmensurables. Entonces las trayectorias son periódicas y cubren una región de dimensi´ on menor a la del toroide. El

580 / Mec´ anica cl´ asica avanzada teorema K.A.M. dice que en este caso, aun si la perturbación es muy peque˜ na, los toroides invariantes pueden cambiar drásticamente en su topolog´ıa; para la mayor parte de las condiciones iniciales las trayectorias son estoc´ asticas o sea que no est´ an colocadas sobre regiones de geometr´ıa definida en el espacio fásico. Para el problema de fuerzas centrales en coordenadas esféricas, además de Ir , Iθ e Iϕ hay una constante de movimiento adicional ϕθ − ϕϕ (y en el problema de Kepler además ϕr − ϕθ es constante). Cuando se aplica una perturbación las constantes que dependen sólo de variables angulares pasan a ser veriables angulares de frecuencia lenta dando lugar a que la trayectoria no sea cerrada sino que ocupe toda la región definida por las variables de acción constantes. Entonces es de esperarse que a causa de los efectos cuánticos, en un sistema degenerado se cumpla también la igualdad (13.70).

13.3.

La mec´ anica ondulatoria

Es posible, en la óptica geométrica, describir la propagación de los rayos por medio del principio de Fermat, ∆Σ = 0, y la propagación de los frentes de ondas por medio de la ecuaci´ on de la eiconal. En óptica f´ısica la luz es una onda electromagnética, y la óptica geométrica es una primera aproximación que describe correctamente la propagación cuando la longitud de onda es peque˜ na en comparaci´ on con las dimensiones caracter´ısticas de la geometr´ıa del problema. Schrödinger encontró que para un sistema mecánico hay un comportamiento similar. La trayectoria de las part´ıculas est´ a determinada por el principio de m´ınima acción y las soluciones de la ecuaci´ on de Hamilton-Jacobi describen el movimiento de unas superficies de acción constante. La mecánica clásica resulta ser la aproximación de ondas cortas de una teor´ıa más general, llamada mecánica ondulatoria. Las ondas de materia est´ an determinadas por dos campos en el espacio ordinario, la ~ ~r), que distribuci´ on de probabilidades Q(~r) y las superficies de acción constante Σ(I, 5 corresponden a la amplitud y la fase de la onda. Seg´ un el ejemplo 13.2.4, Σ determina a Q. Schrödinger encontró la ecuaci´ on diferencial que obedecen las ondas de materia. Propagaci´ on de las superficies de acci´ on constante. Las funciones de Hamilton S y Σ est´ an relacionadas por: ~ t) = Σ(~r, C) ~ − Et S(~r, C,

(13.71)

~ es un conjunto de constantes de movimiento. Las superficies Σ = constante perdonde C manecen fijas en el espacio de configuración, en tanto que las superficies S = constante se mueven. Si en t = 0, S = Σ = σ, entonces en un tiempo posterior dt, la superficie S = σ ya no coincidir´ a con la superficie Σ = σ sino con la superficie Σ = σ + E dt. La velocidad del movimiento de un punto fijo sobre S la llamaremos u: u=

dl dt

(13.72)

5 Esta correspondencia tiene implicaciones en las teor´ ıas gauge de la f´ısica de part´ıculas elementales. V´ ease L.A. S´ anchez, J. Mahecha, Rev. Mex. Fis. 49(2003)364. Tambi´ en http://xxx.lanl.gov/abs/hep-th/0308160

Corespondencia con la mecánica cuántica de Schrödinger / 581 donde dl es el desplazamiento del punto durante el tiempo dt. La condición S(0) = S(dt) = σ nos determina el valor de u. En efecto: S(dt) − S(0) =

∂S ~ ∂S · dl + dt = 0 ∂~r ∂t

(13.73)

Como por su definición d~l est´ a en la direcci´ on normal a S, se sigue que: E u = ∂Σ ∂~r

(13.74)

Σ obedece la ecuaci´ on de Hamilton-Jacobi independiente del tiempo, de donde: ∂Σ 1/2 = (2mT )1/2 (13.75) ∂~r = [2m(E − V )] Por tanto la velocidad de los puntos del frente S para una part´ıcula es: u=

E E = 1/2 p (2mT )

(13.76)

La relaci´ on E = pu, donde p es el momento lineal de la part´ıcula y u la velocidad del frente S, es análoga a E = pc en el caso de los fotones. u = E/mv es peque˜ na cuando v es grande y viceversa, y resulta ser proporcional a la magnitud del vector de lentitud normal análogo al de la ´ optica geométrica. u es llamada la velocidad de fase y v = p/m es la velocidad de la part´ıcula (llamada en mecánica ondulatoria la velocidad de grupo). Cuando la velocidad de las part´ıculas es peque˜ na, las superficies S se mueven rápidamente y cuando las part´ıculas se mueven rápidamente, la velocidad de los frentes ~ t) puede considerarse como un campo o fluido, definido en toda es peque˜ na. S(~r, C, la regi´ on del espacio de configuración accesible a la part´ıcula. Cuando el potencial no depende de la velocidad, las curvas caracter´ısticas en el espacio de configuración son ortogonales a las superficies S. Al moverse las part´ıculas el campo S se propaga con velocidad u(~r) en cada punto. A su vez las part´ıculas mismas caracterizan otro campo, ~ con un flujo de velocidad en cada punto dado por ~r˙ . el de las densidades Q(~r, C), Ejemplo 13.3.1 Hallar las velocidades u y v para un oscilador armónico lineal y analizar los campos Q y S. Las velocidades de los frentes S y de las part´ıculas son respectivamente: u=±

1 2

ωA

1 ωA = 1/2 2 cos(ωt) x2 1− 2 A

1/2 x2 v = ±Aω 1 − 2 = ωA cos(ωt) A

(13.77)

(13.78)

Vemos que v var´ıa entre −Aω y +Aω, en tanto que u var´ıa entre −∞ y −ωA/2 y entre ωA/2 e ∞.


y µ ωA 1 ωA 2 t 0 T/4

T/2

3T/4

T

Figura 13.4 Velocidades u y v para un oscilador armónico lineal

Vemos que en los puntos de retorno x = ±A los frentes S “rebotan” con velocidad muy grande; además la densidad de los frentes S es mayor donde u es baja y es cero donde u es infinita. O sea, los frentes son densos donde la densidad de las part´ıculas es peque˜ na y viceversa (véase figura 13.4). Para este problema, de (13.51) se sigue que Q vale: Q=

1 1 ω = 2 1/2 2πA 2π|v| x 1− 2 A

O sea que Q tiene un comportamiento similar a |u|. La expresión para Σ es: 1/2 " # 2 1/2 1 mE x x Σ= A sen−1 + x 1 − 2 2 2 A A Notemos que Σ determina a Q. En efecto: " # 2 1/2 ∂ ∂Σ ∂ 2x 1/2 2πQ = 1 − mω (2mIω) = ∂I ∂x ∂I 2I

(13.79)

(13.80)

(13.81)

Cuando x = 0, Σ es cero y Q = 1/(2πA) y cuando x = A, Σ = πA(mE/2)1/2 en tanto que Q es infinita. Es interesante notar que Σ no es una funci´ on univaluada de x, pues para x = 0, Σ = 0 si t = 0 y Σ = 2πI si t = T . Igualmente ∂Σ/∂x = ±(2mE − m2ω 2 x2 )1/2 posee dos ramas, una para los tiempos anteriores a la llegada a los puntos de retorno y otra para

Corespondencia con la mecánica cuántica de Schrödinger / 583 los tiempos posteriores. En consecuencia, si no se toma valor absoluto, Q es también en sentido estricto una funci´ on multivaluada. Finalmente, como: ∂Σ x = sen−1 ∂I A se sigue que: I Q dx = 1

(13.82)

(13.83)

como debe ser.

Ondas materiales. Las part´ıculas microscópicas tienen un comportamiento ondulatorio evidenciado por: (i) La densidad en un haz de part´ıculas tiene oscilaciones o variaciones espaciales definidas, es decir, las trayectorias no se pueden distribuir arbitrariamente. (ii) La regi´ on accesible a un sistema ligado de part´ıculas va más allá de los puntos de retorno cl´ asicos, aunque la probabilidad de encontrar las part´ıculas fuera de la regi´ on cl´ asica decrece exponencialmente. (iii) Hay fenómenos de interferencia y difracci´ on. Para hablar de frentes de acción constante no son necesarias las nociones de “ondas” o “longitud” de onda. Al evaluar la distribuci´ on Q se encuentra que no presenta ninguna oscilaci´ on sino variaciones suaves con la posición. Esto es consecuente con la concepción de la mecánica cl´ asica como el comportamiento l´ımite de un movimiento ondulatorio cuando la longitud de onda es peque˜ na. Vimos c´ omo de la formulaci´ on de la mecánica clásica con matrices conmutativas emerge de manera natural la mecánica cuántica de Heisenberg al introducir algunas hipótesis motivadas en la espectroscop´ıa atómica. Desafortunadamente no hay una manera suave de obtener la mecánica cuántica de Schrödinger a partir de la ecuaci´ on de Hamilton-Jacobi y la funci´ on de distribuci´ on clásica, pues estos elementos clásicos son ajenos a conceptos tales como “función de onda”, “ecuación de onda”, “principio de superposición”. Es necesario un drástico cambio conceptual para introducir en la mecánica las nociones ondulatorias. La ecuaci´ on de Schr¨ odinger. Schrödinger admitió la descripción de sistemas microscópicos mediante una amplitud de ondas análoga a la que describe otros fenómenos ondulatorios: ψ(~r, t) = A(~r)eiϕ(~r,t)

(13.84)

Quien inici´ o este tipo de teor´ıas fue Louis de Broglie, cuando en 1923 estudi´ o la posible conexión entre las propiedades ondulatorias y corpusculares de la materia. Partió de la idea siguiente. Si tratándose de part´ıculas se est´ a describiendo el mismo fenóneno mediante los principios de Fermat y de m´ınima acción, en el l´ımite de ondas cortas se cumple la siguiente implicación: Z 2 Z 2 dl = 0 (v = constante) y ∆ p(~r, E) dl = 0 ∆ r , v) 1 1 u(~ (13.85) 1 (E = constante) → p ∝ u

584 / Mec´ anica cl´ asica avanzada que es el mismo resultado (13.76). Para la velocidad de fase de una part´ıcula se cumple: c u(~r, ν) = = λ(~r, ν) ν n(~r, ν)

(13.86)

siendo n el ´ındice de refracci´ on, c una constante y ν la frecuencia de las ondas. Entonces de (13.76) o (13.85) se sigue que: p=

E E h = = u λ(~r, ν)ν λ(~r, ν)

(13.87)

siendo h = E/ν una constante. Como en (13.32) y (13.33), puede decirse que la fase de la onda, ϕ, es proporcional a la acción S: ϕ(~r, t) =

2π Σ(~r, E) Et S(~r, t) = − h ¯h ¯ h

(13.88)

Entonces: ψ(~r, t) = A(~r)eiΣ(~r,E)/¯h−iEt/¯h

(13.89)

ha de ser la forma de la funci´ on de onda en el l´ımite de ondas cortas. Schrödinger asumió que en general ϕ satisface una ecuaci´ on de ondas ordinaria donde la velocidad de la onda es la velocidad de fase u, y además exigió que debe ser consistente con los resultados ya conocidos referentes al l´ımite asint´ otico de ondas cortas caracterizado por la ecuaci´ on (13.89). Esto es: ∇2 ψ −

1 ∂2ψ =0 u2 ∂t2

(13.90)

Como para el l´ımite de ondas cortas u est´ a dada por (13.76), para ese caso (13.90) toma la forma: 2m(E − V ) ∂ 2 ψ = ∇2 ψ E2 ∂t2

(13.91)

La funci´ on de onda de un fenómeno estacionario es de la forma: Ψ(~r, t) = ψ(~r)e−iEt/¯h

(13.92)

por lo cual ψ debe obedecer la ecuaci´ on: −

¯2 2 h ∇ ψ(~r) + V (~r)ψ(~r) = Eψ(~r) 2m

(13.93)

que es la ecuaci´ on de Schrödinger independiente del tiempo. El comportamiento ondulatorio aparece sólo al hacer la identificación (13.88), o sea que est´ a ligado directamente al hecho de no ser cero la constante de Planck (ϕ no es infinita ni λ es cero). Esto de alguna manera ha de estar relacionado con el hecho de no poderse medir las variables de acción I con precisi´ on ∆I = 0, del cual surge la mecánica cuántica de Heisenberg. Si en (13.93) reemplazamos a ψ por: ψ(~r) = eiΣ(~r,E)/¯h A(~r)

(13.94)

Corespondencia con la mecánica cuántica de Schrödinger / 585 obtenemos una ecuaci´ on diferencial para Σ que en el l´ımite ¯h → 0 es precisamente la ecuaci´ on de Hamilton-Jacobi. Además Schrödinger postul´ o que |ψ|2 es la densidad de probabilidad en el espacio de configuración. Para un estado estacionario se debe cumplir: Q(~r) = |ψ(~r)|2

(13.95)

Resulta de (13.94) y (13.95) que para el l´ımite asint´ otico de ondas cortas: Q(~r) = A(~r)2

(13.96)

Por tanto el l´ımite cl´ asico de la funci´ on de onda puede expresarse en términos de las funciones cl´ asicas Q(~r), (13.69), y Σ: ψ(~r, t) = [Q(~r)]1/2 eiΣ(~r,E)/¯h−iEt/¯h o, en términos de Σ: 1/2 ∂2Σ ∂2Σ ∂2Σ ψ(r, t) = ǫλσρ eiΣ(~r,E)/¯h−iEt/¯h ∂x∂Iλ ∂y∂Iσ ∂z∂Iρ J.H. van Vleck (1928) mostró que: 1/2 ∂ 2 S hq|ψi = C det eiS/¯h ∂q∂p

(13.97)

(13.98)

(13.99)

obedece a la ecuaci´ on de Schrödinger si ¯h → 0. N´ otese la similitud entre (13.98) y la ecuaci´ on de van Vleck.6

13.4.

La funci´ on de onda semicl´ asica seg´ un Keller y Maslov

Para un sistema acotado los valores de las variables de acción, y por tanto de la energ´ıa y otras constantes de movimiento, est´ an cuantizados. En la secci´ on 12.1, se se˜ nal´ o que las variables de acción satisfacen las condiciones Iν = αν ¯h, donde las αν son enteras. Al imponer ciertas condiciones sobre las frecuencias vimos en el ejemplo 12.3.1 que para un oscilador armónico la acción est´ a cuantizada seg´ un I = (k + 1/2)¯h, siendo k un entero. Veremos ahora c´ omo tales reglas de cuantización se pueden obtener a partir de la funci´ on de onda semicl´ asica. Bohr y Sommerfeld postularon las reglas de cuantización para un sistema separable en la forma Iν = αν ¯ h. Einstein en 1917 las generalizó para sistemas no separables pero integrables, para los cuales existe un conjunto de variables de acción definidas por los contornos cerrados independientes que haya sobre un toroide invariante, en la forma: I 1 Iν = p~ · d~q = αν ¯ h (13.100) 2π γν 6 M.C.

Gutzwiller, Chaos in classical and quantum mechanics, Springer, New York, 1990 deduce la f´ ormula de van Vleck a partir de una aproximaci´ on de fase estacionaria al propagador de Feynman.

586 / Mec´ anica cl´ asica avanzada donde los γν son los diferentes contornos. Brillouin en 1926 esbozó una teor´ıa de las funciones de onda semicl´ asicas que conduce a reglas de cuantización como la del oscilador armónico, I = (k + 1/2)¯h, basada en consideraciones sobre los puntos de retorno del movimiento cl´ asico. Keller en 1958 y Maslov en 1972 elaboraron una teor´ıa completa acerca de las funciones de onda semicl´ asicas y las reglas de cuantización que generaliza los trabajos de Bohr, Sommerfeld, Einstein y Brillouin. En la actualidad muchos problemas espec´ıficos en f´ısica atómica y molecular son adecuadamente estudiados mediante estas teor´ıas semicl´ asicas, denominadas genéricamente “la aproximación W.K.B”. Acci´ on de Lagrange con dos puntos de retorno. Consideremos una part´ıcula en movimiento unidimensional acotado con dos puntos de retorno. La trayectoria de fases es cerrada y el toroide invariante es una circunferencia. La figura 13.5 muestra una trayectoria t´ıpica. La solución a la ecuaci´ on de HamiltonJacobi para este problema es: Z Σ(x) = ± [2m(E − V )]1/2 dx (13.101) p p2

x x1

x2

p1

Figura 13.5 Trayectoria de fases cerrada En la trayectoria hay dos puntos en los cuales p se anula y cambia de signo que son x1 y x2 . Tanto p como Σ son funciones bivaluadas de x. Los dos valores de p o Σ para cada valor de x est´ an sobre diferentes “hojas”, análogas a las hojas de Riemann de la teor´ıa de las funciones de variable compleja, definidas por la l´ınea de ramificaci´ on x1 x2 . Para p las dos hojas son x1 p2 x2 y x1 p1 x2 . En x1 y x2 , p es singular por ser dp/dx infinita. Similarmente, en la representación de momentos p1 p2 definen una l´ınea de ramificaci´ on que separa el plano xp en las hojas p1 x1 p2 y p1 x2 p2 . La correspondiente acción reducida es Σ(p), conectada con Σ(x) mediante la fórmula (9.217): Σ(p) = Σ(x) − xp

(13.102)

Corespondencia con la mecánica cuántica de Schrödinger / 587 Para un valor dado de E, Σ(x) define parte de la trayectoria de fases, formada por los puntos (x, dΣ/dx). Pero Σ puede usarse sólo para la trayectoria sobre una hoja, ya que la ecuaci´ on de Hamilton-Jacobi no determina a Σ en x1 y x2 . Para pasar a la otra hoja es necesario continuar la funci´ on. En efecto, Σ(p) est´ a bien definida en los puntos x1 y x2 sobre dos hojas, p1 x1 p2 y p1 x2 p2 . Esto permite la extensi´ on anal´ıtica de Σ(x) de una hoja a la otra usando la ecuaci´ on (13.102). La continuación a lo largo de la trayectoria puede lograrse, pues, por transformaciones sucesivas entre las representaciones x y p. Podemos definir las funciones multivaluadas Σ y Σ en términos de funciones univaluadas as´ı:   Σ1 (x) en x1 p2 x2 Σ(x) =  Σ2 (x) en x1 p1 x2 (13.103)   Σ1 (p) en p1 x1 p2 Σ(p) =  Σ2 (p) en p1 x2 p2

La variable de acción es un n´ umero cuya magnitud es igual al cambio experimentado por Σ al completar un circuito, dividido por 2π (sección 10.3): I=

1 [Σ2 (x2 ) − Σ1 (x2 )] 2π

(13.104)

Efecto de la multiformidad de Σ sobre la funci´ on de onda semicl´ asica. Podemos concluir de (13.69) que Q no es univaluada por no serlo Σ. Entonces se deduce de (13.97) que la funci´ on de onda semicl´ asica resulta ser multivaluada a no ser que se imponga una condición adicional. Escribamos a ψ en la forma: Σ Et 1 ψ = exp i − − i ln Q (13.105) h ¯ h ¯ 2 Al hacer un circuito completo sobre la trayectoria de fases la función de onda debe tomar el mismo valor. Esto se consigue solamente haciendo que el cambio del argumento del exponencial en (13.105) al completar un circuito sea un m´ ultiplo entero de 2πi, o sea: i ∆Σ − ∆ ln Q = 2πn h ¯ 2

(13.106)

donde n es un n´ umero entero. Esto da lugar a la siguiente expresión para la cuantización de I = ∆Σ/2π: i I =h ¯ n+ ∆ ln Q (13.107) 4π Para el caso descrito por (13.101), sobre las dos ramas Q difiere sólo en el signo [véase por ejemplo la expresión (13.81)].

588 / Mec´ anica cl´ asica avanzada Las funciones univaluadas Σ1 y Σ2 , definidas en (13.103), permiten encontrar las funciones univaluadas correspondientes Q1 y Q2 . En efecto: m 1/2 1 2πQ1,2 = ±ω (13.108) 2 [E − V (x)]1/2

implica que:

ln Q2 (x2 ) − ln Q1 (x2 ) = ln Q2 (x1 ) − ln Q1 (x1 ) = −πi

(13.109)

El cambio completo en ln Q, partiendo de un punto sobre la rama superior próximo a x2 y regresando al mismo punto luego de pasar por dos discontinuidades es: ∆ ln Q = −2πi

(13.110)

En consecuencia, (13.109) es: 1 I =h ¯ n+ 2

(13.111)

En conclusi´ on, las condiciones de cuantización correctas se obtienen al definir la funci´ on de onda semicl´ asica en términos de la funci´ on Q no tomada como intr´ınsecamente positiva. La funci´ on ´ındice de Maslov. La funci´ on “signo” aplicada a la derivada dp/dx es u ´til para contabilizar el n´ umero de singularidades de las funciones Σ(x) y Σ(p) al pasar de una hoja a la otra. Se define como:  dp  +1 si >0    dx dp = SGN (13.112)  dx  dp   −1 si <0 dx

para todos los valores de dp/dx 6= 0. Maslov define la funci´ on “´ındice” para asociar un n´ umero entero a todos los puntos colocados sobre la misma hoja, as´ı: σ(x) = N´ umero entero sobre cada hoja

x1 p2 x2 − x1 p1 x2

σ(p) = N´ umero entero sobre cada hoja

p1 x1 p2 − p1 x2 p2

(13.113)

σ(p) y σ(x) est´ an conectados en cada punto que no sea de retorno en p o en x por la relaci´ on: dp (13.114) σ(p) = σ(x) + SGN dx Si se toma en un punto x0 a Σ(x0 ) = 0, entonces se define el valor inicial de σ(x) por la condición σ(x0 ) = 0. Sea x0 = x2 + ǫ, entonces σ(x) = 0 para toda la hoja x1 p2 x2 . Para un punto entre p2 y x1 , SGN(dp/dx) = +1; entonces por (13.114), σ(p) = +1 en toda la hoja p1 x1 p2 . Ahora tomemos un punto entre x1 y p1 ; entonces

Corespondencia con la mecánica cuántica de Schrödinger / 589 SGN(dp/dx) = +1, y por (13.114), σ(x) = 2 en la hoja x1 p1 x2 . Para un punto entre p1 y x2 , SGN(dp/dx) = +1; entonces por (13.114), σ(p) = 3 para toda la hoja p1 x1 p2 . Finalmente, sea el punto de partida x0 , donde SGN(dp/dx) = +1; entonces por (13.114) se cumple que σ(x) = 4. Concluimos que σ(x) es una funci´ on multivaluada entera que se incrementa en 4 al completar un circuito. Denotemos por la letra m el cambio en σ(x) al completar un circuito dividido por dos: m=

∆σ 2

(13.115)

Para el caso que estamos considerando, m = 2 que coincide con el n´ umero de singularidades en Σ al completar un circuito. Ver el comentario que sigue a la ecuaci´ on (13.52). Maslov generaliza el resultado (13.110) en la forma: ∆ ln Q = −imπ

(13.116)

para un sistema con un n´ umero cualquiera de puntos de retorno en x y en p. La funci´ on ´ındice permite incluir en la fase de la funci´ on de onda semicl´ asica los efectos provenientes de la no uniformidad de Q, en la forma: ψ(~r) = |Q(~r)|1/2 eiΣ(~r,E)/¯h−iπσ(~r)/4

(13.117)

con esto se est´ a diciendo que la fase es fija sobre cada hoja. Las condiciones de cuantización resultan de exigir que ψ sea univaluada. As´ı, para el caso ilustrado en la figura 13.5, ψ1 (x2 ) = ψ2 (x2 )

(13.118)

Esto exige que, al completar un circuito: ∆Σ π ∆σ − = 2πn h ¯ 4 Por tanto: m I = n+ ¯ h 4

(13.119)

(13.120)

Para el movimiento de un electrón en el átomo de hidrógeno, las coordenadas esféricas r, θ y las parabólicas ξ, η son del tipo considerado en la figura 13.5, siendo entonces m = 2. Esto justifica las f´ ormulas de cuantización semicl´ asica dadas en el ejemplo 10.5.2. La coordenada ϕ se comporta de manera diferente por estar asociada a una rotación, o sea que la trayectoria de fases no tiene puntos de retorno ni en ϕ ni en pϕ (la proyección de la trayectoria de fases sobre el plano pϕ − ϕ es una l´ınea recta). En consecuencia ∆σ = 0 para el grado de libertad ϕ. F´ ormulas de conexi´ on de W.K.B. Para una dimensi´ on la funci´ on de onda de W.K.B., seg´ un se sigue de (13.117) y (13.108) es: 1/2 mω eiΣ(~r,E)/¯h−iEt/¯h−iπσ(~r)/4 (13.121) ψ(~r, t) = π|p|

590 / Mec´ anica cl´ asica avanzada A pesar de ser construida a partir de las cantidades clásicas Q, Σ y σ, esta funci´ on es válida para valores de x entre x = −∞ y x = +∞ diferentes a los puntos de retorno. Fuera de los puntos de retorno Σ es imaginaria, lo cual nos permite afirmar que en general: |ψ(r, t)|2 =

mω −2ImΣ(~r,E)/¯h e π|p|

(13.122)

y la probabilidad resulta exponencialmente amortiguada en las regiones donde ImΣ > 0 y tiende a cero cuando ¯h → 0, en correspondencia con el hecho de ser tales regiones cl´ asicamente prohibidas. La cola exponencial que exhibe ψ corresponde al efecto “t´ unel” de la mecánica cuántica. Las f´ ormulas de conexión permiten pasar a través de los puntos de retorno, para obtener una funci´ on definida entre x = −∞ y x = +∞ (excluyendo a x = x1 y x = x2 y los alrededores de los mismos donde los efectos cuánticos no permiten la aproximación semicl´ asica). En la regi´ on cl´ asicamente inaccesible p y Σ son imaginarios puros, con signos +i o −i dependiendo de la hoja. Cuando el signo es −i resulta que |ψ|2 no se amortigua sino que crece exponencialmente en la región clásicamente prohibida, lo cual no es aceptable. Por tanto a la regi´ on clásicamente prohibida sólo puede pasarse desde la hoja con p > 0. Llamemos 3 a la región −∞ < x < x1 y 4 a la región x2 < x < +∞. Para llegar a la regi´ on 4 la part´ıcula necesariamente provino de la región 1 (p > 0), o sea que no realiz´ o cambio de hoja; entonces, estando en la misma hoja, σ4 = σ1 = 0. Para llegar a la regi´ on 3, la part´ıcula necesariamente provino de la región 2 (p < 0), o sea que debi´ o cambiar de hoja a fin de que ImΣ > 0. Como en cada cambio de hoja σ cambia en 2, se sigue que σ2 = 2 y σ3 = 0. En resumen, σ1 = 0, σ2 = 2, σ3 = 0, σ4 = 0. Por tanto: mω 2π|p|

1/2

Z exp i

mω ψ2 (x) = 2π|p|

1/2

exp −i

mω 2π|p|

1/2

Z exp −

mω ψ4 (x) = 2π|p|

1/2

Z exp −

ψ1 (x) =

ψ3 (x) =

x0

[2m(E − V )]1/2 dx ¯h

x2

Z

x0 x2

x1

x x

x2

[2m(E − V )]1/2 dx π −i ¯h 2

[2m(V − E)]1/2 dx ¯h

[2m(V − E)]1/2 dx ¯h

(13.123)

(13.124)

(13.125)

(13.126)

√ Se han introducido los factores 1/ 2 pues al ampliar el rango de x desde −∞ hasta +∞ se cambia la normalizaci´ on. Cuando la funci´ on de onda en un intervalo dado es multiforme, debe tomarse la suma aritmética de las funciones de onda asociadas a las diferentes hojas. En el presente caso, la regi´ on x1 < x < x2 tiene dos hojas y la funci´ on correcta es ψ1 + ψ2 . Si

Corespondencia con la mecánica cuántica de Schrödinger / 591 multiplicamos las cuatro funciones (13.123) a (13.126) por eiπ/4 , las fases relativas no cambian. Entonces:  1/2 Z x mω [2m(E −V )]1/2 dx π    ; x1 < x < x2 cos +   π|p| ¯h 4  x2      1/2 Z x1  mω [2m(V −E)]1/2 dx iπ (13.127) ψ(x) = ; −∞ < x < x1 exp − +  2π|p| ¯h 4  x      1/2 Z x   [2m(V −E)]1/2 dx iπ mω    ; x2 < x < ∞ exp − + 2π|p| ¯h 4 x2 este es el resultado usual de la aproximación W.K.B.


Bibliograf´ıa Textos generales de mec´ anica cl´ asica

1. Arnold V. I. Méthodes mathématiques de la mécanique classique. Editions Mir, Moscou, 1976. 2. Corben H. C. y Stehle P. Classical mechanics. 2nd ed. J. Wiley, New York, 1960. 3. Gantmacher F. Lectures in analytical mechanics. Mir publishers, Moscow, 1970. 4. Goldstein H. Mec´ anica cl´ asica. Aguilar, Madrid, 1963. 5. Goldstein H. Classical mechanics. 2nd ed. Addison Wesley, Reading, 1980. 6. Hauser W. Introducci´ on a los principios de la mec´ anica. Uthea, México, 1969. 7. Landau L. y Lifshitz E. M. Mec´ anica. Reverté, Barcelona, 1965. 8. Marion J. Classical dynamics of particles and systems. Academic Press, New York, 1970. 9. Pars, L.A. A treatise on analytical dynamics. John Wiley, New York, 1968. 10. Scheck F. Mechanics: from Newton’s laws to deterministics chaos. Springer, Berlin, 1995. 11. Ter Haar D. Elements of hamiltonian mechanics. North-Holland, Amsterdam, 1965. 12. Whittaker E. T. A treatise on the analytical dynamics of particles and rigid bodies. 4th ed. Cambridge University. Press, Cambridge, 1960.

593

594 / Mec´ anica cl´ asica avanzada Colecciones de problemas

13. Kotkin G. L. y Serbo V. G. Problemas de mec´ anica cl´ asica. Editorial Mir, Mosc´ u, 1980. 14. Spiegel M. R. Teor´ıa y problemas de mec´ anica te´ orica. McGraw-Hill, México, 1976.

Textos especializados de mec´ anica cl´ asica

15. Abraham R. y Marsden J. E. Foundations of mechanics. Benjamin, New York, 1967. 16. Born M. The mechanics of the atom. 2nd printing. Ungar, New York, 1967. 17. Lichtenberg A. J. y Lieberman M. A. Regular and stochastic motion. Springer-Verlag, New York, 1983. 18. Percival I. and Richards D. Introduction to dynamics. Cambridge University Press, Cambridge, 1982. 19. Thirring W. Classical dynamical systems. Springer-Verlag, New York, 1978. 20. Yourgrau W. y Mandelstam S. Variational principles in dynamics and quantum theory. 3d ed. Saunders, Philadelphia, 1968.

Textos de matem´ aticas

21. Abramowitz M. y Stegun I. A. Handbook of mathematical functions. Dover, New York, 1965. 22. Ahlfors L. V. An´ alisis de variable compleja. Aguilar, Madrid, 1966. 23. Arnold V. I. Equazioni differenziali ordinarie. Edizioni Mir, Mosca, 1979. 24. Arnold V. I. Geometrical methods in the theory of ordinary differential equations. Springer-Verlag, New York, 1983. 25. Elsgoltz L. Ecuaciones diferenciales y c´ alculo variacional. Editorial Mir, Mosc´ u,

Bibliograf´ıa / 595 1969. 26. Korn G. A. y Korn T. M. Mathematical handbook for scientists and engineers. McGraw-Hill, New York, 1961. 27. Spiegel M. R. Manual de f´ ormulas y tablas matem´ aticas. McGraw-Hill, México, 1970. 28. Whittaker E. T. y Watson G. N. A course of modern analysis. 4th ed. Cambridge University Press, Cambridge, 1927.

Textos de otras ´ areas

29. Galindo A. y Pascual P. Mec´ anica cu´ antica. Alhambra, Madrid, 1978. 30. Gutzwiller M.C. Chaos in classical and quantum mechanics. Springer, New York, 1990. 31. Landau L. D. y Lifshitz E. Théorie du champ. Editions Mir, Moscou, 1966. 32. Landau L. D. y Lifshitz E. Mécanique cuantique: théorie non relativiste. Editions Mir, Moscou, 1967. 33. Van der Waerden B. L. (ed). Sources of quantum mechanics. Dover, New York, 1968.

Monograf´ıas especializadas

34. Augustin S. D. y Rabitz H. “Action-angle variables in quantum mechanics”. Journal of chemical physics, vol. 71, No 12, p 4956, 1979. 35. Chirikov B. V. “A universal instability of many-dimensional oscillator systems”. Physics reports, vol. 52, No 5, p 263, 1979. 36. Keller J. B. “Corrected Bohr-Sommerfeld quantum conditions for nonseparable systems”. Annals of physics, vol. 4, p 180, 1958. 37. Percival I. C. “Semiclassical theory of bound states”. Advances in chemical physics. vol. 36, p 61, 1977.


597

Índice alfab´ etico Fermi, de, 543 Moser, de, 429 Poincaré, de, 427 separatriz, 526, 542 Aproximación clásica, 475, 583, 590 WKB, de, 589, 591 Areolar, velocidad, 130 Arnold, V., 422, 529, 538 integral de, 528 teorema de, 522, 531 Astronom´ıa, 149 August´ın, S.D., 551 Autónomo, hamiltoniano, 525 Autoadjunta, matriz, 551

Abramowitz, 282, 294, 298 Absidales, distancias, 132, 140 Acción(es) adiabáticos, invariantes, 415 discontinuidad en la,, 430, 588 Hamilton, de,, 328 Lagrange, de, 328 perturbaciones adiabáticas , 505 principal, 330 reducida, 330 variables de, 429 Adiabáticas, perturbaciones,, 504 Adiabáticos, invariantes,, 415, 430 Ahlfors, L. V., 241 ´ Algebra de Lie grupo de rotaciones, del, 244, 395, 461 y corchetes de Poisson, 397 Angulares, variables degeneradas, 488 lentas, 500, 505, 513 oscilador armónico, en el, 438 problema de Kepler, en el, 445, 462 rápidas, 500, 504, 513 y de acción, 429 ´ Angulo(s) orbita Kepleriana, en una, 457 ´ como coordenadas generalizadas, 222 condiciones sobre los, 226 dispersi´ on, de, 159, 162 Euler, de, 222 rotación, de, 227, 245 Antisimétrica matriz, 249 Aplicación “twist”, 429, 523, 524 est´ andar, 544

Barrera centr´ıfuga, 131, 135 Bernoulli, regla de oro, 19, 35 Bifurcación de las superficies, 538 Bohr, átomo de, 144, 155 Born, M., 153, 470, 473, 479 Boyle, ley de, 81 Brillouin aproximación de, 589, 591 reglas de cuantización, 586 Br´ ujula de Foucault, 314 Cálculo de variaciones, 59 Cambio de la forma funcional, 379 Campo electromagnético, 65 Canónicas, transformaciones, 104, 107, 319, 343, 400 dependientes del tiempo, 105 ejemplos de, 110, 347, 358 grupo de, 355 infinitesimales, 374 libres, 109, 346 598

Índice alfabético / 599 oscilador armónico, del, 104 Ca´ oticos, movimientos regulares, 522 Caratheodory, lema de, 362 Cascar´ on esférico, 21 Cáusticas, superficies, 444, 576 Cayley-Klein, par´ ametros de, 236 para el trompo, 301 Centr´ıfuga, aceleraci´ on, 94 Centr´ıfugo, potencial, 131 Centro fuerzas, de, 125 masas, de, 125, 161 Chirikov, B. V., 529, 543, 547 criterio de, 543 Clase integral el´ıptica de primera, 284 transformaci´ on can´ onica libre de primera, 109, 348 Completidad, relaci´ on de, 215 Condiciones ligadura, de, 9 ortogonalidad, de, 174, 180, 208 Cónicas, secciones, 140 Conjunto coordenadas generalizadas, de, 13 variables de acción-´ angulo, de, 434 Conmutador, 397, 555 Conservaci´ on, teoremas de, 68, 380 Constante(s) e integrabilidad de las ecuaciones de movimiento, 421 generadores de transformaciones canónicas como, 381 integraci´ on, de, 70 movimiento, de, 70, 421, 437 Planck, de, 123, 414, 584 propiedades de simetr´ıa, y, 381 Construcción de Pionsot, 277 Contacto, transformaci´ on de, 569 Coordenadas c´ıclicas, 76 esféricas, 129, 445 generalizadas, 12 independientes, 46 parabólicas, 443, 462 Corben, H., 201, 273

Corchetes Lagrange, de, 402, 409 Poisson, de, 378, 380, 555 Coriolis, fuerza de, 94, 252 Cosenos directores, 210, 568 Covarianza de las ecuaciones de Hamilton, 103 de las ecuaciones de Lagrange, 42 Cuerda masas discretas, con, 195 oscilaciones de la, 202 uniforme, 202 Cuerpo r´ıgido, 205 asimétrico, 287 dinámica del, 253 libre, 277 momento angular del, 256 simétrico con un punto fijo, 295 sistema de coordenadas del, 206 Curvas de fase, 100, 121, 323, 423 D’Alambert, principio de, 35 Degeneraci´ on accidental, 504, 515 figura de Lissajous, en una, 443 frecuencias, en las, 181 intr´ınseca, 516 para el problema de Kepler, 492 isoenergética, 530 movimiento bajo fuerzas centrales, en el, 445 oscilador isotrópico, en el, 442 Delaunay, elementos de, 457 Densidad funci´ on de, 573, 576, 585 probabilidad, de, 573, 576, 585 Derivada parcial, 41, 94 total respecto al tiempo, 67, 73, 95 Desplazamiento virtual, 16, 18 Determinante jacobiano, 350, 404, 523 matriz de rotación, de la, 216, 220 secular, 171, 186 Di´ adicos Pauli, de, 232

600 / Mec´ anica cl´ asica avanzada traza cero, de, 232 Diada, 212 Diagonalizaci´ on frecuencias propias y modos con el método de, 191 matrices de masa y de constantes de resorte, de las, 191 matriz de rotación, de la, 225 matriz de una perturbación, de la, 497 tensor de inercia, del, 260 Din´ amica hamiltoniana, 88 ecuaci´ on general de la, 35, 55 lagrangiana, 42 variable, 69, 378 Dipolar radiaci´ on, 451, 459 reglas de selecci´ on para radiaci´ on, 475 Dispersi´ on bajo fuerzas centrales, 156 Ecuaci´ on(es) Hamilton-Jacobi, de, 107, 112, 364, 368, 371, 435, 445 can´ onicas, 88 continuidad, de, 573 din´ amica en coordenadas generalizadas, de la, 40 est´ atica en coordenadas generalizadas, de la, 28 estado de un gas real, de, 82 Euler en un sistema de referencia rotante, de, 271 Euler, de, 270, 281, 287 Euler-Lagrange, de, 97 general de la din´ amica, 35 general de la est´ atica, 19 Kepler, de, 148, 449 ligadura, de, 9 movimiento, de, 6, 38, 42, 88 Newton, de, 5 onda, de, 204, 584 secular, 171, 186, 262, 496 transformaci´ on canónica, de una, 363 valores propios, de, 179

Whitaker, de, 325 Efecto Stark cuadrático, 500 lineal, 498 Einstein, reglas de cuantización, 585 Eje(s) instant´ aneo de rotación, 279 principales, 261 rotación, de, 244 simetr´ıa, de, 79 Elementos de matriz, 223 Elipsoide de inercia, 264, 277 Energ´ıa cinética, 42, 72, 255 conservaci´ on de la, 70, 89 funci´ on de Jacobi, 71, 74 potencial, 42, 296 total, 73 Ensamble, 18 Equilibrio est´ atico, 19 estable, 30 Espacio configuración, de, 14 fases, de, 98, 104 momentos, de, 98 no euclidiano, 29, 179 Est´ atica coordenadas generalizadas, con, 29 ecuaci´ on general de la, 19 Estabilidad de los puntos fijos, 541 Estado de un sistema mecánico, 3 Euler ángulos de, 222, 226, 247 ecuaciones, 270, 287 par´ ametros de, 229 teorema sobre desplazamiento de un cuerpo r´ıgido, 217 funciones homogéneas, 71 Evoluci´ on temporal, transformaci´ on canónica de, 113, 374 Extremal, 59 Fase, 572 Fermat, principio de, 330, 567

Índice alfabético / 601 Fermi, aplicación de, 543 Figuras de Lissajous, 132 Fijos, puntos el´ıpticos e hiperb´ olicos, 516 Fourier, expansi´ on de, 149, 437, 450, 470, 497, 550 Frecuencias degeneradas, 186, 491, 493 lentas, 505 multiplemente periódicas, 436 nulas, 171 rápidas, 505 resonantes, 513 Frente ondas, de, 572, 580 superficies de acción constante, de, 580 Fuerza(s) aplicada, 19 centrales, 125 disipación de Rayleigh, de, 66 disipativa(s), 66, 67 electromagnéticas, 65 generalizada, 29 inercial de D’Alambert, 35 ligadura, de, 17 no centrales, 132 Funci´ on(es) Hamilton principal, de, 366, 367 Hamilton, principal, de, 580 hamiltoniana, 86 hamiltoniana caracter´ıstica, 568 distribuci´ on, de, 117, 573, 576, 585 el´ıpticas de Jacobi, 282, 288 generatriz, 343, 362 transformaci´ on can´ onica, de una, 108 transformaci´ on de Legendre, de una, 86 lagrangiana, 42 onda, de, 583 theta, 286 Gantmacher, F., 30, 167, 250, 336, 415 Generador infinitesimal, 243 General, ecuaci´ on din´ amica, de la, 35

est´ atica, de la, 19 Generatriz funci´ on de una transformaci´ on canónica, 343 transformaci´ on canónica, de una, 108 transformaci´ on de Legendre, de una, 86 Goldstein, H, 66, 167, 259 Grados de libertad cuerpo r´ıgido, de un, 205 sistema dinámico, de un, 12 vibracionales, 182 Grupo SU (2), 236 puntual, 264 rotaciones, de, 221, 230 simplicial, 403 transformaciones canónicas, de, 355 Hamilton óptica geométrica, 567 ecuaciones, 88 funci´ on de, 568, 580 principio de, 58, 100, 329 Hamilton-Jacobi diagonalización de la matriz Hamiltoniana, y, 561 ecuaci´ on de la eiconal, y, 572 ecuaci´ on dependiente del tiempo, 366 ecuaci´ on independiente del tiempo, 371 fuerzas centrales, para, 438 mecánica cuántica, y, 580 perturbaciones degeneradas, y, 495 variables de acción-´ angulo, con, 435 Hamiltoniano constante de movimiento, como, 89 corchetes de Poisson, y, 380 generador infinitesimal, como, 376 momento canónico, como, 393 transformaciones canónicas infinitesimales, y, 374 variable dinámica, como, 378 Hauser, W., 167 Heisenberg, W., 549, 558 desigualdad de, 123

602 / Mec´ anica cl´ asica avanzada mecánica cuántica de, 397 Heterocl´ınicos, 538 Hidrógeno, ´ atomo de, 577 Homoc´ıclicos, puntos, 538 Huygens, principio de, 568 Identidad de Jacobi, 384 Impacto, par´ ametro, 157 Indicatriz, funci´ on, 573 Índice funci´ on de Maslov, 588 refracci´ on, de, 567 Integral(es) acción, de, 58, 321, 329 Arnold-Melnikov, de, 528 el´ıptica, 284, 433 movimiento, de, 421 Poincaré-Cart´ an, de, 323 polos, por, 439 primeras, 421 Intr´ınseca, degeneraci´ on, 516 Invariantes adiabáticos, 415, 430 integrales de Poincaré, 333, 336 -Cart´ an, 323, 334 Inversiones, 220 Involuci´ on aplicación, 524 variables din´ amicas en, 422 Irregular(es), movimiento(s), 522, 543 Islas resonancia, en una, 518, 522 resonancias de orden superior, en, 518, 541 Jacobi, identidad de, 384 Jacobiano, determinante, 350, 404, 523, 575, 576 KAM superficie, 537, 540 teorema de, 522, 531 Keller, reglas de cuantización, 585 Kepler ecuaci´ on de, 147, 449 leyes de, 130, 145

problema de, 445, 462 variables de acción-´ angulo, 445 esféricas, 492 parabólicas, 462, 492 Klein, par´ ametros de Cayley y, 236, 301 Kolmogorov, teorema de, 522, 531 Kovalevski, trompo de, 270 Laboratorio, coordenadas de, 161 Lagrange acción de, 328 corchetes de, 402 multiplicadores de, 21, 38, 62 Lagrangiana formulaci´ on, 44 funci´ on, 42 singularidad, 576 Landau, L. D., 463, 551, 565, 577 Legendre, transformaci´ on de, 86, 355 Lema de Caratheodory, 362 Lentidud normal de un frente de onda, 573 Li Hua Chung, teorema de, 332, 337 Libraci´ on, 433 Libres, transformaciones canónicas, 110, 346 Lichtenberg, A, 544 Lie, álgebra de, 244, 395, 461 Lieberman, M. A., 544 Lifshitz, E., 463, 551, 565, 577 Ligadura(s) holonómicas, 10 cuerpo r´ıgido, de, 205 esclerónomas, 10 fuerza(s) de, 11, 17, 21 ideales, 18 no hol´ onomas, 10 no integrables, 10 reónomas, 10 trabajo virtual de las fuerzas de, 18 L´ınea de nodos, 223 Lineal estabilidad, 541 molécula, 182 momento, 76 transformaci´ on, 175

Índice alfabético / 603 Linealizado, movimiento, 542 L´ıneas caracter´ısticas, tubo de, 323 Liouville ecuaci´ on de, 573 teorema sobre la funci´ on de distribuci´ on, 114, 406 Teorema sobre sistemas integrables, 422 Lissajous, figuras de, 132 Longitud ´ optica de un camino, 568, 571 Magnético campo, 73 n´ umero cuántico, 475 Marion, J., 148, 165, 167 Masa centro de, 125 matriz de, 169, 184 reducida, 126 Maslov ´ındice de, 588 funci´ on de, 588 Matriz(ces) Hamiltoniana cl´ asica, 561 constantes de resorte, de, 168 derivadas de las funciones de ligadura, 23 masa, de, 169, 184 mecánica cl´ asica con, 550 Pauli, de, 232 rotación, de, 33, 207, 210, 224, 229, 236 simplicial, 403, 405 transformaci´ on, de, 497 Maupertuis, principio de minima acción de, 331 Mecánica cuántica, 580 estad´ıstica, 114 Schrödinger, 580, 585 Media espacial, 575 Melnikov, integral de, 528 Mersenne, f´ ormula de, 202 Método perturbaciones, de, 479 variacional, 152

Modos normales de oscilación, 167, 181 Molécula de CO2 , 181 Momento angular, 78, 256 espacio de, 98 inercia, de, 256 lineal, 77 Momentos generalizados, 85 representación de, 91 Moser, teorema de, 522, 531 Movimiento acotado, 80, 432 bajo fuerzas centrales, 125 caótico singular, 522 multiplemente periódico, 436 no acotado, 432 planetario, 130 regular, 522 separatriz, 432 N´ umero cuántico, 139, 144, 461, 475, 585, 587 grados de libertad, de, 10 puntos de retorno, de, 589 Nutaci´ on, 303 O(4), 461 O(6), 461 Onda ecuaci´ on de, 584 frente(s) de, 572, 580 funci´ on de, 583 longitud de, 572, 583 materia, de, 580 plana, 572 Operador, 397 ´ Optica geométrica, 330, 567 ´ Orbita(s) cerrada, 132 circulares, 139, 144 ecuaci´ on diferencial de las, 131 espacio de fase, en el, 100 precesi´ on de las, 132, 133 Ortogonal(es)

604 / Mec´ anica cl´ asica avanzada matriz, 208, 222 transformaciones, 208 Ortogonalidad condiciones de, 208 vectores propios, de, 180, 261 Ortonormales, vectores propios, 180 Oscilaciones longitudinales y transversales, 182, 189 Oscilador(es) acoplados, 508 armónico, 61, 101, 104, 106, 136, 368, 559, 581 bidimensional, 423, 438 no lineales, 508, 511, 517 perturbado, 486, 506 Par´ ametro de impacto, 157 Part´ıcula de masa reducida, 126 Pauli diádicos de, 232 matrices de, 232 Péndulo de Foucault, 311 simple, 419, 431 Peque˜ nas oscilaciones cuerda, de una, 195 modos normales de, 167 molécula triat´ omica lineal, de, 167 sistemas de varios grados de libertad, 167 Per´ıodo(s) orbitas el´ıpticas, de, 146 ´ funciones el´ıpticas, de, 282 péndulo, del, 432 puntos fijos de una aplicación, de, 542 Percival, I. C., 476 Perihelio, 499 Pionsot, representación de, 280 Planck, constante de, 414, 584 Plano invariante, 279 Plodia, 279 Poincaré integral de, 333, 336 superficie de secci´ on, 427 teor´ıa de perturbaciones, 482

Poinsot, construcci´ on de, 277 Poisson corchetes de, 378, 380, 555 ecuaciones de, 382 Potencial centr´ıfugo, 131 dependiente de la velocidad, 66 energ´ıa, 66 escalar, 65 generalizado, 66 vectorial, 65 Precesi´ on órbitas, de las, 132, 149 eje de rotación, del, 302 nutación, con, 303 pseudoregular, 304 rápida y lenta, 302 trompo, 304 rápido, de un, 302 Principio Hamilton, de, 97, 100 D’Alambert, de, 35 Fermat, de, 567, 571 m´ınima acción, de, 328, 331 trabajos virtuales, de los, 19 Problema Kepler, de, 140, 445, 462 valores y vectores propios, de, 179 variables de acción-´ angulo, con, 445, 462, 492 Producto(s) escalar de matrices, 214 masa, de, 256 Propagación ondas, de, 580 superficies de acción constante, de, 580 Propiedades de simetr´ıa hamiltoniana y teoremas de conservaci´ on, de la, 381 hamiltoniana, de la, 95 lagrangiana, de la, 67, 68 teoremas de conservaci´ on, y, 68 Punto de retorno, 132, 446, 464 Puntuales, transformaciones, 42, 101, 357

Índice alfabético / 605 Rabitz, H., 551 Raices m´ ultiples diagonalización del tensor de inercia, en la, 261 ecuaci´ on secular, de la, 182 Rayos, 568 Reglas de cuantización, 475, 585 Regla de suma, 558 R´ıgido, cuerpo, 205, 253 Rodadura, ligadura de, 8 Rotaciones grupo de, 221 infinitesimales, 241, 376 Rutherford, E., 160 dispersi´ on de, 159 Schrödinger ecuaci´ on de, 584 mecánica cuántica de, 585 Secci´ on eficaz, 157 diferencial, 158, 165 total, 158 superficie de, 522 Separaci´ on de variables ecuaci´ on de Hamilton-Jacobi, en la, 436 metodo de, 436 Separatriz bifurcaci´ on de, 538 sobreposición, 543, 544 Simetr´ıa hamiltoniano, propiedades de, 95, 380 cambio de escala, de, 95 rotación, de, 69, 74 teoremas de conservaci´ on, y, 68, 94, 380 Simplicial grupo, 403 matriz, 403 transformaci´ on, 404 Sistema coordenadas generalizadas, de, 13 ecuaciones de la din´ amica, de, 38 ecuaciones de la est´ atica, de, 20

ejes pricipales, de, 261 integrable, 421 referencia, de, 3, 161, 310 separable, 442 variables de acción-´ angulo, de, 429, 434, 488 Smirnov, V. I., 257 Spiegel, M. R., 198, 464, 473 Stark efecto cuadrático, 500 efecto lineal, 498 Stegun, I., 282, 294, 298 Stehle, P., 201, 273 SU(2), 461 Superficie(s) acción constante, de, 580 c´ austica, 444, 576 KAM rotacional, de, 540 secci´ on de Poincaré, de, 427, 522 Temporal, evoluci´ on, 113, 374 Tensor inercia, de, 253, 256 métrico, 180 Teor´ıa Hamilton-Jacobi, de, 364 canónica de perturbaciones, 482 cuántica Heisenberg, de, 397 Schrödinger, de, 585 perturbaciones adiabáticas, 504 degeneradas, 494 dependiente del tiempo, 480 independiente del tiempo, 482 matrices, con, 564 Teorema(s) Huygens, de, 568 conservaci´ on energ´ıa, de la, 70, 95 momento angular, del, 78, 95 momento, del, 76, 95 propiedades de simetr´ıa, y, 68, 94, 380 Euler sobre

606 / Mec´ anica cl´ asica avanzada desplazamiento de un cuerpo r´ıgido, el, 217 funciones homogéneas, de, 71 Jacobi, de, 366, 389 KAM, 522, 531 Li Hua Chung, de, 332, 337 Liouville, de, 114, 406 Poincaré-Birkhoff, de, 537 sistemas integrables, sobre los, 422 virial, del, 80 Thomas-Kuhn, regla de suma de, 558 Tiempo condición inicial, como, 70 variable din´ amica, como, 390, 392 Toroide(s) invariante, 420, 422, 423, 476 no resonantes, 531 resonantes, 531 Trabajo fuerzas aplicadas, de las, 57 virtual, 19 Transformaci´ on(es) homográfica y par´ ametros de CayleyKlein, 240 homotética, 573 cambio de escala, de, 96, 107 can´ onica, 107, 319, 343, 400 libre, 109, 346 can´ onicas infinitesimales, 374 contacto, de, 107, 569 coordenadas normales, a, 175 relativas y de centro de masa, a, 125 rotantes, 92 Galileo, de, 68 identidad, 347, 374 Legendre, de, 86, 355 lineal, 360 ortogonales, 208 puntuales, 42, 101, 357 simplicial, 404 unitarias, 562 variables acción-´ angulo, a, 429, 435 Trayectoria circuitosa, 55

fases, de, 97 real, 55 variada, 55, 319 Traza matriz aplicación, de una, 542 rotación, de, 220 Trompo dormido, 306 Foucault, de, 314 rápido, 302 simétrico con un punto fijo, 295 Tubo de trayectorias, 323, 434, 575 Unidad diádico, 214 Universal, integral invariante, 334 Valores propios degenerados, 188, 190 ecuaci´ on de, 171, 179 matriz hamiltoniana, de la, 561 herm´ıtica, de una, 554 tensor de inercia, del, 261, 267 Van der Waerden, B. L., 549 Van Vleck, J.H.,, 585 Variables acción, de, 436 acción-´ angulo, 429 dinámicas, 6, 378 Variación que incluye el tiempo, 320 Variacional, método, 152 Vector(es) Laplace, de, 459, 463 propagación, 572 propios ortogonales, 180 ortogonalidad de los, 180 peque˜ nas oscilaciones, en, 179 tensor de inercia, del, 261, 267 Velocidad angular, 244, 246, 254 areolar, 130 generalizada, 14 precesi´ on, de, 133, 152

Índice alfabético / 607 superficies de acción constante, de las, 581 Vibraciones cuerda, de una, 195 molecula triat´ omica lineal, de la, 182 Virtual desplazamiento, 15 trabajo, 19 Volumen en el espacio de fases, 116, 121, 406 Watson, G. N., 282, 299 Whitaker, E. T., 282, 299, 326 ecuaciones de, 325 WKB, aproximación de, 591

Se terminó de imprimir en la Imprenta Universidad de Antoquia en febrero de 2006

Jorge Mahecha-Mecanica Clasica Avanzada-Editorial Universidad de Antioquia (2006) (1)

Recommend Documents