Jorge Mahecha G´omez
Mec´anica cl´asica avanzada
Mahecha G´ omez, Jorge Mec´ anica cl´ asica avanzada / Jorge Mahecha G´omez. – Medell´ın : Editorial Universidad de Antioquia, 2006. xiv, 608 p. : il., diagrs. ; 24 cm. Incluye bibliograf´ıa e ´ındice. ISBN: 958-655-847-9 1. Mec´ anica 2. Est´ atica 3. Cinem´atica 4. Din´ amica I. T´ıt. 531 cd 19 ed. A1072576 ´ CEP-Banco de la Rep´ ublica-Biblioteca Luis-Angel Arango
Mec´anica cl´asica avanzada Jorge Mahecha G´omez
Ciencia y Tecnolog´ıa
Editorial Universidad de Antioquia
Colecci´ on Ciencia y Tecnolog´ıa c Jorge Mahecha G´
omez c Editorial Universidad de Antioquia
ISBN: 958-655-847-9 Primera edici´ on: enero de 2006 Dise˜ no de cubierta: Erledy Arana Grajales, Imprenta Universidad de Antioquia Diagramaci´ on: Patricia Arredondo Correcci´ on de textos: Arley C´ ardenas Coordinaci´ on editorial: Gonzalo Montoya Vel´ asquez Impresi´ on y terminaci´ on: Imprenta Universidad de Antioquia Impreso y hecho en Colombia / Printed and made in Colombia Prohibida la reproducci´ on total o parcial, por cualquier medio o con cualquier prop´ osito, sin autorizaci´ on escrita de la Editorial Universidad de Antioquia Editorial Universidad de Antioquia Tel´efono: (574) 210 50 10. Telefax: (574) 263 82 82 E-mail:
[email protected] P´ agina web: www.editorialudea.com Apartado 1226. Medell´ın. Colombia Imprenta Universidad de Antioquia Tel´efono: (574) 210 53 30. Telefax: (574) 210 53 32 E-mail:
[email protected]
´Indice general 1. Fundamentos de la mec´ anica newtoniana 1.1. Conceptos preliminares . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.2. Sistema de referencia. Estado de un sistema mec´anico. Ligaduras. Ecuaciones de movimiento para un sistema de part´ıculas. Variables din´amicas. Problemas separables. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2. Ecuaciones generales de la est´ atica y la din´ amica 2.1. Las ligaduras . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.2. Las coordenadas generalizadas . . . . . . . . . . . . . . . . . . . . . . . 2.3. Los desplazamientos virtuales . . . . . . . . . . . . . . . . . . . . . . . 2.4. La ecuaci´ on general de la est´ atica . . . . . . . . . . . . . . . . . . . . . . 2.5. Las ecuaciones de la est´ atica en coordenadas generalizadas . . . . . . . . 2.6. La ecuaci´ on general de la din´amica . . . . . . . . . . . . . . . . . . . . . 2.7. Las ecuaciones de la din´ amica en coordenadas generalizadas para sistemas hol´ onomos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.8. Las ecuaciones de la din´ amica en coordenadas generalizadas para sistemas no hol´ onomos. Uso de coordenadas no independientes . . . . . . . . . . 3. El principio de Hamilton y las ecuaciones de Lagrange 3.1. Forma integral de la ecuaci´ on general de la din´amica para un sistema hol´ onomo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3.2. El principio de Hamilton . . . . . . . . . . . . . . . . . . . . . . . . . . . 3.3. Algunas propiedades de la funci´ on lagrangiana . . . . . . . . . . . . . . 3.4. Simetr´ıas de la lagrangiana y teoremas de conservaci´ on . . . . . . . . . 3.5. El teorema del virial . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4. La formulaci´ on hamiltoniana 4.1. Las variables hamiltonianas de estado . . . . . . . . . . 4.2. Simetr´ıas y el teorema de conservaci´ on . . . . . . . . . . 4.3. La segunda forma del principio de Hamilton . . . . . . 4.4. Las transformaciones puntuales. Las transformaciones en 4.5. Las transformaciones can´ onicas o de contacto . . . . . . . . . . . . . . . . . . . . . . . . v
. . . . . .
1 1
3 7 7 12 15 19 28 35
. 40 . 46 55 . . . . .
55 58 67 68 80
85 . . . . . . . . . . 85 . . . . . . . . . . 94 . . . . . . . . . . 97 el espacio de fases101 . . . . . . . . . . 107
vi 4.6. La funci´ on generatriz de una transformaci´ on can´onica . . . . . . . . . . . . . . . . . . . . . . . . 108 4.7. La evoluci´ on temporal de un sistema considerada como una transformaci´ on can´ onica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 113 4.8. El teorema de Liouville . . . . . . . . . . . . . . . . . . . . . . . . . . . . 114 5. Movimiento de dos part´ıculas que interact´ uan por medio de una fuerza central 5.1. Coordenadas de centro de masa y coordenadas relativas . . . . . . . . . . . . . . . 5.2. El oscilador arm´onico tridimensional . . . . . . . . 5.3. El potencial 1/r . . . . . . . . . . . . . . . . . . . . 5.4. El problema de la dispersi´ on bajo fuerzas centrales
125 . . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
125 136 140 156
6. Peque˜ nas oscilaciones de sistemas de varios grados de libertad 167 6.1. Modos normales de oscilaci´on. Caso no degenerado . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 167 6.2. Modos normales de oscilaci´on. Caso degenerado . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 181 6.3. Un campo mec´anico unidimensional: la cuerda uniforme . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 195 7. Cinem´ atica del cuerpo r´ıgido 7.1. Definici´ on de cuerpo r´ıgido . . . . . . . . . . . . . . . . . . . . 7.2. Sistemas de coordenadas espacial y del cuerpo r´ıgido . . . . . . . . . . . . . . . . . . . . . . . . . 7.3. Los cosenos directores . . . . . . . . . . . . . . . . . . . . . . . 7.4. El teorema de Euler acerca del movimiento de un cuerpo r´ıgido 7.5. El rotador r´ıgido . . . . . . . . . . . . . . . . . . . . . . . . . . 7.6. Los ´ angulos de Euler . . . . . . . . . . . . . . . . . . . . . . . 7.7. Descripci´ on de las rotaciones en t´erminos de n ˆ y Φ. Par´ametros 7.8. Representaci´on del grupo de rotaciones por medio de matrices 2 × 2. Los par´ ametros de Cayley-Klein . . . . . . . . . . . . . . . . . . . . . . . . . . 7.9. Las rotaciones infinitesimales. Cinem´atica de las rotaciones . .
205 . . . . . . 205 . . . . . . . . . . . . . . . . . . . . . . . . . de Euler
. . . . . .
206 210 217 221 222 226
. . . . . . 230 . . . . . . 241
8. Din´ amica del cuerpo r´ıgido 253 8.1. El tensor de inercia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 253 8.2. Diagonalizaci´on del tensor de inercia . . . . . . . . . . . . . . . . . . . . . 260 8.3. Las ecuaciones de movimiento de Euler . . . . . . . . . . . . . . . . . . . 268 8.4. El movimiento de un cuerpo r´ıgido libre . . . . . . . . . . . . . . . . . . . 277 8.5. El trompo con el punto inferior fijo en un campo gravitacional homog´eneo 295 8.6. Movimiento en un sistema de referencia no inercial . . . . . . . . . . . . . 310
vii 9. Las 9.1. 9.2. 9.3. 9.4. 9.5. 9.6. 9.7. 9.8. 9.9.
transformaciones can´ onicas La acci´on en funci´ on de las variables de estado . . . . . La integral invariante de Poincar´e-Cart´ an . . . . . . . . El principio de m´ınima acci´on y expresiones equivalentes El teorema de Li Hua Chung . . . . . . . . . . . . . . . Las transformaciones can´ onicas . . . . . . . . . . . . . . La ecuaci´ on de Hamilton-Jacobi . . . . . . . . . . . . . . Las transformaciones can´ onicas infinitesimales . . . . . . Los corchetes de Poisson . . . . . . . . . . . . . . . . . . Pruebas del car´ acter can´ onico de una transformaci´ on . .
. . . . . . . . .
. . . . . . . . .
. . . . . . . . .
. . . . . . . . .
. . . . . . . . .
319 319 323 328 332 343 364 374 378 400
10.La ecuaci´ on de Hamilton-Jacobi con variables de acci´ on-´ angulo 10.1. Los invariantes adiab´aticos . . . . . . . . . . . . . . . . . . . . . . 10.2. Los toroides invariantes . . . . . . . . . . . . . . . . . . . . . . . . 10.3. Las variables acci´on-´ angulo . . . . . . . . . . . . . . . . . . . . . . 10.4. Problema de Kepler (coordenadas esf´ericas) . . . . . . . . . . . . . 10.5. Problema de Kepler (coordenadas parab´olicas) . . . . . . . . . . .
. . . . .
. . . . .
. . . . .
. . . . .
415 415 420 429 445 462
. . . . . . . . .
. . . . . . . . .
. . . . . . . . .
. . . . . . . . .
. . . . . . . . .
11.Teor´ıa de perturbaciones 11.1. Teor´ıa de perturbaciones dependiente del tiempo . . . . . . . . . . . . . 11.2. Teor´ıa de perturbaciones independiente del tiempo . . . . . . . . . . . . 11.3. Multiplicidad de conjuntos de variables acci´on-´ angulo en los sistemas degenerados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11.4. Teor´ıa de perturbaciones de sistemas degenerados . . . . . . . . . . . . 11.5. Perturbaciones adiab´aticas . . . . . . . . . . . . . . . . . . . . . . . . . . 11.6. Sistema de osciladores lineales con acoplamiento no lineal . . . . . . . . 11.7. Movimiento cerca de una resonancia aislada . . . . . . . . . . . . . . . 11.8. Movimientos regulares e irregulares . . . . . . . . . . . . . . . . . . . . .
479 . 480 . 482 . . . . . .
488 494 504 508 513 522
12.Correspondencia con la mec´ anica cu´ antica de Heisenberg 549 12.1. Representaci´on matricial de variables din´amicas . . . . . . . . . . . . . . . 550 12.2. Corchetes de Poisson y conmutadores de matrices cl´asicas . . . . . . . . . 555 12.3. Problemas mec´anicos a la manera de Heisenberg . . . . . . . . . . . . . . 558 12.4. Ecuaci´ on de Hamilton-Jacobi y diagonalizaci´on de la matriz hamiltoniana 561 12.5. Teor´ıa de perturbaciones con matrices cl´asicas . . . . . . . . . . . . . . . 564 13.Correspondencia con la mec´ anica cu´ antica de Schr¨ odinger 13.1. Ideas de Hamilton acerca de las transformaciones can´onicas . 13.2. Funci´ on de distribuci´ on de probabilidades . . . . . . . . . . . 13.3. La mec´anica ondulatoria . . . . . . . . . . . . . . . . . . . . . 13.4. La funci´ on de onda semicl´ asica seg´ un Keller y Maslov . . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
567 567 573 580 585
A Isabel. A Clara. A Eduardo y Andr´es.
Prefacio No tratar´e de exponer razones para la aparici´ on de un nuevo texto de mec´anica cl´asica. La acogida que reciba mi trabajo en la comunidad universitaria indicar´a si en su concepci´ on y realizaci´ on satisface una necesidad existente en este campo. Hay bellas canciones tradicionales, pero ello no impide que aparezcan nuevas composiciones. Tampoco se pide a un compositor que diga las necesidades del p´ ublico que pretende complacer. Tal vez en toda obra que se realice sin inter´es de lucro, la principal motivaci´ on est´e en el placer experimentado por el autor al superar paulatinamente el reto que voluntariamente se ha impuesto. Considero que estas reflexiones son v´alidas respecto al presente trabajo. Aunque la redacci´ on del manuscrito y el trabajo mecanogr´afico se realizaron fuera de la Universidad, es justo reconocer que el origen y la finalidad del texto, as´ı como su reproduci´ on, est´ an dentro de ella. He dictado el curso de Mec´anica Cl´asica Avanzada en varias ocasiones y el presente trabajo tiene como n´ ucleo los manuscritos de las clases distribuidos a los alumnos. Con sus discusiones muchos estudiantes colaboraron positivamente. Algunos colegas me contribuyeron con sugerencias y discusiones u ´ tiles, como los se˜ nores Fernando Medina, Alberto S´ anchez, Augusto Montes, Rom´ an Casta˜ neda y Roberto Mart´ınez. Debo reconocer que la idea de escribir un libro de mec´anica cl´asica la recib´ı del profesor Fabio Machado. He tratado de hacer una presentaci´on de los temas en forma muy clara, lo cual desafortunadamente ha resultado en contra de la concisi´ on. Especialmente en los ejemplos, no aconsejo una lectura sino un desarrollo de los problemas por parte del lector. Por tratarse de un texto de estudio y no de una obra divulgativa, no he considerado necesario esforzarme por suprimir algunas f´ormulas y frases redundantes. He tratado m´as bien de evitar los errores en el contenido. De antemano pido excusas a los lectores por las deficiencias estil´ısticas de mi trabajo, y especialmente por los errores que puedan encontrar. El plan de la obra consiste en desarrolar los temas tradicionales (formulaciones dalambertiana, lagrangiana y hamiltoniana, fuerzas centrales, cuerpo r´ıgido, peque˜as oscilaciones, transformaciones can´ onicas, el m´etodo de Hamilton-Jacobi y la teor´ıa cl´asica de perturbaciones), con la elaboraci´ on de ciertos puntos en los que no se profundiza en los textos usuales, y especialmente en buscar ilustraciones concretas. He tratado tambi´en algunos problemas de la mec´anica cl´ asica que son objeto de investigaci´on en la actualidad. El lector encontrar´ a una presentaci´on m´as completa que en los textos tradicionales de muchas cuestiones como: el tratamiento de sistemas hol´ onomos, el uso de las coordenadas generalizadas, las transformaciones can´onicas, el oscilador isotr´opico, el m´etodo variacional, la cuerda uniforme, los par´ ametros de Euler y los par´ ametros de Cayley-Klein, las funciones el´ıpticas de Jacobi, las ecuaciones de Euler en sistemas de referencia rotantes, la br´ ujula de Foucault, la formulaci´ on de la mec´anica seg´ un Poincar´e, el teorema de Liouville sobre los sistemas integrables, un tratamiento exhaustivo del problema de Kepler con variables acci´on-´ angulo, la teor´ıa can´onica de perturbaciones, el teorema de K.A.M, los movimientos ca´oticos en sistemas hamiltonianos, una formulaci´ on de la mec´anica cl´ asica con matrices, dos presentaciones de los fundamentos de la mec´anica
x cu´antica, y muchos otros temas que yo no soy el llamado a valorar. El tratamiento de la mec´anica basado en la teor´ıa matem´atica de las variedades diferenciales y en el c´ alculo diferencial e integral de Cartan ha sido excluido por obvias razones. Esto no implica que le reste valor al uso de las matem´aticas contempor´aneas. El matem´atico A. N. Kolmogorov dec´ıa que es mucho m´as importante obtener resultados correctos que rigurosos. Para un f´ısico lo anterior es profundamente v´alido: no hay nada menos riguroso desde el punto de vista te´orico que un resultado experimental, pero tampoco nada que sea m´as cierto ni bello. La aplicaci´on de la teor´ıa de grupos a las vibraciones moleculares, los campos mec´anicos, los sistemas con v´ınculos, los fractales y el caos en sistemas disipativos, son algunos temas importantes de la mec´anica cl´asica contempor´anea que no han sido incluidos. Tal vez si es posible una segunda edici´ on? Mis obras de consulta son excelentes textos (ver bibliograf´ıa) como los de Whittaker, Landau-Lifshitz, Arnold, Gantmacher, Goldstein, Born, Corben-Stehle, Marion, Lanczos, etc., as´ı como numerosas monograf´ıas y art´ıculos especializados. Mi trabajo se alimenta en gran parte de estas obras aunque me he esforzado por evitar el plagio. Dejo a los lectores la determinaci´on del grado de originalidad del libro que tienen en sus manos. Esta es una obra de referencia para profesores y estudiantes de cursos de pregrado y posgrado en f´ısica, y puede servir como texto gu´ıa mediante una adecuada selecci´ on de los temas, complementado con ejercicios. Con los cap´ıtulos I, II, III, IV, V y VI, y un resumen del VII, puede cubrirse el curso de pregrado. Con un resumen de unas quince horas del curso de pregrado, los cap´ıtulos VIII y IX, y una selecci´ on de temas de los cap´ıtulos X, XI, XII y XIII puede cubrirse el curso de postgrado. La comprensi´ on de este material facilita la soluci´on de problemas de investigaci´on y escuchar sin grandes dificultades conferencias en el campo de la din´amica cl´asica. ´ JORGE MAHECHA GOMEZ Medell´ın, Junio de 1987.
1 Fundamentos de la mec´ anica newtoniana
1.1.
Conceptos preliminares
Mec´ anica. Es la ciencia que estudia el comportamiento de la materia a partir del movimiento de las part´ıculas constituyentes. En la mec´anica la m´axima informaci´on acerca de un sistema de part´ıculas consiste en obtener las posiciones y velocidades de cada una de ellas en cada instante de tiempo, respecto a un sistema de referencia dado. Para la soluci´on de cualquier problema mec´anico es necesario: definir un sistema de referencia, hallar las coordenadas m´as adecuadas para describir el sistema y plantear las ecuaciones de movimiento de cuya soluci´on se obtendr´ an las coordenadas y velocidades en funci´ on del tiempo. Importancia. El mundo percibido por el hombre directamente a trav´es de sus sentidos se denomina macrosc´opico. La mec´anica cl´asica brinda la formulaci´ on m´as completa del comportamiento de la mayor´ıa de fen´omenos macrosc´opicos, por ello es el instrumento te´orico por excelencia en ramas como: arquitectura e ingenier´ıa de construcciones, ingenier´ıa mec´anica que est´ a en la base de la moderna industria de la maquinaria, la aeron´ autica y la astron´autica, la geof´ısica, etc. Podemos decir que la ciencia de la mec´anica ha sido estimulada por el desarrollo de la gran industria y a la vez le ha contribuido a ´esta de manera importante. La mec´anica cl´ asica no es una ciencia acabada. En primer lugar, hay muchos problemas fundamentales que son estudiados en la actualidad (Arnold, Abraham, Maslov, etc. son nombres asociados a desarrollos contempor´aneos de la mec´anica). En segundo lugar, hay problemas fundamentales de la f´ısica (entendida como la ciencia o conjunto de ciencias que estudian las propiedades elementales de la materia) que utilizan la mec´anica cl´asica como teor´ıa b´ asica en el grado de validez de la misma (metrolog´ıa, f´ısica de los plasmas, estado s´olido, astrof´ısica, sistemas at´omicos, sistemas nucleares y de part´ıculas elementales en estados altamente excitados, etc.). Una revisi´on de los temas en que trabaja una inmensa mayor´ıa de los f´ısicos contempor´aneos nos muestra que sus objetos de investigaci´on no son las teor´ıas fundamentales sino problemas espec´ıficos referentes a las propiedades de sistemas f´ısicos reales (n´ ucleos, s´olidos, ´atomos, gases, l´ıquidos, luz, 1
2 / Mec´ anica cl´ asica avanzada etc.). Una visi´on hist´orica nos muestra que los virajes en el desarrollo de la f´ısica se han producido a partir de las investigaciones en problemas espec´ıficos que se salen del rango de validez de las teor´ıas existentes. O sea que las modernas teor´ıas f´ısicas no han invalidado la mec´anica cl´asica sino que simplemente han restringido su rango de validez. Por u ´ltimo, en la mec´anica cl´asica est´ a el germen de las teor´ıas m´as completas como la mec´anica cu´antica o la relatividad general. Tales teor´ıas utilizan los conceptos de la mec´anica cl´ asica y los introducen en sus formalismos cambi´andoles el contenido. Las nociones de energ´ıa, momentum, velocidad, posici´on, etc., tienen su origen en la mec´anica cl´ asica, pero mantienen una importancia relevante dentro de las nuevas teor´ıas. Podemos concluir que un conocimiento riguroso de la mec´anica cl´asica es indispensable para el estudio cabal de la mec´anica cu´antica y dem´ as teor´ıas contempor´aneas. Rango de validez. La mec´anica cl´asica no relativ´ıstica es aplicable cuando las velocidades involucradas son mucho menores que la velocidad de la luz.1 La aplicabilidad de la mec´anica cu´antica a sistemas microsc´opicos como ´atomos y mol´eculas est´ a restringida a los estados en los cuales el producto del momento lineal de las part´ıculas por la dimensi´ on caracter´ıstica de la regi´on que ocupan sea del orden Hde la constante de Planck (o m´as exactamente, la mec´anica cl´asica es aplicable cuando pdq ≫ h). No es exacto afirmar que la mec´anica cl´asica es aplicable s´olo en el mundo macrosc´opico. Hay problemas de microf´ısica como: ´atomos en estados excitados, la dispersi´ on de electrones por una radiaci´ on LASER, el movimiento de electrones en algunas mol´eculas, el movimiento de electrones en campos el´ectricos y magn´eticos, etc., en los cuales se puede utilizar la mec´anica cl´ asica. En fin, s´olo un an´alisis del problema espec´ıfico que se tenga permite decidir si la mec´anica cl´asica es aplicable, si se puede usar como una aproximaci´on o si es completamente inadecuada. Modelos fundamentales en la mec´ anica. En las teor´ıas mec´anicas los cuerpos reales son representados por medio de nociones abstractas como las de ”punto material”(part´ıcula), ”s´ olido r´ıgido”, etc. Un punto material es un cuerpo cuyas dimensiones, forma y estructura interna carecen de importancia para la resoluci´on de un determinado problema; esto ocurre cuando las dimensiones que aparecen en el problema son mucho m´as grandes que las de los cuerpos involucrados y cuando la estructura interna d´e lugar a efectos secundarios en el contexto en que se trabaja. Un s´olido r´ıgido es un cuerpo que se considera formado por gran cantidad de part´ıculas, de tal modo que la distancia entre dos cualesquiera es constante y que la forma y dimensiones del cuerpo no cambian cuando ´este se mueve. Usualmente un s´olido r´ıgido se considera formado de un n´ umero muy grande de part´ıculas, que con muy buena aproximaci´on se pueden considerar formando una distribuci´ on continua de masa. En la interacci´ on de dos cuerpos r´ıgidos por contacto se asumen dos modelos: el contacto perfectamente liso y el perfectamente rugoso. Lo anterior es importante en el an´alisis de las fuerzas internas llamadas de ligadura. Otro modelo es el de cuerpo deformable, b´ asico en las teor´ıas de campos mec´anicos. Partes de la mec´ anica. Tradicionalmente se divide en est´ atica, cinem´ atica y 1 Estamos
adoptando el punto de vista que consiste en considerar como cl´ asica a toda teor´ıa f´ısica que no d´ e cuenta de los efectos indeterministas de tipo cu´ antico y permite una descripci´ on causal en sentido cl´ asico. En particular, consideramos cl´ asicas las teor´ıas especial y general de la relatividad.
Fundamentos de mec´anica newtoniana / 3 din´amica. En el curso se tratan dos clases de temas: 1) Generales. Leyes generales de la est´ atica y la din´amica (formalismos lagrangiano, hamiltoniano, poissoniano y de Hamilton-Jacobi), cinem´ atica y din´amica del movimiento de rotaci´on. 2) Espaciales. Problema de los dos cuerpos, movimiento del s´olido r´ıgido y vibraciones mec´anicas. Las teor´ıas, incluyendo la mec´anica cl´asica, adquieren su verdadera relevancia cuando se las aplica a situaciones reales. Las teor´ıas tratan de las leyes generales pero el desarrollo de la f´ısica se halla impulsado por el estudio de problemas espec´ıficos. Por esto, hacemos especial ´enfasis en los ejemplos y en la presentaci´on de c´ alculos detallados.
1.2.
Sistema de referencia. Estado de un sistema mec´ anico. Ligaduras. Ecuaciones de movimiento para un sistema de part´ıculas. Variables din´ amicas. Problemas separables.
Sistema de referencia. Se entiende por tal a un cuerpo r´ıgido real o ficticio que sirve de referencia para estudiar el movimiento del sistema mec´anico considerado. Se supone que tal sistema de referencia est´ a r´ıgidamente unido con un sistema de coordenadas; esto permite ubicar la posici´on de cada part´ıcula del sistema mec´anico respecto del sistema de referencia. Adem´as en el sistema de referencia hay un “cron´ometro” que permite determinar los instantes en que cada part´ıcula del sistema ocupa una posici´on dada del espacio. El sistema de referencia no tiene ninguna propiedad que pueda afectar al sistema mec´anico, aunque s´ı es de esperarse que la descripci´ on obtenida dependa del estado del movimiento del sistema de referencia. As´ı como para especificar la longitud de un objeto se requiere un patr´on de longitud con una unidad de medida asociada, la descripci´on del movimiento de un sistema mec´anico requiere de un “patr´ on”mec´anico que no es m´as que el sistema de referencia. La unidad de medida es an´aloga al sistema de coordenadas. La elecci´on del sistema de coordenadas en un sistema de referencia es cuesti´on de comodidad. Hay un n´ umero infinito de sistemas de coordenadas posible. Con una elecci´on de sistema de coordenadas se busca que las ecuaciones de movimiento sean f´acilmente solubles y que la soluci´on sea lo m´as simple posible. En cualquier sistema de coordenadas es posible escribir las ecuaciones de movimiento, pero puede ocurrir que no sean solubles. Encontrar el adecuado sistema de coordenadas que permita resolver las ecuaciones de movimiento es un importante problema matem´atico que llega a involucrar la teor´ıa de grupos, la geometr´ıa diferencial y otras ramas de las matem´aticas. Estado de un sistema mec´ anico. Es necesario distinguir los conceptos de estado y de descripci´ on de estado. La noci´on de estado es intuitiva (an´aloga a las nociones de longitud, duraci´ on, etc.), involucra s´olo aspectos cualitativos, de car´ acter objetivo. La descripci´ on del estado implica nociones geom´etricas a trav´es del sistema de referencia
4 / Mec´ anica cl´ asica avanzada y el sistema de coordenadas que es necesario elegir (hay analog´ıa con las nociones de distancia, intervalo de tiempo, etc., que implican aspectos cuantitativos). Cl´asicamente para la especificaci´ on o descripci´on completa del estado de un sistema mec´anico se requiere, por ejemplo, conocer la posici´on y velocidad de cada una de las part´ıculas en un tiempo dado. Es imposible obtener la descripci´on del estado sin tener un sistema de referencia y un sistema de coordenadas. En cualquier rama de la f´ısica, y en general cualquier ciencia cuantitativa, se requiere de la noci´on de estado. El tipo de descripci´on depende del sistema que se trate: el estado de un sistema de part´ıculas en mec´anica cl´ asica se describe mediante posiciones y velocidades; en mec´anica cu´antica se describe mediante la funci´ on de onda del sistema. El estado termodin´amico de un sistema macrosc´opico se describe mediante un conjunto de variables termodin´amicas como P , V , T , etc. En econom´ıa, el estado finanaciero de una empresa, por ejemplo, se describe mediante una serie de par´ ametros que evolucionan con el tiempo; qu´e par´ ametros son relevantes, depende del modelo, as´ı como de la ecuaci´ on de evoluci´ on. El sistema de referencia se denomina a veces espacio f´ısico de representaci´on. El sistema de coordenadas permite representar cada estado del sistema por un punto. La representaci´on de los estados ya forma parte de la teor´ıa f´ısica, pero siempre existe el supuesto de que hay una correspondencia que permite asociar a cada estado de movimiento del sistema un punto del espacio de representaci´on, o, para ser m´as exactos, una trayectoria en dicho espacio. A un sistema de N part´ıculas se le asocian 3N coordenadas y 3N velocidades. Los estados del sistema se pueden representar por puntos del espacio de representaci´on, llamado espacio de configuraci´on, y sus vectores tangente y velocidades. Tambi´en los estados se pueden representar por puntos del espacio de fases 6N dimensional. Una descripci´on puede ser por medio de las 6N cantidades: { x1 (t), y1 (t), z1 (t); x2 (t), y2 (t), z2 (t); ...xN (t), yN (t), zN (t);
(1.1)
x˙ 1 (t), y˙ 1 (t), z˙1 (t); x˙ 2 (t), y˙ 2 (t), z˙2 (t); ...x˙ N (t), y˙ N (t), z˙N (t) } Tambi´en es posible una descripci´on en t´erminos de las coordenadas en dos tiempos diferentes, t y t′ . No basta, pues, conocer los valores iniciales de las coordenadas ya que adem´as se requiere informaci´on acerca de c´ omo cambian con el tiempo para poder predecir cu´al ser´a la configuraci´on del sistema en otro tiempo. Para lo anterior desde el punto de vista meramente matem´atico, se requerir´ıa conocer todas las derivadas temporales de las coordenadas y velocidades que en un tiempo determinan los valores de las mismas en cualquier otro instante. En conclusi´ on, el espacio de representaci´on para un sistema de N part´ıculas tiene 6N dimensiones. Los distintos formalismos de la mec´anica se caracterizan, entre otras cosas, por el tipo de espacio de representaci´on que emplean. La formulaci´ on newtoniana utiliza las posiciones y velocidades de las part´ıculas. La formulaci´ on lagrangiana, las coordenadas y velocidades generalizadas. Las formulaciones de Hamilton y Poisson, las coordenadas y momentos generalizados. La formulaci´ on de Hamilton-Jacobi utiliza constantes de movimiento. La mec´anica cu´antica utiliza otro tipo de descrici´on del estado: los vectores de estado del espacio de Hilbert del sistema. Ligaduras. Si con s´olo cambiar las fuerzas y las condiciones iniciales las part´ıculas del sistema pueden ocupar cualquier posici´on en el espacio o cualquier velocidad,
Fundamentos de mec´anica newtoniana / 5 se dice que el sistema es libre. Si lo anterior no es posible, es porque hay restricciones, llamadas ligaduras mec´anicas. Las ligaduras disminuyen el n´ umero de cantidades independientes necesarias para especificar completamente el estado del sistema. Si hay k condiciones de ligadura independientes, el n´ umero de cantidades independientes necesarias para especificar la configuraci´ on del sistema (llamado el n´ umero de grados de libertad) ser´a 3N − k = 1. En lo que sigue supondremos conocidos los conceptos referentes a: trayectoria, primera ley de Newton, sistemas de referencia inerciales, segunda y tercera ley de Newton, trabajo y energ´ıa, y teoremas de conservaci´ on del momento lineal, la energ´ıa y el momento angular. Ecuaciones de movimiento para un sistema de part´ıculas. Supondremos que las fuerzas que act´ uan sobre una part´ıcula son funci´ on de las coordenadas y velocidades de todas las part´ıculas del sistema, y que se pueden descomponer a una parte debida a efectos exteriores al sistema y a otra debida a las dem´ as part´ıculas del sistema. La fuerza neta sobre la part´ıcula i (i = 1, 2, ...N ) ser´a: F~i (~r1 , ~r2 , ...~rN ; ~r˙ 1 , ~r˙ 2 , ...~r˙ N ; t) = F~ei ~r1 , ~r2 , ...~rN ; ~r˙ 1 , ~r˙ 2 , ...~r˙ N ; t +
N X
′~ Fij
j=1
(1.2)
~r1 , ~r2 , ...~rN ; ~r˙ 1 , ~r˙ 2 , ...~r˙ N ; t
Se supone que las part´ıculas del sistema s´olo interact´ uan entre pares; la prima en la sumatoria indica que excluye j = i. En el caso m´as general F~ei y F~ij dependen de las coordenadas y de las velocidades de todo el sistema. Usualmente se cumple lo siguiente: (a) Las fuerzas entre las part´ıculas i y j dependen s´olo de las coordenadas y de las velocidades de ´estas; (b) La fuerza externa sobre la part´ıcula i s´olo depende de sus coordenadas y velocidades: F~i ~r1 , ~r2 , ...~rN ; ~r˙ 1 , ~r˙ 2 , ...~r˙ N ; t = F~ei (~ri , ~r˙ i ; t) +
N X
′~ Fij (~ri ,
~rj , ~r˙ i , ~r˙ j )
(1.3)
j=1
Las ecuaciones de movimiento ser´an: N X j=1
′~ Fij
~ri , ~rj , ~r˙ i , ~r˙ j + F~ei ~ri , ~r˙ i ; t = mi~¨r i
i = 1, 2, ...N
(1.4)
Este u ´ltimo es un sistema de N ecuaciones diferenciales, en general no lineales, de segundo orden, acopladas, con N inc´ ognitas (~r1 , ~r2 , ...~rN ), o si se quiere, de 3N ecuaciones diferenciales escalares con 3N inc´ ognitas. La soluci´on de estas ecuaciones contiene 6N constantes de integraci´ on, que pueden tomarse como las 3N coordenadas y las 3N velocidades en el tiempo t = t0 , y proporciona directamente la especificaci´ on completa del estado del sistema.
6 / Mec´ anica cl´ asica avanzada Variables din´ amicas. Cualquier funci´ on del estado del sistema y del tiempo se denomina una variable din´amica. Las coordenadas o las velocidades mismas son variables din´ amicas. Tambi´en lo son el momento angular, la energ´ıa, el momento lineal, las coordenadas del centro de masa, etc. Un conjunto de 6N funciones (independientes entre s´ı) de las coordenadas y las velocidades constituye un conjunto completo de variables din´ amicas y sirve para especificar completamente el estado del sistema. Una clase especial de variables din´ amicas es constituida por las constantes de movimiento. Un conjunto m´aximo de constantes de movimiento, 6N , permite describir completamente el estado del sistema. En mec´anica cu´antica pueden haber a lo sumo 3N constantes de movimiento independientes, exactamente definidas; entonces las otras 3N constantes ser´an completamente indefinidas. La mec´anica newtoniana en su forma original es adecuada para el estudio de sistemas libres. Para sistemas con ligaduras es m´as conveniente el formalismo lagrangiano. Desde el punto de vista te´orico es deseable un formalismo en el cual las ecuaciones del movimiento sean covariantes y en el cual la mec´anica se deduzca de principios m´as generales (variacionales); en este sentido tambi´en es m´as u ´ til la mec´anica lagrangiana. Problemas separables. Son aquellos en los cuales el sistema de ecuaciones de movimiento acopladas, es posible mediante alg´ un cambio de variables reducirlo a un sistema de 3N ecuaciones diferenciales desacopladas, o sea, 3N ecuaciones donde en cada ecuaci´ on hay s´olo una inc´ ognita. En principio algunos problemas mec´anicos son separables, pero en la mayor´ıa de los casos esto es un problema muy dif´ıcil (o imposible) de resolver matem´aticamente. Algunos problemas que han sido resueltos matem´aticamente son: el de N part´ıculas en un campo externo pero no interactuantes entre s´ı; N part´ıculas en un campo externo interactuando entre s´ı con fuerzas restauradoras lineales (cadena de osciladores acoplados, mol´ecula lineal poliat´ omica, etc.); dos part´ıculas interactuando entre s´ı a trav´es de un potencial central (problema de dos cuerpos, por ejemplo); s´olido r´ıgido con un punto fijo en un campo gravitacional homog´eneo. Pero la mayor parte de los problemas mec´anicos no se han podido resolver anal´ıticamente, por ejemplo, el problema de tres part´ıculas interactuando entre s´ı a traves de un potencial central de tipo gravitacional (problema de los tres cuerpos), o el problema de una part´ıcula cargada en presencia del campo electrost´ atico de una carga fija y un campo magn´etico homog´eneo. Los problemas solubles cl´ asicamente lo son tambi´en cu´anticamente; en cuanto a la b´ usqueda de soluciones anal´ıticas exactas, la mec´anica cu´antica no aporta mucho en relaci´on con la mec´anica cl´ asica, sin embargo, la mec´anica cu´antica ha alcanzado una mayor flexibilidad en la b´ usqueda de soluciones aproximadas al problema de muchas part´ıculas interactuantes entre s´ı.
2 Ecuaciones generales de la est´ atica y la din´ amica 2.1.
Las ligaduras
Esta noci´ on aparece en f´ısica macrosc´opica con frecuencia y raras veces en f´ısica microsc´opica. Es de inter´es en las aplicaciones t´ecnicas, como el dise˜ no de maquinaria. Por ejemplo, en la definici´on de s´olido r´ıgido aparece el concepto de ligadura. Este sistema se define por la condici´on que la distancia entre cualquier par de part´ıculas permanece fija. Para N = 2, el cuerpo r´ıgido consiste de dos part´ıculas a una distancia fija entre s´ı; la condici´on de ligadura es: (x1 − x2 )2 + (y1 − y2 )2 + (z1 − z2 )2 = constante
(2.1)
El sistema posee seis coordenadas, pero la ligadura permite expresar una de ellas en t´erminos de las otras, quedando s´olo 6 − 1 = 5 coordenadas independientes. Por tales coordenadas pueden tomarse las tres del centro de masa y dos ´angulos que especifican la orientaci´on respecto al centro de masa. Para N = 3 hay nueve coordenadas y tres condiciones de ligadura que pueden expresarse en forma vectorial como: |r~1 − r~2 | = a |r~2 − r~3 | = b
(2.2)
|r~3 − r~1 | = c Hay s´olo 9 − 3 = 6 coordenadas independientes que pueden tomarse as´ı: tres para especificar la posici´on del centro de masa del sistema total y tres ´angulos que especifican la orientaci´on del plano de las part´ıculas con el centro de masa fijo. Para un s´olido r´ıgido en general se requieren 3N coordenadas pero habr´ a cierto n´ umero de condiciones de ligadura independientes. El n´ umero total de coordenadas independientes requeridas para especificar la posici´on de un s´olido r´ıgido son seis, que pueden 7
8 / Mec´ anica cl´ asica avanzada tomarse as´ı: las tres coordenadas del centro de masa y tres ´angulos que especifican la orientaci´on del cuerpo con el centro de masa fijo. Se dice que un s´olido r´ıgido de N part´ıculas tiene seis grados de libertad y 3N − 6 condiciones de ligadura. Otros tipos de ligaduras son las siguientes: (a) Hay alguna condici´on que obliga a las part´ıculas a moverse sobre una superficie o en una l´ınea. En una superficie cada part´ıcula posee s´olo dos coordenadas independientes, o sea que el sistema tendr´a N condiciones de ligadura y 2N grados de libertad. Para un sistema de part´ıculas sobre un plano las condiciones de ligadura son las siguientes, si se toma en el plano x − y: zi = 0 ;
i = 1, 2, ... N
(2.3)
Para una esfera de radio a y tomando el centro de la esfera como origen de coordenadas las ligaduras son: x2i + yi2 + zi2 − a2 = 0 ;
i = 1, 2, ... N
(2.4)
(b) Si hay cuerpos r´ıgidos en contacto que ruedan sin deslizarse sobre un plano. Sea un cilindro de radio a que rueda sin deslizar sobre el plano z = 0. El cilindro requiere de seis coordenadas para especificar su posici´on, pero hay dos condiciones de ligadura. zCM = a 2 x˙ 2CM + y˙ CM = a2 φ˙ 2
(2.5)
~ CM y R ~˙ CM son la posici´on y velocidad del centro de masa y φ˙ es la velocidad donde R angular de rotaci´on alrededor del eje del cilindro. Si se escoge el sistema de coordenadas de modo que el eje del cilindro sea paralelo al eje x, la ecuaci´ on (2.5) puede integrarse para dar: yCM = aφ
(2.6)
La ecuaci´ on (2.5) puede tambi´en integrarse directamente para obtener una relaci´on entre el ´ angulo de giro del cilindro y el desplazamiento del centro de masa. En (2.6) se ha escogido a φ de modo que yCM = 0 cuando φ = 0. Las ligaduras de “rodar” relacionan las velocidades entre s´ı y con las coordenadas, y en general son no hol´ onomas, o sea no integrables. Son los casos de un disco o una esfera rodando sobre un plano. Para un disco rodando sobre un plano se requieren dos coordenadas para especificar la posici´on del centro de masa, una para especificar el giro alrededor del eje y dos para especificar la posici´on del plano del disco. Hay dos ligaduras de “rodar” que relacionan las componentes de la velocidad del centro de masa con la velocidad angular de rotaci´on al rededor del eje (v´ease la figura 2.1). Una de las coordenadas necesarias para especificar el plano del disco puede tomarse como el ´ angulo que hace el eje del disco con la direcci´ on x. La otra coordenada la especificamos exigiendo que el plano del disco sea siempre perpendicular al plano x − y. Una condici´on de ligadura es zCM = a. Las otras dos coordenadas del centro de masa
Ecuaciones generales de la est´ atica y la din´amica / 9 z
y
a ϕ
v
α
x
Figura 2.1 Disco rodando sobre un plano
son las mismas del punto de contacto del disco con el plano. Las condiciones de ligadura ˙ de rodar son: que la magnitud de la velocidad del centro de masa sea proporcional a φ, v = aφ˙
(2.7)
y que la direcci´ on de la velocidad del centro de masa siempre est´e en el plano de rotaci´on del disco, x˙ = v senα
y˙ = −v cos α
(2.8)
De estas tres condiciones de ligadura s´olo hay dos independientes: dx − a senα dφ
=0
dy + a cos α dφ
=0
(2.9)
Las ecuaciones (2.9) no se pueden integrar para obtener relaciones que involucren s´olo cantidades finitas. Para poder hacer esto ser´ıa necesario hallar ciertas funciones f (x, α; φ) y g(y, α; φ) tales que al multiplicar por ellas las ecuaciones (2.9) se obtengan diferenciales exactos. Lo anterior no es posible, o sea que las relaciones (2.9) no pueden usarse para expresar una coordenada en t´erminos de las dem´ as; esto implica que las condiciones de ligadura deben considerarse simult´ aneamente con la soluci´on del problema mec´anico, que contendr´a s´olo tres coordenadas independientes. Los anteriores ejemplos nos muestran que un sistema de N part´ıculas y k condiciones de ligadura tendr´a 3N − k grados de libertad. Un cuerpo r´ıgido tendr´a 6 − k grados
10 / Mec´ anica cl´ asica avanzada de libertad. Las condiciones de ligadura para un sistema de part´ıculas pueden siempre expresarse en la forma: fα (~r1 , ~r2 , ... ~rN ; ~r˙ 1 , ~r˙ 2 , ... ~r˙ N ; t) = 0;
α = 1, 2, ... k
(2.10)
Ligaduras holon´ omicas. Tambi´en se llaman integrables, finitas o geom´etricas. Su nombre se deriva de las ra´ıces griegas nomos (ley) y holo (entero, todo). Estas ligaduras s´olo restringen las posiciones posibles del sistema, o sea que se pueden expresar por medio de igualdades que no involucran las velocidades. Para un sistema de N part´ıculas son de la forma: fα (~r1 , ~r2 , ... ~rN ; t) = 0
α = 1, 2, ... h
(2.11)
Para un cuerpo r´ıgido son: ~ θ, φ, ψ; t) = 0 fα (R,
α = 1, 2, ... h
(2.12)
~ denota la posici´on del centro de masa, φ, θ, ψ son tres ´angulos que especifican donde R la orientaci´on del cuerpo con el centro de masa fijo y h es el n´ umero de condiciones de ligadura hol´ onomas. Un sistema se dice que es hol´ onomo si no tiene ligaduras diferenciales no integrables. Ligaduras no holon´ omicas. Tambi´en se llaman no integrables, diferenciales o cinem´ aticas. Son aquellas que no pueden integrarse. Para un cuerpo r´ıgido son de la forma: ˙ φ, ˙ ψ; ˙ t) = 0 ; ~ R, ~˙ θ, φ, ψ, θ, fα (R,
α = 1, 2, ... n
(2.13)
donde n es el n´ umero de ligaduras no hol´ onomas. En la mayor´ıa de los casos (por ejemplo el de la figura 2.1), se pueden expresar en la forma: ~lα · R ~˙ + mα θ˙ + nα φ˙ + σα ψ˙ + Pα = 0 ;
α = 1, 2, ... n
(2.14)
~ θ, φ, ψ, t. La generalizaci´ donde ~lα , mα , nα , σα , Pα , son funciones de R, on de (2.12), (2.13) y (2.14) para sistemas de cuerpos r´ıgidos es inmediata. Para un sistema de N part´ıculas usualmente son de la forma: N X i=1
~lα · r~˙i + Dα = 0 ; i
α = 1, 2, ... n
(2.15)
donde ~lαi y Dα son funciones de ~r1 , ~r2 , ... ~rN , t. Ligaduras reon´ omicas. Del griego reo (flujo). Son las ligaduras, holon´omicas o no holon´omicas, que dependen del tiempo. Ser´ıa el caso de dos part´ıculas unidas entre s´ı por una varilla cuya longitud var´ıa con el tiempo de manera conocida: |~r1 − ~r2 | = l(t)
(2.16)
Ligaduras escleron´ omicas. Del griego esclero (duro). Son las ligaduras r´ıgidas o que no cambian con el tiempo. Es el caso de dos part´ıculas unidas entre s´ı por una
Ecuaciones generales de la est´ atica y la din´amica / 11 varilla r´ıgida. La noci´ on de ligadura involucra dos aspectos. Por una parte, indica que el n´ umero de variables independientes necesarias para especificar el estado del sistema es menor. En segundo lugar aparecen las llamadas fuerzas de ligadura, que no se pueden conocer a priori porque dependen del problema espec´ıfico, es decir de las fuerzas aplicadas y de las condiciones iniciales. Vemos que las ligaduras introducen nuevas inc´ ognitas en el problema. Las ligaduras consideradas como fuerzas. La noci´on de ligadura es puramente macrosc´opica. Viendo las cosas en detalle en los ejemplos, notamos que las ligaduras son el resultado de interacciones. As´ı, en el caso de la part´ıcula que se mueve sobre la esfera, deben existir fuerzas que impiden que la part´ıcula salga de la superficie, bien sea hacia afuera o hacia adentro (por esto se dice que esta ligadura es bilateral. En el caso en que la part´ıcula pudiera ocupar s´olo cualquier posici´on dentro de la esfera se dice que la ligadura es unilateral). En el caso del disco que rueda sin deslizar, debe haber alg´ un tipo de interacci´ on entre la superficie del disco y la del plano en la zona de contacto. En todos estos casos sucede que es imposible conocer las fuerzas a priori, independientemente de las fuerzas aplicadas y de las condiciones iniciales. Por ejemplo, en el caso de las dos part´ıculas unidas por una varilla, no sabemos cu´al es la fuerza que ejerce la varilla sobre ellas. Obviamos esta dificultad diciendo simplemente que hay una “ligadura”: |~r1 − ~r2 | = l
(2.17)
Pero podemos, si queremos, modelar dicha fuerza, digamos que consider´ andola como un caso l´ımite de una interacci´ on del tipo restauradora lineal. As´ı, las fuerzas de la varilla sobre las part´ıculas ser´ıan de la forma: F~1′
= −k ′ (r − l)ˆ u
F~2′
= k ′ (r − l)ˆ u
(2.18)
donde k ′ ser´ıa la constante de resorte, l la separaci´on de las part´ıculas en la posici´on ˆ un vector unitario en la direcci´ de equilibrio y u on del vector ~r2 − ~r1 = ~r. En el caso de dos part´ıculas interactuando a trav´es de una fuerza central es posible separar el movimiento en dos partes: el movimiento del centro de masa, y el movimiento de una part´ıcula de masa reducida µ respecto al centro de masa bajo una interacci´ on id´entica a la interacci´ on entre las dos part´ıculas originales. Entonces, el movimiento relativo descrito como el movimiento de la part´ıcula ficticia de masa µ obedece la ecuaci´ on: s r 2E k′ r−l = sen (t − t0 ) (2.19) k′ µ donde E es la energ´ıa del movimiento, que consideraremos tiene un valor finito dado. Cuando k ′ → ∞, la frecuencia de las oscilaciones aumenta, en tanto que r − l tiende a cero, obteni´endose la relaci´ on cinem´ atica r = l. Por otra parte, como la energ´ıa E depende de otras condiciones –fuerzas externas y condiciones de ligadura–, es realmente indeterminada a priori. S´ olo un modelo microsc´opico nos permitir´ıa estimar el valor de
12 / Mec´ anica cl´ asica avanzada k ′ . Por lo tanto las fuerzas de ligadura F~ ′ 1 y F~ ′ 2 son indeterminadas; su valor depende de la soluci´on al problema mec´anico completo. Es claro que la indeterminaci´on en las fuerzas de ligadura no proviene de la omisi´on de los detalles microsc´opicos, pues aun a escala microsc´opica las interacciones depender´ıan del movimiento completo del sistema.
2.2.
Las coordenadas generalizadas
Grados de libertad. El n´ umero de grados de libertad de un sistema mec´anico es igual al n´ umero de coordenadas independientes necesarias para especificar completamente cada configuraci´on del sistema. Entendemos por configuraci´on la posici´on que ocupa cada una de las part´ıculas del sistema. Si hay h condiciones de ligadura hol´ onomas y n condiciones de ligadura no hol´ onomas (o sea si hay k = n + h condiciones de ligadura independientes), el n´ umero l de grados de libertad ser´a: l = 3N − h − n
(2.20)
Clasificaci´ on de los grados de libertad. Sea un sistema de part´ıculas sin ligaduras, k = 0. Sus 3N coordenadas se pueden clasificar en traslacionales y rotacionales (cuando describen el movimiento del centro de masa y las rotaciones del sistema respecto al centro de masa), y en vibracionales (cuando describen los movimientos relativos de las part´ıculas que no trasladan el centro de masa y no rotan el sistema). Por ejemplo, sea un sistema de dos part´ıculas –mol´ecula diat´omica–, las seis coordenadas se pueden clasificar en tres grados de libertad traslacionales, dos grados de libertad rotacionales y un grado de libertad vibracional; en el caso de tratarse de una mol´ecula de H2 , adem´as hay grados de libertad internos a las dos part´ıculas: seis grados de libertad correspondientes a los dos electrones, un grado de libertad interno, el esp´ın para cada n´ ucleo y para cada electr´on. Las modernas teor´ıas de las part´ıculas elementales consideran que a su vez el prot´on y el electr´on poseen otros grados de libertad internos. Gran parte de los modelos que se construyen en la f´ısica consisten en hallar cu´ales son los grados de libertad que tienen m´as relevancia para una situaci´ on dada. As´ı por ejemplo, en la mec´anica se omiten los grados de libertad microsc´opicos. Las coordenadas generalizadas. Sea un sistema de N part´ıculas con h condiciones de ligadura hol´ onomas, dadas por las ecuaciones (2.11). Estas ecuaciones permiten expresar a h coordenadas en t´erminos de 3N − h coordenadas, que s´olo ser´an independientes en el caso en que no haya ligaduras no hol´ onomas. Es conveniente realizar una transformaci´ on de coordenadas de modo que se eliminen del problema las h coordenadas superfluas; para ello basta exigir que la transformaci´ on anule id´enticamente las funciones fα en las ecuaciones (2.11) y (2.12). Es decir, si: xi =
xi (q1 , q2 , ... q3N −h , t)
yi =
yi (q1 , q2 , ... q3N −h , t)
zi =
zi (q1 , q2 , ... q3N −h , t) ;
(2.21) i = 1, 2, ... N
Ecuaciones generales de la est´ atica y la din´amica / 13 donde q1 , q2 , ... q3N −h son las coordenadas generalizadas y la transformaci´ on depender´ a del tiempo si las ligaduras hol´ onomas son adem´as re´onomas. La transformaci´ on adem´as debe cumplir que se anulen id´enticamente las funciones: f~α (q1 , q2 , ... q3N −h , t) ≡ fα [~r1 (q1 , q2 , ... q3N −h , t), ~r2 (q1 , q2 , ... q3N −h , t), ... t]
(2.22)
para α = 1, 2, ... h
Usaremos la siguiente notaci´ on: los sub´ındices latinos se refieren a cantidades que se pueden asociar a las part´ıculas. Para nombrar las coordenadas generalizadas reservamos los sub´ındices griegos: qν (ν = 1, 2, ... 3N − h). Para nombrar el conjunto de todas las coordenadas generalizadas usamos la notaci´ on (q). M´ as adelante usaremos tambi´en la notaci´ on ~q. Si k = h, o sea si n = 0, entonces q ser´a un conjunto de coordenadas generalizadas independientes. Por ejemplo, para una part´ıcula que se puede mover s´olo sobre una esfera de radio a la condici´on de ligadura est´ a dada por la ecuaci´ on (2.4); o sea que, por ejemplo, si el radio de la esfera cambia con el tiempo de manera conocida, f (x, y, z, t) ≡ x2 + y 2 + z 2 − a2 (t)
(2.23)
el sistema tiene una coordenada superflua que se puede eliminar introduciendo unas coordenadas en la superficie de la esfera. Si tomamos como coordenadas generalizadas los ´angulos θ y φ definidos por: x(θ, φ, t) = a(t) senθ cos φ y(θ, φ, t) = a(t) senθ senφ
(2.24)
z(θ, φ, t) = a(t) cos θ Vemos que f (θ, φ, t) se anula id´enticamente, o sea que la condici´on de ligadura (2.4), se reduce a 0 = 0. Veamos otro ejemplo, sea el sistema formado por dos bolas pegadas entre s´ı por varillas r´ıgidas sin masa y una de ellas unida por una varilla r´ıgida sin masa a un punto fijo. Este sistema se denomina p´endulo doble (v´ease figura 2.2). El sistema posee seis coordenadas que no son independientes. Supongamos que s´olo hay movimientos permitidos en un plano. Entonces las condiciones de ligadura ser´an, z1 =
0
z2 =
0
x22 + y22 − l22 =
0
(x1 − x2 )2 + (y1 − y2 )2 + l12 =
0
(2.25)
donde tomamos el plano x − y como el plano de movimiento, y el origen de coordenadas en el extremo fijo de la varilla l2 . El sistema tendr´a dos grados de libertad que son las
14 / Mec´ anica cl´ asica avanzada
0
θ2
l2
m2 θ1
l1 m1
Figura 2.2 P´endulo doble
coordenadas θ1 , θ2 definidas por: x1 − x2 =
l1 cos θ1 ,
x2 =
l2 cos θ2 ,
z1 ≡ 0
y1 − y2 =
l1 sen θ1 ,
y2 =
l2 sen θ2 ,
z2 ≡ 0
(2.26)
son unas coordenadas generalizadas, ya que reducen las ecuaciones (2.25) a la identidad 0 = 0. Las coordenadas generalizadas se refieren al sistema como un todo y no a las part´ıculas individuales. Adem´as, no necesitan tener dimensiones de longitud. En general, cualquier conjunto de 3N − h variables din´amicas independientes del sistema puede servir de sistema de coordenadas generalizadas. Velocidades generalizadas. Son las derivadas totales de las coordenadas generalizadas respecto al tiempo: (q) ˙ = (q˙1 , q˙2 , ... q˙3N −h )
(2.27)
En coordenadas cartesianas se cumple que el momento est´ a relacionado con la velocidad mediante la relaci´on ~p = m~v. En coordenadas generalizadas no existe una relaci´on de este tipo en general. Espacio de configuraci´ on. Es un espacio definido por las l coordenadas independientes del sistema, donde l = 3N −k. Al describir un sistema con ligaduras por medio del espacio 3N dimensional, estamos usando un espacio euclidiano (en ausencia de fuerzas, una part´ıcula se mueve en l´ınea recta); entonces las trayectorias no rectil´ıneas inmediatamente se atribuyen a la presencia de fuerzas de ligadura. Al describir un sistema con
Ecuaciones generales de la est´ atica y la din´amica / 15 ligaduras por medio del espacio de configuraci´on l-dimensional, usamos un espacio no euclidiano; entonces las trayectorias no rectil´ıneas se atribuyen no a fuerzas, sino a la curvatura del espacio, como en relatividad general.
2.3.
Los desplazamientos virtuales
Sea un sistema sujeto a k condiciones de ligadura, h hol´ onomas, dadas por las ecuaciones (2.11) y n no hol´ onomas dadas por las ecuaciones (2.15), o por (2.12) y (2.14) respectivamente si se trata de un cuerpo r´ıgido, o sus generalizaciones para un sistema de cuerpos r´ıgidos. Para una configuraci´on dada del sistema en un tiempo t, s´olo hay ciertas velocidades compatibles con las n condiciones de ligadura no hol´ onomas. O sea que hay n componentes de las velocidades que se pueden expresar en funci´ on de las 3N − n componentes restantes. Velocidades posibles. Son las velocidades que para una configuraci´on dada (~r1 , ~r2 , ... ~rN ) del sistema en el tiempo t son compatibles con las k condiciones de ligadura. S´ olo hay entre las velocidades posibles un conjunto de velocidades (~r˙ 1 , ~r˙ 2 , ... ~r˙ N ) que efectivamente toma el sistema. Las velocidades reales se hallan solamente al resolver el problema mec´anico completo. Desplazamientos posibles. Son los ~r˙ i = ~r˙ i dt, i = 1, 2, ... N , cuando las ~r˙ i son las velocidades posibles. Cuando las ~r˙ i son las velocidades reales para una configuraci´on dada, d~ri = ~r˙ i dt son los desplazamientos reales. Tanto los desplazamientos reales como los posibles deben ser compatibles con las h condiciones de ligadura hol´ onomas; es decir, estas deben satisfacerse tanto en la configuraci´on (~r1 , ~r2 , ... ~rN ) como en la configuraci´on (~r1 + d~r1 , ~r2 + d~r2 , ... ~rN + d~rN ), siendo los d~ri desplazamientos posibles. Se sigue entonces que los desplazamientos posibles deben satisfacer simult´ aneamente las k = h + n condiciones, N X i=1
~lα · d~ri + Dα dt = 0 i
N X ∂fα i=1
∂~ri
· d~ri +
α = 1, 2, ... n
∂fα dt = 0 α = 1, 2, ... h ∂t
(2.28)
(2.29)
que se siguen de (2.11) y (2.15). ∂/∂~ri denota el gradiente respecto a las coordenadas de la part´ıcula i. Desplazamientos virtuales. Son los desplazamientos posibles cuando se dejan fijas las ligaduras durante el desplazamiento. Por ejemplo, si en la situaci´ on representada por la figura 2.1 se permite que el plano x−y se mueva de manera conocida, las ligaduras ser´an re´ onomas; supongamos que se trate s´olo de un movimiento del plano en la direcci´ on z. En un desplazamiento virtual del disco se deja el plano x − y fijo mientras se efect´ ua
16 / Mec´ anica cl´ asica avanzada el desplazamiento. En un desplazamiento posible, el centro de masa del disco tiene movimiento en la direcci´ on z y en el plano x − y; en un desplazamiento virtual el centro de masa s´olo se mueve en el plano x − y. Para hallar la condici´on para que los desplazamientos virtuales sean compatibles con las ligaduras, consideremos dos conjuntos de desplazamientos posibles durante un tiempo dt, d~ri = ~vi dt y d′~ri = ~vi′ dt, donde ~vi y ~vi′ son dos conjuntos de velocidades posibles. Los d~ri satisfacen las ecuaciones (2.28) y (2.29) y d′~ri satisface, N X i=1
~lα · d′~ri + Dα dt = 0 ; i
N X ∂fα i=1
∂~ri
· d′~ri +
∂fα dt = 0 ; ∂t
α = 1, 2, ... n
α = 1, 2, ... h
(2.30)
(2.31)
an evaluadas en ~r1 , ~r2 , ... ~rN , t y En las ecuaciones (2.30) y (2.31), ~lαi y Dα est´ an´alogamente ∂fα /∂~ri y ∂fα /∂t. Definimos los desplazamientos virtuales δ~ri como: δ~ri = d′~ri − d~ri
(2.32)
y las condiciones de su compatibilidad con las ligaduras son: N X i=1
~lα · δ~ri = 0 ; i
N X ∂fα i=1
∂~ri
· δ~ri = 0 ;
α = 1, 2, ... n
α = 1, 2, ... h
(2.33)
(2.34)
Ejemplo 2.3.1 Sea una part´ıcula sometida a una fuerza externa F~ (x, y, t) y constre˜ nida a moverse solamente sobre una superficie descrita por la ecuaci´ on Φ(x, y, z) = 0
(2.35)
Como la ligadura es hol´ onoma, vemos que cualquier velocidad es posible si es tangente a la superficie. La u ´nica condici´on sobre los desplazamientos virtuales es que sean compatibles con la ligadura. En este caso es que satisfagan la ecuaci´ on (2.34), donde Φ hace las veces de fα , es decir, ∂Φ ∂Φ ∂Φ δx + δy + δz = 0 ∂x ∂y ∂z
(2.36)
O sea que δx, δy, δz no pueden ser arbitrarios; s´olo dos de ellos pueden serlo. En otras palabras, hay dos grados de libertad. La ecuaci´ on de movimiento, F~ = m ~¨r, y la ecuaci´ on de ligadura (2.35), deben ser compatibles. En efecto, (2.35) impone condiciones a las velocidades posibles y a las aceleraciones posibles: ∂Φ ˙ · ~r = 0 ∂~r
(2.37)
Ecuaciones generales de la est´ atica y la din´amica / 17 d ∂Φ ¨ ∂Φ ~r˙ · + ~r · =0 dt ∂~r ∂~r
(2.38)
la ecuaci´ on de movimiento ser´a compatible con (2.38) s´olo si: d ∂Φ F~ ∂Φ ~r˙ · + · =0 dt ∂~r m ∂~r
(2.39)
Como F~ puede darse arbitrariamente, vemos que s´olo por accidente se cumplir´ıa (2.39). Por tanto concluimos que la superficie debe reaccionar sobre la part´ıcula con una ~ que depender´a de las condiciones iniciales, de la fuerza aplicada fuerza suplementaria R ~ se llama fuerza de reacci´on de la ligadura y ha de y de la ecuaci´ on de la superficie. R ser tal que: ~ m~¨r = F~ + R
(2.40)
Ahora tenemos seis inc´ ognitas para el problema: x, y, z, Rx , Ry , Rz , en tanto hay s´olo las cuatro ecuaciones siguientes: m¨ x = Fx + Rx m¨ y = Fy + Ry (2.41) m¨ z = Fz + Rz Φ(x, y, z) = 0 Faltan pues, dos ecuaciones adicionales. Para obtenerlas basta imponer la condici´on ~ no realiza trabajo al efectuarse un de que la ligadura sea ideal. Esto quiere decir que R desplazamiento virtual. Es claro que si la superficie no tiene rozamiento (idealmente ~ ser´a siempre normal a la superficie y como δ~r debe estar sobre la superficie se suave), R ~ y ~r son perpendiculares, sigue que R ~ · δ~r = 0 R
(2.42)
o tambi´en, Rx δx + Ry δy + Rz δz = 0
(2.43)
~ no realiza trabajo en desplazamientos virtuales. Seg´ Es decir, R un la ecuaci´ on (2.36), δx, δy y δz no son independientes. Podemos expresar a δz en t´erminos de δx y δy. Entonces la ecuaci´ on (2.33) puede escribirse en la forma:
Rx − Rz
∂Φ/∂x ∂Φ/∂z
∂Φ/∂y δx + Ry − Rz δy = 0 ∂Φ/∂z
(2.44)
18 / Mec´ anica cl´ asica avanzada ~ ha de satisfacer Como δx, δy son diferentes de cero y arbitrarios, se sigue que R adem´as las ecuaciones: ∂Φ/∂x ∂Φ/∂z
Rx =
Rz
Ry =
∂Φ/∂y Rz ∂Φ/∂z
(2.45)
complet´ andose as´ı las seis ecuaciones requeridas. Las ligaduras ideales. Se dice que las condiciones de ligadura sobre un sistema mec´anico son ideales si se cumple que el trabajo realizado por las fuerzas de reacci´on de las ligaduras al efectuar desplazamientos virtuales de todas las part´ıculas es cero: N X i=1
~ i · δ~ri = 0 R
(2.46)
Las fuerzas de fricci´on dependen del tipo de ligadura, sin embargo para este tipo de fuerzas deben emplearse m´etodos que no impliquen la noci´on de “ligadura ideal”. “Ensambles” y desplazamientos virtuales. Entenderemos por “ensamble” a un conjunto de r´eplicas iguales de un sistema din´amico, donde la u ´ nica diferencia entre las r´eplicas es la configuraci´on, que debe ser compatible con las condiciones de ligadura, adem´as, en estas r´eplicas las ligaduras est´ an en id´entica condici´on; es decir, entre un sistema y otro, para un tiempo dado, las ligaduras son id´enticas. Podemos imaginar las configuraciones de estos sistemas formando una red o matriz bidimensional: los elementos de las “filas” constituyen un “ensamble” y las “columnas” dan los distintos estados de un sistema cuando evoluciona el tiempo; cada fila est´ a caracterizada por un valor del tiempo y cada columna por una configuraci´on. Al cambiar t a un valor vecino t + dt los sistemas del ensamble experimentan desplazamientos reales (de una fila a otra). Al realizarse un desplazamiento virtual, un sistema se convierte en otro vecino (de una columna pasa a otra). Ejemplo 2.3.2 Sean dos part´ıculas de masas m1 y m2 que interact´ uan entre s´ı a trav´es de una varilla r´ıgida sin masa. Est´ an sometidas a una fuerza externa y en un estado de movimiento arbitrario. Se trata de mostrar que la ligadura es ideal. Todos los desplazamientos infinitesimales que no cambian la longitud de la varilla son virtuales. Las fuerzas ejercidas por la varilla sobre las part´ıculas son de ligadura y depender´an del estado de movimiento y de las fuerzas aplicadas sobre las part´ıculas. Por ejemplo, si rotan al rededor del centro de masa, las fuerzas de ligadura depender´an de la velocidad angular de rotaci´on. ~1 y R ~ 2 las fuerzas ejercidas por la varilla sobre las part´ıculas, y G ~1 y G ~2 Sean R las fuerzas ejercidas por las part´ıculas sobre la varilla, por la tercera ley de Newton se ~ 1 = −R ~1 y G ~ 2 = −R ~ 2. cumple que G
Ecuaciones generales de la est´ atica y la din´amica / 19 ~1 y G ~ 2 podr´ıan producir aceleraci´ G on del centro de masa de la varilla y aceleraci´ on angular, pero como la masa de la varilla es cero, lo mismo que el momento de inercia, ~1 + G ~ 2 = 0, lo mismo que el torque. Por lo tanto tambi´en se cumple que se sigue que G ~ ~ R1 = −R2 y como no hay torques, estos vectores estar´ an a lo largo de la varilla. El trabajo virtual de las fuerzas de ligadura ser´a: ~ 1 · δ~r1 + R ~ 2 · δ~r2 = R ~ 2 · (δ~r2 − δ~r1 ) R
(2.47)
Si llamamos ~r = ~r2 − ~r1 , δ~r = δ~r2 − δ~r1 , entonces un desplazamiento virtual δ~r puede descomponerse en uno perpendicular a la varilla y en uno paralelo a la misma, δ~r = δ~r⊥ + δ~rk
(2.48)
Como la varilla es r´ıgida, δ~rk → 0, luego: ~ 1 · δ~r1 + R ~ 2 · δ~r2 = R ~ 2 · δ~r = R ~ 2 · δ~r⊥ R
(2.49)
~ 2 est´ ~ 1 · δ~r2 = 0 concluy´endose por tanto que la pero R a a lo largo de la varilla, luego R ~ 1 · δ~r1 y R ~ 2 · δ~r2 no son cero por separado, pero s´ı su suma. ligadura es ideal. R
2.4.
La ecuaci´ on general de la est´ atica
Sea un sistema de N part´ıculas. La fuerza sobre la part´ıcula i se puede descomponer (a) ~ i ). Si el en una fuerza aplicada (F~i ) y en una fuerza de reacci´on de las ligaduras (R sistema est´ a en equilibrio se debe cumplir que: (a) ~ i = ~0 ; F~i = F~i + R
i = 1, 2, ...N
(2.50)
El trabajo virtual de las F~i tambi´en ser´a cero, N X i=1
F~i · δ~ri =
N X i=1
(a) F~i · δ~ri +
N X i=1
~ i · δ~ri = 0 R
(2.51)
~ i no sean nulas, ser´a nulo el Si suponemos que las ligaduras son ideales, as´ı las R (a) trabajo virtual realizado por ellas, ecuaci´ on (2.46). Aun en el equilibrio las F~i no ser´an nulas, pero de (2.46) y (2.51) se sigue que el trabajo virtual de las fuerzas aplicadas debe ser cero: N X i=1
(a) F~i · δ~ri = 0
(2.52)
La ecuaci´ on (2.52) se llama la ecuaci´ on general de la est´ atica o tambi´en el principio de los trabajos virtuales. El contenido de la ecuaci´ on (2.52) es el siguiente: “para que alguna configuraci´on del sistema, compatible con las ligaduras, sea una posici´on de equilibrio, es necesario y suficiente que en esa posici´on la suma de los trabajos virtuales de las fuerzas efectivas sea cero”. Este enunciado se llama la “regla de oro de la mec´anica” y fue formulado por J. Bernoulli en 1717.
20 / Mec´ anica cl´ asica avanzada La compatibilidad de los desplazamientos virtuales con las ligaduras se expresa a trav´es de las ecuaciones (2.34). Por lo tanto los desplazamientos virtuales δ~ri en la ecuaci´ on (2.52) no ser´an independientes, por lo que se pueden expresar k de ellos en t´erminos de los 3N − k restantes. Las coordenadas generalizadas independientes permiten hallar una expresi´on a partir de (2.52) que contenga los desplazamientos independientes e igualar a cero los coeficientes. Este procedimiento hace posible hallar la configuraci´on de equilibrio pero no las fuerzas de ligadura. Sistema de ecuaciones de la est´ atica. La soluci´on de un problema de est´ atica consiste en hallar la configuraci´on de equilibrio (xi , zi , yi para i = 1, 2, ... N ), y las fuerzas de reacci´on de las ligaduras (Rxi , Ryi , Rzi para i = 1, 2, ... N ). Son seis inc´ ognitas que se obtienen resolviendo simult´ aneamente las siguientes ecuaciones algebraicas: (a) ~i = 0 ; F~i + R N X i=1
i = 1, 2, ... N
(2.53)
~ i · δ~ri = 0 R
(2.54)
fα (~r1 , ~r2 , ... ~rN ) = 0 ;
α = 1, 2, ... k
(2.55)
(a) ~ i en la posici´on Como las F~i son funciones conocidas de las coordenadas, las R de equilibrio se hallan con s´olo conocer dicha posici´on, o sea que en (2.53) son 3N ~ i . Para hallar la configuraci´on de equilibrio basta resolver ecuaciones que determinan las R las ecuaciones: N X i=1
(a) F~i · δ~ri = 0
y
fα (~r1 , ~r2 , ... ~rN ) = 0 ;
α = 1, 2, ... k
(2.56)
Como (2.55) debe cumplirse en las configuraciones ~r1 , ~r2 , ... ~rN y ~r1 + δ~r1 , ~r2 + δ~r2 , ... ~rN + δ~rN , es cierto que: N X ∂fα i=1
∂~ri
· δ~ri = 0 ;
α = 1, 2, ... k
(2.57)
Con lo cual es posible expresar k desplazamientos en t´erminos de 3N − k. Escribamos el conjunto de 3N coordenadas x1 , y1 , z1 , x2 , y2 , z2 , ...xN , yN , zN , en la forma u1 , u2 , ... u3N de modo que tomamos a u1 , u2 , ... uk como k coordenadas que se pueden expresar en t´erminos de las coordenadas uk+1 , uk+2 , ... u3N que tomaremos como (a) 3N − k coordenadas independientes. Llamaremos an´alogamente Fs a las componentes (a) atica pueden escribirse como: Fus . Con estas modificaciones las ecuaciones de la est´ 3N X
Fs(a) δus = 0
(2.58)
s=1
fα (u1 , u2 , ... u3N ) = 0 ;
3N X ∂fα s=1
∂us
δus = 0 ;
α = 1, 2, ... k
(2.59)
Ecuaciones generales de la est´ atica y la din´amica / 21 Introducimos las k cantidades λ1 , λ2 , ... λk , llamadas multiplicadores indeterminados de Lagrange, de la siguiente manera: multiplicamos las ecuaciones (2.59) que relacionan los δus por λα y sumamos sobre α para obtener: 3N X k X ∂fα λα δus = 0 ∂us s=1 α=1
(2.60)
Ahora sumamos (2.58) y (2.60): ! k 3N X X ∂f α δus = 0 Fs(a) + λα ∂us α=1 s=1
(2.61)
Tenemos k cantidades indeterminadas, λα , que podemos escoger de tal manera que en (2.61) se anulen los coeficientes de los k desplazamientos dependientes δu1 , δu2 , ... δuk , es decir, Fs(a) +
k X
λα
α=1
∂fα = 0; ∂us
s = 1, 2, ... k
(2.62)
Ahora, con (2.62), quedar´a (2.61) convertida en una combinaci´ on lineal igualada a cero de las cantidades linealmente independientes δuk+1 , δuk+2 , ... δu3N . Lo anterior es posible s´olo si se anulan los coefientes, lo cual, junto con (2.62) conduce a: Fs(a) +
k X
λα
α=1
∂fα = 0; ∂us
s = 1, 2, ... 3N
(2.63)
La ecuaci´ on general de la est´ atica (2.58) queda convertida en las 3N ecuaciones (2.63). Ahora hay k inc´ ognitas adicionales, o sea 3N + k en total. Pero hay 3N + k ecuaciones que son las (2.55) y las (2.63). La soluci´on nos dar´ a la posici´on de equilibrio del sistema. Las fuerzas de ligadura se hallan de cualquiera de las expresiones: Rs = −Fs(a) (u1 , u2 , ... u3N ) ; Rs =
k X
α=1
λα
s = 1, 2, ... 3N
∂ fα (u1 , u2 , ... u3N ) ; ∂us
(2.64)
s = 1, 2, ...k
(2.65)
Ejemplo 2.4.1 Sean dos part´ıculas de masas m1 y m2 , unidas por una varilla r´ıgida sin masa y colocadas dentro de un cascar´on esf´erico, en presencia de la gravedad (v´ease figura la 2.3). Hallar la posici´on de equilibrio y las fuerzas de reacci´on de las ligaduras. Las ecuaciones de ligadura, cuando se toma el origen de coordenadas en el centro de la esfera, son: (x2 − x1 )2 + (y2 − y1 )2 + (z2 − z1 )2 − l2 =
0
x21 + y12 + z12 − a2 =
0
x22 + y22 + z22 − a2 =
0
(2.66)
22 / Mec´ anica cl´ asica avanzada Donde a es el radio de la esfera y l ≤ 2a la longitud de la varilla. Tomando el eje z en la direcci´ on vertical, las fuerzas aplicadas son: (a) F~1 = −m1 g kˆ ;
(a) F~2 = −m2 g kˆ
(2.67)
Ecuaci´ on de equilibrio (2.58): −m1 g δz1 − m2 g δz2 = 0
(2.68)
k
a m
1
0
m
l
2
Figura 2.3 Masas m1 y m2 unidas por una varilla r´ıgida sin masa y colocadas dentro de un cascar´on esf´erico Compatibilidad de los desplazamientos virtuales con las ligaduras: (x1 − x2 )δx1 + (x2 − x1 )δx2 + (y1 − y2 )δy1
+
(y2 − y1 )δy2 + (z1 − z2 )δz1 + (z2 − z1 )δz2 = 0
(2.69)
x1 δx1 + y1 δy1 + z1 δz1 = 0 x2 δx2 + y2 δy2 + z2 δz2 = 0 Las ecuaciones (2.69) indican que s´olo tres desplazamientos virtuales pueden darse independientemente. Escogeremos independientes a δy1 , δy2 , δz2 y dependientes a δx1 , δx2 , δz1 . Las seis ecuaciones correspondientes a las dadas por la expresi´on (2.63) se obtienen usando la matriz de tres filas y seis columnas ∂fα /∂us donde α = 1, 2, 3 y
Ecuaciones generales de la est´ atica y la din´amica / 23 s = 1, 2, ... 6. α = 1, 2, 3 corresponden a las ecuaciones (2.66) respectivamente y las us corresponden a x1 , x2 , z1 , y1 , y2 , z2 respectivamente. Los elementos de la matriz ∂fα /∂us son: a −a b c −c −b ∂fα x 0 z y 0 0 = (2.70) 1 1 1 ∂us 0 x2 0 0 y2 z2 donde a = x1 − x2 , b = z1 − z2 y c = y1 − y2 . Las ecuaciones (2.63) ser´an: 0 + λ1 (x1 − x2 ) + λ2 x1 + 0 = 0
(2.71)
0 + λ1 (x2 − x1 ) + 0 + λ3 x2 = 0
(2.72)
−m1 g + λ1 (z1 − z2 ) + λ2 z1 + 0 = 0
(2.73)
0 + λ1 (y1 − y2 ) + λ2 y1 + 0 = 0
(2.74)
0 + λ1 (y2 − y1 ) + 0 + λ3 y2 = 0
(2.75)
−m2 g + λ1 (z2 − z1 ) + 0 + λ3 z2 = 0
(2.76)
De (2.71), (2.72) y (2.73) obtenemos para λ1 , λ2 , λ3 : λ1 = m1 g
x1 ; x2 z1 − x1 z2
λ2 = m1 g
x2 − x1 x2 z1 − x1 z2
x1 x1 − x2 λ3 = m1 g x2 x2 z1 − x1 z2
(2.77)
Reemplazando a (2.77) en (2.74), (2.75) y (2.76), obtenemos: x2 y1 − x1 y2 = 0; x2 z1 − x1 z2
x1 x2 y1 − x1 y2 =0 x2 x2 z1 − x1 z2
x1 x2 z1 − x1 z2 m2 + =0 m1 x2 x2 z1 − x1 z2
(2.78)
Si se cumple que x2 z1 − x1 z2 = 0, las ecuaciones (2.78) se convierten en: x2 y1 − x1 y2 = 0;
x2 z1 − x1 z2 = 0
(2.79)
La otra posibilidad es que x2 z1 − x1 z2 no sea cero. En este caso, de (2.78) salen las dos relaciones diferentes: x1 m2 x1 y2 = x2 y1 ; =− (2.80) x2 m1 La soluci´on (2.79) no tiene sentido pues implica: ~r1 × r~2 = (y1 z2 − z1 y2 )ˆi − (x1 z2 − z1 x2 )ˆj + (x1 y2 − x2 y1 )kˆ = 0
(2.81)
24 / Mec´ anica cl´ asica avanzada O sea que los vectores de posici´on de las part´ıculas son paralelos, independientemente de las masas y la longitud de la varilla. Esta soluci´on podr´ıa ser aceptable en los casos l´ımites en que l = 0 o l = 2a. La soluci´on (2.80) da:1 y1 m2 =− ; y2 m1
x1 m2 =− x2 m1
(2.82)
Las relaciones (2.82) implican que el centro de masa se encuentra siempre sobre el eje z. Las ecuaciones de ligadura se pueden escribir como: 2a2 − 2x1 x2 − 2y1 y2 − 2z1 z2 − l2 = 0
(2.83)
x21 + y12 + z12 − a2 = 0
(2.84)
x22 + y22 + z22 − a2 = 0
(2.85)
De reemplazar (2.82) en (2.83) obtenemos: 2a2 + 2
m2 2 m2 2 x +2 y − 2z1 z2 − l2 = 0 m1 2 m1 2
Usando (2.84) y (2.85) podemos escribir a (2.86) como: s 2 m m2 2 2 2 2 2 a − z2 − 2z2 a − (a2 − z22 ) − l2 = 0 2a + 2 m1 m1 Despejando en (2.87) a (a2 − z2 2 ) obtenemos luego para z22 : 2 m2 l2 2 1+ a − m1 2 z22 = 2 m2 2 m2 l a2 − 1+ m1 m1
z1 se obtiene de (2.74), (2.84) y (2.85): 2 m2 2 2 a − z1 = a2 − z22 m1 Lo cual conduce a: 2 m2 l 2 m2 2 a − 1+ m1 m1 2 z22 = 2 m1 m1 2 l 1+ a2 − m1 m1
(2.86)
(2.87)
(2.88)
(2.89)
(2.90)
Se ve f´ acilmente que al intercambiar las part´ıculas, o sea en (2.88) al reemplazar m2 por m1 y viceversa se obtiene (2.90). 1 En
(2.77) resulta entonces que las λ son infinitas, o sea que las fuerzas de ligadura son infinitas.
Ecuaciones generales de la est´ atica y la din´amica / 25 Las ecuaciones (2.82) nos indican que: y1 y2 = x1 x2
(2.91)
Observando la proyecci´on de las part´ıculas sobre el plano xy, vemos que la varilla debe cortar el eje z, lo cual est´ a de acuerdo con el hecho de que el centro de masa est´ a sobre el eje z en la posici´on de equilibrio. Lo anterior nos dice que la proyecci´on de la varilla sobre el plano xy es una l´ınea recta que pasa por el origen. Debido a que de las tres ecuaciones (2.78) s´olo se obtienen dos relaciones independientes, vemos que habr´ a una indeterminaci´on en los valores de x1 y y1 (y correspondientemente de x2 , y2 ), lo cual es debido a la simetr´ıa del problema bajo rotaciones en el eje z. Podemos determinar solamente a ax21 + y12 y ax22 + y22 : y
m
1
ϕ2
ϕ1 x
m
2
Figura 2.4 Proyecci´ on de las part´ıculas m1 y m2 sobre el plano xy
x22 + y22 =
x21
+
y12
=
l2 l 2 a2 − 4 2 m2 m2 2 a2 1 + l − m1 m1
m2 m1
2
(2.92)
(x22 + y22 )
De (2.86) y (2.68) obtenemos la siguiente expresi´on que nos permite analizar los signos de z1 y z2 : 2 m2 l4 m1 l2 1+ + a2 a2 − 2 m1 m2 4 z1 z2 = 2 m2 m1 a2 1 + − l2 m1 m2
(2.93)
26 / Mec´ anica cl´ asica avanzada Supongamos que l = 2a, con m1 6= m2 . Entonces, z1 z2 = −a2
(2.94)
De tal forma que (2.88), (2.90) y (2.83) a (2.85) dan z12 = z22 = a2 . Hay para este caso, pues, dos soluciones posibles: z1 = a, z2 = −a o z1 = −a, z2 = a, que corresponden a la varilla vertical. Si adem´as m1 = m2 , (2.88), (2.89) y (2.90) conducen a valores indeterminados de z1 y z2 : cualquier posici´on es de equilibrio, lo cual est´ a de acuerdo con que el centro de masa est´ a en O para todas las posiciones de la varilla. Para m1 = m2 , con l arbitrario, se obtiene de (2.88), (2.89) y (2.90): z12 = z22 = a2 −
l2 4
(2.95)
y de (2.93) se obtiene: z 1 z 2 = a2 −
l2 4
(2.96)
que indica que z1 y z2 deben tener el mismo signo. Las condiciones de ligadura no contienen informaci´ on acerca de si las part´ıculas est´ an dentro del cascar´on o pegadas a ´el (pudiendo moverse sin fricci´on); por esto (2.96) admite dos soluciones: z1 = z2 = a2 − l2 /4 o z1 = z2 = −(a2 − l2 /4). Es claro que la segunda soluci´on es la u ´ nica aceptable cuando las part´ıculas est´ an colocadas simplemente dentro del cascar´on. La posici´on del centro de masa en un caso general es: zCM =
m1 z 1 + m2 z 2 = m1 + m2 m2 m2 m2 l 2 l2 2 2 ±m1 1 + ± m2 1 + a − a − m1 m 2 m1 2 s1 2 m2 2 m2 l a2 − 1+ (m1 + m2 ) m1 m1
(2.97)
Es claro que cuando las part´ıculas est´ an dentro del cascar´on debe excluirse la soluci´on en que z1 y z2 tienen ambas signos positivos. Las otras soluciones son: Para z1 > 0 , z2 < 0: m2 1− a2 m1 zCM = s (2.98) 2 m m2 2 2 l a2 − 1+ m1 m1 Para z1 < 0 , z2 > 0: m2 − 1 a2 m1 zCM = s 2 m2 m2 2 1+ l a2 − m1 m1
(2.99)
Ecuaciones generales de la est´ atica y la din´amica / 27 Para z1 < 0 , z2 > 0: zCM
m1 =− m1 + m2
s
m2 1+ m1
2
a2 −
m2 2 l m1
(2.100)
Las ecuaciones (2.98), (2.99) y (2.100) ser´an la expresi´on correcta para zCM dependiendo del signo de z1 z2 en la ecuaci´ on (2.93). Estas ecuaciones pueden tambi´en escribirse como: zCM =
zCM =
m1 − m2 r m1 + m2 a2 − m2 − m1 r m1 + m2 a2 −
zCM = −
r a2 −
a2
(2.101)
1 m1 m2 2 l m1 + m2 m1 + m2 a2
(2.102)
1 m1 m2 2 l m1 + m2 m1 + m2
1 m1 m2 2 l m1 + m2 m1 + m2
(2.103)
Cuando p m1 = m2 s´olo es v´alida (2.103). En ese caso, como es de esperarse zCM = z1 = z2 = − a2 − l2 /4. En general (2.101) y (2.102) s´olo ser´an v´alidas cuando se cumple una de las desigualdades siguientes: m1 m2 a2 o l 2 > 2 1 + a2 (2.104) l2 > 2 1 + m1 m2 Para el c´ alculo de las fuerzas de reacci´on de las ligaduras se requiere evaluar los λα . Los denominadores en las ecuaciones (2.77) se calculan usando las ecuaciones (2.80): x2 m1 −z2 + z1 (2.105) = −zCM 1 + x1 m2 Con lo cual las ecuaciones (2.77) nos dan: λ1 = −
m1 m2 g ; m1 + m2 zCM
λ2 = m2
g ; zCM
λ3 = m2
g zCM
(2.106)
De acuerdo con (2.65), (2.71) a (2.76), se puede hallar la contribuci´on de cada ligadura a las fuerzas de reacci´on de las ligaduras. λ1 est´ a asociada a la fuerza ejercida por la varilla sobre las part´ıculas, λ2 a la fuerza ejercida por el cascar´on sobre la part´ıcula de masa m1 y λ3 a la fuerza ejercida por el cascar´on sobre la part´ıcula de masa m2 . Estas fuerzas, en forma vectorial, son respectivamente: λ1 (~r1 − ~r2 );
λ1 (~r2 − ~r1 );
λ2~r1 ;
λ3~r2
(2.107)
La fuerza total, de la varilla y el cascar´on, sobre la part´ıcula de masa m1 y sobre la de masa m2 respectivamente es: (λ1 + λ2 )~r1 − λ1~r;
(λ1 + λ3 )~r2 − λ1~r1
(2.108)
28 / Mec´ anica cl´ asica avanzada Utilizando las expresiones para los λα , las fuerzas ejercidas separadamente por la varilla y el cascar´on sobre las part´ıculas de masas m1 y m2 respectivamente, son: m1 m2 g ~r1 − ~r2 ; m1 + m2 zCM
m1 m2 g ~r1 − ~r2 ; m1 + m2 zCM
m1 g
~r1 ; zCM
m2 g
~r2 zCM
(2.109)
Por ejemplo, tomemos la soluci´on de equilibrio estable cuando l = 2a y m1 > m2 : ˆ r~2 = ak, ˆ ~r1 − ~r2 = −2akˆ y x1 = x2 = y1 = y2 = 0, z1 = −a, z2 = a. En este caso r~1 = −ak, zCM ser´a: m1 − m2 zCM = − a (2.110) m1 + m2 Las fuerzas ejercidas sobre m1 por la varilla y el cascar´on respectivamente son: −2aλ1 kˆ = −
2m1 m2 g ˆ k m1 − m2
y
− aλ2 kˆ =
m1 (m1 + m2 ) ˆ gk m1 − m2
(2.111)
Las fuerzas sobre la part´ıcula de masa m2 son: 2m1 m2 g ˆ 2aλ1 kˆ = k m1 − m2
y
m2 (m1 + m2 ) ˆ gk aλ3 kˆ = m1 − m2
(2.112)
Las ecuaciones (2.111) y (2.112) nos dicen que la fuerza ejercida por el cascar´on sobre m2 no es cero y que la fuerza ejercida por el cascar´on sobre m2 es diferente de (m1 + m2 )g, lo cual contradice nuestra idea intuitiva de que las part´ıculas est´an “colocadas” dentro del cascar´on (v´ease figura 2.3). El resultado que acabamos de obtener nos dice que las part´ıculas est´ an “agarradas” del cascar´on de alguna manera. Esto nos ilustra una propiedad de las ecuaciones de ligadura del tipo (2.88), (2.89), (2.90), o sea de las ligaduras hol´ onomas bilaterales: las fuerzas de ligadura asociadas a las ligaduras bilaterales se pueden ejercer en dos direcciones. Por esto en la parte m´as alta del cascar´on, ecuaci´ on (2.112), ´este ejerce sobre la part´ıcula de masa m2 una fuerza en la direcci´ on z negativa. La fuerza total sobre m1 y la fuerza total sobre m2 , usando las ecuaciones (2.100) y (2.106), son respectivamente: m1 g
~ CM R ; zCM
m2 g
~ CM R zCM
(2.113)
Cuando l = 2a, la fuerza neta ejercida por las ligaduras sobre m1 es m1 g kˆ y sobre m2 ˆ Es decir, las ligaduras ejercen sobre cada part´ıcula una fuerza que contrarresta es m2 g k. su peso, como debe ser cuando las part´ıculas est´ an “agarradas” al cascar´on. El estudio del caso en que las part´ıculas est´ an simplemente “colocadas” en el cascar´on requiere reemplazar (2.66) por dos condiciones de ligadura unilaterales: r1 ≤ a, r2 ≤ a. La soluci´on se obtiene f´acilmente a partir de la hallada cuando las ligaduras son bilaterales.
2.5.
Las ecuaciones de la est´ atica en coordenadas generalizadas
Las ligaduras hacen que los desplazamientos virtuales de las part´ıculas (δx1 , δy1 , δz1 ; ... δxn , δyn , δzn ) no sean todos independientes. Por esto en la ecuaci´ on general de
Ecuaciones generales de la est´ atica y la din´amica / 29 la est´ atica, ecuaciones (2.52) y (2.58), no se tienen combinaciones lineales de cantidades linealmente independientes y los coeficientes de los desplazamientos no se anulan. Si introducimos las coordenadas generalizadas independientes (q), para lo cual es necesario que el sistema sea hol´ onomo, mediante las ecuaciones de transformaci´ on (2.21), podemos expresar los δ~ri en t´erminos de los δqν : δ~ri =
l X ∂~ri δqν ∂q ν ν=1
(2.114)
donde l es el n´ umero de grados de libertad; l = 3N − k, con k = h, puesto que en est´ atica no hay ligaduras no hol´ onomas. Entonces la ecuaci´ on (2.52) toma la forma: ! l N N l X X X X ∂~ r ∂~ r i i (a) (a) F~i · F~i · δqν = 0 (2.115) δqν = ∂qν ∂qν ν=1 ν=1 i=1 i=1
En la ecuaci´ on (2.115) se tiene una combinaci´ on lineal de los desplazamientos virtuales independientes δqν igualada a cero. Por esto se debe cumplir que: Q(a) ν
≡
(a)
N X
ri (a) ∂~ = 0; F~i · ∂q ν i=1
ν = 1, 2, ... l
(2.116)
Qν se denomina la fuerza generalizada asociada al grado de libertad qν . En coor(a) denadas generalizadas las condiciones de equilibrio son Qν = 0 para ν = 1, 2, ... l, que proporciona un sistema de l ecuaciones algebraicas simult´ aneas con las l inc´ ognitas q1 , q2 , ... ql que son las coordenadas generalizadas en la posici´on de equilibrio. En cuanto a las fuerzas de ligadura, de la ecuaci´ on (2.50) se sigue que la fuerza de reacci´on de las ligaduras asociada al grado de libertad qν tambi´en es cero: Eν =
N X
N X ∂~ri ~ i . ∂~ri = − R F~i (a) · ∂qν ∂qν i=1 i=1
ν = 1, 2, ... l
(2.117)
Se sigue de (2.117) que s´olo ser´an diferentes de cero las fuerzas asociadas a las 3N − l = k coordenadas “superfluas”. Como en coordenadas generalizadas desaparecen las ecuaciones de ligadura, se sigue que las fuerzas de ligadura tambi´en se anulan, de acuerdo con la idea de que en el espacio de configuraci´on no euclidiano, definido por las coordenadas generalizadas, el efecto de las ligaduras es asociado con la propiedad geom´etrica de “curvatura del espacio”. Fuerzas derivables de un potencial. Si las fuerzas aplicadas se pueden obtener a partir de una funci´ on V (~ rl , r~2 , ... ~rN , t) en la forma: ∂V (a) ; F~i = − ∂~ri
i = 1, 2, ... N
(2.118)
Las condiciones de equilibrio en coordenadas generalizadas son, para este caso: Q(a) ν
=−
N X ∂V i=1
∂~ri
·
∂~ri ∂V =− ; ∂qν ∂qν
i = 1, 2, ... l
(2.119)
30 / Mec´ anica cl´ asica avanzada Las ecuaciones (2.119) dicen que la posici´on de equilibrio est´ atica es aquella para la cual la funci´ on de energ´ıa potencial tiene un m´ınimo o un m´aximo respecto a todas las coordenadas generalizadas. Sin definir estrictamente la estabilidad de un sistema, podemos decir que un m´ınimo en V corresponde a equilibrio estable, y un m´aximo a equilibrio inestable; las condiciones rigurosas de estabilidad est´ an dadas por el teorema de Lagrange y los teoremas de Liapunov y Chetayev (v´ease el cap´ıtulo 5 del libro Lectures in analytical mechanics de Gantmacher). A manera de ilustraci´ on, consideraremos una part´ıcula colocada sobre una esfera de radio a que puede variar con el tiempo. Las coordenadas generalizadas pueden tomarse como θ, φ, de acuerdo con la ecuaci´ on (2.24). A las fuerzas aplicadas se les pueden asociar las fuerzas generalizadas Qθ , Qφ . La condici´on de equilibrio es Qθ = Qφ = 0, o sea que no haya torques externos en las direcciones de θ y φ. En el equilibrio, la part´ıcula se mover´ a sobre la superficie de la esfera sin aceleraci´ on o permanecer´ a en reposo respecto a la misma. Con coordenadas generalizadas no es posible obtener la fuerza de ligadura en la direcci´ on radial. Ejemplo 2.5.1 Hallar la configuraci´on de equilibrio para el problema del ejemplo 2.4.1 en coordenadas generalizadas. La figura 2.5 muestra una configuraci´on general del sistema. Se requiere hallar tres par´ ametros independientes compatibles con las ligaduras y expresar en t´erminos de ellos las coordenadas de las part´ıculas. Luego, hallar las fuerzas generalizadas asociadas a esos par´ ametros. La configuraci´on de equilibrio estar´ a dada por los valores de los par´ ametros que anulan las fuerzas generalizadas. Las coordenadas generalizadas ser´an tres par´ ametros que ubican la posici´on del tri´angulo r´ıgido: 012. Como el vector de posici´on del centro de masa ~rCM es fijo respecto al tri´angulo 012, dos par´ ametros podr´ıan ser φCM , θCM y el tercer par´ ametro ser´ıa un ´angulo de rotaci´on del tri´angulo alrededor de ~rCM . Sin embargo, resultan m´as convenientes los tres ´angulos de Euler que determinan la ubicaci´on de un sistema de coordenadas cartesianas x′ , y ′ , z ′ , fijo al tri´angulo, respecto al sistema de coordenadas espacial x, y, z. Los ´ angulos de Euler permiten mediante tres rotaciones sucesivas obtener los ejes x′ , y ′ , z ′ a partir de los ejes x, y, z: primero se rota alrededor del eje z por un ´angulo φ, con lo cual el eje x pasa a ser cierto eje ξ; luego se rota alrededor del eje ξ por un angulo θ, con lo cual z pasar´ ´ a a ser cierto eje ξ ′ ; luego se rota alrededor del eje ξ ′ por un ´ angulo ψ, con lo cual se obtendr´ a la posici´on final de los ejes x′ , y ′ , z ′ . La figura 2.6 muestra estas tres rotaciones. La figura 2.7 muestra la ubicaci´on del tri´angulo mediante los ´angulos de Euler φ, θ, ψ. Se escoge el eje z ′ a lo largo de la l´ınea que une a O con el centro de masa, y ′ perpendicular a 0−CM en el plano del tri´angulo, y x′ perpendicular al plano del tri´angulo. Las coordenadas de las part´ıculas respecto a los ejes x′ , y ′ , z ′ son: x′1 =
0
y1′ =
−a sen
z1′ =
a cos
β −α 2
β −α 2
x′2 = 0 y2′ = a sen z2′ = a cos
β +α 2
β +α 2
(2.120)
Ecuaciones generales de la est´ atica y la din´amica / 31 z
2 l
1
θ2
θ1
r1
r2 y
ϕ2
ϕ1 x
Figura 2.5 Configuraci´on de equilibrio del sistema de dos masas unidas por una varilla r´ıgida (del ejemplo 2.4.1)
ζ′
z,ζ
z θ
z
zi ′ θ
yi′
η′
η
x
ϕ
x ζ
y
y
y
x
ϕ
ϕ
ψ
xi′
ζ′
Figura 2.6 Los ´angulos de Euler φ, θ y ψ
Llamando ~rm la posici´on del punto medio de la varilla, obtenemos la siguiente expresi´on que relaciona a cos α con cos β:
~rCM · ~rm =
a2 (1 + cos β) = rCM rm cos α 2
(2.121)
32 / Mec´ anica cl´ asica avanzada z zi ′
2
z i′
1 y i′
× CM 2
× CM
1
α
θ a
y
β
0
a
xi′ ϕ
y i′
ψ
0
x
Figura 2.7 Ubicaci´on del tri´angulo mediante los ´angulos de Euler
De la definici´on de ~rCM y de la geometr´ıa se sigue que: s l2 m1 m2 rCM = a 1 − 2 (m1 + m2 ) a2 rm = a
r
1−
l2 4a2
l2 cos β = 1 − 2 ; 2a
(2.122)
(2.123) β l sen = ; 2 2a
β cos = 2
r
1−
l2 4a2
(2.124)
Usando (2.122), (2.123) y (2.124) se obtienen de (2.121) las siguientes expresiones para senα y cos α: sen α =
l m1 − m2 s 2a m1 + m2 1−
v u u u cos α = u u t
1 m1 m2 l2 (m1 + m2 )2 a2
l2 1− 2 4a m1 m2 l2 1− 2 (m1 + m2 ) a2
(2.125)
De (2.120), (2.124) y (2.125) se deducen las siguientes expresiones para las coordenadas de las part´ıculas respecto a los ejes x′ , y ′ y z ′ : x′1 = x′2 = 0
(2.126)
Ecuaciones generales de la est´ atica y la din´amica / 33 v u u m2 u u ′ y1 = −l u m1 + m2 t
l2 4a2 m1 m2 l2 1− 2 (m1 + m2 ) a2 1−
l2 m2 1− 2 2a m1 + m2 ′ z1 = a s m1 m2 l2 1− (m1 + m2 )2 a2 v u l2 u u 1− 2 m 1 u 4a y2′ = l u m1 + m2 t m1 m2 l2 1− 2 (m1 + m2 ) a2 m1 l2 1− 2 4a m1 + m2 ′ z2 = a s l2 m1 m2 1− (m1 + m2 )2 a2
(2.127)
(2.128)
(2.129)
(2.130)
Definamos las variables c = cos ψ, c′ = cosφ, c′′ = cos θ, s = senψ, s′ = senφ y s = senθ. Las ecuaciones de transformaci´ on del sistema de coordenadas x′ , y ′ , z ′ al sistema de coordenadas x, y, z son las siguientes [ver (2.118)]: x y = z (2.131) ′ c c′ − s s′ c′′ −s c′ − c′′ s′ c s′′ s′ x c s′ + c′′ c′ s −s s′ + c′′ c′ c −s′′ c′ y ′ s′′ s s′′ c c′′ z′ ′′
Como las componentes del vector de posici´on del centro de masa en los ejes x′ , y ′ , z son: ′
′ x′CM = yCM = 0;
′ = rCM , zCM
(2.132)
se deduce de (2.131) que respecto a los ejes x, y, z las coordenadas del centro de masa son: xCM = rCM senθ senφ yCM
= −rCM senθ cos φ
zCN
= rCM cos θ
(2.133)
34 / Mec´ anica cl´ asica avanzada Las fuerzas generalizadas se obtienen usando las ecuaciones (2.67) y (2.116): Qν = −m1 g
∂z1 ∂z2 ∂zCM − m2 g = −g(m1 + m2 ) ∂qν ∂qν ∂qν
(2.134)
donde en este caso tomanos q1 = φ, q2 = θ, q3 = ψ. De (2.133) y (2.134) se sigue inmediatamente que: Qφ
≡0
Qψ
≡0
Qθ
= (m1 + m2 )grCM senθ
(2.135)
Las condiciones de equilibrio son Qν = 0, lo cual da las siguientes ecuaciones: 0 = 0,
0 = 0,
senθ = 0
(2.136)
Se sigue de (2.136) que las configuraciones de equilibrio son aquellas para las cuales θ = 0 o θ = π, donde φ y ψ pueden tomar cualquier valor. Como para θ = 0 y θ = π, φ y ψ est´ an en el mismo plano, realmente s´olo hay un ´angulo arbitrario: todas las configuraciones que se obtienen por rotar alrededor del vector de posici´on del centro de masa son de equilibrio, donde el centro de masa est´ a sobre el eje z. Las configuraciones de equilibrio respecto a los ejes x, y, z se obtienen de (2.131) con ψ y φ arbitrarios: ′ x cos(ψ ± φ) −sen(ψ ± φ) 0 x ′ y = sen(φ ± ψ) cos(φ ± ψ) 0 y (2.137) z 0 0 ±1 z′ Donde el signo superior se refiere al caso en que θ = 0 y el inferior a φ = π. Expl´ıcitamente (2.137) da: x
= x′ cos(ψ ± φ) − y ′ sen(ψ ± φ)
y
= x′ sen(φ ± ψ) + y ′ cos(φ ± ψ)
z
= ±z ′
(2.138)
en concordancia con lo dicho anteriormente. En la configuraci´on de equilibrio estable, θ = π, las coordenadas de las part´ıculas, de acuerdo con (2.138) y (2.126) a (2.130), son: m2 l2 1− 2 2a m1 + m2 ; z1 = −a s m1 m2 l2 1− (m1 + m2 )2 a2
m1 l2 1− 2 2a m1 + m2 z2 = −a s m1 m2 l2 1− (m1 + m2 )2 a2
(2.139)
de acuerdo con los resultados obtenidos anteriormente [ecuaciones (2.88) y (2.90)]. Los resultados (2.80) tambi´en se obtienen directamente de (2.138).
Ecuaciones generales de la est´ atica y la din´amica / 35
2.6.
La ecuaci´ on general de la din´ amica
Si un sistema no est´ a en equilibrio, la fuerza neta sobre cada una de las part´ıculas no es cero sino, de acuerdo con la segunda ley de Newton, es igual al producto de su masa por su aceleraci´ on: (a) ~ i = mi~¨ri ; F~i = F~i + R
i = 1, 2, ...N
(2.140)
Debido a que consideramos ligaduras ideales, que no realizan trabajo sobre el sistema como un todo al desplazar virtualmente todas las part´ıculas, se sigue que: n X i=1
(a) F~i − mi~¨r i · δ~ri = 0
(2.141)
(a) La cantidad F~i − mi~¨r i ·δ~ri no es cero, pero su suma s´ı lo es. La f´ormula (2.141) se llama la ecuaci´ on general de la din´amica o tambi´en el principio de D’alembert. Esta ecuaci´ on establece lo siguiente: “en todo instante en un sistema din´amico la suma de (a) las fuerzas efectivas F~i y de las fuerzas de inercia −mi~r¨i no realiza trabajo al efectuar desplazamientos virtuales del sistema”, o m´as en general establece que: “la ecuaci´ on general de la din´ amica expresa una condici´on necesaria y suficiente para que un movimiento compatible con las ligaduras sea a la vez compatible con las fuerzas aplicadas”. Esta ecuaci´ on es aplicable a cualquier sistema ideal, hol´ onomo o no hol´ onomo. Como hay 3N − k desplazamientos virtuales independientes, la ecuaci´ on general de la din´ amica proporciona 3N − k ecuaciones, al igualar a cero los coeficientes de los desplazamientos virtuales independientes, que junto con las k ecuaciones de ligadura constituye un sistema de 3N ecuaciones con 3N inc´ ognitas. Esta vez, a diferencia del caso est´ atico, las ecuaciones no ser´an algebraicas sino diferenciales. (a) (a+f ) on (2.141) queda as´ı: = F~i − mi~r¨i la ecuaci´ Si llamamos F~i N X i=1
(a+f ) · δ~ri = 0 F~i
(2.142)
o sea que la ecuaci´ on general de la din´amica toma la misma forma de la ecuaci´ on general de la est´ atica. Esta ecuaci´ on puede interpretarse como una ecuaci´ on para caracterizar en cada instante del tiempo la posici´on de equilibrio del sistema donde a las fuerzas (a) as precisamente, efectivas F~i se les adicionan las fuerzas ficticias o inerciales −mi~¨r i . M´ el principio de D’alembert (1760) dice: “cualquier posici´on de un sistema din´amico puede considerarse como una posici´on de equilibrio instant´ aneo si a las fuerzas aplicadas que act´ uan sobre el sistema se agregan las fuerzas ficticias o de inercia”. La regla de oro de J. Bernoulli queda aplicable tambi´en en la din´amica. A −mi~¨r i se llama fuerza inercial de D’alembert. En el problema est´ atico asociado, las fuerzas de reacci´on de las ligaduras coinciden con las del problema original, din´amico. Ejemplo 2.6.1 Sea un recipiente lleno de agua que se mueve con una aceleraci´ on ~a perpendicular a la fuerza de gravedad (v´ease figura 2.8). Hallar la forma y la posici´on de la superficie del agua.
36 / Mec´ anica cl´ asica avanzada Cuando ~a = 0, la u ´nica fuerza aplicada sobre cada elemento de volumen es la de gravedad; las fuerzas ejercidas por el resto del l´ıquido pueden asumirse como de reacci´on. La forma de la superficie en el caso est´ atico es plana y horizontal, perpendicular a la fuerza aplicada.
dm –dma
a ϕ ϕ
F ( a) = –dmgk Figura 2.8 Diagrama de fuerzas ejercidas sobre el elemento de masa dm En el caso din´ amico, a cada elemento de masa dm se le aplica adicionalmente una fuerza ficticia −dm ~a. La superficie del agua ser´a ahora un plano perpendicular a la fuerza F~ (a+f ) . La inclinaci´on de la superficie estar´ a dada por: tan φ =
a g
(2.143)
Ejemplo 2.6.2 Sean dos part´ıculas en un doble plano inclinado, unidas por una cuerda inextensible sin masa (v´ease figura 2.9). Hallar la condici´on de equilibrio. Resolver el problema din´ amico. Las ligaduras son: z1 =
0 z2 = 0
y1 =
x1 tan α1
y2 =
−x2 tan α2
(2.144) p p x21 + y12 + x22 + y22 =
l
Ecuaciones generales de la est´ atica y la din´amica / 37 y α2
z
α1
m
m1
2
α2
α1
Figura 2.9 Dos part´ıculas en un doble plano inclinado, unidas por una cuerda inextensible sin masa.
Hay s´olo un grado de libertad. Los desplazamientos virtuales son a lo largo de los planos, como los desplazamientos reales. El principio de los trabajos virtuales nos conduce a: −m1 g ˆj · δ~r1 − m2 g ˆj · δ~r2 = 0
(2.145)
−m1 tan α δx1 + m2 tan α2 δx2 = 0
(2.146)
es decir:
De la condici´on de ligadura impuesta por la cuerda se obtiene: δx1 =
cos α1 δx2 cos α2
(2.147)
Con lo cual la ecuaci´ on de equilibrio queda as´ı: cos α1 −m1 tan α1 + tan α2 δx2 = 0 cos α2
(2.148)
Como δx2 es arbitrario, se obtiene que: m1 senα1 = m2 senα2
(2.149)
O sea que cuando los ´ angulos y las masas sean tales que se cumple la anterior condici´on, el sistema estar´ a en equilibrio en cualquier posici´on. Para el caso din´ amico, o sea cuando m1 senα1 6= m2 senα1 , aplicamos la ecuaci´ on general de la din´ amica: (m1~g − m1~a1 ) · δ~r1 + (m2~g − m2~a2 ) · δ~r2 = 0
(2.150)
Las aceleraciones deben ser compatibles con las ligaduras, con lo cual se obtienen las siguientes relaciones: a1x = a2x
cos α1 ; cos α2
a1y = a1x tan α1 ;
a2y = −a2x tan α2
(2.151)
38 / Mec´ anica cl´ asica avanzada Adem´as, entre los desplazamientos virtuales hay estas tres relaciones: cos α2 senα2 δy1 = δx1 tan α1 ; δx2 = δx1 ; δy2 = −δx1 cos α1 cos α1
(2.152)
Al expresar en la ecuaci´ on general de la din´amica todas las componentes de las aceleraciones en t´erminos de a1x y todos los desplazamientos virtuales en t´erminos de δx1 , obtenemos: " senα2 − m1 g tan α1 + m2 g senα1 (2.153) # −(m1 sec2 α1 + m2 sec2 α1 ) a1 x δx1 = 0
Con lo cual se obtiene a a1x y por consiguiente a a1y . La magnitud de ~a1 ser´a: a1 =
|m1 g senα1 − m2 g senα2 | m1 + m2
(2.154)
La aceleraci´ on a2 tiene igual magnitud. Las componentes x de las aceleraciones son iguales y de signos contrarios. Sistema de ecuaciones de la din´ amica. Para sistemas hol´ onomos, el principio de D’alembert permite usar los resultados obtenidos en el caso est´atico. Las ecuaciones (a) (2.63) nos permiten obtener las ecuaciones de movimiento con s´olo reemplazar a F~i (a) por F~i − mi~¨r i : (a) F~i − mi~¨r i +
N X
λα
α=1
∂fα =0 ∂~ri
(2.155)
Para un sistema no hol´ onomo, adem´as de lo anterior, los desplazamientos virtuales deben satisfacer las relaciones (2.33): N X i=1
~lα · δ~ri = 0 ; i
α = 1, 2, ... n
(2.156)
Debemos entonces introducir los multiplicadores de Lagrange adicionales µ1 , µ2 , ...µn , que escogeremos de modo que se anulen los coeficientes de los n desplazamientos dependientes adicionales. Para ello, multiplicamos (2.33) por µα y sumamos sobre α: N X n X
i=1 α=1
µα ~lαi · δ~ri = 0
(2.157)
Claramente se ve que en este caso las ecuaciones de movimiento tomar´an la siguiente expresi´on: (a) mi~r¨i = F~i +
h X
α=1
n
λα
∂fα X ~ + µα lαi ; ∂~ri α=1
i = 1, 2, ... N
(2.158)
Ecuaciones generales de la est´ atica y la din´amica / 39 Estas 3N ecuaciones contienen las 3N + n + h inc´ ognitas ~r1 , ~r2 , ... ~rN , λ1 , λ2 , ...λh , µ1 , µ2 , ...µn que junto con las n + h condiciones de ligadura (2.11) y (2.15) nos dan 3N + n + h ecuaciones con 3N + n + h inc´ ognitas. Esta vez las ecuaciones ser´an diferenciales acopladas. Las fuerzas de ligadura estar´ an dadas por: ~i = R
h X
α=1
n
λα
∂fα X ~ + µα lαi ; ∂~ri α=1
i = 1, 2, ... N
(2.159)
Las ecuaciones (2.158) se llaman ecuaciones de Lagrange de la primera clase y fueron dadas por Lagrange en el a˜ no de 1788. La ecuaci´ on (2.159) nos permite obtener la contribuci´ on de cada ligadura a las fuerzas de reacci´on de las ligaduras. Este formalismo es aplicable a cualquier sistema mec´anico con ligaduras ideales, hol´ onomo o no hol´ onomo, sometido a fuerzas conservativas o no conservativas. Ejemplo 2.6.3 Sea un alambre largo, r´ıgido, que gira uniformemente alrededor de un eje perpendicular a ´el. Una bolita se desliza en el alambre sin fricci´on. No hay fuerzas aplicadas (v´ease figura 2.10). Hallar la trayectoria de la part´ıcula y las fuerzas de reacci´on de la ligadura. Elegimos las coordenadas de modo que el alambre permanece en el plano x − y. La ecuaci´ on de ligadura es: tan ωt x − y = 0
(2.160) y
m
ωt 0
x
Figura 2.10 Alambre largo y r´ıgido que gira uniformemente alrededor de un eje perpendicular a ´el. La masa m se desliza sobre ´el sin fricci´ on. Las ecuaciones (2.158) y (2.159) para este caso son: m¨ x = λ tan ωt
(2.161)
m¨ y = −λ
(2.162)
Rx = λ tan ωt ;
R − y = −λ
(2.163)
40 / Mec´ anica cl´ asica avanzada La ecuaci´ on de ligadura nos proporciona la siguiente ecuaci´ on diferencial, que junto con (2.161) y (2.162) nos permite obtener a x, y, λ: y¨ = x ¨ tan ωt + 2xω ˙ sec2 ωt + 2ω 2 x sec2 ωt tan ωt
(2.164)
La ecuaci´ on diferencial para x es: x ¨ + 2ω x˙ tan ωt + 2ω 2 x tan2 ωt = 0
(2.165)
Haciendo la sustituci´on x = u cos ωt obtenemos la siguiente ecuaci´ on diferencial para u: u ¨ − ω2u = 0
(2.166)
Con lo cual la soluci´on para x, y, λ es: x = A cosh ωt cos ωt
(2.167)
y = A cosh ωt senωt
(2.168)
λ = −2Amω 2 senhωt cos ωt
(2.169)
Las componentes de la fuerza de reacci´on de la ligadura son: Rx = −2Amω 2 senhωt senωt ;
Ry = 2Amω 2 senhωt cos ωt
(2.170)
~ con el eje x est´ El ´ angulo de R a dado por: Ry = cot ωt Rx
(2.171)
~ es siempre perpendicular al alambre y su magnitud es R = 2Amω 2 senhωt. o sea que R
2.7.
Las ecuaciones de la din´ amica en coordenadas generalizadas para sistemas hol´ onomos
Al introducir las coordenadas generalizadas independientes las ecuaciones de ligadura se satisfacen id´enticamente. El paso a coordenadas generalizadas de la ecuaci´ on general de la din´ amica se puede realizar en forma an´aloga al caso de la est´ atica en virtud del principio de D’alembert. De acuerdo con las ecuaciones (2.142) y (2.116) las ecuaciones de movimiento en coordenadas generalizadas son: ) Q(a+f = ν
N X
ri (a+f ) ∂~ = 0; · F~i ∂qν i=1
ν = 1, 2, ... l
(2.172)
o, m´as expl´ıcitamente, N ∂~r X i (a) = 0; F~i − mi~¨r i · ∂q ν i=1
ν = 1, 2, ... l
(2.173)
Ecuaciones generales de la est´ atica y la din´amica / 41 Definimos la fuerza generalizada aplicada asociada al grado de libertad ν por: Q(a) ν =
N X
ri (a) ∂~ F~i · ∂qν i=1
(2.174)
La fuerza generalizada asociada correspondiente a la fuerza de inercia se puede relacionar con la energ´ıa cin´etica de la siguiente manera: ) Q(f ν
=
=
N X
d~r˙i ∂~ri · dt ∂qν i=1 N X d ˙ ∂~ri d ∂~ri ˙ − mi ~ri · − mi~ri · dt ∂qν dt ∂qν −
mi
(2.175)
i=1
Podemos expresar en (2.175) a ∂~ri /∂qν y su derivada temporal en t´erminos de derivadas respecto a ~r˙ i . Para ello partimos de la siguiente expresi´on para ~r˙ i : ~r˙ i =
l X ∂~ri ∂~ri q˙µ + ∂q ∂t µ µ=1
(2.176)
mediante la cual obtenemos: ∂~ri ∂~r˙i = ; ∂ q˙ν ∂qν
l X ∂ 2~ri d ∂~ri ∂ 2~ri = q˙µ + dt ∂qν ∂qµ ∂qν ∂t∂qν µ=1
(2.177)
Por otra parte tenemos que: l X ∂~r˙ i ∂ d~ri ∂ 2~ri ∂ 2~ri = q˙µ + = ∂qν ∂qν dt ∂qν ∂qµ ∂qν ∂t µ=1
(2.178)
De (2.177) y (2.178) se sigue entonces que: ∂~r˙i ∂~ri = ; ∂ q˙ν ∂qν
d ∂~ri ∂~r˙i = dt ∂qν ∂qν
(2.179)
Mediante (2.179) el lado derecho de (2.175) se transforma en: ! # " N ˙i X ∂ ~ r d ˙ ∂~r˙ i − mi~r˙ i · = ~ri · mi − dt ∂q ∂qν ν i=1
(2.180)
N N d X1 ∂ ˙2 X 1 ∂ ˙2 − mi ~ri + ~r mi dt i=1 2 ∂ q˙ν 2 ∂qν i i=1
Las ecuaciones (2.174) y (2.180) nos permiten escribir a (2.173) en la forma: Q(a) ν −
∂T d ∂T + = 0; dt ∂ q˙ν ∂qν
ν = 1, 2, ... l
(2.181)
42 / Mec´ anica cl´ asica avanzada Igual que en el caso est´ atico las fuerzas generalizadas de ligadura se anulan, seg´ un una ecuaci´ on an´aloga a la (2.117). Las ecuaciones (2.181) se denominan las ecuaciones de Lagrange de la segunda clase. En esas ecuaciones T es la energ´ıa cin´etica del sistema. Una vez resueltas las ecuaciones (2.181) mediante las f´ormulas de transformaci´ on (2.21) y (2.23) se hallan los ~ri (t) (a) ¨ ~ con los cuales se pueden hallar Fi (t) y ~ri que permiten obtener de (2.140) las fuerzas de reacci´on de las ligaduras. Fuerzas derivables de un potencial. Si todas las fuerzas aplicadas se pueden obtener de una funci´ on V mediante las f´ormulas (2.118), las fuerzas generalizadas tomar´an la forma: Q(a) ν =−
∂ V (q, t) ; ∂qν
ν = 1, 2, ... l
Como ∂V /∂ q˙ν = 0, (2.181) se pueden escribir: ∂ d ∂(T − V ) − (T − V ) = 0 ν = 1, 2, ... l dt ∂ q˙ν ∂qν
(2.182)
(2.183)
T en coordenadas generalizadas depende de (q), (q) ˙ y de t en el caso en que las ligaduras sean re´ onomas. Se define la funci´ on lagrangiana, o simplemente “el lagrangiano” L as´ı: L(q, q, ˙ t) ≡ T (q, q, ˙ t) − V (q, t)
(2.184)
Entonces las ecuaciones de movimiento para un sistema hol´ onomo con fuerzas derivables de un potencial que no depende de las velocidades son: d ∂L ∂L − = 0; dt ∂ q˙ν ∂qν
ν = 1, 2, ... l
(2.185)
Las ecuaciones (2.185) se denominan usualmente “ecuaciones de Lagrange” y hay una por cada grado de libertad del sistema. Covariancia de las ecuaciones de Lagrange. Sean dos conjuntos diferentes de on: coordenadas generalizadas (q) y (q) relacionadas mediante la transformaci´ qν = qν (q, t) ;
q ν = q ν (q, t) ;
ν = 1, 2, ... l
(2.186)
Esta transformaci´ on que no mezcla coordenadas con velocidades se denomina puntual. Queremos hallar si en las coordenadas (q) las ecuaciones de Lagrange toman la forma de (2.185) en las coordenadas (q). Mediante la transformaci´ on (2.186) tenemos que: l l X X ∂L ∂L ∂ q˙α ∂L ∂qα = = ˙ ˙ ∂ q ˙ ∂ q˙α ∂qν ∂ qν α ∂ qν α=1 α=1
(2.187)
Ecuaciones generales de la est´ atica y la din´amica / 43 ˙ y t, que se obtiene de L(q, q, donde L es la funci´ on de (q), (q) ˙ t) al realizar la transfor ˙ q˙ , t), t . Por otra parte: maci´ on: L(q, q,˙ t) ≡ L q(q, t), q(q, " l X d ∂L ∂qα d ∂L = dt ∂ q˙ ν dt ∂ q˙α ∂qα α=1 !# l ∂L X ∂ 2 qα ∂ 2 qα (2.188) + + ∂ q˙α µ=1 ∂qµ ∂q ν ∂t∂q ν l X ∂L ∂qα ∂L ∂ q˙α ∂L = + ∂q µ ∂qα ∂q ν ∂ q˙α ∂qν α=1
(2.189)
Entonces se sigue de (2.188), (2.189) y (2.185) que: l X d ∂L d ∂L ∂L ∂ q˙α ∂L − = =0 − dt ∂ q˙ ν ∂q ν dt ∂ q˙α ∂qα ∂q ν α=1
(2.190)
Es decir, la forma de las ecuaciones de Lagrange es la misma en cualquier sistema de coordenadas generalizadas. Es interesante la siguiente relaci´on que se obtiene directamente usando la transformaci´ on puntual (2.186): l l X X ∂L ∂L ˙ qν q˙ν = ∂ q ˙ ∂ q˙ ν ν α=1 ν=1
(2.191)
Sistema sin ligaduras. Si no hay ligaduras las f´ormulas (2.185) siguen siendo v´alidas, donde l = 3N . Se sigue de (2.190) que cuando el sistema no tiene ligaduras las ecuaciones de Lagrange (2.185) constituyen la forma de las ecuaciones de movimiento en cualquier sistema de coordenadas, propiedad que no cumplen las ecuaciones de la segunda ley de Newton, que son de naturaleza vectorial: las ecuaciones de Lagrange contienen la misma informaci´ on que la segunda ley de Newton con la ventaja adicional de ser ecuaciones completamente covariantes. En coordenadas cartesianas las fuerzas generalizadas son de la forma Qxi , Qyi , Qzi . Qxj =
T =
N X
N
X (a) ri (a) (a) ∂~ ˆx δij = Fix F~i · µ = F~i · ∂x j i=1 i=1
N X 1 i=1
2
mi x˙ 2i + y˙ i2 + z˙i2
(2.192)
(2.193)
Con lo cual las ecuaciones (2.181) nos dan: (a)
mi x ¨i = Fix
es decir, las ecuaciones de Lagrange conducen a la segunda ley de Newton.
(2.194)
44 / Mec´ anica cl´ asica avanzada Comparaci´ on de los formalismos newtoniano y lagrangiano. Llamaremos newtoniano al formalismo basado en la ecuaci´ on general de la din´amica directamente. Este formalismo tiene la ventaja de su generalidad. Sin embargo, para sistemas hol´ onomos con fuerzas derivables de un potencial, el formalismo basado en las ecuaciones de Lagrange presenta algunas ventajas: las ecuaciones de movimiento se obtienen a partir de una sola funci´ on escalar, la lagrangiana L, en tanto que en el formalismo newtoniano se trabaja con las fuerzas que act´ uan sobre las part´ıculas. El uso de coordenadas generalizadas permite en el formalismo lagrangiano eliminar del problema las fuerzas de ligadura y las coordenadas superfluas. En el formalismo lagrangiano se trabaja con l parametros independientes que no se refieren a las part´ıculas sino al sistema como un todo, en cambio en el formalismo newtoniano se trabaja necesariamente con coordenadas de las part´ıculas. Finalmente, la covariancia de las ecuaciones de Lagrange es claramente una ventaja del formalismo lagrangiano. Ejemplo 2.7.1 Sea un alambre largo y r´ıgido que rota uniformemente alrededor de un punto O como se muestra en la figura 2.11. Una part´ıcula de masa m est´ a sometida a la ligadura de permanecer sobre el alambre. No hay fricci´on y act´ ua la fuerza de gravedad en el plano de rotaci´on del alambre. Resolver el problema usando coordenadas generalizadas y las ecuaciones de Lagrange.
y
A c ωt
h
m β
ωt O
B
x
–mgj
Figura 2.11 Alambre largo y r´ıgido que gira uniformemente alrededor de un punto O
Suponer que en t = 0 la part´ıcula parte del punto C con velocidad cero a lo largo del alambre. La ligadura es hol´ onoma y re´onoma, dada por la ecuaci´ on de la linea del alambre: y = x tan β + OA
(2.195)
Ecuaciones generales de la est´ atica y la din´amica / 45 De la geometr´ıa se sigue que sen ωt = h/OA y tan β = − cot α, con lo cual la ecuaci´ on de ligadura toma la forma: x cos ωt + y senωt − h = 0
(2.196)
Es una ligadura dependiente expl´ıcitamente del tiempo. El sistema tiene s´olo un grado de libertad. Podemos tomar como coordenada generalizada el desplazamiento de part´ıcula sobre el alambre respecto el punto C. Las ecuaciones de transformaci´ on son: x(q, t) =
q senωt + h cos ωt
y(q, t) =
−q cos ωt + h senωt
(2.197) Al reemplazar (2.197) en (2.196) se obtiene la identidad 0 = 0. El lagrangiano del problema es: L=
1 m(x˙ 2 + y˙ 2 ) − mgy 2
(2.198)
L expresado en t´erminos de la coordenada generalizada q y la velocidad generalizada q˙ es: ˙ L(q, q, ˙ t) = 21 m(q˙2 + q 2 ω 2 + h2 ω 2 − 2qhω)
(2.199)
−mg(h senωt − q cos ωt) Para escribir la ecuaci´ on de Lagrange se requiere conocer: ∂L = mqω 2 + mg cos α ; ∂q
∂L = m(q˙ − hω) ∂ q˙
(2.200)
Con lo cual la ecuaci´ on de movimiento para la coordenada generalizada q (ecuaci´on de Lagrange) es: q¨ − qω 2 = g cos ωt
(2.201)
Claramente la soluci´on de (2.201) es de la forma: q = Aeωt + Be−ωt + C cos ωt
(2.202)
que satisface las condiciones iniciales q(0) = 0, q(0) ˙ = 0 s´olo si A = B = −(1/2)C. C se determina reemplazando (2.202) en (2.201), obteni´endose finalmente para q(t): q(t) =
g (cosh ωt − cos ωt) 2ω 2
(2.203)
Las fuerzas de reacci´on de las ligaduras se determinan a partir de la ecuaci´ on (2.140): Rx =
m¨ x
Ry =
mg + m¨ y
(2.204)
46 / Mec´ anica cl´ asica avanzada Las ecuaciones (2.197) y (2.203) permiten calcular a x ¨ y y¨: x¨
= q¨ senωt + 2qω ˙ cos ωt − qω 2 senωt − hω 2 cos ωt
(2.205)
y¨ = −q cos ωt + 2qω ˙ senωt + qω 2 cos ωt − hω 2 senωt Con lo cual se obtiene para Rx y Ry: Rx = mg(senhωt + 2senωt) cos ωt − mhω 2 cos ωt Ry
(2.206)
= mg(senhωt + 2senωt)senωt − mhω 2 senωt
El vector ~l est´ a dirigido a lo largo del alambre: ~l = ˆisenωt − ˆj cos ωt
(2.207)
~ es cero: ~l· R ~ = 0 o sea que R ~ es siempre perpendicular El producto escalar de ~l con R al alambre. Su magnitud es: R = mg(senhωt + 2senωt) − mhω 2 (2.208)
2.8.
Las ecuaciones de la din´ amica en coordenadas generalizadas para sistemas no hol´ onomos. Uso de coordenadas no independientes
Con sistemas no hol´ onomos no es posible, mediante la introducci´on de coordenadas generalizadas independientes, eliminar las condiciones de ligadura. Por alguna raz´ on ser´ıa deseable trabajar con un conjunto de 3N coordenadas no cartesianas q1 , q2 , ... q3N , que no ser´an independientes. Incluso ser´ıa posible trabajar con un conjunto de 3N − h coordenadas generalizadas no independientes definido de tal manera que se eliminen del problema las ligaduras hol´ onomas. En cualquiera de estos dos casos debemos trabajar con coordenadas generalizadas no independientes. Se trata de hallar las ecuaciones de movimiento usando estas coordenadas. Para ello basta partir de las ecuaciones de Lagrange de la segunda clase, ecuaciones (2.181), considerando esta vez las Qν como formadas de las fuerzas aplicadas y de las fuerzas de ligadura (2.159): ! h N n X X X ∂f ∂~ri α (a) λα F~i + Qν = + µα~lαi · ∂~ r ∂q i ν α=1 α=1 i=1 ν = 1, 2, ... 3N
(2.209)
definimos las cantidades dα y aαν de la siguiente manera: ∂fα ; dα = ∂t
aαν =
N X ∂fα i=1
∂~ri
·
∂~ri ∂fα = ∂qν ∂qν
para α = 1, 2, ... h
(2.210)
Ecuaciones generales de la est´ atica y la din´amica / 47
dα = Dα ;
aαν =
N X
~lα · ∂~r1 ∂qν i=1 para α = h + 1, h + 2, ... h + n = k
(2.211)
Con lo cual podemos escribir a (2.209) como: Qν = Q(a) ν +
k X
λα aαν
(2.212)
α=1
donde esta vez λα representan los k multiplicadores de Lagrange λ1 , λ2 , ... λh , µ1 , µ2 , ... µn . Las ecuaciones de Lagrange de la segunda clase se pueden escribir entonces en la forma: k X ∂T d ∂T − = Qν(a) + λα aαν ; dt ∂ q˙ν ∂qν α=1
ν = 1, 2, ... 3N
(2.213)
En resumen, con las coordenadas generalizadas q1 , q2 , ... q3N las ecuaciones de ligadura se pueden escribir en la forma: 3N X
aαν q˙α + dα = 0 ;
α = 1, 2, ... h, h + 1, h + 2, ... h + n = k
(2.214)
α=1
que junto con las 3N ecuaciones de Lagrange nos proporcionan 3N + k ecuaciones con las 3N + k inc´ ognitas siguientes: q1 , q2 , ... q3N , λ1 , λ2 , ... λh , µ1 , µ2 , ... µn . Las fuerzas de reacci´ o n de las ligaduras en estas coordenadas no independientes estar´ an dadas por Pk λ a , o m´ a s expl´ ıcitamente: α=1 α αν h X
n
∂fα X + µα aαν Rν = λα ∂qα α=1 α=1
(2.215)
Ejemplo 2.8.1 Resolver el problema del ejemplo 2.7.1 usando multiplicadores de Lagrange y coordenadas no independientes. Tomaremos a q y h como coordenadas generalizadas no independientes. En la ecuaci´ on de ligadura escribiremos a la distancia OC como h0 : f (x, y, t) = x cos ωt + y senωt − h0
(2.216)
Haciendo la transformaci´ on de las coordenadas x, y a las coordenadas q, h, ecuaci´ on (2.197), obtenemos para ~r y f : f (q, h, t) = h − h0
(2.217)
~r(q, h, t) = q(ˆi senωt − ˆj cos ωt) + h(ˆi cos ωt + ˆj senωt)
(2.218)
48 / Mec´ anica cl´ asica avanzada con lo cual se obtienen las siquientes expresiones para los coeficientes aq , ah , d, seg´ un (2.210): aq =
∂f =0 ∂q
ah =
∂f =1 ∂h
(2.219)
∂f =0 ∂t Las fuerzas aplicadas generalizadas ser´an: d=
∂~r Qν = −mg ˆi · ∂qν
(2.220)
con lo cual: Qh = −mg senωt ;
Qq = mg cos ωt
(2.221)
La energ´ıa cin´etica ser´a: ˙ + h˙ 2 ) ˙ t) = 1 m(q˙2 + q 2 ω 2 + h2 ω 2 − 2qhω ˙ + 2q hω T (q, q, ˙ h, h, 2
(2.222)
Entonces las ecuaciones (2.213) ser´an: ˙ − m(qω 2 + hω) ˙ m(¨ q − hω) = mg cos ωt
(2.223)
¨ + qω) m(h ˙ − m(hω 2 − qω) ˙ = −mg sen ωt + λ La ecuaci´ on (2.214) ser´a: h˙ = 0 ⇒ h = h0
(2.224)
Reemplazando (2.224) en (2.223) obtenemos: q¨ − qω 2 = g cos ωt
(2.225)
λ = 2qω ˙ − hω 2 + g senωt m La soluci´on de las ecuaciones (2.225) de acuerdo con (2.224) ser´a: g (cosh ωt − cos ωt) q = 2ω 2 λ
= mg(senhωt + 2senωt) − mhω
(2.226)
2
Las fuerzas generalizadas de ligadura ser´an, de (2.226) y (2.215): Rh = mg(senhωt + 2senωt) − mhω 2 ;
Rq = 0
en completo acuerdo con los resultados de (2.208).
(2.227)
Ecuaciones generales de la est´ atica y la din´amica / 49 Ejemplo 2.8.2 Sea un disco de radio R que rueda sobre un plano inclinado con el plano del disco perpendicular al plano inclinado (podr´ıa ser una de las ruedas de un carro). Hallar y resolver las ecuaciones de movimiento. Tomaremos el plano xy en el plano inclinado, con lo cual se tendr´a una configuraci´on como en la figura 2.1. Las coordenadas del sistema ser´an: xCM , yCM , α, φ, que tomamos como coordenadas genaralizadas no independientes. De las ecuaciones de ligadura, no hol´ onomas dadas por las ecuaciones (2.9): x˙ − R senα φ˙ = 0
(2.228)
y˙ + R cos α φ˙ = 0 obtenemos las siquientes expresiones para los coeficientes aαν que aparecen en (2.214): a1x = 1
a1y = 0
a1α = 0
a1φ = −R senα
a2x = 0
a2y = 1
a2α = 0
a2φ = R cos α
(2.229)
Los momentos de inercia de un disco alrededor de su eje y alrededor de un di´ametro son respectivamente: 1 1 mR2 ; Iα = mR2 (2.230) 2 4 La energ´ıa cin´etica contendr´a una parte debida al movimiento del centro de masa y otra debida al movimiento respecto al centro de masa:2 Iφ =
1 1 1 m(x˙ 2 + y˙ 2 ) + mR2 φ˙ 2 + mR2 α˙ 2 (2.231) 2 4 8 Tomaremos los ejes xy de modo que el eje x est´e horizontal y el eje y haciendo un ´angulo β con la horizontal. Las fuerzas generalizadas ser´an entonces: T =
(a)
Q(a) α = Qφ = 0 ;
Q(a) x = 0;
Q(a) y = mg senβ
(2.232)
Usando las ecuaciones (2.229), (2.231) y (2.232), las ecuaciones (2.213) se transforman en: m¨ x = µ1 m¨ y = mg senβ + µ2 1 2 R m¨ α= 0 4
(2.233)
1 2 ¨ R mφ = −µ1 R senα + µ2 R cos α 2 La tercera de las ecuaciones (2.233) nos da: α = ωα t + α0 2 Para
una justificaci´ on rigurosa de (2.231) ver secci´ on 8.3.
(2.234)
50 / Mec´ anica cl´ asica avanzada Las dos primeras ecuaciones (2.233) junto con las (2.228) nos dan las siguientes expresiones para µ1 y µ2 en t´erminos de φ: µ1 = mRωα cos(ωα t + α0 ) φ˙ + mR cos(ωα t + α0 ) φ¨ (2.235) µ2 = mRωα sen(ωα t + α0 ) φ˙ − mR cos(ωα t + α0 )φ¨ − mg sen β
Ahora, reemplazando a µ1 y µ2 en la u ´ltima de las (2.233) obtenemos: 2 g φ¨ = − senβ cos(ωα t + α0 ) 3 R que al ser integrada nos da: 2g senβ cos(ωα t + α0 ) + At + B φ= 3Rωα2 ˙ = 0, (2.237) ser´a: Tomando la condici´on inicial φ(0) = 0 y φ(0) 2g senβ[cos(ωα t + α0 ) − cosα0 + ωt senα0 ] φ= 3Rωα2
(2.236)
(2.237)
(2.238)
Tomando adem´as a α0 = 0, lo que equivale a tomar en t=0 a α = 0, obtenemos: α
= ωα t
φ
=−
µ1 µ2
2gsenβ ωt sen2 3Rωα2 2
2 = − mg senβsen2ωα t 3 2 = −mgβ 1 − cos 2ωα t 3
x
g senβ =− 3ωα2
y
=
(2.239)
1 ωα t − sen2ωα t 2
gsenβ sen2 ωα t 3ωα2
Donde hemos tomado que x = 0, y = 0, x˙ = 0, y˙ = 0 en t = 0. Las fuerzas de reacci´on de las ligaduras ser´an, usando (2.215): Rx = µ1 Ry = µ2 Rα = 0 Rφ = −µ1 R senωα t + µ2 R cos ωα t 1 = − mgR senβ cos ωα t 3
(2.240)
Ecuaciones generales de la est´ atica y la din´amica / 51 Si se deja la rueda inicialmente alineada en el eje y, se tiene que ωα = 0, con lo cual: α=
0
φ=
−
x=
0
y=
1 gsenβ t2 3
g senβ 2 t 3R
Rx =
0
Ry =
1 − mg senβ 3
Rα =
0
(2.241)
1 − mgR senβ 3
R=
Si en vez de un disco se tuviera una masa que baja sin rozamiento a lo largo del eje y, la fuerza a lo largo del plano ser´ıa mg senβ. En este caso se tiene que el plano ejerce sobre la rueda una fuerza en y dada por (−1/3)mg senβ y que la hace rodar hacia abajo en la direcci´ on de y positiva. Rφ es el torque que produce la rotaci´on. La aceleraci´ on del centro de masa ser´a (2/3)g senβ con lo cual y = (1/3) senβ t2 y φ = (1/3)g senβ t2 /R. Ejemplo 2.8.3 Sean dos part´ıculas de masas m1 = m2 = 1 unidas por una varilla r´ıgida de longitud l, sin masa. El sistema de alguna manera est´ a constre˜ nido a moverse en un plano vertical, de modo que la velocidad del centro de masa siempre est´ a en la direcci´ on de la varilla (v´ease figura 2.12). Hallar y resolver las ecuaciones de movimiento.
x r1 r r2
1 · α
g
2 y Figura 2.12 Part´ıculas de masas m1 = m2 = 1 unidas por una varilla r´ıgida y constre˜nidas a moverse en un plano vertical
52 / Mec´ anica cl´ asica avanzada La ligadura hol´ onoma es: |~r1 − ~r2 | = l
(2.242)
La ligadura no hol´ onoma es: x˙ = tan α y˙
(2.243)
Escogemos como coordenadas generalizadas no independientes a x, y y α. Definimos el vector ~l como: ~l = ~r1 − ~r2
(2.244)
con magnitud l y direcci´ on α. Las ecuaciones de transformaci´ on de coordenadas son: ~r1 = ~r +
~l 2
(2.245)
~l ~r2 = ~r − 2 La energ´ıa cin´etica se puede escribir como: 1 T = x˙ 2 + y˙ 2 + l2 α˙ 2 4
(2.246)
Los coeficientes en la ecuaci´ on de ligadura no hol´ onoma son: ax = − tan α ;
ay = 1 ;
aα = 0
(2.247)
La fuerza aplicada generalizada es: Qx = 0 ;
Qy = 2g ;
Qα = 0
(2.248)
Las ecuaciones de Lagrange, (2.213), ser´an: 2¨ x=
−µ tan α
2¨ y − 2g =
µ
1 2 l α ¨= 2
0
(2.249)
Para α se halla: α = ωt + δ
(2.250)
x, y y µ se hallan de las ecuaciones: 2¨ x=
−µ tan(ωt + δ)
2¨ y=
2g + µ
y˙ − x˙ tan(ωt + δ) =
0
(2.251)
Ecuaciones generales de la est´ atica y la din´amica / 53 x˙ obedece la ecuaci´ on diferencial: 2¨ x + 2xω ˙ tan α = g sen2α
(2.252)
Esta es una ecuaci´ on diferencial lineal de primer orden en x˙ cuya soluci´on general est´ a dada por una f´ ormula est´ andar. La soluci´on para x˙ es: x˙ = −
g (1 + cos 2α) + A cos α 2ω
(2.253)
Su integral nos da directamente: x=−
A g (2ωt + sen2α) + senα + B Aω 2 ω
(2.254)
donde A y B son constantes de integraci´ on. Para y y µ se halla: y=
A g cos 2α − cos α + C 2 4ω ω
µ = −2g(1 + cos 2α) + 2Aω cos α
(2.255) (2.256)
Las fuerzas de reacci´on de las ligaduras ser´an: Rx =
2g sen2α − 2Aω senα
Ry =
−4g cos 2α + 2Aω cos α
Rα =
0
(2.257)
Se sigue que si al sistema se aplica una fuerza dada por (2.257), se mover´a con la condici´on de ligadura (2.243). ω, δ, A, B, y C son constantes de integraci´ on que dependen de las condiciones iniciales.
54 / Mec´ anica cl´ asica avanzada
3 El principio de Hamilton y las ecuaciones de Lagrange 3.1.
Forma integral de la ecuaci´ on general de la din´ amica para un sistema hol´ onomo
Trayectorias variadas. La ecuaci´ on general de la din´amica, ecuaci´ on (2.141), es v´alida en cada instante t, ya que por definici´on los δ~ri se realizan instant´ aneamente alrededor de la posici´on real del sistema. La ecuaci´ on general de la din´amica es un “principio diferencial” que expresa la anulaci´ on del trabajo virtual de las fuerzas de ligadura en cada instante t, o equivalentemente en cada configuraci´on del sistema. Tomemos fijos t1 y t2 . Si en cada instante t, entre t1 y t2 , se realiza un desplazamiento virtual en las coordenadas de cada part´ıcula, δ~ri (t), y se impone la condici´on δ~ri (t1 ) = δ~ri (t2 ) = 0 se obtendr´ a que la secuencia de desplazamientos virtuales define una trayectoria diferente entre t1 y t2 . A esta trayectoria se le denomina “trayectoria variada” y la trayectoria seguida por el sistema se denomina “trayectoria real” (v´ease figura 3.1 ). La funci´ on del tiempo ~ri (t) determina la trayectoria real y la funci´ on ~ri (t) + δ~ri (t) determina la trayectoria variada. A la funci´ on δ~ri (t) se le denomina la “variaci´on” de la funci´ on ~ri (t). Tambi´en se suele llamar “trayectoria recta” a la real y “trayectoria circuitosa” a la variada (v´ease figura 3.1). ~ri (t) es una representaci´on param´etrica de la trayectoria con par´ ametro t. De acuerdo con los comentarios de la secci´ on 2.3, el conjunto de desplazamientos virtuales en un tiempo t puede asociarse a un “ensamble” muy grande de sistemas. Las trayectorias se forman uniendo un elemento de una “fila”, t, a un elemento de la “fila” t + dt, en forma de “zig-zag” en la matriz bidimensional mencionada en la secci´ on 2.3; una trayectoria ser´a “recta”; todas las dem´ as ser´an “circuitosas”. Si el trabajo virtual de las fuerzas de ligadura es cero en cada instante t: N X i=1
~ i (t) · δ~ri (t) = 0, R
(3.1)
tambi´en ser´a cero el promedio de los trabajos virtuales realizados por las fuerzas de 55
56 / Mec´ anica cl´ asica avanzada z Trayectoria variada
2
δri mi 1 Trayectoria real ri y x
Figura 3.1 Representaci´on de trayectorias en desplazamientos virtuales
ligadura entre t1 y t2 : 1 t2 − t1
Z
N t2 X
t1
i=1
~ i (t) · δ~ri (t)dt = 0 R
(3.2)
Como consecuencia de lo anterior, la ecuaci´ on general de la din´amica toma la forma: Z
N h t2 X
t1
i=1
i (a) F~i (t) − mi~¨r i (t) · δ~ri (t)dt = 0
(3.3)
Esta es una expresi´on integral, en t´erminos ya no de desplazamientos virtuales sino de variaciones globales de las trayectorias de las part´ıculas. Transformando la ecuaci´ on (3.3) llegaremos a una expresi´on completamente equivalente a la ecuaci´ on general de la din´ amica y por lo tanto a las ecuaciones de Lagrange de la primera y de la segunda clase, para sistema hol´ onomos. Cada punto de la trayectoria variada se puede obtener de un punto de la trayectoria real, para cada una de las part´ıculas, por medio de un desplazamiento virtual. Como consecuencia de esto, tanto la trayectoria real como la variada han de ser compatibles con las condiciones de ligadura. En cada instante t podemos escribir los δ~ri como: δ~ri (t) = ~ri v (t) − ~ri r (t)
(3.4)
donde v denota “variada” y r “real”. Se impone la condici´on de que las variaciones se anulen en t1 y en t2 para cada part´ıcula. Es decir que ~riv (t) = ~rir (t) en t = t1 y t = t2 para i = 1, 2, ...N .
El principio de Hamilton y las ecuaciones de Lagrange / 57 La integral de acci´ on. Es la integral (3.3) haciendo algunas transformaciones. En la ecuaci´ on (3.3) hacemos la siguiente transformaci´ on: d ˙ d mi~¨r i · δ~ri = mi~ri · δ~ri − mi~r˙ i · (δ~ri ) (3.5) dt dt Notando que las operaciones δ y d/dt conmutan:
d d (δ~ri ) = [~ri v (t) − ~ri r (t)] = ~r˙ i v − ~r˙ i r = δ~r˙ i dt dt
(3.6)
podemos escribir a (3.5) en la forma: 1 2 d ˙ mi~ri · δ~ri − mi δ~r˙ i mi~¨r i · δ~ri = dt 2
(3.7)
Con lo cual se tiene que:
N X
N X
d mi~¨r i · δ~ri = dt i=1
i=1
mi~r˙ i · δ~ri
!
−δ
N X 1 i=1
2
2
mi~r˙ i
Por tanto la ecuaci´ on (3.3) tomar´a la forma: # " ! Z t2 X N N N X 2 d X ˙ (a) ˙ ~ mi~ri dt = 0 Fi · δ~ri − mi~ri · δ~ri + δ dt i=1 t1 i=1 i=1
(3.8)
(3.9)
Notamos que en (3.9) aparecen el trabajo virtual de las fuerzas aplicadas, δA, y la energ´ıa cin´etica:1 N X
N
1 X ˙2 mi~ri 2 i=1
(3.10)
O sea que (3.9) se puede escribir como: t2 Z t2 N X ˙ mi~ri · δ r~i = 0 (δA + δT )dt − t1
(3.11)
δA =
i=1
(a) F~i · δ~ri ;
i=1
T =
t1
En virtud de la condici´on impuesta a los desplazamientos virtuales en t = t1 y t = t2 , el t´ermino integrado se anula con lo cual (3.11) queda finalmente: Z t2 (δA + δT )dt = 0 (3.12) t1
Podr´ıa pensarse que la presencia de condiciones de ligadura har´ıa que δ~ri (t1 ) = δ~ri (t2 ) = 0 no es posible imponerla para todas las coordenadas sino s´olo para las independientes, quedando la posibilidad de que no se cumpla para las coordenadas dependientes. 1 Como para pasar de r a r +δ~ ri se requiere realizar un trabajo, la energ´ıa en cada trayectoria variada i i es diferente. Esto caracteriza al principio de Hamilton, a diferencia de otros principios variacionales como el de “m´ınima acci´ on” (v´ ease secci´ on 9.3).
58 / Mec´ anica cl´ asica avanzada Sin embargo este no es el caso, pues de una transformaci´ on a coordenadas generalizadas independientes q1 , q2 , ...ql se sigue que: δ~ri =
l X ∂~ri δqν ∂qν ν=1
(3.13)
Basta pues que se imponga la condici´on siguiente sobre los desplazamientos virtuales de las coordenadas generalizadas: δqν (t1 ) = δqν (t2 ) = 0 ;
ν = 1, 2, ...l
(3.14)
para que se satisfaga la condici´on requerida para los desplazamientos virtuales δ~ri . En el caso particular en que las fuerzas aplicadas se pueden obtener como el gradiente de una funci´ on de las coordenadas y del tiempo, V (~r, t) vemos que: δV (~r, t) =
N X ∂V i=1
∂~ri
.δ~ri = −
N X i=1
(a) F~i .δ~ri = −δA
(3.15)
Para este caso la ecuaci´ on (3.12) toma la forma: Z t2 Z t2 Z t2 L dt = 0 δL dt = δ δ(T − V )dt = t1
t1
(3.16)
t1
donde el segundo signo igual en (3.16) est´ a justificado por lo siguiente: Z t2 Z t2 Z t2 Z t2 Z t2 r v v r L dt L dt = δ L dt − (L − L )dt = δL dt = t1
t1
t1
t1
(3.17)
t1
Por medio de las transformaciones a coordenadas independientes se ve que T es funci´ on de (q), (q), ˙ t, y V es funci´ on de (q) y t, con lo cual (3.16) se puede escribir como: Z t2 L(q, q, ˙ t)dt = 0 (3.18) δS = δ t1
Esta ecuaci´ on es equivalente a la ecuaci´ on general de la din´amica y de ella se pueden obtener tambi´en las ecuaciones de Lagrange usando el c´ alculo variacional. A la integral S se la denomina integral de acci´ on
3.2.
El principio de Hamilton
Es posible el desarrollo formal de la mec´anica tomando la ecuaci´ on (3.12) como postulado fundamental en vez de partir del principio de D’Alembert, ecuaci´ on (2.141). En este formalismo se denomina al contenido de la ecuaci´ on (3.18), el principio de Hamilton. El principio de Hamilton para sistemas con fuerzas aplicadas derivables de un potencial. El movimiento del sistema, descrito por las coordenadas generalizadas qν (t), es tal que entre dos instantes t1 y t2 se satisface: Z t2 L(q1 , q2 , ...ql ; q˙1 , q˙2 , ...q˙l ; t)dt = 0 (3.19) δ t1
El principio de Hamilton y las ecuaciones de Lagrange / 59 Este es un principio variacional, formulado por W. Hamilton en 1835. Matem´ aticamente (3.19) es la condici´on para que la acci´on S sea una extremal. S es una funcional de la trayectoria q(t). En an´alisis de funciones, se tiene que si F (x1 , x2 , ...xn ) es una funci´ on de muchas variables, F tendr´a un valor extremal, m´aximo o m´ınimo, si al realizar un cambio infinitesimal en las variables F no cambia al primer orden en dichos cambios infinitesimales. Es decir si: F (x1 + δx1 , x2 + δx2 , ...xn + δxn ) − F (x1 , x2 , ...xn )
(3.20)
= δF (x1 , x2 , ...xn ) entonces: δF (x1 , x2 , ...xn ) =
N X ∂F δxi + 0(δx2i ) = 0 ∂x i i=1
(3.21)
Se sigue que F (x1 , x2 , ...xn ) ser´a extremal para aquellos valores de x1 , x2 , ...xn que hacen que se anulen todas las derivadas parciales de primer orden de F : ∂F =0 ∂xi
i = 1, 2, ...n
(3.22)
En el an´alisis de funciones F (x1 , x2 , ...xn ) es un n´ umero que se asocia al conjunto de n´ umeros x1 , x2 , ...xn . Al cambiar los n´ umeros x1 , x2 , ...xn cambia el n´ umero F . Se dice que F es extremal si no cambia al primer orden en δxi cuando los xi se cambian por xi + δxi . 2 En el an´alisis funcional I [f1 (x), f2 (x), ...fn (x)] es un n´ umero que se asocia al conjunto de funciones f1 (x), f2 (x), ...fn (x). Al cambiar las funciones f1 (x), f2 (x), ...fn (x) cambia el n´ umero I. Se dice que I es extremal si no cambia al primer orden en δfi (x) cuando las funciones fi (x) se cambian por las funciones fi (x) + δfi (x). A δfi (x) se le denomina variaci´ on de la funci´ on fi (x). Toda funci´ on continua en un punto x0 puede expandirse en serie de Taylor alrededor de x0 : fi (x) =
∞ X 1 (k) f (x0 )(x − x0 )k k! i
(3.23)
k=0 (k)
on fi (x) en x = x0 y donde fi (x0 ) denota el valor de la derivada k-´esima de la funci´ (n) (0) ametros fi (x0 ) para k = 0, 1, 2, ...∞ se obtiene una fi (x0 ) ≡ fi (x0 ). Variando los par´ funci´ on diferente. S es una funcional de qν (t), pues a cada posible soluci´on q1 (t), q2 (t), ...ql (t) le corresponde un valor definido a la integral de acci´on S. El principio de Hamilton dice que al variar las funciones qν (t) se obtiene el conjunto de funciones verdaderas que describen la evoluci´ on del sistema por hallar qu´e conjunto es el que hace que S sea una extremal. Para la mayor´ıa de las situaciones f´ısicas se encuentra que S es m´ınima para 2 El m´ aximo o m´ınimo de una funci´ on se halla resolviendo el sistema de ecuaciones algebraicas (3.22), como en la est´ atica. Los extremales de una funcional se hallan resolviendo un sistema de ecuaciones diferenciales, como en la din´ amica.
60 / Mec´ anica cl´ asica avanzada la soluci´on correcta. En otras palabras, S tiene un valor m´ınimo cuando las funciones qν (t) describen las trayectorias reales.3 El n´ umero S asignado a cualquier trayectoria variada es mayor que el n´ umero S asociado a la trayectoria real. Ejemplo 3.2.1 Ilustrar el principio de Hamilton con el problema del tiro parab´olico en presencia del campo gravitacional (v´ease figura 3.2). Sabemos que la trayectoria real est´ a descrita por: 1 2 gt 2 Eliminando el par´ ametro t se obtiene que la trayectoria es parab´olica: g 2 x y= 2Vx2 x(t) = Vx t ;
y(t) =
(3.24)
(3.25)
Esta trayectoria pasa por el punto (x = 0, y = 0) en t = 0 y por el punto (x2 , y2 = gx22 /(2Vx2 )) en t = t2 (v´ease figura 3.2). La siguiente trayectoria variada pasa por los mismos puntos que la trayectoria real en t = t1 = 0 y t = t2 : x = Vx t y = y2
(3.26)
ex/x2 − 1 e−1
Se trata de mostrar que la integral de acci´on tiene menor valor para la trayectoria real que para esta trayectoria variada. El lagrangiano del problema es: 1 m(x˙ 2 + y˙ 2 ) + mgy 2 Sobre la trayectoria real L es: L=
1 m(Vx2 + g 2 t2 ) + 2 La integral de acci´on es: Z t2 1 L dt = mVx2 t2 + 2 0 L=
(3.27)
1 1 mg 2 t2 = mVx2 + mg 2 t2 2 2
(3.28)
1 1 x2y2 mg 2 t32 = mVx x2 + 0, 666 mg 3 2 Vx
(3.29)
Sobre la trayectoria variada: x˙ = Vx ;
y˙
y2 Vx eVx t/x x2 (e − 1)
Con lo cual L es: 1 mgy2 Vx t/x2 y22 Vx2 2Vx t/x2 L = m Vx2 + + e − 1) (e 2 2 2 (e − 1) x2 e−1 3 De
(3.30)
(3.31)
acuerdo con el principio de D’Alembert esto equivale a decir que las posiciones verdaderas son de “equilibrio” estable.
El principio de Hamilton y las ecuaciones de Lagrange / 61
P1
x
P2 (x2,y2) g
y
Figura 3.2 Trayectoria parab´ olica en presencia de un campo gravitacional. Trayectoria variada.
La integral de acci´on es: Z
t2
L dt =
0
1 81e − 60 mgx2 y2 mVx x2 + 2 72(e − 1) Vx
(3.32)
mgx2 y2 1 = mVx x2 + 0,689 2 Vx Vemos que la acci´on en la trayectoria real es menor que la acci´on en la trayectoria variada. Cuando no se conoce la trayectoria, es decir cuando no se ha resuelto el problema, el principio de Hamilton directamente no proporciona un m´etodo pr´actico: se requiere un m´etodo de ensayo y error; suponer una soluci´on y evaluar S; obtener una “tabla” de soluciones posibles en funci´ on de la acci´on. La soluci´on correcta ser´ıa aquella para la cual S es m´ınima. Ejemplo 3.2.2 Resolver el problema del oscilador arm´onico lineal usando directamente el principio de Hamilton, con las siguientes condiciones en t = 0 y t = t1 : x(0) = 0 ,
x(t1 ) = x1 ,
x(0) ˙ = v0
(3.33)
62 / Mec´ anica cl´ asica avanzada Las posibles funciones de t las asumiremos de la forma: ∞ X x(t) = a n tn
(3.34)
n=0
O sea que a cada conjunto de par´ ametros a0 , a1 , a2 , ...a∞ le corresponder´a una soluci´on.4 El conjunto de par´ ametros que determina la soluci´on real es aquel para el cual δS = 0. De la condici´on x(0) = 0 se sigue que a0 = 0, con lo cual: ∞ X a n tn (3.35) x(t) = n=1
El lagrangiano para el oscilador arm´onico unidimensional es: 1 1 L = µx˙ 2 − kx2 2 2 Reemplazando (3.35) en (3.36) obtenemos: ∞ ∞ ∞ ∞ 1 XX 1 XX L= µ nman am tn+m−2 − k an am tn+m 2 n=1 m=1 2 n=1 m=1 Con lo cual la integral de acci´on ser´a: Z t1 L dt = S=
(3.36)
(3.37)
0
∞ ∞ nm 1 1XX n+m−1 n+m+1 t t −k an am µ 2 n=1 m=1 n+m−1 1 n+m+1 1
La condici´on δS = 0 nos da: "∞ # ∞ X X nm 1 am µ tn+m−1 − k tn+m+1 δan = 0 n+m−1 1 n+m+1 1 n=1 m=1
(3.38)
(3.39)
En la ecuaci´ on (3.39) los δan son los cambios de los coeficientes an que dar´ an lugar a la variaci´ on δx(t). Los δan no son independientes, pues se debe adem´as cumplir la condici´on δx(t1 ) = 0: n X δx(t1 ) = δan tn1 = 0 (3.40) n=1
En virtud de (3.40) un δan puede expresarse en t´erminos de los dem´ as. Vamos a introducir un multiplicador indeterminado λ multiplicando la ecuaci´ on (3.40) por λ y el resultado lo sumamos a la ecuaci´ on (3.39) para obtener: " ∞ ∞ X X mn µ t1n+m−1 n + m − 1 n=1 m=1 (3.41) 1 tn+m+1 am + λtn1 δan = 0 −k n+m+1 1 4 La
ecuaci´ on (3.34) constituye una representaci´ on multiparam´ etrica de la trayectoria en el espacio de configuraci´ on.
El principio de Hamilton y las ecuaciones de Lagrange / 63 Ahora escogemos a λ de modo que se anule el coeficiente de δa1 : ∞ X 1 m+2 µtm − k am + λt1 = 0 t 1 m+2 1 m=1
(3.42)
En la ecuaci´ on (3.41) quedar´a una combinaci´ on lineal de los δa2 , δa3 , ...δa∞ , igualada a cero. Como estas cantidades son ahora independientes, se debe cumplir que sus coeficientes se anulen. Igualando a cero los coeficientes de δa2 , δa3 , ...δa∞ y reemplazando el valor de λ que se obtiene de (3.42), llegamos a: ∞ X m−1 m 1 m+2 µ am = 0 (3.43) t +k t m+n−1 1 (m + 2)(m + n + 1) 1 m=1 De (3.43) se obtiene la siguiente relaci´on de recurrencia para coeficientes, por igualar a cero los coeficientes de las tm 1 : am = −
k 1 am−2 ; µ m(m − 1)
m = 2, 4, ...
(3.44)
Como a0 = 0, se sigue que: a0 = a2 = a4 = ... = 0
(3.45)
Los coeficientes impares se pueden expresar en t´erminos de a1 , que se determina de la condici´on x(0) ˙ = v0 : a1 = v0
(3.46)
Con lo cual se obtiene que: (m−1)/2 k (m−1)/2 1 v0 ; am = (−1) m! µ
m = 1, 3, ...
(3.47)
o tambi´en en la forma: a2n+1 = (−1)n
n k 1 v0 ; µ (2n + 1)!
n = 0, 1, 2, ...
(3.48)
Con lo cual x(t) ser´a: x(t) = v0
r
∞ 1 µX (−1)n k n=0 (2n + 1)!
Llamando ω = x(t) =
s !2n+1 k µ
p k/m llegamos a:
v0 sen(ωt) ω
Claramente el m´etodo es engorroso en problemas m´as complicados.
(3.49)
(3.50)
64 / Mec´ anica cl´ asica avanzada Deducci´ on de las ecuaciones de Lagrange a partir del principio de Hamilton generalizado. La ecuaci´ on (3.12) se denomina el principio de Hamilton generalizado. Es aplicable a cualquier sistema hol´ onomo independientemente de la naturaleza de las fuerzas aplicadas. Como T es una funci´ on de (q), (q), ˙ t, δT (q, q, ˙ t) =
l X ∂T
ν=1
∂T δqν + δ q˙ν ∂qν ∂ q˙
(3.51)
En tanto que δA puede escribirse en t´erminos de las fuerzas generalizadas Qν : δA =
N X i=1
(a) F~i · δ~ri =
l X
Qν δqν
(3.52)
ν=1
En δT podemos hacer la transformaci´ on siguiente: ∂T d ∂T ∂T d d ∂T δqν δ q˙ν = δqν − δqν = ∂ q˙ν ∂ q˙ dt dt ∂ q˙ν dt ∂ q˙ν
(3.53)
Reemplazando (3.51), (3.52) y (3.53) en la ecuaci´ on (3.12): Z t2 (δA + δT )dt = t1
l t1 X
Z
Qν δqν +
t1 ν=1
d ∂T − ∂qν dt
∂T ∂ q˙ν
δqν
dt
(3.54)
t2 δqν = 0 + ∂ q ˙ ν ν=1 l X ∂T
t1
La parte integrada en (3.54) es nula debido a que las δqν se anulan en t = tl y t = t2 , con lo cual se llega a: ) Z t1 (X l ∂T d ∂T (3.55) Qν + δqν dt = 0 − ∂qν dt ∂ q˙ν t1 ν=1 Como las δqν son arbitrarias, el integrando es una funci´ on arbitraria del tiempo; si la integral es cero, es necesario entonces que el integrando sea cero. Ahora queda una combinaci´ on lineal de las cantidades independientes δqν igualada a cero, l X ν=1
∂T d Qν + − ∂qν dt
∂T ∂ q˙ν
δqν = 0
Como las δqν son independientes, se debe cumplir tambi´en que: d ∂T ∂T = 0 ; ν = 1, 2, ...l − Qν + ∂qν dt ∂ q˙ν
(3.56)
(3.57)
El principio de Hamilton y las ecuaciones de Lagrange / 65 A estas ecuaciones no podr´ıamos haber llegado cuando el sistema es no hol´ onomo. Estas ecuaciones son las correspondientes ecuaciones en c´ alculo funcional a las ecuaciones (3.22) del c´ alculo de funciones, a las cuales se reducen en el caso est´ atico cuando las fuerzas son derivables de un potencial. Hemos llegado a las ecuaciones de Lagrange de la segunda clase a partir del principio de Hamilton. Supongamos que las fuerzas aplicadas se pueden descomponer en una parte derivable de un potencial monog´enico y otra no derivable de tal potencial. Se entiende por potencial monog´enico o potencial generalizado a una funci´ on de las coordenadas, las velocidades y el tiempo, a partir de la cual se pueden derivar todas las fuerzas monog´enicas del sistema, mediante las f´ ormulas: ∂V d ∂V (a) F~i = − + + F~i′ ; ∂~ri dt ∂~r˙ i
i = 1, 2, ...N
(3.58)
Las fuerzas generalizadas correspondientes ser´an: Qν = −
d ∂V ∂V + + fν ; ∂qν dt ∂ q˙ν
ν = 1, 2, ...l
(3.59)
donde fν es la fuerza generalizada correspondiente a las fuerzas F~i′ . Es posible con este tipo de fuerzas definir una funci´ on lagrangiana asociada a las fuerzas derivables del potencial generalizado. fν contiene las fuerzas no incluidas en L. Las ecuaciones de Lagrange toman la forma: d ∂L ∂L − + fν = 0 ; ∂qν dt ∂ q˙ν
ν = 1, 2, ...l
(3.60)
donde L est´ a definido como: L(q, q, ˙ t) = T (q, q, ˙ t) − V (q, q, ˙ t)
(3.61)
El lagrangiano para N part´ıculas en un campo electromagn´ etico. Sea un sistema de part´ıculas cargadas en presencia de un campo electromagn´etico descrito por ~ r , t) y B(~ ~ r , t). La fuerza de interacci´ los campos E(~ on con la part´ıcula i es: ~ ri , t) + qi ~ri × B(~ ~ ri , t) F~i ~ri , ~r˙ i , t = qi E(~ (3.62) c
Los campos el´ectrico y magn´etico se pueden derivar de los potenciales escalar y ~ vectorial φ, A: ~ r , t) ∂φ(~r, t) 1 ∂ A(~ − ∂~r c ∂t
~ r , t) = E(~
−
~ r , t) = B(~
∂ ~ r , t) × A(~ ∂~r
Entonces F~i se puede escribir como: ∂φ(~ri , t) 1 ∂A(ri~, t) 1 ∂ ~ ri , t) F~i (~ri , ~r˙ i , t) = qi − − + r~i × × A(~ ∂~ri c ∂t c ∂~ri
(3.63)
(3.64)
66 / Mec´ anica cl´ asica avanzada Algunas manipulaciones con el rotacional nos llevan a:5 ~ ~ ∂ ~ ri , t) = ∂ ~r˙ i · A ~ i − dAi + ∂ Ai ~r˙ i × × A(~ ∂~ri ∂~ri dt ∂t
(3.65)
Con lo cual (3.63) se puede escribir como: F~i ~ri , ~r˙ i , t =
(3.66)
Como φ no depende de ~r˙ i : F~i ~ri , ~r˙ i , t =
(3.67)
∂ ∂ ˙ ~ 1 ~ ri , t) − 1 d qi − ~ri · A(~ri , t) φ(~ri , t) − ~r˙ i · A(~ ∂~ri c c dt ∂~r˙ i
qi
∂ − ∂~ri
1˙ 1 d ∂ 1˙ ~ φi − ~ri · Ai φi − ~ri · Ai + c c dt ∂~r˙ i c
Si se define la funci´ on V :
" # N X ˙i ~ r ~ ri , t) , qi φ(~ri , t) − · A(~ V ~r1 , ~r2 , ...~rN , ~r˙ 1 , ~r˙ 2 , ...~r˙ N , t = c i=1
(3.68)
las fuerzas de interacci´ on con el campo electromagn´etico se pueden derivar del potencial monogenico V : ∂V d ∂V F~i = − + ∂~ri dt ∂~r˙ i
(3.69)
Entonces el lagrangiano de un sistema de part´ıculas en un campo electromagn´etico puede escribirse como: " !# N X 1 ˙2 ~r˙ i ~ ˙ ˙ ˙ L(~r1 , ~r2 , ...~rN , ~r1 , ~r2 , ...~rN , t) = (3.70) mi~ri − qi φi − · Ai 2 c i=1 En este lagrangiano no est´ an incluidas las fuerzas de interacci´ on de las part´ıculas entre s´ı. Fuerzas viscosas. Son un tipo de fuerzas que no se pueden derivar de un potencial. Para muchos casos de inter´es se pueden escribir en la forma: F~i′ = −~k.~r˙ i
(3.71)
Se define la funci´ on de disipaci´on de Rayleigh como: N
5 Ver
1X F= kx x˙ 2i + ky y˙ i2 + kz z˙i2 2 i=1 el texto Mec´ anica cl´ asica de Goldstein, 1a ed, secci´ on 1.5. ¯
(3.72)
El principio de Hamilton y las ecuaciones de Lagrange / 67 Las fuerzas viscosas (3.71) se pueden obtener como el gradiente de velocidades de F:
∂F F~i = − ∂~r˙ i
(3.73)
La fuerza generalizada correspondiente ser´a: Fν =
N X i=1
Fi′ ·
N X ∂~ri ∂F ∂~r˙ i ∂F · =− =− ˙ i ∂ q˙ν ∂qν ∂ q˙ν ∂ ~ r i=1
(3.74)
Para el caso en que las fuerzas no potenciales sean todas viscosas, las ecuaciones de Lagrange toman la forma: ∂L ∂F d ∂L − + = 0; dt ∂ q˙ν ∂qν ∂ q˙ν
ν = 1, 2, ...l
(3.75)
de modo que deben darse dos funciones escalares, L y F , para obtener las ecuaciones de movimiento. Estas ser´an las ecuaciones a aplicarse en el caso de un sistema de osciladores amortiguados por ejemplo; L contiene las fuerzas de “resorte” y F las fuerzas disipativas.
3.3.
Algunas propiedades de la funci´ on lagrangiana
Aditividad de L. Si el sistema consta de dos partes, A y B, que no interact´ uan, entonces el lagrangiano del sistema se descompone en dos partes: L = LA + LB . Donde LA contiene s´olo las coordenadas y velocidades de la parte A y similarmente LB . Es el caso de dos part´ıculas que se mueven en presencia de un campo externo sin interactuar entre s´ı. Tambi´en en el caso de un sistema de part´ıculas que interact´ uan entre s´ı pero no con un campo externo, L se puede descomponer en una parte que contiene s´olo las coordenadas y velocidades del centro de masa y otra que s´olo contiene las coordenadas y velocidades de las part´ıculas respecto al centro de masa: no hay interacci´ on del movimiento del centro de masa con el movimiento respecto al centro de masa. Adici´ on a L de una derivada total respecto al tiempo de una funci´ on arbitraria. Sean dos funciones lagrangianas, que dependen de las mismas coordenadas y velocidades generalizadas, tales que difieren por una derivada total respecto al tiempo: L′ (q, q, ˙ t) = L(q, q, ˙ t) +
d f (g, t) dt
(3.76)
Las integrales de acci´on de L y de L′ tienen valores extremales simult´ aneamente: S ′ = S + f [q(t2 ), t2 ] − f [q(t1 ), t1 ]
(3.77)
Como δq(t2 ) = δq(t1 ) = 0 se sigue que δS ′ = δS = 0. Esto implica que L y L′ dan lugar a las mismas ecuaciones de movimiento; a este resultado se puede llegar de manera m´as convincente transformando las ecuaciones de Lagrange mismas.6 que eiS/¯h es el l´ımite cl´ asico de la funci´ on de onda Ψ. Entonces la arbitrariedad de f implica una arbitrariedad en la fase de Ψ. 6 Veremos
68 / Mec´ anica cl´ asica avanzada Ejemplo 3.3.1 Sea una part´ıcula libre, descrita en un sistema de referencia inercial O mediante el lagrangiano. L=
1 ˙2 m~r 2
(3.78)
Si se realiza una transformaci´ on de Galileo, a un nuevo sistema de referencia inercial O′ que se mueve respecto a O con velocidad constante V~ : ~ ~υ = ~υ ′ + V
(3.79)
Entonces el lagrangiano en el nuevo sistema de referencia inercial ser´a: 1 2 1 1 ~ +V ~2 (3.80) L′ = m~r˙ ′2 = m~r˙ + m −2~r · V 2 2 2 Los dos lagrangianos est´ an relacionados as´ı: d m ~ 2t L′ = L + −2~r · V~ + V (3.81) dt 2 A la funci´ on: m ~ +V ~ 2t −2~r · V (3.82) f (r, t) = 2 por razones que se ver´an m´as adelante, se le denomina “funci´on generadora de la transformaci´ on de Galileo”. Vemos que: m ~ − 2~r2 · V ~ +V ~ 2 t2 − ~υ 2 t1 S′ = S + (3.83) 2~r1 · V 2
y por tanto δS ′ = δS dado que δ~r = δ~r ′ = 0 en t = t1 y t = t2 .
3.4.
Simetr´ıas de la lagrangiana y teoremas de conservaci´ on
Simetr´ıa. Se dice que L posee una simetr´ıa cuando no cambia bajo una transformaci´ on de las coordenadas y del tiempo. Por ejemplo, sea una part´ıcula libre, cuyo lagrangiano est´e dado por (3.78). Se le realiza un desplazamiento de la part´ıcula por una cantidad arbitraria ~a, ~r → ~r + ~a
(3.84)
como ~a˙ = 0, se sique que L no cambia. Se dice que este lagrangiano es sim´etrico bajo translaciones. Veremos que esta simetr´ıa est´ a asociada a la conservaci´ on del momento lineal. Si se realiza una rotaci´on arbitraria de la part´ıcula, digamos alrededor del eje z por un ´ angulo α, x
→ x cos α + y senα
y
→ −x senα + y cos α
z
→ z
(3.85)
El principio de Hamilton y las ecuaciones de Lagrange / 69 y L no cambia, se dice que L es sim´etrico bajo rotaciones alrededor del eje z arbitrarias. Veremos que esta simetr´ıa est´ a asociada con la conservaci´ on del momento angular. Si se realiza una inversi´ on de las coordenadas, x, y, z → −x, −y, −z
(3.86)
y L no cambia, esto implica la conservaci´ on de la paridad: L es siempre par o impar en el transcurso del movimiento. Al aplicar un campo externo las simetr´ıas de L depender´an de las simetr´ıas del campo. Si el campo tiene menor simetr´ıa que el lagrangiano libre, el nuevo lagrangiano tendr´a la simetr´ıa del campo. Supongamos que se coloca una fuerza constante y uniforme en la direcci´ on z. L ahora ser´a: L=
1 ˙2 m~r + Fz z 2
(3.87)
Las simetr´ıas de L son alteradas. Bajo la transformaci´ on de translaci´ on espacial, (3.84): L → L + Fz az
(3.88)
L se altera a no ser que az sea cero. Ya no habr´ a simetr´ıa de translaci´ on a lo largo del eje z. Veremos que esto implica que s´olo son constantes las componentes x y y del momento lineal. L no cambia bajo rotaciones alrededor del eje z (a lo largo del cual act´ ua la fuerza), pero obviamente no tendr´a simetr´ıa de rotaci´on alrededor de ning´ un otro eje. Antes de aplicar la fuerza, L ten´ıa simetr´ıa de rotaci´on alrededor de cualquier eje (simetr´ıa esf´erica), ahora s´olo tiene simetr´ıa de rotaci´on en el eje z (simetr´ıa cil´ındrica). Esta simetr´ıa implica que s´olo se conserva la componente z del momento angular, en tanto que en ausencia del campo se conservan las tres componentes. En general, hay una relaci´on entre las simetr´ıas de L y las variables din´amicas que se conservan. Variables din´ amicas. A cualquier funci´ on del estado del sistema y del tiempo se le llama una variable din´ amica. Para un sistema con l grados de libertad las variables din´ amicas son de la forma Dα (q1 , q2 , ...ql , q˙1 , q˙2 , ...q˙l , t). Ejemplos de variables din´amicas son: ~ri ; P~ =
mi~r˙ i ; N X i=1
mi~r˙ i ;
~li = mi~ri × ~r˙ i ; ~ = L
N X i=1
mi~ri × ~r˙ i ;
(3.89) T =
N X 1 i=1
2
2 mi~r˙ i
(3.90)
Obviamente es posible definir un n´ umero infinito de variables din´amicas para un sistema dado, pero s´olo hay un n´ umero de variables din´amicas independientes igual al doble del n´ umero de grados de libertad. En efecto, s´olo es posible formar conjuntos de 2l funciones independientes de q1 , q2 , ... ql , q˙1 , q˙2 , ...q˙l , pero pueden definirse muchos conjuntos diferentes. En general las 2l variables din´amicas independientes de un sistema no son constantes de movimiento, aunque en principio siempre es posible encontrar un
70 / Mec´ anica cl´ asica avanzada conjunto de 2l constantes de movimiento, si el sistema es integrable. Constantes de movimiento. Las ecuaciones de Lagrange dan lugar a un sistema de l ecuaciones diferenciales acopladas de segundo orden con 2l inc´ ognitas, q1 , q2 , ...ql , q˙1 , q˙2 , ...q˙l , independientes entre s´ı. La soluci´on a las ecuaciones de movimiento contendr´a 2l constantes de integraci´ on arbitrarias que determinan los valores iniciales de (q) y (q). ˙ En el cap´ıtulo 1 se defini´o la especificaci´ on del estado del sistema mec´anico en un tiempo t por medio de los valores de las coordenadas y velocidades en ese instante. Ahora vemos que las constantes de integraci´ on determinan no s´olo el estado en el tiempo inicial, sino adem´as todos los estados subsiguientes. Con s´olo dar valores a t, para unos valores dados de las constantes de integraci´ on, se obtienen los valores correspondientes de las variables de estado. Las constantes de integraci´ on suministran una noci´on global de estado: se dice que a cada conjunto de valores de las constantes de integraci´ on le corresponde un estado de movimiento del sistema. El tiempo inicial, o comienzo del movimiento, siempre puede tomarse como una de las constantes de integraci´ on. La integraci´ on de las ecuaciones de movimiento dar´ a lugar a 2l funciones de la forma: qν = qν (c1 , c2 , ...c2l−1 , t + t0 ) (3.91) q˙ν = q˙ν (c1 , c2 , ...c2l−1 , t + t0 ) ;
ν = 1, 2, ...l
Podemos en principio invertir estas ecuaciones para expresar las 2l constantes de integraci´ on en funci´ on de (q), (q), ˙ t: t0 = −t + θ(q, q) ˙ ;
cα = cα (q, q) ˙ ;
α = 1, 2, ..,2l − 1
(3.92)
Por otra parte, con las 2l constantes de integraci´ on se puede obtener cualquier otro conjunto de 2l constantes independientes. En conclusi´ on, a cualquier sistema din´amico integrable se le pueden asociar 2l funciones de (q), (q) ˙ y t cuya derivada total respecto a t sea cero. Estas cantidades son variables din´amicas, o sea que para cada sistema mec´anico integrable siempre es posible hallar 2l constantes de movimiento independientes, o en otras palabras 2l variables din´amicas que se conservan, si es integrable. En mec´anica cu´antica se pueden encontrar a lo sumo l variables din´amicas que pueden tomar simult´ aneamente valores constantes. Se dice que para un sistema cu´antico de l grados de libertad hay s´olo l operadores herm´ıticos independientes que conmutan entre s´ı y que tienen estados propios con valores definidos de las correspondientes variables din´ amicas. Conservaci´ on de la energ´ıa. Se trata de mostrar que para aquellos sistemas en que L sea sim´etrica bajo el cambio del origen del tiempo hay una constante de movimiento que es la energ´ıa.7 Sea un sistema que cumple estas tres condiciones: (a) puede ser descrito completamente a partir de L, es decir, se puede definir una funci´ on V de la cual se obtienen todas las fuerzas; (b) el potencial no depende de las (q) ˙ ni de t; (c) el sistema es tal que L no depender´a expl´ıcitamente de t al introducir las coordenadas generalizadas y adem´as es escler´onomo. Mediante la condici´on (c) se garantiza que las 7 Veremos
que si L no cambia al cambiar E, ∂L/∂E = 0, entonces t0 se conserva. Se dice que t0 y E son dos cantidades can´ onicamente conjugadas.
El principio de Hamilton y las ecuaciones de Lagrange / 71 ligaduras no realizan trabajo sobre el sistema, entonces para tal sistema se cumple que L es sim´etrica bajo el cambio de origen del tiempo: ∂L ∂L =0 ⇒ =0 ∂t0 ∂t
(3.93)
La derivada total de L respecto al tiempo es: l ∂L ∂L dL X ∂L q˙ν + q¨ν + = dt ∂qν ∂ q˙ν ∂t i=1
(3.94)
De las ecuaciones de Lagrange se tiene que: ∂L d ∂L = − fν ∂qν dt ∂ q˙ν
(3.95)
Con lo cual (3.94) toma la forma: l ∂L dL X d ∂L q˙ν − fν q˙ν + = dt dt ∂ q˙ν ∂t ν=1
(3.96)
O sea que se cumple: dL dt
l X ∂L q˙ν − L ∂ q˙ν ν=1
!
=
l X
ν=1
fν q˙ν −
∂L ∂t
(3.97)
La cantidad entre par´entesis se llama la funci´ on energ´ıa, denotada h(q, q, ˙ t) con lo cual: ˙ q, h(q, ˙ t) =
l X
ν=1
fν q˙ν −
∂L ∂t
(3.98)
De las condiciones (a) y (c) y del hecho de que V no depende de t se sigue que fν = 0 y ∂L/∂t = 0, con lo cual: h(q, q, ˙ t) = constante
(3.99)
Esta constante se llama “energ´ıa” o “constante de Jacobi”. La funci´ on h es igual al hamiltoniano H. La diferencia es que ´este se define como una funci´ on de (q), (p), t y aquella es funci´ on de (q), (q) ˙ y t. Veremos que si adem´as se cumple que V no depende de las (q), ˙ h coincide con la energ´ıa total T +V . (a) implica que el sistema es hol´ onomo. Teorema de Euler acerca de las funciones homog´ eneas. Sea una funci´ on f de n variables: f (x1 , x2 , ...xn ) tal que: F (λx1 , λx2 , ...λxn ) = λr F (x1 , x2 , ...xn )
(3.100)
Se dice que F es una funci´ on hom´ ogenea de grado r. El teorema dice que: N X i=1
xi
∂F = rF ∂xi
(3.101)
72 / Mec´ anica cl´ asica avanzada La prueba es la siguiente: derivando ambos lados en (3.101) respecto a λ, d F (λx1 , λx2 , ...λxN ) = rλn−1 F (x1 , x2 , ...xn ) dλ
(3.102)
la derivada del lado izquierdo es: n
X ∂F (λx1 , λx2 , ...λxN ) ∂(λxi ) d F (λx1 , λx2 , ...λxN ) = dλ ∂(λxi ) ∂λ i=1
(3.103)
Se sigue entonces que: n X ∂F (λx1 , λx2 , ...λxN )
∂(λxi )
i=1
xi = λn−1 rF (x1 , x2 , ...xn )
(3.104)
Haciendo ahora λ = 1 se obtiene la igualdad (3.101). Teorema acerca de la energ´ıa cin´ etica de un sistema escler´ onomo. Si el sistema es descrito mediante coordenadas generalizadas, en virtud de la ecuaci´ on (2.176) la energ´ıa cin´etica puede escribirse como: N
T =
1 X ˙2 mi~ri = 2 i=1
" l l 2 # l N X X ∂~ri ∂~ri X ∂~ri ∂~ri ∂~ri 1X mi · q˙ν q˙µ + 2 · q˙ν + 2 i=1 ∂qν ∂qµ ∂qν ∂t ∂t ν=1 µ=1 ν=1
(3.105)
Como ~ri es funci´ on (q) y t, se sigue que T en coordenadas generalizadas toma la forma: T (q, q, ˙ t) =
l X l X
Aνµ (q, t)q˙ν q˙µ +
ν=1 µ=1
l X
Aν (q, t)q˙ν + A(q, t)
(3.106)
ν=1
O sea que T se puede escribir como la suma de tres funciones homog´eneas de las velocidades generalizadas de grados 2, 1 y 0: T = T2 + T1 + T0
(3.107)
Se sigue que para un sistema escler´onomo (∂~ri /∂t = 0) T (q, q, ˙ t) = T2 (q, q, ˙ t) =
l X l X
Aνµ (q, t)q˙ν q˙µ
(3.108)
ν=1 µ=1
Es decir, que la energ´ıa cin´etica es una funci´ on homog´enea cuadr´atica en las velocidades. La funci´ on Aνµ (q, t) es sim´etrica: Aνµ (q, t) = Aµν (q, t)
(3.109)
El principio de Hamilton y las ecuaciones de Lagrange / 73 En virtud del teorema de Euler acerca de las funciones homog´eneas se sigue que para un sistema escler´ onomo: l X ∂T q˙ν = 2T ∂ q˙ν ν=1
(3.110)
Conservaci´ on de la energ´ıa total T + V. Si se cumple (b), como L = T − V se sigue que: ∂L ∂T = ∂ q˙ν ∂ q˙ν
(3.111)
Entonces h tomar´a la forma, en virtud de (3.110) y (3.111): h(q, q, ˙ t) =
l X ∂T q˙ν − T + V = T + V ∂ q˙ν ν=1
(3.112)
En este caso h coincide con la energ´ıa total. Las fuerzas que son derivables de un potencial que no depende de las velocidades ni del tiempo se llaman fuerzas conservativas. Si V depende de las (q) ˙ cumpli´endose las otras condiciones, h es una constante de movimiento pero no es la energ´ıa total. Si se cumple (c) y que V no dependa de las (q), ˙ ser´a cierto que h = T + V , pero h no ser´a una constante de movimiento. En este caso: l
X dE ∂L dh = = fν q˙ν − dt dt ∂t ν=1
(3.113)
donde la dependencia que tiene L de t puede provenir s´olo de que V dependa del tiempo. Si las fuerzas fν son viscosas y se pueden obtener de la funci´ on de disipaci´on de Rayleigh, que es una funci´ on homog´enea cuadr´atica de las velocidades, en virtud de las ecuaciones (3.72), (3.74) y (3.101), se sigue que: l X
ν=1
fν q˙ν = −
l X ∂F q˙ν = −2F ∂ q˙ν ν=1
(3.114)
En este caso (3.113) ser´a: ∂L dh = −2F − dt ∂t
o
∂E ∂V = −2F + ∂t ∂t
(3.115)
En (3.115) resulta claro que la rata de cambio de la energ´ıa total consta de la rata de disipaci´on de energ´ıa 2F y de la rata de suministro de energ´ıa debida a la variaci´on temporal de V . Ejemplo 3.4.1 Hallar la constante de Jacobi y la rata de cambio de la energ´ıa total para una part´ıcula cargada en presencia de un campo electromagn´etico.
74 / Mec´ anica cl´ asica avanzada De acuerdo con la ecuaci´ on (3.70): L=
1 ˙2 q ~ m~r − qφ + ~r˙ · A 2 c
(3.116)
La funci´ on energ´ıa ser´a: h=
∂L ˙ 1 2 · ~r − L = m~r˙ + qφ 2 ∂~r˙
(3.117)
Se ve que h no es la energ´ıa total E = T + V , lo cual es consecuencia de que V dependa de la velocidad, h incluye s´olo la energ´ıa potencial el´ectrica. En virtud de (3.98) h ser´a: ~ ∂L ∂V ∂φ q ˙ ∂ A h˙ = − = =q − ~r · ∂t ∂t ∂t c ∂t
(3.118)
O sea que en general h ser´a constante de movimiento s´olo si los campos no dependen ~ tengan una forma tal que h sea del tiempo, adem´as del caso particular en que φ y A cero, como: q ~ E = h − ~r˙ · A c Se sigue que para un campo electromagn´etico est´ atico: q d ~ − ~r˙ · A E˙ = dt c
(3.119)
(3.120)
Es decir, E no se conserva porque el potencial magn´etico no es constante. Si se ~ sea uniforme, A ~ se puede aplica el campo electromagn´etico constante de modo que B escribir en la forma: ~ = 1B ~ × ~r A 2
(3.121)
~ es uniforme. En este caso el potencial magn´etico ser´a: que satisface a (3.63) si B q ~ · (~r × ~r˙ ) = − q B ~ · ~l ~ = − q ~r˙ · (B ~ × ~r) = − q B − ~r˙ · A c 2c 2c 2mc
(3.122)
donde ~l es el momento angular de la part´ıcula. Entonces (3.120) y (3.122) nos dan: qB ˙ q ~ ~˙ B·l = − lB E˙ = − 2mc 2mc
(3.123)
~ lo lB se conserva si L es sim´etrico bajo rotaciones alrededor del eje determinado por B, cual en general no se cumplir´ a; para ello basta que φ tenga simetr´ıa cil´ındrica alrededor ~ de B. Ejemplo 3.4.2 Una part´ıcula est´ a sometida al efecto de la gravedad y a la condici´on de ligadura de moverse siempre sobre un alambre circular de radio a. El alambre rota uniformemente con velocidad angular ω alrededor de un eje vertical en el plano del alambre que pasa por el centro. Calcular h y E˙ y analizar su significado.
El principio de Hamilton y las ecuaciones de Lagrange / 75 El problema tiene un grado de libertad. Tomemos el eje z en la direcci´ on de la fuerza de gravedad, coincidiendo con el eje de rotaci´on. Definamos un sistema de ejes que rotan solidariamente con el alambre as´ı: el eje z ′ en la direcci´ on de la fuerza de gravedad, coincidiendo con el eje de rotaci´on; el eje y ′ en el plano del alambre; y el eje x′ perpendicular al alambre en el centro. Las f´ormulas que expresan a x, y y z en t´erminos de x′ , y ′ y z ′ son: x = x′ cos ωt − y ′ senωt ;
y = x′ senωt + y ′ cos ωt ;
z = z′
(3.124)
Tomemos como coordenada generalizada el ´angulo que hace el vector de posici´on de la part´ıcula con el eje z ′ y en t´erminos del cual podemos expresar a x′ , y ′ y z ′ , puesto que x′ = 0. Entonces, mediante (3.124) obtenemos: x = −a senq senωt ;
y = a senq cos ωt ;
z = a cos q
(3.125)
El lagrangiano del problema es en consecuencia: L(q, q, ˙ t) =
1 ma2 (q˙2 + ω 2 senq) + mga cos q 2
(3.126)
El lector puede verificar f´ acilmente que si ω 2 < g/a, la posici´on q = 0 es de equilibrio estable con frecuencia de peque˜ nas oscilaciones dada por Ω = ω 2 − g/a. Si 2 ω > g/a, la posici´on de equilibrio estable no es q = 0 sino alg´ un valor de q entre 0 y π/2 con frecuencia de peque˜ nas oscilaciones dada por Ω2 = g/a − ω 2 . Finalmente, si ω 2 ≫ g/a, la posici´on de equilibrio estable ser´a q = π/2, siendo ω la frecuencia de peque˜ nas oscilaciones. Sabemos que si se cumplen las condiciones (a) y (b), pero no se cumple (c), es decir, si las ligaduras son re´ onomas, lo cual es el caso para este problema, entonces h no ser´a la energ´ıa total. De (3.107) y (3.112) se sigue, usando el teorema de Euler acerca de las funciones homog´eneas, que: h = 2T2 + T1 − L = T + V − T1 − 2T0
(3.127)
De (3.98) se sigue que cuando fν = 0, ∂L = E˙ − T˙1 − 2T˙0 (3.128) h˙ = − ∂t Por tanto, si como en este ejemplo las ligaduras re´onomas no dan lugar a que t aparezca en L, h ser´a constante de movimiento pero E no lo ser´a. En efecto, en este caso las ligaduras realizan trabajo sobre el sistema ya que los desplazamientos virtuales son tangentes al alambre (o sea que ´este no realiza trabajo virtual), pero como un desplazamiento real de la part´ıcula no coincide con una virtual, la ligadura realiza trabajo bajo desplazamientos reales. Para este problema, T2 = 12 ma2 q˙2 ; T1 = 0 ; T0 = 1 2 2 2 ma ω sen q y V = −mga cos q. De (3.127) se sigue entonces que: 1 ma2 (q˙2 − ω 2 senq) − mga cos q (3.129) 2 la cual es una constante de movimiento. Podemos reinterpretar a h diciendo que es la energ´ıa total respecto al sistema de ejes rotantes x′ , y ′ y z ′ . La energ´ıa cin´etica h = T2 − T0 + V =
76 / Mec´ anica cl´ asica avanzada es T ′ = (1/2)ma2 q˙2 y la energ´ıa potencial consta de dos partes, la energ´ıa potencial gravitacional y la energ´ıa potencial centr´ıfuga que resulta debido a que el sistema de referencia x′ , y ′ y z ′ es no inercial, es decir: T′ =
1 ma2 q˙2 ; 2
1 V ′ = − ma2 ω 2 senq − mga cos q 2
(3.130)
En efecto, V ′ puede escribirse como V ′ = −(1/2)maω 2y ′ − mgz ′ y de ´el se deriva la fuerza siguiente: 1 ∂V ′ F~ ′ = − ′ = maω 2ˆi′ + mg kˆ′ ∂~r 2
(3.131)
O sea que (1/2)maω 2 es la fuerza centr´ıfuga; es como si existiera un campo gravitacional homog´eneo en la direcci´ on x′ . La energ´ıa total respecto a los ejes x, y y z ser´a E y constar´a de dos t´erminos: h y el trabajo realizado por el alambre. Como h˙ = 0, de (3.128) se sigue que: E˙ = T˙1 + 2T˙0 = ma2 ω 2 cos q q˙
(3.132)
˙ ma2 ω 3 q0 senΩt, Para peque˜ nas oscilaciones alrededor de q = 0, E˙ es de la forma E= o sea que E = h − (ma2 ω 3 /Ω)q0 cos Ωt, lo cual nos muestra que la energ´ıa total tendr´a fluctuaciones peri´odicas. Conservaci´ on del momento lineal. Sea un sistema que cumple las siguientes condiciones: (a) se describe completamente a partir de un lagrangiano; (b) L no depende de alguna de las coordenadas generalizadas. Entonces se cumple: ∂L =0 ∂qν0
(3.133)
on donde la coordenada qν0 que no aparece en L se llama c´ıclica o ignorable. La ecuaci´ de Lagrange para la coordenada qν0 implica que: d ∂L = f0 (3.134) dt ∂ q˙ν0 O sea que si fν0 = 0 la siguiente cantidad se conserva: Pν0 ≡
∂L = constante ∂ q˙ν0
(3.135)
Se define el momento can´onico conjugado a la coordenada qν as´ı:8 Pν =
∂L ; ∂ q˙ν
ν = 1, 2, ...l
(3.136)
luego, el momento can´onico conjugado a una coordenada c´ıclica es una constante de movimiento. Si L no depende de qν0 y fν0 = 0 se dice que el sistema es sim´etrico bajo cualquier cambio en la coordenada qν0 . 8 La palabra “can´ onico” viene desde de ´ epoca de Hamilton; significa “de acuerdo con el canon”. Se usa ampliamente en f´ısica para designar diversos aspectos del formulismo hamiltoniano, que describe los sistemas mec´ anicos mediante las variables (q, p).
El principio de Hamilton y las ecuaciones de Lagrange / 77 Sea un lagrangiano dado por (3.87). Como L no depende de x ni de y, se sigue que px = mx˙ y py = my˙ son constantes de movimiento. Como L depende de z, pz = mz˙ no se conserva. Si qν0 es una coordenada lineal, pν0 ser´a un momento lineal. Homogeneidad espacial. Sea un sistema aislado. Es de esperarse que L no cambie cuando se traslada el sistema como un todo. Esto equivale a desplazar todas las part´ıculas por la misma cantidad sin cambiarles su movimiento: ~r˙ i → ~r˙ i
~ri → ~ri + ~ǫ ;
(3.137)
Entonces el cambio experimentado por L ser´a: δL =
N N X X ∂L ∂L · δ~ri = ~ǫ · ∂~ r ∂~ qi i i=1 i=1
(3.138)
Por hip´ otesis no hay ligaduras, con lo cual las ecuaciones de Lagrange nos dan: δL = ~ǫ ·
N N X d X d ∂L dP~ = ~ǫ · p~i = ~ǫ · , dt ∂~r˙ i dt i=1 dt i=1
(3.139)
donde P~ es el momento total del sistema. Se sigue que si hay homogeneidad espacial, δL = 0, entonces se sigue que la variable din´amica ~ǫ· P~ se conserva. Como E es arbitrario, se sigue que P~ es una constante. Si s´olo hay simetr´ıa de translaci´ on en determinada direcci´ on ~ǫ se sigue que s´olo se conserva la componente de P~ en la direcci´ on de ~ǫ. Como L = T − V y T s´olo depende de las velocidades de las part´ıculas, ∂V ∂L =− = F~i ∂~ri ∂~ri
(3.140)
Entonces en (3.138) se tiene: δL = ~ǫ ·
N X
F~i
(3.141)
i=1
δL ser´a cero si el sistema no est´ a sometido a una fuerza neta externa, es decir si el sistema est´ a aislado. O tambi´en: si el sistema es aislado, no debe haber fuerzas sobre el centro de masa: ∂V F~CM = − =0 (3.142) ~ CM ∂R luego V no depende de RCM y ´esta ser´a c´ıclica. El momento can´onico conjugado de ~ CM ser´a el momento lineal total y ser´a una constante de movimiento: R P~CM =
N X ∂L ∂L ∂~r˙ i = · ~ CM ~˙ CM r˙ i ∂ R ∂R i=1 ∂ ~
(3.143)
~ CM est´ Como R a dado por N
1X ˙ ˙ ~ CM R = mi~ri 2 i=1
(3.144)
78 / Mec´ anica cl´ asica avanzada Se sigue que: ∂~r˙ i ~ = ~1 ˙ ~ ∂ RCM
(3.145)
~1 es el di´adico unidad, que se representa por una matriz unidad de dimensi´ donde ~ on 3 × 3 (v´ease secci´ on 7.4). Por tanto: N
N
X X ∂L ∂L mi~r˙ i = P~CM = = ˙ ˙~ ∂ ~ r i ∂ RCM i=1 i=1
(3.146)
Conservaci´ on del momento angular. Sea un sistema que se describe completamente a partir de un lagrangiano y adem´as tal que no depende de alguna coordenada angular qν0 , entonces su momento can´onico conjugado ser´a un momento angular que se conserva. Por ejemplo, sea una part´ıcula cuyo lagrangiano es: 1 ˙2 m~r − V (~r) (3.147) 2 Sea n ˆ un eje arbitrario y δφ una rotaci´on alrededor de ese eje (v´ease figura 3.3). L=
n
δϕ
δr r r + δr θ
Figura 3.3 Rotaci´on por ´angulo δφ alrededor de n ˆ Supongamos que φ es una de las coordenadas generalizadas del sistema. En una rotaci´on alrededor de n ˆ bajo un ´angulo δφ, ~r se cambia en ~r + δ~r donde δ~r es un vector perpendicular a ~r y a n ˆ y cuya magnitud es r senθ δφ. Por tanto se cumple que: δ~r = n ˆ × ~rδφ
(3.148)
El principio de Hamilton y las ecuaciones de Lagrange / 79 y que: ∂~r =n ˆ × ~r ∂φ
(3.149)
El momento can´ onico conjugado de φ ser´a: pφ =
∂L ∂~r˙ ∂~r = m~r˙ · (ˆ n × ~r) = n ˆ · m~r × ~r˙ = m~r˙ · = m~r˙ · ∂φ ∂ φ˙ ∂ φ˙
(3.150)
Se sigue que pφ es la componente del momento angular a lo largo de n ˆ . Si L no depende de φ, pφ es una constante de movimiento. Isotrop´ıa espacial. Sea un sistema tal que no cambia L cuando se rota como un todo alrededor de un eje n ˆ . Esto es, si para cada part´ıcula: ~ri → ~ri + n ˆ × ~ri δφ ;
~r˙ i → ~r˙ i + n ˆ × ~r˙ i δφ
el cambio en L ser´a: X N N X ∂L ˙ ∂L p~˙ i · δ~ri + p~i · δ~r˙ i · δ~ri = · δ~ri + δL = ∂~ri ∂~r˙ i i=1 i=1
(3.151)
(3.152)
Usando (3.151) y usando la invariancia del triple producto escalar bajo permutaci´on c´ıclica de los factores: δL =
N X d ˆ δφ · n ˆ · ~ri × p~˙ i + p~i × ~r˙ i δφ = n ~ri × p~i dt i=1 i=1
N X
(3.153)
Con lo cual ~˙ δL = δφˆ n·L
(3.154)
~ es el momento angular total. Por otra parte, en virtud de las ecuaciones de donde L Lagrange: δL =
N X i=1
F~i · δ~ri + p~i · δ~ri =
(3.155)
N N X X ~ki = δφˆ ~ n·K n· ~ri × F~i + ~r˙ i × p ~i = δφˆ δφˆ n· i=1
i=1
~ es el torque total, por tanto: donde K ∂L ~˙ = n ~ =n ˆ ·L ˆ ·K ∂φ
(3.156)
Si no hay torque neto sobre el sistema entonces ´este ser´a is´ otropo y en consecuencia se conserva el momento angular total. Si simplemente se anula el torque en cierta direcci´ on, L ser´a sim´etrico bajo rotaciones alrededor de esa direcci´ on y se conservar´a la
80 / Mec´ anica cl´ asica avanzada ~ en esa direcci´ componente de L on. Integrales de movimiento aditivas. Para un sistema aislado la energ´ıa total ~ y el momento lineal P~ se conservan: hay siete constantes de E, el momento angular L movimiento. Quedan a´ un otras 6N − 7 constantes de movimiento. Estas siete constantes de movimiento tienen la caracter´ıstica de ser aditivas. Es decir, si el sistema consta de varias partes que no interact´ uan, cada parte tendr´a valores determinados de la energ´ıa, el momento angular y el momento lineal totales. Las correspondientes cantidades del sistema total se pueden obtener adicionando las respectivas constantes de movimiento de las partes.
3.5.
El teorema del virial
Es un teorema de naturaleza estad´ıstica porque se refiere a promedios temporales. Sea un sistema que: (a) la energ´ıa potencial es funci´ on homog´enea de las coordenadas; (b) el movimiento es tal que en todo momento las coordenadas y las velocidades toman valores finitos (el sistema es ligado). Se trata de calcular los valores medios de T y V cuando el tiempo tiende a infinito. Del teorema de Euler acerca de las funciones homog´eneas se sigue: N X ∂T ˙ · ~ri = 2T ∂~r˙ i
(3.157)
i=1
Entonces se cumple, dado que V no depende de las velocidades: N N X d X ˙ ~p˙ i · ~ri p~i · ~ri − pi · ~ri = ~ 2T = dt i=1 i=1 i=1 N X
2T =
N N X d X F~i · ~ri pi · ~ri − ~ dt i=1 i=1
(3.159)
si tomamos en (3.159) la media temporal a ambos lados, as´ı: Z 1 τ l´ım 2T dt = τ →∞ τ 0 1 l´ım τ →∞ τ
N X i=1
! τ Z N 1 τ X~ p~i · ~ri − l´ım Fi · ~ri dt τ →∞ τ 0 0
(3.158)
(3.160)
i=1
La condici´on (b) conduce a la anulaci´ on del primer miembro del lado derecho, con lo cual llegamos a: 2T = −
N X i=1
F~i · ~ri ,
(3.161)
El principio de Hamilton y las ecuaciones de Lagrange / 81 donde la barra indica promedio temporal. La ecuaci´ on (3.161) se denomina el teorema del virial. El lado derecho de (3.161) es el doble del llamado virial de Clausius. Si V es funci´ on homog´enea de las coordenadas, se cumple: −
N X i=1
F~i · ~ri =
N X ∂V i=1
∂~ri
· ~ri = kV = 2T
(3.162)
donde k es el grado de homogeneidad de V . Como T + V = E es una constante, se sigue que T + V = E. Por lo tanto se cumple que: 2T + 2V = 2E ;
kT + kV = kE
(3.163)
De (3.162) y (3.163) se sigue que: V =
2 E; 2+k
T =
k E; 2+k
T =
k V 2
(3.164)
Para un potencial del tipo r−1 se cumple que 2T = −V = −2E. Para un potencial del tipo r2 se cumple: T = V = (1/2)E. Se deduce que para un potencial del tipo r−1 hay movimientos acotados solamente si E < 0, dado que T es positiva, y que para un potencial del tipo r2 s´olo hay movimientos acotados para E > 0. Ley de Boyle. Sea un sistema constituido por un gas de mol´eculas en un recipiente. En este caso N es muy grande. Si la energ´ıa cin´etica media por part´ıcula es t, entonces: T = Nt
(3.165)
La energ´ıa por part´ıcula est´ a relacionada con la temperatura θ a trav´es de la relaci´ on: 3 t = kB θ (3.166) 2 donde kB es la constante de Boltzmann. La ecuaci´ on (3.166) se obtiene del teorema de la equipartici´ on de la energ´ıa, seg´ un el cual por cada grado de libertad hay una energ´ıa de (1/2)kθ. La fuerza sobre la part´ıcula i depende de la ligadura impuesta por el recipiente: ~i F~i = F~ig + R
(3.167)
F~ig
donde es la fuerza ejercida por todas las otras part´ıculas del gas sobre la part´ıcula i ~ y Ri es la fuerza ejercida por las paredes del recipiente sobre la part´ıcula i. Si llamamos I a: I=
N X
F~ig .~ri
(3.168)
i=1
El virial de Clausius se descompone en dos partes: N X i=1
F~i .~ri = I +
N X i=1
~ i .~ri R
(3.169)
82 / Mec´ anica cl´ asica avanzada ~ i act´ Las fuerzas R uan s´olo cuando la part´ıcula i choca con las paredes del recipiente. Estas fuerzas representan la reacci´on del muro a la colisi´ on ejercida por los ´atomos sobre la pared. Esto es lo que se denomina la reacci´on a la presi´ on P que ejerce el gas sobre el recipiente. PN ~ En un tiempo t dado, en i=1 R ri s´olo contribuyen los t´erminos correspondientes i ·~ a las part´ıulas que en ese instante chocan con las paredes del recipiente. Podemos dividir el ´ area de las paredes en elementos infinitesimales de ´area dA. Todas las dN part´ıculas que choquen sobre un dA dado tendr´an aproximadamente el mismo radio vector ~ri que llamaremos ~r. La contribuci´on de las dN part´ıculas a la sumatoria ser´a aproximadamente ~ dN · ~r, donde R ~ es la fuerza que ejerce el elemento de ´area sobre cada una de las dN R ~ dN = dR, ~ entonces tenemos que: part´ıculas que inciden sobre ella. Si llamamos R N X i=1
~ i · ~ri = R
Z
~ ~r · dR
(3.170)
~ en t´erminos de la Si n ˆ es un vector normal a la superficie, podemos escribir a dR presi´ on de la siguiente manera: ~ = −ˆ dR nP dA
(3.171)
Como la presi´ on es constante escribimos: N X i=1
~ i · ~ri = −P R
Z
n ˆ · ~r dA
(3.172)
Ahora, en virtud del teorema de la divergencia, podemos pasar de la integral de superficie a una integral de volumen: Z Z ~ ∇ · ~rdV = 3V (3.173) ~r · dS = V
S
Entonces: N X i=1
~ i · ~ri = −3P V R
(3.174)
Como esta cantidad no depende del tiempo se sigue que: N X i=1
F~i · ~ri = I − 3P V
(3.175)
En virtud del teorema del virial, que es v´alido en este caso porque el movimiento es acotado, y usando (3.162) y (3.166) se sigue que: 3N KB θ = −I + 3P V
(3.176)
Lleg´andose a la ecuaci´ on de estado para un gas real: 1 P V = N KB θ + I 3
(3.177)
El principio de Hamilton y las ecuaciones de Lagrange / 83 El t´ermino (1/3)I es una medida de la separaci´on de la ecuaci´ on de estado del gas real respecto al ideal en el cual no se consideran los efectos de interacci´ on entre las mol´eculas dada por 3.168, en tanto que P V proviene de la ligadura impuesta por el recipiente.
84 / Mec´ anica cl´ asica avanzada
4 La formulaci´ on hamiltoniana 4.1.
Las variables hamiltonianas de estado
En el formalismo lagrangiano el estado de un sistema mec´anico hol´ onomo con l grados de libertad se describe por medio de las qν y q˙ν . Por medio de la funci´ on L(q, q, ˙ t) se hallan las ecuaciones de movimiento a partir de las ecuaciones de Lagrange. Las variables (q, q, ˙ t) se llaman variables lagrangianas. Hamilton (1805-1865) propuso describir el sistema mediante las variables (q, p, t), donde los pν son los momentos generalizados can´onicamente conjugados a las coordenadas generalizadas qν definidos por: pν =
∂L(q, q, ˙ t) ; ∂ q˙ν
ν = 1, 2, ...l
(4.1)
Las variables (q, p, t) se llaman variables hamiltonianas. Las ecuaciones (4.1) constituyen las f´ ormulas de transformaci´ on de las variables (q, q, ˙ t) a las variables (q, p, t). En (4.1) hay l ecuaciones que relacionan las l cantidades pν con las l cantidades q˙ν . En principio se pueden expresar las (q) ˙ en t´erminos de las (p) por la transformaci´ on inversa: q˙ν = Φν (q, p, t) ;
ν = 1, 2, ...l
(4.2)
Es claro que el estado del sistema puede ser descrito indistintamente por las variables lagrangianas o por las hamiltonianas. Decimos que L “genera” la transformaci´ on (q, q, ˙ t) → (q, p, t). Seg´ un (3.106) y (3.107) T se puede escribir como: T = T2 + T1 + T0
(4.3)
Si V no depende de las (q), ˙ pν =
l X ∂T ∂L = = Aνµ q˙µ + Aν ; ∂ q˙ν ∂ q˙ν µ=1
ν = 1, 2, ...l
(4.4)
Mediante este sistema de ecuaciones lineales podemos expresar a (q) ˙ en t´erminos de (p): q˙ν =
l X
bνµ pµ + bν ;
ν = 1, 2, ...l
µ=1
85
(4.5)
86 / Mec´ anica cl´ asica avanzada Si V depende de las (q), (q) ˙ en la forma: V (q, q, ˙ t) =
l X
Πν (q, t)q˙ν + Π(q, t)
(4.6)
ν=1
que ser´ıa por ejemplo la forma que tomar´ıa el potencial electromagn´etico (3.68) al ser expresado en coordenadas generalizadas, entonces pν ser´a: pν =
l X
µ=1
Aνµ q˙µ + Aν − Πν ;
ν = 1, 2, ...l
(4.7)
Notaci´ on. Usaremos L para denotar a T −V , expresada en funci´ on de las variables lagrangianas. Es claro que al expresarla en t´erminos de las variables hamiltonianas la funci´ on es diferente, aunque a veces, sin mucho rigor, se le escribe tambi´en como L. Lo correcto es: L(q, q, ˙ t) = L [q, q(q, ˙ p, t), t] = L(q, p, t)
(4.8)
Ejemplo 4.1.1 Sea el lagrangiano: 1 2 ~ r , t) − Π(~r, t) L(~r, ~r˙ , t) = m~r˙ − ~r˙ · Π(~ 2
(4.9)
El momento can´ onico ser´a: p= ~
~ ∂L ~ ⇒ ~r˙ = p~ + Π = m~r˙ − Π ˙ m ∂~r
(4.10)
Con lo cual: L(~r, p~, t) =
~2 ~2 − Π p −Π 2m
(4.11)
La funci´ on hamiltoniana. Se defini´o en (3.97) la funci´ on energ´ıa como: h(q, q, ˙ t) =
l X ∂L(q, q, ˙ t) q˙ν − L(q, q, ˙ t) ∂ q ˙ ν ν=1
(4.12)
A la funci´ on energ´ıa expresada en t´erminos de las variables hamiltonianas se le llama la funci´ on hamiltoniana: H(q, p, t) ≡ h(q, p, t) = h[q, q ′ (q, p, t), t] =
l X
ν=1
pν q˙ν − L(q, p, t)
(4.13)
Los generadores de la transformaci´ on de Legendre. Sea X(x1 , x2 , ...xn ; α1 , α2 , ... αm ) una funci´ on que “genera” la siguiente transformaci´ on de variables (x1 , x2 , ...xn ) → (y1 , y2 , ...yn ): yi =
∂X ; ∂xi
i = 1, 2, ...n
(4.14)
La formulaci´ on hamiltoniana / 87 entonces existe una transformaci´ on de las variables y1 , y2 , ...yn a las variables x1 , x2 , ...xn , la transformaci´ on inversa, “generada” por cierta funci´ on Y (y1 , y2 , ...yn ; α1 , α2 , ...αm ): xi =
∂Y ; ∂yi
i = 1, 2, ...n
(4.15)
Demostremos que las funciones X y Y est´ an relacionadas por la f´ormula: Y (y1 , y2 , ...yn ; α1 , α2 , ...αm ) = n X i=1
(4.16) xi yi − X(x1 , x2 , ...xn ; α1 , α2 , ...αm )
En efecto, es posible expresar las variables xi en t´erminos de las yi : xi = fi (x1 , x2 , ...xn ; α1 , α2 , ...αm ) ;
i = 1, 2, ...n
(4.17)
Con lo cual escribimos (4.16) como: Y (y1 , y2 , ...yn ; α1 , α2 , ...αm ) = n X
k=1
(4.18) yk fk − X(f1 , f2 , ...fn , α1 , α2 , ...αm )
Entonces: n
X ∂Y = ∂yi
k=1
∂fk yk + fk δik ∂yi
n X ∂fk k=1
∂fk yk − yk ∂yi ∂yi
−
n X ∂X ∂fk = ∂fk ∂yi k=1
(4.19)
+ fi = xi
Demostremos el siguiente teorema: ∂X ∂Y =− ; ∂αi ∂αi
i = 1, 2, ...m
(4.20)
Para evaluar ∂y/∂αi usemos la ecuaci´ on (4.18): n
n
k=1
k=1
X ∂fk X ∂X ∂fk ∂X ∂Y = yk − − ∂αi ∂αi ∂fk ∂αi ∂αi
(4.21)
En virtud de (4.14), los t´erminos de la sumatoria se cancelan, con lo cual queda demostrado el teorema. Una transformaci´ on de este tipo es llamada transfomaci´ on de Legendre (1752-1833). En s´ıntesis, las f´ ormulas caracter´ısticas de una transformaci´on de Legendre son: X = X(x1 , x2 , ...xn ; α1 , α2 , ...αm )
(4.22)
88 / Mec´ anica cl´ asica avanzada Y = Y (y1 , y2 , ...yn ; α1 , α2 , ...αm ) yi =
∂X ; ∂xi
Y =
X k
xi =
∂Y ; ∂yi
xk yk − X ;
(4.23)
i = 1, 2, ...n
∂X ∂Y =− ; ∂αi ∂αi
(4.24) i = 1, 2, ...m
(4.25)
Las ecuaciones de movimiento hamiltonianas. La transformaci´ on de las variables lagrangianas a las hamiltonianas es una transformaci´ on de Legendre generada por la funci´ on L. Aqu´ı las q˙ν hacen el papel de las xi , el conjunto (q), t, hace el papel de las (α), y las pν hacen el papel de las yi ; L es X. Comparando (4.13) y (4.16) vemos que H es Y : H(q, p, t) =
l X
ν=1
pν q˙ν − L(q, q, ˙ t)
(4.26)
Es decir, L genera la transformaci´ on (q) ˙ → (p) y H genera la transformaci´ on inversa (p) → (q): ˙ q˙ν =
∂H(q, p, t) ∂pν
(4.27)
De las ecuaciones (4.20) se sigue inmediatamente que: ∂H ∂L =− ; ∂qν ∂qν
ν = 1, 2, ...l
(4.28)
∂H ∂L =− ∂t ∂t
(4.29)
teniendo en cuenta que el conjunto (q), t, hace el papel de las (α). De las ecuaciones de Lagrange se sigue que: ∂L d ∂L = − fν = p˙ − fν ; ∂qν dt ∂ q˙ν
ν = 1, 2, ...l
(4.30)
Las ecuaciones (4.27) a (4.30) nos dan: q˙ν =
∂H ; ∂pν
p˙ν = −
∂H + fν ; ∂qν
ν = 1, 2, ...l
(4.31)
Las ecuaciones (4.31) se denominan las ecuaciones can´ onicas de Hamilton y constituyen las ecuaciones de movimiento en las variables hamiltonianas. Son 2l ecuaciones diferenciales que involucran s´olo primeras derivadas de (q) y (p), en tanto que las de Lagrange son l ecuaciones deferenciales de segundo orden en las (q). En esencia s´olo el segundo conjunto de ecuaciones (4.31) constituye las ecuacionnes de movimiento, pues el primer conjunto s´olo proporciona la transformaci´ on inversa a pν = ∂L/∂ q˙ν .
La formulaci´ on hamiltoniana / 89 La funci´ on hamiltoniana. H no s´olo permite escribir las ecuaciones de movi˙ miento sino que tiene significado f´ısico directo. Veamos qu´e es H: l X ∂H ∂H ∂H ˙ H= q˙ν + p˙ ν + ∂q ∂p ∂t ν ν ν=1 =
l X
[(fν − p˙ ν ) q˙ν + q˙ν p˙ ν ] +
l X
fν q˙ν +
ν=1
=
ν=1
∂H ∂t
(4.32)
∂H ∂t
Si las ligaduras re´ onomas no dan lugar a que t aparezca en H y el potencial no depende del tiempo, ∂H/∂t = 0, y si adem´as no hay fuerzas no derivables del potencial, se sigue que H˙ = 0, o sea que H es una constante de movimiento. Si adem´as las fuerzas son derivables de un potencial que no depende de las velocidades, sabemos de (3.112) que H = T + V . O sea que bajo estas condiciones la energ´ıa total E = T + V se conserva, de lo contrario se cumple que H es constante pero no es cierto que H = E. Si V no depende de (q) ˙ ni de t y las ligaduras re´onomas no dan lugar a que t aparezca en H se cumple que ∂H/∂t = 0 y que H = T + V . En este caso: l
d(T + V ) X dE = = fν q˙ν dt dt ν=1
(4.33)
Luego, dE/dt es igual a la rata a la cual las fuerzas no conservativas realizan trabajo sobre el sistema. Si estas son nulas, la energ´ıa total se conserva. Por otra parte, si las fν son cero, o bien V depende de t, o las ligaduras re´onomas dan lugar a que t aparezcan en H, dH ∂H = dt ∂t
(4.34)
Ejemplo 4.1.2 Usando la transformaci´ on de Legendre inversa, derivar las ecuaciones de movimiento lagrangianas a partir de las ecuaciones de movimiento hamiltonianas. Supongamos que fν = 0. Las ecuaciones de movimiento ser´an: q˙ν =
∂H ; ∂pν
p˙ = −
∂H ; ∂qν
ν = 1, 2, ...l
(4.35)
La transformaci´ on de Legendre inversa es (p) → (q) ˙ y est´ a generada por H: q˙ν =
∂H(q, p, t) ; ∂pν
ν = 1, 2, ...l
(4.36)
El generador de la transformaci´ on (q) ˙ → (p) es L: L(q, q, ˙ t) =
l X
ν=1
q˙ν pν − H(q, p, t)
(4.37)
90 / Mec´ anica cl´ asica avanzada En virtud del teorema dado por (4.20): ∂L ∂H =− ; ∂qν ∂qν
ν = 1, 2, ...l ;
∂L ∂H =− ∂t ∂t
(4.38)
O sea: ∂L = p˙ν ; ∂qν
ν = 1, 2, ...l
(4.39)
Como L genera la transformaci´ on (q) ˙ → (p) pν =
∂L ; ∂ q˙ν
ν = 1, 2, ...l
(4.40)
Con lo cual llegamos a las ecuaciones de Lagrange: d ∂L ∂L = ; ∂qν dt ∂ q˙ν
ν = 1, 2, ...l
(4.41)
Ejemplo 4.1.3 Hallar las ecuaciones de movimiento correspondientes a las variables (p), (p) ˙ y t obtenidas mediante una transformaci´ on de Legendre. El generador de la transformaci´ on (q) → (−p) ˙ es H: −p˙ ν =
∂H ; ∂qν
ν = 1, 2, ...l
(4.42)
Entonces el generador de la transformaci´ on (−p) ˙ → (q) ser´a cierta funci´ on L′ (p, p, ˙ t) dada por: L′ (p, p, ˙ t) =
l X
(−p˙ν )qν − H(q, p, t)
(4.43)
ν=1
En virtud del teorema (4.20): ∂L′ ∂H =− ; ∂pν ∂pν
ν = 1, 2, ...l;
∂L′ ∂H =− ∂t ∂t
(4.44)
Como en virtud de las ecuaciones de Hamilton: ∂H = q˙ν ; ∂pν
ν = 1, 2, ...l
(4.45)
y debido a que L′ genera la transformaci´ on (−p) ˙ → (q) −qν =
∂L′ ; ∂ p˙ ν
ν = 1, 2, ...l
(4.46)
Se sigue de (4.44), (4.45) y (4.46) que: d ∂L′ ∂L′ = −q˙ν = ; ∂pν dt ∂ p˙ ν
ν = 1, 2, ...l
(4.47)
La formulaci´ on hamiltoniana / 91 Entonces las ecuaciones de movimiento lagrangianas para las variables (p) y (p) ˙ son: ˙ t) ∂L′ (p, p, ˙ t) d ∂L′ (p, p, − = 0; ∂pν dt ∂ p˙ ν
ν = 1, 2, ...l
(4.48)
Esta es la representaci´on de momentos, que nos dice que mediante las variables (p), (p) ˙ es posible describir completamente el sistema. Ejemplo 4.1.4 Hallar las ecuaciones de movimiento lagrangianas y hamiltonianas para una part´ıcula de masa m en el potencial V = −k/r (r distancia del origen a la part´ıcula). L=T −V =
1 2 k mr˙ + 2 r
(4.49)
L es esf´ericamente sim´etrico, luego se conserva el momento angular ~l = m~r × ~r˙ : ~l es constante en magnitud y direcci´ on. Entonces ~r y ~r˙ son perpendiculares a ~l y en consecuencia el movimiento es en un plano. Elegimos un sistema de coordenadas polares en el plano del movimiento, con lo cual: L=
k 1 m(r˙ 2 + r2 φ˙ 2 ) + 2 r
(4.50)
El sistema, para ~l dado, tiene en esencia dos grados de libertad, luego hay dos ecuaciones de Lagrange: k m¨ r − mrφ˙ + 2 = 0 y r
mr2 φ˙ = constante
(4.51)
Como ~l vale: ~l = m~r × ~r˙ = mr2 φ˙ kˆ
(4.52)
donde kˆ es un vector unitario normal al plano del movimiento, se sigue de (4.51) y (4.52) que: m¨ r−
k l2 + 2 =0 mr3 r
(4.53)
La anterior es una ecuaci´ on que permite hallar a r(t) para l dado. Una vez conocido r(t), tenemos que φ(t) se determina al integrar: φ˙ =
l mr2
(4.54)
Para pasar al formalismo hamiltoniano partimos de las f´ormulas de transformaci´ on: pr =
∂L = mr˙ ; ∂ r˙
pφ =
∂L = mr2 φ˙ = l = constante ∂ φ˙
(4.55)
92 / Mec´ anica cl´ asica avanzada El hamiltoniano ser´a: H(r, φ, pr , pφ ) = pr r˙ + pφ φ˙ − L = p2φ p2r 1 + 2 − m m r 2
p2φ p2r 2 + r m2 m2 r 4
!
−
k r
(4.56)
Con lo cual: H=
p2φ p2r k − =T +V + 2m 2mr2 r
(4.57)
Las ecuaciones de Hamilton ser´an: r˙ = − φ˙ =
∂H pr = ; ∂pr m
pφ ∂H = ; ∂pφ mr2
p˙ r = −
p2φ k ∂H =− 3 + 2 ∂r mr r
(4.58)
∂H p˙ φ = − =0 ∂φ
Las ecuaciones (4.58) de la izquierda no son m´as que las ecuaciones de la transformaci´ on inversa a (4.55). Al reemplazar ´estas en las ecuaciones (4.58) de la derecha, se obtienen las ecuaciones (4.51), como es de esperarse. Es decir, el formalismo hamiltoniano no aporta nada nuevo en cuanto a las ecuaciones de movimiento se refiere. Notamos que φ es c´ıclica tanto en L como en H. En consecuencia pφ se conserva. H presenta las mismas simetr´ıas que L y por tanto tiene los mismos teoremas de conservaci´ on. Ejemplo 4.1.5 Hallar el hamiltoniano y las ecuaciones de movimiento para una part´ıcula en un sistema de coordenadas que rota uniformemente con velocidad angular ~ω . En el sistema de ejes espaciales: 1 L ~r, ~r˙ = m~r˙2 − V (~r) 2
(4.59)
Si instant´ aneamente coinciden los ejes espaciales y los ejes rotantes, se cumple que: ~r = ~r ~r˙ = ~r˙ + ~ ω × ~r
(4.60)
donde ~r es el vector de posici´on de la part´ıcula respecto a los ejes rotantes y ~r˙ su velocidad en esos ejes. Entonces usando la transformaci´ on (4.60), (4.59) tomar´a la forma: 1 2 2 ˙ ˙ ˙ ~ ~ ~ ~ ~ ~ − V ~r L r, r = m r + 2r · ~ω × r + ~ω × r (4.61) 2 Las componentes del momento can´onico son: px =
∂L ... ∂ x˙
(4.62)
La formulaci´ on hamiltoniana / 93 O vectorialmente: ~p = ∂L = m ~r˙ + ~ ω × ~r ∂~r˙
(4.63)
La velocidad expresada en t´erminos del momento es: ~ ~r˙ = p − ~ ω × ~r m
(4.64)
El lagrangiano (4.61) en t´erminos de las variables hamiltonianas es: 1 p2 L ~r, ~p = − V ~r 2m
(4.65)
El hamiltoniano ser´a:
H ~r, ~p =
X ν
pν q˙ν − L = ~p ·
~p − ~ω × ~r m
Con lo cual: H=
1 p2 ~ ω × ~r + V ~r −p· ~ 2m
!
−
1 p2 + V ~r 2m
(4.66)
(4.67)
˙ H es: En t´erminos de ~r y ~r, h=
2 1 ~˙ 2 1 mr − m ~ ω × ~r + V ~r 2 2
(4.68)
N´ otese que el hamiltoniano correspondiente a L(~r, ~r˙ ) difiere de h por el t´ermino ~ m(~ω × r)2 /2. Comparando las ecuaciones (4.61) y (4.68) vemos que h no es T + V . De acuerdo con (3.124), h es T + V s´olo si T es funci´ on cuadr´atica de las velocidades, en tanto que en este caso hay en T t´erminos de las formas T1 y T0 . T2 =
1 ˙2 mr 2
T1 = m~r˙ · (~ ω × ~r ) T0 =
(4.69)
1 m(~ ω × ~r)2 2
h es una constante de movimiento porque L no depende del tiempo y no hay fuerzas disipativas, pero E = T + V no es constante de movimiento. De acuerdo con (3.126): E˙ = T˙1 + 2T˙0
(4.70)
Vemos que T1 + 2T0 act´ uan como un trabajo sobre el sistema que hace que E no sea constante. Esto es debido a la rotaci´on del sistema de coordenadas. Sucede que en este caso la transformaci´ on ~r → ~r depende del tiempo debido a la rotaci´on, con lo cual la transformaci´ on es de tipo re´ onomo. T1 + 2T0 es un potencial “ficticio” inercial. T1
94 / Mec´ anica cl´ asica avanzada est´ a asociada con la fuerza de Coriolis y T0 con la fuerza centr´ıfuga. H puede escribirse como: H=
p2 −~ ω · ~r × ~p + V ~r 2m
(4.71)
en t´erminos de ~l = ~r × ~p se escribe como: H=
p2 −~ ω · ~l + V ~r 2m
(4.72)
como ~r depende expl´ıcitamente del tiempo, es de esperarse que ~l no se conserve. Las ecuaciones de movimiento son: ∂H ~ ∂V = p × ~ω − ∂~r ∂~r
~p˙ =
−
~r˙ =
~p ∂H = − ~ω × ~r m ∂~p
(4.73)
Como suponemos a ~ω constante, ~p × ~ω ~˙ 1 ∂V ~¨r = p − ~ − ~ω × ~r ω × ~r˙ = − m m m ∂~r
(4.74)
Expresando en (4.74) a ~p en t´erminos de ~r˙ obtenemos: 1 ∂V ~¨r + 2~ ω × ~r˙ + ~ ω × ~ω × ~r = − m ∂~r
(4.75)
Vemos que la fuerza en el sistema rotante no es masa por aceleraci´on, sino que tiene dos t´erminos adicionales, el centr´ıfugo y el de Coriolis, que caracterizan el movimiento de una part´ıcula descrito desde un sistema de referencia no inercial.
4.2.
Simetr´ıas y el teorema de conservaci´ on
Una coordenada c´ıclica en L tambi´en es c´ıclica en H. En efecto, de las ecuaciones de Lagrange y de las ecuaciones de Hamilton se sigue respectivamente que: ∂L ∂qν
p˙ν =
fν +
p˙ν =
∂H ; fν − ∂qν
(4.76) ν = 1, 2, ...l
Con lo cual siempre se cumple: ∂L ∂H =− ; ∂qν ∂qν
ν = 1, 2, ...l
(4.77)
La formulaci´ on hamiltoniana / 95 que en realidad es una propiedad general de la transformaci´ on de Legendre (q) ˙ → (p) seg´ un (4.28). Se sigue que todos los resultados obtenidos para L en cuanto a la relaci´on entre simetr´ıas y teoremas de conservaci´ on se aplican directamente en el formalismo hamiltoniano. De (4.32) se sigue que si no hay fuerzas disipativas y H no contiene el tiempo expl´ıcitamente (o, de (4.29), cuando L no contiene el tiempo expl´ıcitamente): dH ∂H =− =0 dt ∂t
(4.78)
Adem´as, si la transformaci´ on a coordenadas generalizadas no contiene el tiempo expl´ıcitamente y V no depende de las velocidades, H = T + V = E, o sea que la energ´ıa se conserva. Si H no depende de t pero hay fuerzas disipativas: l
X dA dH = fν q˙ν = dt dt ν=1
(4.79)
Si adem´as H = T + V = E, se sigue: dA dE = dt dt
(4.80)
Si la transformaci´ on de coordenadas depende del tiempo expl´ıcitamente, V no depende de (q) ˙ y fν = 0, T = T0 + T1 + T2
(4.81)
entonces se sigue que: pν = 2
l X
Aµν q˙µ + Aν ;
ν = 1, 2, ...l
(4.82)
µ=1
con lo cual H = T2 − T0 + V = E − T1 − 2T0
(4.83)
la H anterior en general no se conserva. Simetr´ıas de cambio de escala. Supongamos que el sistema es conservativo, de modo que E = T + V . Por simplicidad supondremos que no hay ligaduras, de modo que las coordenadas cartesianas pueden tomarse como coordenadas generalizadas independientes. La simetr´ıa de cambio de escala se da en una clase restringida de sistemas: aquellos en los cuales la energ´ıa potencial V es una funci´ on homog´enea de grado k: V (λ~r1 , λ~r2 , ...λ~rN ) = λk V (~r1 , ~r2 , ...~rN )
(4.84)
En coordenadas cartesianas T no depende de las coordenadas y es una funci´ on homog´enea cuadr´atica de las velocidades: ˙ ) = λ2 T (~r˙ 1 , ~r˙ 2 , ...~r˙ N ) T (λ~r˙1 , λ~r˙2 , ...λ~rN
(4.85)
96 / Mec´ anica cl´ asica avanzada Supongamos la siguiente transformaci´ on de cambio de escala en las longitudes y tiempos: ~ri t
→ α~ri ;
i = 1, 2, ...N (4.86)
→ βt
Entonces: V → αk V ; T →
2 α T β
(4.87)
El cambio en H ser´a: 2 α T + αk V H→ β
(4.88)
H ser´a funci´ on homog´enea de grado k bajo la transformaci´ on (4.86) si: α2 = αk ; β2
H → αk H
(4.89)
Esta transformaci´ on no cambia la forma de las ecuaciones de Hamilton: α2 1 β 2 ∂H α 1 ∂H → ~r˙ i = ; ~r˙ i = m ∂~r˙ i β m α ∂~r˙ i β
i = 1, 2, ...N
α2 α ∂H β 2 ∂H → m 2 ~¨r i = m~¨ri = − ∂~ri β α ∂~ri
(4.90)
(4.91)
Esta transformaci´ on pertenece a la clase de las transformaciones can´ onicas, o sea a las transformaciones que no cambian la forma de las ecuaciones can´onicas. La ecuaci´ on (4.86) dice que si las longitudes l se cambian por l′ = αl y los tiempos ′ t por t = βt, el sistema tendr´a simetr´ıa de cambio de escala si α y β son tales que se cumple (4.89), β = α1−k/2 , o sea si la transformaci´ on en longitudes y tiempos cumple: ′ 1−k/2 t′ l (4.92) = t l La ecuaci´ on (4.92) permite obtener algunas simples relaciones entre los per´ıodos de oscilaci´ on de sistemas peri´odicos que s´olo difieren entre s´ı por sus dimensiones caracter´ısticas y para los cuales V sea funci´ on homog´enea. Para el p´endulo simple, donde el potencial mgz es funci´ on homog´enea de grado 1: r t′ l′ = , (4.93) t l como se ve, es general; vale no s´olo para peque˜ nas oscilaciones.
La formulaci´ on hamiltoniana / 97 Para el oscilador arm´onico simple V es funci´ on homog´enea de grado k = 2. En este caso: t′ =1 t
(4.94)
Nos dice que el per´ıodo del movimiento no depende de la amplitud. Para el potencial gravitacional, V = −Gm1 m2 /r, k = −1. Entonces: t′ = t
′ 3/2 l l
(4.95)
En este caso la longitud caracter´ıstica es la distancia media al sol. La ecuaci´ on (4.95) expresa la tercera ley de Kepler, que vale para un potencial del tipo 1/r solamente. Una transformaci´ on can´ onica se refiere s´olo a transformaciones de las coordenadas y momentos, pero no del tiempo. Sin embargo, la transformaci´on (4.86), cuando las coordenadas cartesianas son a la vez generalizadas, es equivalente a la transformaci´on can´ onica ~ri → α~ri ; ~ pi → (α/β)~ pi , i = 1, 2, ...N . En rigor (4.86) debe llamarse transfomaci´ on de semejanza mec´ anica.
4.3.
La segunda forma del principio de Hamilton
La segunda forma del principio de Hamilton es simplemente el principio variacional del cual puede obtenerse la trayectoria del sistema en el espacio de fases. En otras palabras, se busca hallar qu´e principio variacional conduce a las ecuaciones de Hamilton como ecuaciones de Euler-Lagrange, en el espacio de fases: Z x2 ∂f d ∂f − =0 (4.96) f (y, y ′ , x)dx = 0 implica que δ ′ dx ∂y ∂y x1 Sea la funci´ on: ˜ p, q, L(q, ˙ p, ˙ t) =
l X
ν=1
pν q˙ν − H(p, q, t)
(4.97)
˜ es funci´ L on de las variables se˜ naladas tomadas independientemente. En particular (p) y (q) ˙ toman todos los valores compatibles con las ligaduras, independientemente de que se puedan relacionar mediante una transfomaci´on de Legendre. Sea ahora el siguiente principio variacional en el espacio de fases: δ
Z
t2
˜ p, q, L(q, ˙ p, ˙ t) dt = 0
(4.98)
t1
Con las condiciones en los extremos: δpν = 0 ,
δqν = 0
en
t = t1
y
t = t2 ;
ν = 1, 2, ...l
(4.99)
98 / Mec´ anica cl´ asica avanzada Las ecuaciones correspondientes de Euler-Lagrange son: ˜ ˜ d ∂L ∂L − = 0; dt ∂ q˙ν ∂qν
ν = 1, 2, ...l
˜ ˜ d ∂L ∂L − = 0; dt ∂ p˙ ν ∂pν
ν = 1, 2, ...l
(4.100)
Las ecuaciones (4.97) y (4.100) conducen a las ecuaciones can´onicas de Hamilton. ˜ y L coinciden solamente sobre las trayectorias verdaderas, para las cuales se debe L cumplir que: pν =
∂L ∂ q˙ν
ν = 1, 2, ...l
(4.101)
El espacio de fases. La formulaci´ on lagrangiana est´ a definida en el espacio de configuraci´ on l-dimensional constituido por las coordenadas generalizadas q1 , q2 , ...ql . Matem´ aticamente, el espacio de configuraci´on puede considerarse como una variedad diferenciable de l dimensiones. El espacio de los momentos generalizados tambi´en es l dimensional y est´ a constituido por los p1 , p2 , ...pl y se llama espacio de los momentos, que tambi´en es una variedad diferenciable de l dimensiones. Como sabemos, el estado del sistema puede describirse igualmente por (q, q) ˙ o por (p, p), ˙ o por dos puntos del espacio de configuraci´on o el de momentos respectivamente. q1 , q2 , ...ql ; p1 , p2 , ...pl forman el espacio de fases que es una variedad diferenciable 2l-dimensional. Cada punto del espacio de fases representa un estado del sistema y cada trayectoria de fases representa un estado de movimiento del sistema. En efecto, las variables hamiltonianas (q, p) especifican exhaustivamente el estado del sistema. Ejemplo 4.3.1 Sea una part´ıcula de masa m sometida a la condici´on de ligadura de moverse sobre la superficie de un cilindro, y sometida a una fuerza restauradora lineal dirigida hacia el centro del cilindro, F~ = −k~r, donde se toma el origen de coordenadas en el centro del cilindro. Hacer un estudio de la trayectoria en el espacio de fases. Tomando el eje z a lo largo del eje del cilindro, la condici´on de ligadura se puede expresar por: x2 + y 2 = R2
(4.102)
Las coordenadas generalizadas pueden tomarse θ, z, donde θ es un ´angulo en el ˙ z, z) plano perpendicular al eje del cilindro. Entonces L(θ, θ, ˙ ser´a: 1 1 m(R2 θ˙2 + z˙ 2 ) − k(R2 + z 2 ) 2 2 Los momentos can´onicos son: L=T −V = pθ = mR2 θ˙ ;
pz = mz˙
(4.103)
(4.104)
El hamiltoniano ser´a: H =T +V =
1 p2θ p2z + kz 2 + 2 2m 2mR 2
(4.105)
La formulaci´ on hamiltoniana / 99 donde hemos suprimido una constante aditiva. Planteando las ecuaciones de Hamilton e integr´andolas se llega a la soluci´on: θ = θ0 + at z = z0 sen
(4.106) r
k t+δ m
!
(4.107)
donde θ0 , a, z0 y δ son constantes de integraci´ on. Las ecuaciones (4.106) y (4.107) permiten hallar la ecuaci´ on de la trayectoria en el espacio de configuraci´on: ! r 1 k θ+φ , (4.108) z = z0 sen a m p gr´aficamente tomamos θ0 = 0, δ = 0, de modo que φ = 0. Llamando ω = k/m obtenemos: ω (4.109) θ = at ; z = z0 sen ωt ; z = z0 sen θ a x R –R m z
–z0
z0 R
y
–R w=a
Figura 4.1 Part´ıcula constre˜ nida a moverse sobre la superficie de un cilindro La figura 4.1 representa el caso en que ω = a. La trayectoria en el espacio de configuraci´on siempre ser´a cerrada cuando ω/a sea un n´ umero racional. La proyecci´on del movimiento sobre el eje z es arm´onica simple y sobre el plano x − y es circular uniforme. Como l = 2, el espacio de fases es 4-dimensional, constituido por θ, pθ , z, pz . Como pθ es constante, pθ = mR2 a, basta representar la proyecci´on del espacio 4-dimensional sobre el subespacio 3-dimensional θ, z, pz . La proyecci´on de la trayectoria de fases sobre pθ es un punto. El movimiento en z es arm´onico simple. El diagrama de fases z, ˙ z, es una elipse. Igualmente la proyecci´on de la trayectoria de fases sobre el plano z, pz ser´a una elipse. El
100 / Mec´ anica cl´ asica avanzada ˙ θ, es una l´ınea recta, como tambi´en la proyecci´on de la trayectoria diagrama de fases θ, de fases sobre el plano θ, pθ . La proyecci´on de la trayectoria de fases en el subespacio tridimensional θ, z, pz , es una h´elice el´ıptica. Esto es representado en la figura 4.2. pz
Ez = cte
pθ
pθ = cte θ
z
pθ = mR2a pz2 1 Ez = + kz 2 zm i2
pθ
pz
pθ = cte
θ z Superficie Ez = cte
Figura 4.2 Arriba: diagramas de fases sobre los planos z-pz y θ-pθ respectivamente. Abajo: Proyecci´ on de la trayectoria de fases en el subespacio tridimensional θ, z, pz . Para este ejemplo, el principio de Hamilton dice que la trayectoria correcta en el espacio de configuraci´on es aquella para la cual la integral de acci´on es extremal: # Z t2 "X Z t2 l ∂L L(q, q, ˙ t) dt = δ δ q˙ν − h(q, q, ˙ t) dt = 0 ∂ q˙ν t1 t1 ν=1 (4.110) {δqν (t1 ) = δqν (t2 ) = 0} En tanto que el principio de Hamilton en el espacio de fases (segunda forma del principio de Hamilton) dice que la trayectoria correcta en el espacio de fases es aquella ˜ (v´ease figura 4.2): para la cual es extremal la integral sobre dt de L δ
Z
t2
˜ q, L(q, ˙ p, p, ˙ t) dt =
δ
Z
l t2 X
t1 ν=1
t1
[pν q˙ν − H(q, p, t)] dt = 0
δqν (t1 ) =
δqν (t2 ) = 0
δpν (t1 ) =
δpν (t2 ) = 0
(4.111)
La formulaci´ on hamiltoniana / 101
4.4.
Las transformaciones puntuales. Las transformaciones en el espacio de fases
Puntuales son las transformaciones de un sistema de coordenadas generalizadas a otro: qν → q ν = q ν (q, t) ;
ν = 1, 2, ...l
(4.112)
Las velocidades generalizadas se transforman como: q˙ µ =
l X ∂q ν ∂q ˙ t) ; q˙µ + ν = q˙ ν (q, q, ∂qµ ∂t ν=1
ν = 1, 2, ...l
(4.113)
Bajo estas transformaciones, tanto las ecuaciones de Lagrange como las de Hamilton son covariantes. Transformaciones en el espacio de fases. Son transformaciones m´as generales que las puntuales. Si para definir el estado del sistema se requiere todo el espacio de fases, podemos pensar que cualquier conjunto de variables (2l) sirve equivalentemente para describir el estado. Un cambio de variables en el espacio de fases involucra no s´olo las coordenadas generalizadas sino tambi´en los momentos: qν , pν → q ν = q ν (q, p, t) ;
pν = pν (q, p, t) ;
ν = 1, 2, ...l
(4.114)
Ejemplo 4.4.1 Un oscilador arm´onico unidimensional. El espacio de fases es bidimensional, definido por las “coordenadas cartesianas” x − px . Definir en el espacio de fases una transformaci´ on a “coordenadas polares”; hallar a H y las ecuaciones de Hamilton en esas variables (v´ease figura 4.3). Nota: es irrelevante reemplazar a px por px /mω. La transformaci´ on a coordenadas polares est´ a dada por: p2x = r2 m2 ω 2 px tan φ = mωx x+
(4.115) (4.116)
Entonces H se transforma as´ı: H=
p2x 1 p2 1 1 + mω 2 x2 = mω 2 x2 + 2x 2 = mω 2 r2 2m 2 2 m ω 2
(4.117)
Es decir, el nuevo hamiltoniano es: 1 mω 2 r2 2 Las ecuaciones de Hamilton se transforman as´ı: ∂H ∂r ∂H ∂φ ∂H = + x˙ = ∂px ∂r ∂px ∂φ ∂px H=
∂H px 1 ∂H = + ∂r m2 ω 2 r ∂φ mωx sec2 φ
(4.118)
(4.119)
102 / Mec´ anica cl´ asica avanzada
px / mω
r
ϕ
x
Figura 4.3 Espacio de fases para el oscilador arm´onico unidimensional
p˙ x = −
∂H ∂x
=− =−
∂H ∂φ ∂H ∂r + ∂r ∂x ∂φ ∂x
−px ∂H x ∂H + ∂r r ∂φ mωx2 sec2 φ
(4.120)
Se obtiene entonces para ∂H/∂px y ∂H/∂x: ∂H ∂H senφ ∂H cos φ = + ∂px ∂r mω ∂φ mωr
(4.121)
∂H ∂H ∂H sen φ = cos φ − ∂x ∂r ∂φ r Por otra parte se tiene para x˙ y p˙ x : x˙ =
∂x ˙ ∂x φ = cos φ r˙ − r senφ φ˙ r˙ + ∂r ∂φ (4.122)
p˙x =
∂px ∂px ˙ φ = mω senφ r˙ + mωr cos φ φ˙ r˙ + ∂r ∂φ
o sea que las ecuaciones de Hamilton se transforman en: ∂H senφ ∂H cos φ cos φ r˙ − r senφ φ˙ = + ∂r mω ∂φ mωr
(4.123)
La formulaci´ on hamiltoniana / 103 ∂H ∂H senφ mω senφ r˙ + mωr cos φ φ˙ = − cos φ + ∂r ∂φ r
(4.124)
˙ El resultado se Podemos resolver simult´ aneamente a (4.123) y (4.124) para r˙ y φ. obtiene f´ acilmente con notaci´ on matricial: r˙ cos φ −senφ = ˙ senφ cos φ rφ
∂H senφ cos φ ∂r 1 1 ∂H mω − cos φ senφ r ∂φ
(4.125)
Esto se puede escribir tambi´en como: r˙ cos φ senφ cos φ −senφ = ˙ −senφ cos φ senφ cos φ rφ
∂H cos φ +senφ senφ cos φ ∂r 1 mω 1 ∂H −senφ cos φ − cos φ senφ r ∂φ
De donde:
∂H r˙ 0 1 ∂r = 1 mω 1 ∂H −1 0 rφ˙ r ∂φ
(4.126)
1 ∂H 1 r ∂φ = mω ∂H − ∂r
(4.127)
Con lo cual las ecuaciones de movimiento en las nuevas variables son: r=
1 ∂H ; mωr ∂φ
1 ∂H φ˙ = − mωr ∂r
(4.128)
Vemos que en las variables (r, φ) las ecuaciones de movimiento no toman la misma forma que las ecuaciones can´ onicas (no son r = ∂H/∂φ; φ˙ = −∂H/∂r, por ejemplo). En general, una transformaci´ on de variables en el espacio f´asico cambia la forma de las ecuaciones de movimiento. En general, las ecuaciones de Hamilton no son covariantes bajo transformaciones arbitrarias en el espacio de fases. Notemos sin embargo, que hay una transformaci´ on can´ onica en t´erminos de (r, φ). Hagamos ahora el nuevo cambio de variables: (r, φ) → (r2 , φ)
(4.129)
104 / Mec´ anica cl´ asica avanzada Si llamamos ρ = r2 , tenemos que: ∂H ∂H = 2r ; ∂r ∂ρ
ρ˙ = 2r r˙
(4.130)
O sea que las ecuaciones de Hamilton para las variables (ρ, φ), que obtenemos de (4.128) y (4.130), son: mω ∂H ρ˙ = ; 2 ∂φ
2 ∂H φ˙ = − mω ∂ρ
Notemos finalmente que si llamamos q, p, a: mω q = −φ ; p = ρ 2
(4.131)
(4.132)
las ecuaciones (4.131) se convierten en: ∂H ; p˙ = − ∂q
∂H q˙ = ∂p
(4.133)
O sea que la transformaci´ on en el espacio f´asico bidimensional definida por: r √ 2p cos q ; x= px = − 2ωp senq mω (4.134) 2 mω p p x p= x2 + 2x 2 ; q = −tan−1 2 m ω mωx deja covariantes las ecuaciones de Hamilton, donde el nuevo hamiltoniano se obtiene del anterior simplemente expresando a x y px en funci´ on de q y p mediante las f´ormulas (4.134): H = (q, p) = H [x(q, p), px (q, p)]
(4.135)
Se dice entonces que la transformaci´ on (4.134) es can´ onica. La referencia hecha en el enunciado al oscilador arm´onico no es importante, pues la covariancia de las ecuaciones de Hamilton bajo la transformaci´ on (4.134) no depende de la forma de H, siendo aplicable a cualquier sistema de un grado de libertad. En general, a la pregunta acerca de la covariancia de las ecuaciones de Hamilton bajo una transformaci´ on arbitraria en el espacio de fases, (q, p) → (q, p), se responde que no necesariamente son covariantes. Pero existe una clase de transformaciones para las cuales esto se cumple; tales transformaciones se llaman can´onicas o de contacto. La transformaci´ on empleada en las ecuaciones (4.90), (4.91) y (4.134), son ejemplos de transformaciones can´ onicas. Ejemplo 4.4.2 Efectuar una rotaci´on con velocidad angular constante a en el espacio de fases bidimensional. Mostrar que tal transformaci´ on es can´onica s´olo si al nuevo hamiltoniano se le adiciona un t´ermino. Mostrar que las f´ormulas de transformaci´ on y el nuevo hamiltoniano se pueden obtener a partir de las primeras derivadas de cierta on diferencial parcial si se anula el funci´ on F (q, q, t). Mostrar que F satisface una ecuaci´ nuevo hamiltoniano, lo cual es posible para un oscilador arm´onico.
La formulaci´ on hamiltoniana / 105 Las f´ ormulas de la transformaci´ on y su inversa son: p q = q cos at + sen at ; p = −cq sen at + p cos at c q q = q cos at − sen at ; p = cq sen at + p cos at c donde a y c son par´ ametros de la transformaci´ on que permanecen constantes. Es simple probar que: q˙ q˙ cos at −sen at = ˙ p˙ p sen at cos at c c q −sen at − cos at +a p cos at −sen at c y que: ∂H ∂H cos at −sen at ∂p ∂p = 1 ∂H 1 ∂H sen at cos at − − c ∂q c ∂q Igualando los lados derechos de (4.137) y (4.138) obtenemos: ∂H ˙ q q 0 −1 ∂p = ˙ + a p 1 ∂H q 1 0 − c c c ∂q
(4.136)
(4.137)
(4.138)
(4.139)
Las ecuaciones de movimiento para las variables q y p son: a ∂H = q˙ − p ; ∂q c
∂H = −p˙ − acq ∂q
(4.140)
Estas ecuaciones ser´an de forma can´onica solamente si se cambia el nuevo hamiltoniano:1 2 p 1 (4.141) H(q, p) = H [q(q, p), p(q, p)] + a + cq 2 2 c Notemos que las ecuaciones (4.136) permiten expresar a p/c y p/c en t´erminos de q, q: q − q cos at p = ; c sen at 1 En
p −q + q cos at = c sen at
(4.142)
as ciertos general una transformaci´ on dependiente del tiempo es can´ onica si H es igual a H m´ t´ erminos adicionales.
106 / Mec´ anica cl´ asica avanzada Si F es la funci´ on de q, q y t siguiente: F (q, q, t) = c
2qq − (q 2 + q 2 ) cos at 2 sen at
(4.143)
Comparando a (4.142) y (4.143) vemos que: p=
∂F (q, q, t) ; ∂q
p=−
∂F (q, q, t) ∂q
(4.144)
Como las ecuaciones (4.144) son completamente equivalentes a las ecuaciones de transformaci´ on (4.136), se dice que F es la funci´ on generatriz de la transformaci´ on, que ser´a can´ onica solamente si el nuevo hamiltoniano es: H =H+
∂F ∂t
(4.145)
puesto que, ∂F (q, q, t) −2qq cos at + q 2 + q 2 ca = ca = 2 ∂t 2 sen at 2
p2 2 q + 2 c
(4.146)
Los anteriores resultados valen para cualquier sistema de un grado de libertad. Para un oscilador arm´onico encontramos que: k 2 1 c2 p2 H[q(q, p), p(q, p)] = + q + − k q 2 sen2 at 2m 2 2 m (4.147) p2 k c 1 k q p sen at cos at + sen2 at + − − m c 2 c2 m Si escogemos el valor de c tal que: c2 = km
(4.148)
Obtenemos que: H(q, p) =
k q2 a p2 + q 2 + ( + cq 2 ) 2m 2 2 c
(4.149)
H ser´a cero solamente si a y c cumplen: 1 a + = 0; m c
k + ac = 0
(4.150)
Es decir, si a =√ −c/m = −k/c, valor que es compatible con el valor de c dado por (4.148). Como c = ± km, a debe valer: r k (4.151) a=± m Tomamos negativo el valor de c para que a sea positiva y coincida con la frecuencia p del oscilador ω = k/m. Notamos que H = 0 implica que q y p son constantes, o sea que las f´ ormulas (4.136) nos dan directamente la soluci´on en t´erminos de q y p que se
La formulaci´ on hamiltoniana / 107 determinan por las condiciones iniciales de q y p.2 Es simple verificar que F satisface la ecuaci´ on diferencial llamada de Hamilton-Jacobi para el oscilador arm´onico: 2 ∂F 1 ∂F 1 + kq 2 + =0 (4.152) 2m ∂q 2 ∂t F es una soluci´on de (4.152) que no posee la propiedad de ser la suma de una funci´ on de t y una funci´ on de q. Posteriormente veremos que (4.152) posee otra soluci´on por el m´etodo de separaci´on de variables (llamada soluci´on completa) que genera otra trasformaci´ on can´ onica que anula el hamiltoniano para un oscilador arm´onico.
4.5.
Las transformaciones can´ onicas o de contacto
Estas transformaciones en el espacio de fases son importantes, entre otras cosas, porque conservan el formalismo can´onico y permiten reemplazar el hamiltoniano H por una H que tenga una forma mucho m´as simple. As´ı por ejemplo, es posible mediante una transformaci´ on can´ onica hacer que todas las coordenadas sean c´ıclicas; con ello la soluci´on de un problema mec´anico se reduce a un problema de geometr´ıa en el espacio de fases: hallar la transformaci´ on can´onica adecuada. Ejemplo 4.5.1 Mostrar que la transformaci´ on de cambio de escala es can´onica independientemente de las propiedades de homogeneidad del potencial. Tal transformaci´ on es:
q ν = αqν ;
pν = βpν ;
α 6= 0 ,
β 6= 0 ;
ν = 1, 2, ...l
(4.153)
Mediante esta transformaci´ on se tiene: ∂H ∂H =α ; ∂qν ∂q ν 1 q˙ν = q˙ν ; α
∂H ∂H =β ∂pν ∂pν 1 p˙ ν = p˙ ν ; β
(4.154)
ν = 1, 2, ...l
con lo cual las ecuaciones de Hamilton se convierten en: ∂H ; q˙ ν = αβ ∂pν
∂H ; p˙ ν = −αβ ∂q ν
ν = 1, 2, ...l
(4.155)
En las nuevas variables (q, p) las ecuaciones de movimiento ser´an de la forma can´onica solamente si se cambia el hamiltoniano. H(q, p, t) = αβH(q, p, t)
(4.156)
2 Tambi´ en H = 0 si tomamos C = mω, a = −ω. Como el punto representativo del estado del oscilador en el espacio f´ asico (v´ ease figura 4.3), rota en el sentido de las agujas del reloj con velocidad angular ω, a el punto estacionario. H describe pues, un problema de equilibrio. con las coordenadas q y q se ver´
108 / Mec´ anica cl´ asica avanzada Este ejemplo, al igual que los dos anteriores, ilustra el hecho de que el car´ acter can´ onico de una transformaci´ on es algo inherente a la transformaci´ on misma, independientemente de la forma del hamiltoniano, en particular, independientemente de sus propiedades de simetr´ıa. Por esto cualquier sistema de l grados de libertad posee ecuaciones de movimiento covariantes bajo la transformaci´ on (4.153), aunque solamente si el potencial es funci´ on homog´enea de las coordenadas el sistema posee simetr´ıa de semejanza mec´anica, ecuaci´ on (4.92). As´ı mismo las transformaciones (4.115) y (4.116), no can´ onicas, y (4.134), can´onica, pueden hacerse sin referencia alguna a la forma del hamiltoniano. Sin embargo, para un hamiltoniano dado, s´olo cierta transformaci´ on can´onica permite obtener un nuevo hamiltoniano de forma simple. As´ı, para un oscilador arm´onico lineal la transformaci´ on can´onica (4.134) conduce a que H = ωp, o sea a que φ sea c´ıclica en H. Sin embargo (4.134) es aplicable a cualquier sistema de un grado de libertad. De forma similar (4.136) conduce a H = 0 para el oscilador. Ejemplo 4.5.2 Mostrar que es can´onica la transformaci´ on: q ν = αpν ;
pν = βqν ;
α 6= 0 ,
β 6= 0 ;
ν = 1, 2, ...l
(4.157)
En este caso: H = −αβH
(4.158)
En particular, la transformaci´ on con α = 1, β = −1: q ν = pν ;
pν = −qν ;
ν = 1, 2, ...l,
(4.159)
es can´ onica con H = H. Este ejemplo muestra que las nociones de “coordenada” y “momento” pierden su sentido inicial, pues mediante una transformaci´ on can´onica (T.C.) es posible hacer que los momentos pasen a hacer el papel de coordenadas y viceversa. Como en general q ν = q ν (q, p, t) y pν = pν (q, p, t), con las f´ormulas inversas qν = qν (q, p, t); pν = pν (q, p, t), se ve que se requieren tanto (q) como (p) para poder especificar la posici´on del sistema en el espacio de configuraci´on. (q) y (p) no son pues “coordenadas” y “momentos” generalizados, sino simplemente pares de cantidades can´ onicamente conjugadas. En conclusi´ on, en el espacio de fases el estado del sistema se especifica mediante un conjunto completo (de 2l) de cantidades can´onicamente conjugadas.
4.6.
La funci´ on generatriz de una transformaci´ on can´ onica
Las ecuaciones can´onicas pueden deducirse de un principio variacional en el espacio de fases (segunda forma del principio de Hamilton) y viceversa: ! Z t2 X l ∂H δ pν q˙ν − H dt = 0 ↔ q˙ν = ∂pν t1 ν=1 (4.160) ∂H ; ν = 1, 2, ...l p˙ν = − ∂qν
La formulaci´ on hamiltoniana / 109
que:
Si la transformaci´ on (q, p) ↔ (q, p) es can´onica, entonces debe tambi´en cumplirse δ
Z
t2
t1
l X
!
pν q˙ ν − H
ν=1
∂H ; p˙ ν = − ∂qν
∂H dt = 0 ↔ q˙ ν = ; ∂pν
(4.161)
ν = 1, 2, ...l
Las ecuaciones (4.160) y (4.161) indican que hay dos expresiones variacionales de las cuales pueden deducirse las ecuaciones de Hamilton. De acuerdo con la propiedad enunciada en (3.76), se sigue que los integrandos en las variacionales deben diferir a lo sumo por la derivada total respecto al tiempo de una funci´ on arbitraria de las “coordenadas” de que depende dicho integrando y del tiempo, o sea de (q, p, t), o de (q, p, t): l X
ν=1
pν q˙ν − H =
l X
ν=1
pν q˙ ν − H +
d F (q, p, t) dt
(4.162)
an relacionadas mediante la transformaci´ on can´onica, Debido a que (q, p) y (q, p) est´ F (q, p, t) puede expresarse en funci´ on de cualquier subconjunto de 2l cantidades indeon pendientes extraidos del conjunto de 4l cantidades (q, p, q, p) dependientes. La ecuaci´ (4.162) puede escribirse como: dF =
l X
ν=1
pν dqν −
l X
ν=1
pν dq ν + H − H dt
(4.163)
En el caso en que las 2l cantidades (q, q) sean independientes, podemos expresar a F en funci´ on de (q, q, t). En ese caso la T.C. se llama “transformaci´on can´onica libre de la primera clase”. Matem´ aticamente, la independencia de las 2l cantidades (q, q) se expresa mediante la condici´on de que el jacobiano de las (q) respecto a las (p) sea diferente de cero, lo cual garantiza que las (p) se puedan expresar en t´erminos de las (q): ∂qµ q 1 , q 2 , ...q l J ≡ det 6= 0 (4.164) p1 , p2 , ...pl ∂pν Si se cumple (4.164) entonces es posible expresar los pν en funci´ on de (q, q, t) y por lo tanto representar cualquier funci´ on de (q, p, t) en t´erminos de (q, q, t). En este caso es posible escribir: F (q, p, t) = F1 (q, q, t)
(4.165)
Esto permite escribir: dF = dF1 =
l l X X ∂F1 ∂F1 ∂F1 dqν + dq ν + dt ∂qν ∂qν ∂t ν=1 ν=1
(4.166)
Como las 2l + 1 cantidades (dq, dq, dt) son independientes, vemos que para una transfomaci´ on can´ onica libre de la primera clase, de (4.163) y (4.166) se sigue que: pν =
∂F1 (q, q, t) ; ∂qν
pν = −
∂F1 (q, q, t) ; ∂qν
ν = 1, 2, ...l
(4.167)
110 / Mec´ anica cl´ asica avanzada Adem´as se sigue que: ∂F1 (q, q, t) (4.168) dt La ecuaci´ on (4.167) dice que a cada transformaci´ on can´onica libre de la primera clase le corresponde una funci´ on F1 y viceversa. F1 se llama la funci´ on generatriz de la transformaci´ on can´ onica.3 H(q, p, t) − H(q, p, t) =
Ejemplo 4.6.1 Hallar la transformaci´ on can´onica generada por la funci´ on: F1 (q, q, t) = −
l X
qν q ν
(4.169)
ν=1
En (4.169) est´ a impl´ıcito que (q) y (q) son independientes. Por lo tanto las f´ormulas de la transformaci´ on can´onica ser´an: ∂F1 (4.170) pν = = −q ν ⇒ q ν = −pν ; ν = 1, 2, ...l ∂qν pν = −
∂F1 = qν ⇒ pν = qν ; ∂qν
ν = 1, 2, ...l
(4.171)
Es esencialmente la misma transformaci´ on (4.159), que intercambia coordenadas y momentos. Este ejemplo muestra que cada funci´ on de (q, q, t) define una transformaci´ on can´ onica Ejemplo 4.6.2 Probar que la transformaci´ on can´onica (4.134) es libre de la primera clase. Hallar la correspondiente funci´ on F1 . Sea q = x y p = px . Las f´ormulas de transformaci´ on ser´an entonces: r p 2p q= cos q ; p = − 2mωp sen q mω p2 1 p p = mω x2 + 2 2 ; q = −tan−1 2 m ω mωq El jacobiano (4.164) es trivial y diferente de cero: ∂q q J 6= 0 = p ∂p
(4.172) (4.173)
(4.174)
O sea que la transformaci´ on es libre de la primera clase y puede ser generada por cierta funci´ on de las variables independientes q y q. La transformaci´ on no depende del tiempo, pues suponemos a m y a ω constantes. Notamos de (4.174) que toda transformaci´ on can´ onica no puntual es libre de primera clase para sistemas de un grado de libertad. F1 (q, q, t) ha de ser tal que, de acuerdo con (4.163): p2 1 dF1 = p dq − pdq = p dq − mω q 2 + 2 2 dq (4.175) 2 m ω 3 La
funci´ on del ejemplo 4.4.2, (4.143), es la funci´ on generatriz de la transformaci´ on can´ onica (4.136).
La formulaci´ on hamiltoniana / 111 Debemos expresar a p en t´erminos de q y q lo cual se obtiene directamente de (4.173): p = −mωq tan q
(4.176)
Reemplazando a (4.176) en (4.175) obtenemos: 1 = −mωq tan q dq − mωq 2 sec2 q dq 2 1 2 q tan q = −mωd 2
dF1
(4.177)
Se sigue entonces que, salvo una constante aditiva: 1 F1 (q, q) = − mωq 2 tan q 2
(4.178)
Podemos probar directamente, usando las f´ormulas (4.167), que F1 dada por (4.178) efectivamente genera la transformaci´ on dada por (4.172) y (4.173): ∂F1 = −mωq tan q ; ∂q
∂F1 1 = − mωq 2 sec2 q ∂q 2
(4.179)
O sea que: p = −mωq tan q ;
p=
1 mωq 2 sec2 q 2
(4.180)
Al despejar en (4.180) a p y q obtenemos a (4.170), y al despejar a p y q obtenemos a (4.173). Notemos que −Et − mωq 2 tan q/2 es una soluci´on a la ecuaci´ on de HamiltonJacobi (4.152). Ejemplo 4.6.3 Sea una part´ıcula descrita por el hamiltoniano: H=
p2 − aq 2m
(4.181)
donde m y a son constantes. Hallar la T.C. que lleva al hamiltoniano: H=0
(4.182)
En las nuevas variables las ecuaciones de Hamilton con H = 0 conducen a la soluci´on trivial: p = constante ;
q = constante
(4.183)
La transformaci´ on ha de ser tal que se cumpla para F1 , seg´ un (4.167) y (4.168): ∂F1 = p; ∂q
∂F1 = −p ; ∂q
−H =
∂F1 ∂t
(4.184)
112 / Mec´ anica cl´ asica avanzada Se sigue de (4.181) y (4.184) que F1 debe ser soluci´on a la ecuaci´ on diferencial de Hamilton-Jacobi: 2 1 ∂ ∂ F1 (q, q, t) − aq = − F (q, q, t) (4.185) 2m ∂q ∂t La ecuaci´ on diferencial es de primer orden e involucra derivadas respecto a q y respecto a t. La soluci´on debe contener constantes de integraci´ on arbitrarias; una de ellas puede ser aditiva. Podemos tomar a q como la constante no aditiva de integraci´ on. La ecuaci´ on (4.185) tiene una soluci´on de la forma: F1 (q, q, t) = −qt + f (q, q)
(4.186)
La ecuaci´ on (4.186) equivale a tomar la constante q igual a la energ´ıa, puesto que H en (4.181) es constante, H = E: q=E
(4.187)
Con esta soluci´on, (4.184) se reduce a: 2 1 df (q, q) − aq = q 2m dq Integrando (4.188) obtenemos: √ 2 2m (q + aq)3/2 + constante f (q, q) = ± 3 a Con lo cual, omitiendo la constante aditiva: √ 2 2m F1 (q, q, t) = −qt ± (q + aq)3/2 3 a
(4.188)
(4.189)
(4.190)
La ecuaci´ on (4.190) genera la siguiente transformaci´ on can´onica, de acuerdo con las f´ ormulas (4.167): √ p 2m p −p = −t ± q + aq (4.191) p = ± 2m(q + aq) ; a Expl´ıcitamente la transformaci´ on es:
a q (t − p)2 q(q, p, t) = − + a 2m
p(q, p, t) = (t − p)a ; p(q, p, t) = t −
p ; a
q(q, p, t) =
p2 − aq 2m
(4.192) (4.193)
Como q y p son constantes, (4.192) proporciona la soluci´on al problema del movimiento descrito por (4.181). En particular describe el problema del movimiento de una part´ıcula en presencia de la gravedad (a = −mg , q = z , p = mz). ˙ z=
1 E − g(t − p) ; mg 2
mz˙ − mg(t − p)
(4.194)
La formulaci´ on hamiltoniana / 113 Las constantes E y p tienen las siguientes expresiones en funci´ on de los valores de z y z˙ en t = 0: E=
1 mv 2 + mgz0 ; 2 0
p=
v0 g
(4.195)
Entonces para z(t) y z(t) ˙ obtenemos: 1 z = z0 + v0 t − gt2 ; z˙ = v0 − gt (4.196) 2 de acuerdo con el resultado obtenido usando m´etodos elementales. Es claro que la transformaci´ on dada por (4.192) y (4.193) es can´onica independientemente de la forma de H y aplicable a cualquier sistema de un grado de libertad; sin embargo, s´olo para H dado por (4.181) mediante (4.192) se consigue H = 0 y por tanto que q y p sean constantes. Este problema ilustra el m´etodo de resolver un problema mec´anico mediante una transformaci´ on can´onica sin integrar las ecuaciones de Hamilton.
4.7.
La evoluci´ on temporal de un sistema considerada como una transformaci´ on can´ onica
Sean qν0 y p0ν los valores de qν y pν en t = t0 (ν = l, 2, ...l). Estos valores determinar´an todos los valores sucesivos de las (q, p), de modo que en un tiempo t podemos escribir: qν (t) = qν (q 0 , p0 , t − t0 ) ;
ν = 1, 2, ...l (4.197)
pν (t) = pν (q 0 , p0 , t − t0 ) La ecuaci´ on (4.197) puede considerarse como una cierta transformaci´ on en el espacio de fases, donde (q 0 , p0 ) son las viejas variables y (q, p) las nuevas. Esta transformaci´on es can´ onica pues tanto (q 0 , p0 ) como (q, p) satisfacen las ecuaciones de Hamilton. La funci´ on generatriz de esta transformaci´ on satisface: dF =
l X
ν=1
p0ν dqν0 −
l X
ν=1
pν dqν + (H 0 − H) dt
(4.198)
Si no hay fuerzas disipativas y las ecuaciones que definen las coordenadas generalizadas no dependen del tiempo, H se conserva, H = H 0 , luego: t l l l X X X 0 0 dF = pν dqν − pν dqν = − pν dqν (4.199) ν=1
ν=1
ν=1
t0
Por otra parte, escribamos la integral de acci´on entre t0 y t: Z t L dt S= t0
(4.200)
114 / Mec´ anica cl´ asica avanzada Una variaci´ on de las (q) nos conduce a: Z tX l ∂L ∂L δS = δqν + δ q˙ν dt ∂ q˙ν t0 ν=1 ∂qν Z tX l d ∂L d ∂L ∂L δqν dt δqν + δqν − = dt ∂ q˙ν dt ∂ q˙ν t0 ν=1 ∂qν =
Xl
ν=1
(4.201)
t # Z t "X l ∂L ∂L ∂L d δqν dt δqν + − ∂ q˙ν dt ∂ q˙ν t0 ν=1 ∂qν t0
Si asumimos que la trayectoria es real, se cumplen sobre ella las ecuaciones de Lagrange, luego: t t l l X X ∂L (4.202) pν δqν δqν = δS = ∂ q˙ν t0 ν=1
ν=1
t0
Comparando a (4.199) y (4.202) vemos que: F = −S
(4.203)
En conclusi´ on, la acci´on es la funci´ on generatriz de la transformaci´ on can´onica ´ de evoluci´ on temporal del sistema. Esta es una transformaci´ on del espacio de fases en s´ı mismo: cambia el punto del espacio de fases (q 0 , p0 ) por el punto del espacio de fases (q, p). En el ejemplo del oscilador arm´onico lineal, la figura 4.3 es una circunferencia. La evoluci´ on temporal consiste simplemente en una rotaci´on del vector de posici´on del punto del espacio f´ asico que representa al sistema, lo cual tambi´en puede verse en las f´ ormulas (4.172), y m´as claramente a´ un mediante el ejemplo 4.4.2.
4.8.
El teorema de Liouville
El teorema de Liouville es un teorema b´ asico para la mec´anica estad´ıstica, o sea la mec´anica de sistemas tales que: (a) El n´ umero de grados de libertad es muy grande. (b) No se pueden determinar las 2l condiciones iniciales, y por lo tanto tampoco el estado del sistema en sentido cl´asico. Solamente se conoce el hamiltoniano del sistema, las condiciones de ligadura, y a lo sumo siete de las 2l constantes de movimiento (las ~ P~ ). aditivas: H, L, (c) Respecto a las condiciones iniciales, o sea a las posibles trayectorias del espacio de fases, s´olo se pueden hacer suposiciones estad´ısticas. En particular se puede asumir que todas las trayectorias de fase compatibles con las ligaduras y con los valores de las siete constantes de movimiento aditivas son igualmente probables (distribuci´ on uniforme). En general, habr´ a una regi´on del espacio de fases que es accesible al sistema y se puede postular alguna distribuci´ on de probabilidades de las distintas trayectorias de fase dentro de la regi´on accesible (las trayectorias externas a la regi´ on accesible tienen probabilidad cero).
La formulaci´ on hamiltoniana / 115 Ejemplo 4.8.1 Analizar un oscilador arm´onico lineal cuando s´olo se conoce exactamente su energ´ıa. Mediante la transformaci´ on can´onica (4.172), la din´amica del oscilador est´ a descrita por: q=
r
2p cos q ; mω
p=−
p 2mωp senq ;
H = ωp = E
(4.204)
Las ecuaciones can´ onicas en las variables (q, p) tienen la soluci´on: E = constante (4.205) ω donde δ es una constante arbitraria. La otra constante arbitraria es E. O sea que dados E y δ queda determinado completamente el estado de movimiento: r 2E cos (ωt + δ) q(E, δ, t) = mω 2 (4.206) √ p(E, δ, T ) = − 2mE sen(ωt + δ) q = ωt + δ ;
p=
p / mω
r
t>0
δ
q
(2E / mω 2 ) 1/2 t=0
Figura 4.4 Espacio de fases del oscilador arm´onico lineal para E conocida E define el radio de la trayectoria y δ el tiempo inicial de la misma (v´ease figura 4.4). on accesible la constituyen todos los puntos de una circunferencia de radio p La regi´ 2E/(mω 2 ). Las diferentes trayectorias est´ an definidas por los valores de δ.
Ejemplo 4.8.2 Analizar el oscilador tridimensional sometido a la ligadura de moverse u ´nicamente sobre la superficie de un cilindro, cuando s´olo se conoce exactamente la energ´ıa y el momento angular en la direcci´ on z (ver ejemplo 4.3.1).
116 / Mec´ anica cl´ asica avanzada La figura 4.2 muestra que cada valor de Ez determina un “cilindro” en el espacio de fases. La energ´ıa total es, de acuerdo con la ecuaci´ on (4.105): L2z (4.207) 2mR2 Parte de la energ´ıa est´ a asociada al movimiento en z y parte a la rotaci´on, siendo ambas constantes por separado. Para Lz arbitrario, la regi´on accesible del espacio f´asico est´ a definida por el “cilindro” E = constante. Todos los puntos interiores a este cilindro son accesibles. Para Lz y Ez dados, habr´ a un conjunto infinito de trayectorias de fase en “espiral”, caracterizada cada una por los valores de θ0 y δ [ecuaciones (4.106) y (4.107)], que pueden estar entre 0 y 2π. En el caso en que se conozcan Lz y Ez , la distribuci´ on uniforme para este sistema es aquella en la cual todos los valores de θ0 y δ tienen igual probabilidad. En general cuando s´olo se conocen exactamente la energ´ıa total, el momento lineal total y el momento angular total del sistema, adem´as de las ligaduras, la regi´on del espacio de fases accesible al sistema est´ a definida por las ecuaciones: E = Ez +
E(q, p) = E0 ;
~ p) = L ~0 ; L(q,
P~ (q, p) = P~0
(4.208)
que definen una variedad de 2l − 7 dimensiones en el espacio de fases.4 Las 2l − 7 constantes de movimiento adicionales no son determinadas; la distribuci´ on microcan´ onica asigna a cada uno de los estados caracterizados por (4.208) y los valores de las 2l − 7 constantes restantes igual probabilidad. Conjunto estad´ıstico. Es una noci´on u ´til en los casos donde hay 2l−7 constantes de movimiento no determinadas. Consiste en un conjunto de sistemas iguales (el mismo n´ umero de grados de libertad, la misma clase de part´ıculas y de interacciones, las mismas ligaduras y los mismos valores de las constantes de movimiento aditivas). Es decir, dos sistemas de un conjunto estad´ıstico s´olo pueden diferir por los valores de las 2l − 7 constantes no aditivas. Se considera que el n´ umero de sistemas es muy grande, de modo que es una muestra estad´ısticamente representativa de la distribuci´ on de los valores de las 2l − 7 constantes indeterminadas. En cada instante del tiempo, el estado de cada sistema del conjunto ser´a representado por un punto del espacio f´asico, y su estado de movimiento por una trayectoria de fases. El conjunto estad´ıstico de sistemas de l grados de libertad estar´ a representado en cada instante por un “enjambre” de puntos del espacio f´ asico. Como los sistemas del conjunto estad´ıstico no interact´ uan, cada punto se mueve independientemente de los dem´ as en el espacio f´asico 2l-dimensional.5 Teorema de Liouville. En cada elemento de volumen del espacio f´asico la densidad de puntos representativos del conjunto estad´ıstico permanece constante en el tiempo. Sea dΓ = dq1 dq2 , ...dql dp1 , dp2 , ...dpl = dΓq dΓp un elemento de volumen infinitesimal del espacio de fases. Sea: dN = ρ(p, q, t)dΓq dΓp
(4.209)
4 Estas constantes tienen la propiedad de ser aditivas. La variedad puede reducirse si tomamos en cuenta que asociadas a la posici´ on del centro de masa de un sistema libre hay tres constantes; quedar´ıan en ese caso 6N − 10 constantes no determinadas. 5 Un conjunto estad´ ıstico tiene analog´ıa con los “ensambles” que mencionamos en la secci´ on 2.3.
La formulaci´ on hamiltoniana / 117 el n´ umero de sistemas dentro de dΓ. A ρ(q, p, t) se le llama la funci´ on de distribuci´ on estad´ıstica y hace el papel de funci´ on de densidad de probabilidad en el espacio de fases. ρ satisface la condici´on de normalizaci´ on: Z ρdΓq dΓp = 1 (4.210) donde la integral abarca todo el espacio de fases. Matem´ aticamente el teorema dice que: l
ρ˙ = 0
o
dρ X = dt ν=1
∂ρ ∂ρ q˙ν + p˙ ν ∂qν ∂ p˙ ν
+
∂ρ =0 ∂t
(4.211)
Una forma cualitativa de visualizarlo se da a continuaci´on. Sea un volumen arbitrario del espacio de fases en t = t0 . Como el n´ umero de sistemas es muy grande, en la frontera de tal volumen habr´ a un gran n´ umero de puntos representativos de sistemas del conjunto, de modo que aproximadamente podemos decir que la frontera del elemento de volumen est´ a definida por un conjunto de puntos representativos del conjunto estad´ıstico. Cuando transcurre el tiempo, el volumen se mueve al moverse los puntos de la frontera. El tama˜ no del volumen podr´a cambiar, pero no el n´ umero de puntos que lo constituyen. En efecto, sea (q, p) un punto arbitrario de la frontera. Todo punto que entre o salga del elemento de volumen deber´a pasar por la frontera, pero al llegar a la frontera tendr´a los mismos (q, p) de un punto de la misma. Ambos puntos tendr´an las mismas condiciones iniciales para el movimiento posterior, en consecuencia deber´an seguir movi´endose juntos. En conclusi´ on, el n´ umero de puntos en cualquier regi´on del espacio f´ asico es constante. Se puede demostar que: Z Z (4.212) dΓq dΓp = dΓq dΓp donde la transformaci´ on (q, p) → (q, p) es can´onica. Como la evoluci´ on temporal es una T.C., se sigue que: Z Z dΓq0 dΓp0 = dΓq dΓp (4.213) Como no cambian con el tiempo ni el volumen ni el n´ umero de puntos dentro de ´el, la densidad ser´a constante. Demostraci´ on del teorema de Liouville. Sea un conjunto estad´ıstico de sistemas de un grado de libertad, entonces el espacio f´asico es bidimensional y dΓ = dq dp. Adem´as, dN = ρ dq dp es el n´ umero de sistemas en dΓ. Consideremos que cada uno de los sistemas del conjunto tiene energ´ıa entre E y E + ∆E. La figura 4.5 muestra la regi´on accesible, definida por las l´ıneas E = constante y E + ∆E =p constante (depser osciladores arm´onicos, tal regi´on ser´ıa una corona circular de radios 2E/mω 2 y 2(E + ∆E)/mω 2 ). Cuando el tiempo transcurre, los puntos representativos del conjunto se mueven dentro de esta regi´on. Entre t y t + dt entran al elemento de volumen dΓ todos los puntos que se mueven hacia el frente a las caras de la izquierda e inferior. El n´ umero de los puntos que entran a dΓ durante el tiempo dt
118 / Mec´ anica cl´ asica avanzada p
E + dE
t
t + dt dp
E
pdt (q,p) dq
q
qdt
Figura 4.5 Espacio f´asico. Regi´on accesible definida por las l´ıneas E = constante y E +∆E = constante.
ser´a igual a: ρq˙ dt dp + ρp˙ dt dq
(4.214)
O sea que el n´ umero de puntos que entran a dΓ por unidad de tiempo es: ρq˙ dp + ρp˙ dq = ρ(q˙ dp + p˙ dq)
(4.215)
Para hallar los puntos que salen, debemos considerar los que se mueven dentro de dΓ hacia las caras derecha y superior y que las alcanzar´ an en el tiempo dt. Esto se puede obtener de (4.215) mediante una expansi´ on de Taylor alrededor de (q, p), para hallar (4.215) en (q + dq, p + dp): (ρq)| ˙ q+dq dp + (ρp)| ˙ p+dp dq˙ = ∂ ∂ (ρq) ˙ dq dp + ρp˙ + (ρp) ˙ dp dq ρq˙ + ∂q ∂p
(4.216)
La variaci´ on del n´ umero de puntos dentro de dΓ es igual a lo que entra menos lo que sale por unidad de tiempo, o sea a (4.215) menos (4.216): ∂ ∂ − (ρq) ˙ + (ρp) ˙ dq dp (4.217) ∂q ∂p Dentro de dΓ la rata de incremento temporal de la densidad ser´a ∂ρ/∂t y el cambio del n´ umero de puntos en dΓ por unidad de tiempo es (∂ρ/∂t).dq dp y debe ser igual a (4.217): ∂ ∂ ∂ρ dq dp = − (ρq) ˙ + (ρp) ˙ dq dp (4.218) ∂t ∂q ∂ρ
La formulaci´ on hamiltoniana / 119 Se sigue entonces que: ∂ρ ∂ q˙ ∂ρ ∂ p˙ ∂ρ +ρ + q˙ + ρ + p˙ = 0 ∂t ∂q ∂q ∂p ∂p
(4.219)
Usando las ecuaciones de Halmilton se tiene: ∂2H ∂2H ∂ q˙ ∂ p˙ + = − =0 ∂q ∂p ∂q∂p ∂p∂q
(4.220)
Con lo cual (4.219) nos da el resultado: ∂ρ ∂ρ ∂ρ dρ + q˙ + p˙ = =0 ∂t ∂q ∂p dt
(4.221)
La generalizaci´ on a sistemas de varios grados de libertad es an´aloga. En ese caso debemos reemplazar el plano p − q por el plano pν − qν correspondiente al grado de libertad ν. dΓ → dqν dpν es la proyecci´on del elemento de volumen dΓq dΓp sobre el plano ν. Las l´ıneas E y E + dE son el corte del plano ν con las hipersuperficies en el espacio de fases E = constante, E + dE = constante. dΓ ser´a: dΓ = dΓp dΓq = dq1 dq2 ...dqν−1 dqν+1 ...dql dp1 dp2 (4.222) ...dpν−1 dpν+1 ...dpl dqν dpν = dΓν dqν dpν ;
ν = 1, 2, ...l
Debemos reemplazar las ecuaciones (4.215) y (4.216) por: ρ dΓν (q˙ dpν + p˙ ν dqν ) y, ∂ ν ν ρ dΓ q˙ν + (ρ dΓ q˙ν ) dqν dpν ∂qν
∂ ν ν + ρ dΓ p˙ ν + (ρ dΓ p˙ ν ) dpν dqν ∂pν
(4.223)
(4.224)
Por tanto la variaci´ on del n´ umero de puntos en el ´area dqν dpν ser´a igual a (4.223)(4.224): ∂ ∂ ν ν (ρ dΓ q˙ν ) + (ρ dΓ p˙ ν ) dqν dpν = − ∂qν ∂pν (4.225) ∂ ∂ (ρq˙ν ) + (ρp˙ν ) dΓ − ∂qν ∂pν La variaci´ on del n´ umero de puntos en todo el volumen dΓ es igual a la suma de las variaciones de los n´ umeros de puntos sobre sus proyecciones q1 − p1 , q2 − p2 , ...ql − pl . ´ Esta ser´a: l X ∂ ∂ (ρq˙ν ) + (ρp˙ ν ) dΓ (4.226) − ∂qν ∂pν ν=1 Usando el resultado (4.220) para cada grado de libertad e igualando (4.226) a ∂ρ/∂t dΓ obtenemos el teorema de Liouville, ecuaci´ on (4.211).
120 / Mec´ anica cl´ asica avanzada Ejemplo 4.8.3 Sea un conjunto de cuatro part´ıculas iguales que se lanzan hacia arriba en un campo gravitacional uniforme, con las siguientes condiciones iniciales: z10 = z0 ,
z20 = z0 + ∆z0
z30 = z0 ,
z40 = z0 + ∆z0
pz10 = p0 ,
pz20 = p0
(4.227)
pz30 = p0 + ∆p0 , pz40 = p0 + ∆p0 (a) Hallar la regi´on que inicialmente ocupa el conjunto en el espacio de fases. (b) Hallar las trayectorias de fase de las part´ıculas. (c) Considerar c´ omo cambia la regi´on ocupada por el conjunto para t > 0. El espacio f´ asico de cada sistema es 6-dimensional, pero s´olo hay variaciones en la proyecci´on bidimensional z − pz . x, px , y y py permanecen constantes, ya que por definici´on las part´ıculas no interact´ uan entre s´ı. La energ´ıa de cada part´ıcula es constante. Entonces: Hi =
p2zi + mgzi = Ei = constante ; 2m
i = 1, 2, 3, 4
(4.228)
La ecuaci´ on de la trayectoria de cada part´ıcula en el espacio de fases ser´a parab´olica: p (4.229) pzi = ± 2m(Ei − mgzi )
De acuerdo con (a) y (b) las Ei ser´an:
p20 + mg(z0 + ∆z0 ) 2m
E1 =
p20 + mgz0 ; 2m
E3 =
(p0 + ∆p0 )2 + mgz0 2m
E4 =
(p0 + ∆p0 )2 + mg(z0 + ∆z0 ) 2m
E2 =
(4.230)
Asumiendo positivos a ∆p0 y ∆z0 , vemos que: E4 > E3 ;
E4 > E2 ;
E3 > E1 ;
E2 > E1
(4.231)
Adem´as, para precisar, asumamos que ∆p0 y ∆z0 son tales que E3 > E2 , de modo que: E4 > E3 > E2 > E1
(4.232)
La soluci´on a este problema es: pzi = pzi0 − mgt ;
zi = zi0 +
pzi0 1 t − gt2 ; m 2
i = 1, 2, 3, 4
(4.233)
La formulaci´ on hamiltoniana / 121 De modo que: pz 1 = z1 = pz 3 =
pz2 = p0 − mgt
p0 − mgt ; z0 +
p0 1 t − gt2 ; m 2
p0 + ∆p0 − mgt ;
z2 = z0 + ∆z0 +
p0 1 t − gt2 m 2
pz4 = p0 + ∆p0 − mgt
(4.234)
1 p0 + ∆p0 t − gt2 m 2
z3 =
z0 +
z4 =
z0 + ∆z0 +
1 p0 + ∆p0 t − gt2 m 2
Las ecuaciones (4.234) nos dicen que: Pz1 = pz2 = p < p0 ; z3 = z1 + z2 = z1 + ∆z0 ;
∆p0 t m
Pz3 = pz4 = p + ∆p0 (4.235)
∆p0 t; z4 = z2 + m
z4 = z3 + ∆Z0
z1 = z La figura 4.6 muestra la regi´ on ocupada por el conjunto en el espacio de fases, en t = 0 y en t > 0. Vemos que el ´ area (volumen) del espacio f´asico ocupada por el conjunto de sistemas permanece constante en el tiempo y es igual a: ∆z0 ∆p0
(4.236)
Dicha regi´ on se mueve distorsion´andose pero sin cambiar el valor del ´area. El resultado es el mismo en el caso en que dentro del ´area en menci´ on haya un n´ umero arbitrario de puntos: el ´ area de la regi´on limitada por las l´ıneas 1 − 2, 2 − 4, 3 − 4 y 1 − 3 permanecer´ıa constante y todos los puntos quedar´ıan dentro. La densidad de puntos en el espacio de fases tambi´en es una constante; en este caso. 4 = constante ∆z0 ∆p0
(4.237)
De haber inicialmente en el centro del rect´angulo una quinta part´ıcula, esta permanecer´ıa en el centro del cuadril´ atero en t > 0. La figura 4.7 muestra las trayectorias de fase. Ejemplo 4.8.4 Sea una part´ıcula que se lanza hacia arriba en presencia de un campo gravitacional uniforme. Sus condiciones iniciales se conocen con cierta indeterminaci´on:
122 / Mec´ anica cl´ asica avanzada
pz p0 + ∆p0
3
4
1
2
∆p0t / m
p0 3
p + ∆p0
4
p 1 z0 + ∆z0
z0
2 z + ∆z0
z
z
Figura 4.6 Regi´on ocupada por el conjunto de sistemas en el espacio de fases pz p0 + ∆p0 p0
3
4
1
2
z z0
z0 + ∆z0 2
1 3
1 2
4
3 4
Figura 4.7 Trayectorias de fase. Caso en que dentro del ´area hay un n´umero arbitrario de puntos
z(0) = z0 ±
∆z0 ; 2
pz (0) = p0 ±
∆p0 2
(4.238)
Es decir, se sabe que en t = 0 la part´ıcula est´ a en un rect´angulo de ´area ∆z0 ∆p0 en el espacio de fases. Analizar la evoluci´ on de la part´ıcula. Basta considerar el movimiento de la part´ıcula en los valores extremos de las condiciones iniciales (z0 − ∆z0 /2 , p0 − ∆p0 /2 ; z0 − ∆z0 /2 , p0 + ∆p0 /2 ; z0 + ∆z0 /2 , p0 −
La formulaci´ on hamiltoniana / 123 ∆p0 /2 ; z0 + ∆z0 /2 , p0 + ∆p0 /2), que coinciden con las condiciones iniciales (4.227) del ejemplo anterior, cambiando z0 por z0 + ∆z0 /2 y p0 por p0 + ∆p0 /2. Se concluye inmediatamente que para una part´ıcula se cumple: ∆z(t) ∆pz (t) = ∆z(0) ∆pz (0) = constante = ∆z0 ∆p0
(4.239)
Para un valor dado de esta constante, si se reduce la indeterminaci´on en z, se aumenta la indeterminaci´on en ∆pz y viceversa. Cl´asicamente no hay l´ımite al valor m´as peque˜ no que puede tomar la constante ∆p0 ∆z0 . Cu´ anticamente no puede ser menor que ¯h/2, donde ¯h es la constante de Planck, luego: ∆z ∆pz ≥
¯ h 2
(4.240)
La ecuaci´ on (4.240) se denomina la desigualdad de Heisenberg. El resultado (4.239) es v´alido en general, de acuerdo con el teorema de Liouville. La proyecci´on del volumen del espacio f´asico dentro del cual inicialmente se encuentra la part´ıcula, ∆Γ0 = ∆p10 ∆q10 ∆p20 ∆q20 ...∆pl0 ∆ql0 , sobre el plano qν − pν , tiene un ´ area ∆pν0 ∆qν0 . Se tiene entonces que: ∆pν (t) ∆qν (t) = ∆pν0 ∆qν0 = constante
(4.241)
O sea que, cu´anticamente se cumple que para cualquier par de variables can´ onicamente conjugadas: ∆pν ∆qν ≥
¯ h 2
(4.242)
Cl´asicamente, para un valor dado de la constante ∆pν0 ∆qν0 , al aumentar la indeterminaci´ on de pν , se disminuye la indeterminaci´on de qν y viceversa. Lo espec´ıfico de la desigualdad de Heisenberg (el “efecto cu´antico”) es que la constante no puede ser cero sino que tiene un m´ınimo valor.
124 / Mec´ anica cl´ asica avanzada
5 Movimiento de dos part´ıculas que interact´ uan por medio de una fuerza central ´ Este es un problema que en principio es soluble de manera exacta para cualquier fuerza central. Pertenece a los pocos problemas de la mec´anica cl´asica en que es posible la separaci´on de las variables. Como se sabe, no existen soluciones anal´ıticas exactas para el problema general de m´as de dos part´ıculas interactuando mutuamente por fuerzas de dos part´ıculas.
5.1.
Coordenadas de centro de masa y coordenadas relativas
En general las coordenadas de las part´ıculas individuales, por ejemplo X1 , Y1 , Z1 , X2 , Y2 y Z2 , no permiten desacoplar las ecuaciones de movimiento. S´ olo cuando las fuerzas son lineales ha sido dise˜ nado un formulismo que desacopla las ecuaciones de movimiento mediante la transformaci´ on a coordenadas normales. Afortunadamente, el problema de dos part´ıculas que interact´ uan a trav´es de una fuerza central admite la separaci´on de variables mediante la transformaci´ on a las coordenadas relativas y de centro de masa. ~ = m1~r1 + m2~r2 , ~r = ~r2 − ~r1 , R m1 + m2 (5.1) m m 2 1 ~− ~+ ~r1 = R ~r , ~r2 = R ~r M M Un potencial central es aquel que depende s´olo de la distancia entre las part´ıculas: V (~r1 , ~r2 ) = V (|~r2 − ~r1 |) = V (r)
(5.2)
Las f´ ormulas (5.1) permiten escribir la energ´ıa cin´etica as´ı: T =
2 2 1 1 ~˙ 2 1 ˙ 2 1 m1~r˙ 1 + m2~r˙ 2 = M R + µ~r 2 2 2 2
125
(5.3)
126 / Mec´ anica cl´ asica avanzada donde M es la masa total y µ la masa reducida: m1 m2 m1 + m2 Entonces en vez de L ~r1 , ~r2 , ~r˙ 1 , ~r˙ 2 podemos escribir: M = m1 + m2 ;
µ=
2 ~˙ + 1 µ~r˙ 2 − V (r) ~ ~r˙ , R ~˙ = 1 M R L ~r, R; 2 2
(5.4)
(5.5)
~ es c´ıclica y por lo tanto el momento lineal del centro de masa es una constante de R movimiento. L consta de t´erminos desacoplados, es decir, describe un sistema equivalente de dos part´ıculas, una libre de masa M colocada en el centro de masa y otra de masa µ colocada por ejemplo en la posici´on de la part´ıcula 2, y sometida al efecto de un centro de fuerzas inm´ovil colocado en la posici´on de la part´ıcula 1, y exactamente sometida a la misma energ´ıa potencial de interacci´ on de las dos part´ıculas originales: LCM =
1 ~˙ 2 MR ; 2
Lrel =
1 ˙2 µ~r − V (r) 2
(5.6)
Lrel es esf´ericamente sim´etrico pues depende s´olo de la magnitud de los vectores ~r y ~r˙ . En consecuencia, el momento angular de la part´ıcula de masa reducida µ, ~l = ~r × µ~r˙ , es una constante de movimiento. Para pasar al formalismo hamiltoniano, evaluemos los momentos can´onicos conju~ gados de ~r y R: p= ~
∂L = µ~r˙ ; ∂~r˙
∂L ~˙ = MR P~ = ˙ ~ ∂R
(5.7)
Entonces el hamiltoniano del sistema ser´a: H=
P~2 p~2 + + V (r) 2M 2µ
(5.8)
H es una constante de movimiento, as´ı como por separado lo son la energ´ıa del centro de masa y la de la part´ıcula de masa reducida. Sistema de coordenadas de centro de masa. Es un sistema de coordenadas con origen colocado en el centro de masa. Las f´ormulas de transformaci´ on son (v´ease la figura 5.1): ~r1c = ~r2c
m2 m2 ~r (~r1 − ~r2 ) = − M m1
m1 m1 = (~r2 − ~r1 ) = ~r M M
(5.9)
Adem´as se cumple que: m1~r1c + m2~r2c = 0 ;
~r2c − ~r1c = ~r
No existen f´ ormulas que expresen a ~r1 , ~r2 en funci´ on de ~r1c y ~r2c .
(5.10)
Movimiento de dos part´ıculas que interact´ uan ... / 127 La energ´ıa total de las dos part´ıculas en el sistema de referencia del centro de masa es: Ec =
2 2 1 1 1 2 m1~r˙ 1c + m2~r˙ 2c + V (r) = µ~r˙ + V (r) 2 2 2
(5.11)
y el momento angular respecto al centro de masa: ~ c = ~r1c × m1~r˙ 1c + ~r2c × m2~r˙ 2c = µ~r × ~r˙ L
(5.12)
1 r1c
r2c r1 2 R
r2
O Figura 5.1 Sistema de coordenadas de centro de masa para dos part´ıculas Se ve que la energ´ıa total en el sistema del centro de masa coincide con la energ´ıa total de la part´ıcula de masa reducida, y el movimiento angular total coincide con el momento angular de la part´ıcula de masa reducida. El momento angular total en el sistema de referencia del laboratorio es: ~ ×R ~˙ + µ~r × ~r˙ ~ = ~r1 × m1~r˙ 1 + ~r2 × (m2~r˙ 2 ) = M R (5.13) L
vemos que es igual al momento angular del centro de masa m´as el momento angular respecto al sistema de referencia del centro de masa. Finalmente podemos afirmar que los aspectos no triviales del problema est´ an en el movimiento de la part´ıcula de masa reducida. Ecuaciones de Lagrange para las coordenadas relativas. Tomemos un sistema de coordenadas esf´ericas para ubicar la part´ıcula de masa reducida µ (v´ease figura
128 / Mec´ anica cl´ asica avanzada z êϕ
êΦ êr
r
Θ y
ϕ
êΦ
x
Figura 5.2 Posici´ on ~r de la part´ıcula µ en coordenadas esf´ericas
5.2). No hay ninguna raz´ on f´ısica para suponer d´ onde est´ a el origen de ese sistema de coordenadas. Si queremos podemos colocarlo en el centro de masa o, como se propuso antes, en la posici´on de la part´ıcula 1. Las componentes de ~r y ~r˙ es conveniente expresarlas en coordenadas esf´ericas; esto es simple mediante las f´ormulas de transformaci´ on entre vectores unitarios: eˆr =
senθ cos φ ˆi + senθ senφ ˆj + cos θ kˆ
eˆθ =
−senφ ˆi + cos φ ˆj
eˆφ =
senθ kˆ − cos θ (cos φ ˆi + senφ ˆj)
(5.14)
y las f´ ormulas inversas: ˆi =
senθ cos φ eˆr − senφ eˆθ − cos θ cos φ eˆφ
ˆj =
senθ senφ eˆr + cos φ eˆθ − cos θ senφ eˆθ
kˆ =
cos θ eˆr + senθ eˆφ
(5.15)
´estos son dos conjuntos ortonormales de vectores de base (v´ease figura 5.2). Entonces ~r y ~r˙ tienen las siguientes expresiones: ˙eφ + r senθ φˆ ˙ eθ ~r = rˆ er ; ~r˙ = rˆ ˙ er − rθˆ
(5.16)
Movimiento de dos part´ıculas que interact´ uan ... / 129 El lagrangiano en coordenadas esf´ericas es: 1 L = µ r2 + r2 θ˙2 + r2 sen2 θ φ˙ 2 − V (r) (5.17) 2 donde hemos suprimido la parte correspondiente al centro de masa. La coordenada φ es c´ıclica y por ello su momento can´ onico conjugado pφ es una constante de movimiento: pφ =
∂L = µr2 sen2 θ φ˙ = constante ∂ φ˙
(5.18)
Debido a la simetr´ıa de rotaci´on del lagrangiano, todas las componentes del momento angular son constantes de movimiento. Las componentes esf´ericas, o sea, a lo largo de los vectores unitarios eˆr , eˆθ , eˆφ , son: lr = 0 ,
lθ = µr2 θ˙ ,
lφ = µr2 senθ φ˙
(5.19)
en tanto que las componentes cartesianas son: ˙ + φ˙ senθ cos θ cos φ) lx = −µr2 (θsenφ ly = µr2 (θ˙ cos φ − φ˙ senθ cos θ senφ)
(5.20)
lz = µr2 sen2 θ φ˙ Los otros momentos can´ onicos conjugados son: pr =
∂L = µr˙ ; ∂ r˙
pθ =
∂L = µr2 θ˙ ∂ θ˙
(5.21)
pr y pθ no son constantes de movimiento. Podemos expresar las componentes de ~l, (5.19) y (5.20), en funci´ on de los momentos can´onicos: lθ = pθ ;
lφ =
pφ ; senθ
l2 = p2θ +
p2φ sen2 θ
(5.22)
lx = −pθ senφ − pφ cot θ cos φ ly = −pθ cos φ − pφ cot θ senφ
(5.23)
lz = pφ N´ otese la similitud de (5.23) con las correspondientes expresiones cu´antico-mec´anicas, y aun con las componentes l± = lx ± ily : l+ = (ipθ − pφ cot θ)eiφ ;
l− = (−ipθ − pφ cot θ)e−iφ
(5.24)
En coordenadas esf´ericas la constante de movimiento pφ , el momento can´onico conjugado a φ, coincide con la componente Z del momento angular. lθ y lφ no son constantes de movimiento, pero s´ı lx , ly y lz , como tambi´en: lr = 0 ;
lz = pφ ;
l2 = p2θ +
p2φ = µ2 r4 (θ˙2 + sen2 θφ˙ 2 ) sen2 θ
(5.25)
130 / Mec´ anica cl´ asica avanzada de lo anterior se sigue que existe un valor m´ınimo de θ dado por: pφ senθmin = ; θmax = π − θmin l
(5.26)
Como ~l es constante, tenemos que los vectores ~r y ~r˙ siempre permanecer´ an en un plano perpendicular a ~l, o sea que cuando las fuerzas son centrales la part´ıcula de masa reducida permanece siempre sobre un plano; las ´orbitas son planas. θmin y θmax son los ´ angulos de m´aximo y m´ınimo acercamiento de la part´ıcula al eje Z respectivamente, donde θ˙ cambia de signo. Comparando la expresi´on (5.25) para ~l 2 , con (5.17), obtenemos: L=
l2 1 − V (r) µr˙ + 2 2µr2
(5.27)
En esta forma se nota la completa simetr´ıa esf´erica del lagrangiano, ya que s´olo depende de r pues ~l es una constante. El hamiltoniano es: H=
p2r l2 + V (r) + 2µ 2µr2
(5.28)
En esta expresi´on para H podemos tomar ventaja del hecho de depender s´olo de la parte radial: H describe el movimiento unidimensional equivalente de una part´ıcula de masa µ en un potencial efectivo: Vef (r) =
l2 + V (r) 2µr2
(5.29)
La segunda ley de Kepler. Podemos definir las coordenadas de manera que desaparezca del problema uno de los ´angulos. Si tomamos el eje Z de modo que coincida con la direcci´ on de ~l, que es constante, entonces el movimiento permanecer´ a siempre sobre el plano X − Y : θ = π/2 = constante; θ˙ = 0, con lo cual la magnitud del momento toma la forma: l = pφ = µr2 φ˙ = constante
(5.30)
En el plano de la ´orbita, el ´area barrida por el radio vector en un tiempo dt es dA = (1/2)r2 dφ, siendo dφ el ´angulo que gira el radio vector en el tiempo dt. Entonces, 1 l A˙ = r2 φ˙ = = constante 2 2µ
(5.31)
Nos dice que la velocidad areolar es constante para cualquier movimiento bajo fuerzas centrales (segunda ley de Kepler, descubierta emp´ıricamente en 1609 en observaciones planetarias. La primera y la tercera leyes de Kepler valen s´olo para potenciales de la forma 1/r). El problema unidimensional equivalente. Del lagrangiano (5.27) se sigue la ecuaci´ on de movimiento: l2 d d V + = − Vef = fc + f (5.32) µ¨ r=− dr 2µr2 dr
Movimiento de dos part´ıculas que interact´ uan ... / 131 donde f es la fuerza derivable de V y fc es la llamada fuerza centr´ıfuga, derivada del potencial centr´ıfugo l2 /(µr2 ). La ecuaci´ on radial (5.32) supone un observador fijo respecto a la direcci´ on del radio; como el radio vector gira, para este observador aparece una fuerza inercial que es precisamente fc . Como el hamiltoniano (5.28) es una constante de movimiento, la energ´ıa total en el centro de masa, que llamaremos E, proporciona una ecuaci´ on diferencial para r que puede integrarse por cuadratura: Z r dr t − t0 = (5.33) 1/2 r0 2 l2 (E − V ) − 2 2 µ µ r de (5.33) en principio puede obtenerse a r en funci´ on del tiempo, para cada conjunto de valores de t0 , r0 , µ, E y l. Es de inter´es encontrar a r en funci´ on de φ, o sea, hallar la ecuaci´ on de la ´ orbita en coordenadas polares en el plano de la misma. De (5.30) podemos notar que: r˙ =
l dr µr2 dφ
de donde: φ − φ0 =
Z
(5.34)
r
r0
l r2
dr 1/2 l2 2µ E − V − 2µr2
(5.35)
De manera similar puede hallarse a φ(t) si se conoce a r(t): Z r l dt φ − φ0 = 2 r0 µ r (t)
(5.36)
Las f´ ormulas (5.34) y (5.35), recordemos, valen si se eligen las coordenadas de modo que el eje z coincide con la direcci´ on de ~l. Para una elecci´on general de las coordenadas, las expresiones para hallar la ecuaci´ on de la ´orbita y la dependencia temporal de θ y φ resultan m´as complicadas: estas f´ormulas las consideramos m´as adelante usando el formalismo de Hamilton-Jacobi. La f´ormula (5.33) no depende de la elecci´on de las coordenadas. Hallemos ahora la llamada ecuaci´ on diferencial de la ´orbita. Es una ecuaci´ on diferencial para r en funci´ on de φ. Se halla a partir de (5.34) y de: r˙ = −
l dυ ; µ dφ
r¨ = −
l2 2 d2 υ υ ; µ2 dφ2
donde υ =
1 r
(5.37)
Con la ayuda de (5.37), la ecuaci´ on (5.32) se transforma en la ecuaci´ on diferencial de la o ´rbita: µ F (υ) d2 υ =− 2 2 , dφ2 l υ
(5.38)
donde F (υ) = f (1/υ). Esta ecuaci´ on permite, dada f (r) hallar a r(φ), y dada r(φ) hallar a f (r).
132 / Mec´ anica cl´ asica avanzada Coordenadas de retorno. Son los valores de las coordenadas en que la respectiva velocidad se anula, o sea, que cambia de signo. Los puntos de retorno en r son aquellos para los cuales r˙ = 0, o sea, los que satisfacen la ecuaci´ on algebraica: l2 + V (r) − E = 0 2µr2
(5.39)
En estos puntos la velocidad no es cero pues θ˙ y φ˙ no se anulan necesariamente. Si ocurre que r˙ se anula solo cuando r es finito y que el movimiento es acotado o ligado, habr´ a un punto de m´aximo acercamiento y uno de m´aximo alejamiento de la part´ıcula al centro de fuerza. Si r˙ = 0 en un punto r → ∞, el movimiento es no ligado; ´este es el caso de los procesos de colisiones o de dispersi´ on. Los puntos de retorno en θ son aquellos en que θ˙ = 0, o sea pθ = 0; en esos puntos θ vale θmax o θmin , ecuaci´ on (5.26). La ecuaci´ on (5.26) nos dice que no existen valores de φ en los cuales φ˙ = 0; no hay puntos de retorno en φ. Si r tiene dos l´ımites, rmin y rmax , el movimiento es ligado y la ´orbita est´ a contenida dentro de una corona limitada por las circunferencias r = rmin y r = rmax . La ´orbita puede o no ser cerrada; en general no lo ser´a. Para los potenciales de la forma 1/r o r2 las ´ orbitas son cerradas y pueden ser no circulares (son el´ıpticas1 ). Para precisar, consideremos un oscilador bidimensional arm´onico en el plano de la ´ orbita; este se obtiene tomando fuerzas restauradoras lineales perpendiculares de la forma fx = −kX x y fy = −kY y donde kX y kY son las “constantes de resorte”.2 La dependencia temporal de x y y es: x(t) = Ax sen(ωX t + φX ) ;
y(t) = Ay sen(ωY t + φY )
(5.40)
Eliminando t obtenemos la ecuaci´ on de la ´orbita en coordenadas cartesianas. Cuando ωX es un m´ ultiplo racional de ωY la ´orbita es una figura de Lissajous. Si ωX = ωY , la figura es una elipse; si ωX y ωY difieren ligeramente, la elipse aparece como si estuviera sometida a un movimiento de precesi´ on (v´ease figura 5.3). ∆α es el ´ angulo que se desplaza el semieje mayor cuando la variaci´on temporal de r ha completado un per´ıodo completo. La trayectoria ser´a cerrada si despu´es de cierto n´ umero de ciclos completos de variaci´on r la trayectoria se repite; o sea si al transcurrir n per´ıodos de variaci´ on de r, el radio a partir del cual la ´orbita se repite ha dado un n´ umero m de vueltas completas, es decir, si: n∆α = m2π
(5.41)
Si la condici´on (5.41) no se cumple, entonces la trayectoria no es cerrada y cuando t → ∞ llena toda la corona. Otra forma de obtener este resultado es la siguiente. El movimiento en r tiene una frecuencia νr y el movimiento angular tiene una frecuencia να . La ´ orbita ser´a cerrada s´olo si νr y να son conmensurables. ~rmax y ~rmin se llaman vectores absidales. La ´orbita siempre es sim´etrica por reflexi´ on en los vectores absidales, o sea que con s´olo conocer la porci´on de ´orbita comprendida entre dos ~rmax y ~rmin consecutivos es posible por reflexi´on construir toda la ´orbita. Esto se puede obtener f´acilmente analizando la ecuaci´ on diferencial de la ´orbita. 1 Para otros potenciales pueden haber ´ orbitas cerradas no circulares pero s´ olo accidentalmente, es decir, para valores muy bien determinados de l y E. 2 Cuando k X 6= kY la fuerza es no central. Esto no es esencial, pues aun con fuerzas centrales puede presentarse la precesi´ on de las ´ orbitas.
Movimiento de dos part´ıculas que interact´ uan ... / 133
∆α rmáx
rmín
´ Figura 5.3 Orbitas de un oscilador arm´onico bidimensional
Ejemplo 5.1.1 Hallar la velocidad angular de precesi´ on de la ´orbita de una part´ıcula sometida a fuerzas restauradoras lineales con kX ≈ kY . Se cumple que ωX ≈ ωY . En (5.40) tomamos φX = φY = 0 y llamamos ∆ω a ωY − ωX . Para hallar la ecuaci´ on de la ´orbita notemos que, al primer orden en ∆ω t: y = AY cos ωY t = AY (cos ωX t − ∆ωt senωX t)
(5.42)
de este modo la ecuaci´ on de la ´ orbita es, al primer orden en ∆ω t: y2 xy x2 + 2 +2 ∆ω t = 1 2 Ax Ay Ax Ay
(5.43)
que es la ecuaci´ on de una elipse con el eje mayor rotado. La ecuaci´on (5.43) puede escribirse como una forma cuadr´atica no diagonal: A2y Ax Ay ∆ω t x = A2x A2y (x, y) (5.44) 2 y Ax Ay ∆ω t Ax
Para llevar (5.43) a la forma est´ andar de la ecuaci´ on de la elipse, realicemos una rotaci´on de los ejes coordenados por cierto ´angulo δ: ′ x cos δ −senδ x = (5.45) ′ y senδ cos δ y
134 / Mec´ anica cl´ asica avanzada Luego, la matriz de la forma cuadr´atica ser´a diagonal si: tan 2δ =
2Ax Ay ∆ω t A2x − A2y
(5.46)
Si t es el tiempo que tarda r en completar un per´ıodo en este problema de fuerza no central, entonces, al primer orden en ∆ωt, la velocidad angular de precesi´ on de la orbita es: ´ δ˙ ≈
Ax Ay (ωy − ωx ) A2x − A2y
(5.47)
si AX no es del orden de AY (´ orbitas muy exc´entricas). Ejemplo 5.1.2 Hallar para qu´e valores del momento angular es posible que sea acotado el movimiento en presencia del potencial: A l2 V (r) = − e−αr r 2µr2
(5.48)
La energ´ıa potencial efectiva es: l2 A Vef (r) = − e−αr + r 2µr2
(5.49)
Vemos que Vef → +0 para r → ∞, y Vef → +∞ para r → 0. La figura 5.4 muestra la forma de Vef . Hay posibilidad de movimiento acotado s´olo si Vef tiene un m´ınimo, o ′ sea si la ecuaci´ on Vef = 0 tiene soluci´on, esto es: l2 Aα −αr Ae−αr − =0 e + r r2 µr3
(5.50)
Si llamamos x = αr, entonces (5.50) se puede llevar a la forma: (x2 + x)e−x =
αl2 µA
(5.51)
Hay soluci´on solamente si la curva f (x) = (x2 + x)e−x corta a la recta αl2 /(µA) (v´ease figura 5.5), esto es, si: f (x0 ) >
αl2 µA
(5.52)
donde x0 es la posici´on en la cual f (x) tiene un m´aximo. f ′ (x) = 0 si: x2 − x − 1 = 0 La u ´nica soluci´on aceptable de (5.53) es: √ 1+ 5 ≈ 1,618 x0 = 2
(5.53)
(5.54)
Movimiento de dos part´ıculas que interact´ uan ... / 135
Vef l2 2µr2
E 1/α r –Ae–αr/r
Figura 5.4 Energ´ıa potencial efectiva Vef componente de los potenciales centr´ıfugo y de Yukawa
Entonces: √ 1+√5 f (x0 ) = 2 + 5 e− 2 ≈ 0,84
(5.55)
′ Hay soluci´on a Vef (r) = 0 s´olo si:
0, 84 >
αl2 µA
(5.56)
Si (5.48) se usa para describir la interacci´ on nuclear, por ejemplo entre un neutr´on y un prot´on, habr´ a resonancias, o sea estados ligados de energ´ıa positiva, si se cumple la condici´on (5.56). El momento angular l = 0 presenta estados ligados pero no resonancias. Puede haber resonancias s´olo si: 0, 84
µA >¯ h2 α
(5.57)
La barrera que se forma en Vef se llama “barrera centr´ıfuga”. Se entiende por resonancia (“de forma”) el efecto t´ unel que se produce cuando la part´ıcula viene desde r → ∞ y atraviesa la barrera quedando atrapada por el pozo de potencial durante cierto tiempo. Este proceso no es cl´ asicamente posible.
136 / Mec´ anica cl´ asica avanzada
αl 2 µA
f(x)
x0 Figura 5.5 Soluci´on f (x) al potencial efectivo
5.2.
El oscilador arm´ onico tridimensional
Es el problema del movimiento de la part´ıcula de masa reducida en presencia de la interacci´ on central: f~(r) = −kr eˆr
(5.58)
Soluci´ on en coordenadas cartesianas. Tomando coordenadas cartesianas en el plano de la ´ orbita, la soluci´on al oscilador arm´onico bidimensional es (5.40). La ecuaci´ on de la ´ orbita es: x2 y2 2xy cos δ = sen2 δ ; + − A2x A2y Ax Ay
δ = φy − φx
(5.59)
˜ r = sen2 δ, La ecuaci´ on (5.59) es la forma cuadr´atica bidimensional de la forma ~r · M~ ˜ donde M es la matriz: a − cos δ ˜ = A−1 A−1 ; a = Ay (5.60) M x y Ax −cosδ a−1
˜ . Sea la rotaRealizando una rotaci´on de coordenadas es posible diagonalizar a M ′ ˜ ci´ on ~r = R~r , entonces: ˜T M ˜ R~ ˜ r ′ = sen2 δ ~r ′ · R
(5.61)
Movimiento de dos part´ıculas que interact´ uan ... / 137 ˜ es ortogonal, R ˜R ˜ T = I˜ y diagonaliza a M ˜ si es de la forma: La matriz R cos α −senα 2 cos δ ˜= ; R tan 2α = −1 a −a senα cos α
(5.62)
˜ T es la transpuesta de R. ˜ R ˜ diagonalizada son: Por simplicidad tomaremos Ay = Ax (a = 1). Entonces α y M 1 − cos δ 1 ˜ = M A2 0
π α = (cos δ > 0) ; 4
0 1 + cos δ
(5.63)
La ecuaci´ on de la ´ orbita (5.60) se torna la est´ andar de la elipse, con semiejes mayor a y menor b, y excentricidad ǫ: r r δ 2 cos δ b2 δ a = A cos ; ǫ= 1− 2 = (5.64) b = A sen ; 2 2 a 1 + cos δ δ est´ a relacionado con el momento angular y A con la energ´ıa total: l=−
E senδ ; ω
E = µA2 ω 2
(5.65)
Entonces la excentricidad y el semieje mayor tienen la siguiente expresi´on en t´erminos de E y l: s kl2 s 2 1− 2 2 µE kl 1E s 1+ 1− (5.66) E2 = ; a2 = 2 2 k µE 2 kl 1+ µE Soluci´ on en coordenadas polares. En vez de hacer la transformaci´ on de coordenadas, usaremos las f´ ormulas halladas en el numeral anterior, cuando se toma el eje Z perpendicular al plano de la ´ orbita. De la ecuaci´ on (5.35) se sigue: l φ − φ0 = √ 2µ
Z
r
r0
r2
dr
s
l2 1 E − kr2 − 2 2µr2
(5.67)
Haciendo la sustituci´ on ρ = r2 , (5.67) toma la forma: l φ − φ0 = √ 2 µk
Z
r2
r02
ρ
s
dρ
2E l2 −ρ2 + ρ− k µk
(5.68)
138 / Mec´ anica cl´ asica avanzada La integral se halla en tablas de integrales. El resultado es: r2 2 2Eρ 2l − 1 l k µk φ − φ0 = √ sen−1 s 2 µk l 4E 2 4l2 √ ρ − µk k2 µk 2
(5.69)
r0
Entonces llegamos a: r2 =
B2 1 − e sen2(φ − φ0 + β0 )
(5.70)
donde B, e y β0 son:
B=
s
l2 µE
;
e=
s
1−
kl2 µE 2
;
2β0 = arcsen
l2 µk r02 e
r02 −
(5.71)
La ecuaci´ on de la elipse centrada y no rotada en coordenadas polares es: r2 =
b2 1 − cos2 φ
(5.72)
ǫ2
Si se rota 45◦ toma la forma: b2
r2 =
1 − ǫ2 cos2 (φ −
φ ) 4
=
b2 /(1 − ǫ2 /2) ǫ2 1− sen2φ 2 − ǫ2
(5.73)
Las ecuaciones (5.70) y (5.73) coinciden si: β0 = φ0 ;
B2 =
b2 2
ǫ 1− 2
;
e=
ǫ2 2 − ǫ2
(5.74)
Las ecuaciones (5.71) y (5.74) conducen a los valores hallados en (5.66) para los par´ ametros de la elipse en funci´ on de las constantes de movimiento. La ´orbita es una elipse y el centro de la misma coincide con el centro de fuerza. C´ alculo de la variaci´ on temporal del radio. Para hacer este c´ alculo usamos la ecuaci´ on (5.33): Z r dr s (5.75) t − t0 = r0 1 2 l2 2 E − kr − 2 2 µ 2 µ r Los puntos de retorno se hallan resolviendo la ecuaci´ on (5.39): s ! kl2 E E 2 1± 1− = (1 ± e) rmax, min = k µE 2 k
(5.76)
Movimiento de dos part´ıculas que interact´ uan ... / 139 Vemos que: l rmax = a = p ; µE(1 − e)
l rmin = b = p µE(1 + e)
(5.77)
Esto nos permite escribir la expresi´on bajo el signo de ra´ız cuadrada en (5.75) como: r Z r µ rdr p t − t0 = (5.78) 2 k r0 (a − r2 )(r2 − b2 ) Haciendo el cambio de variable p = r−2 , llegamos a: 1 t − t0 = 2
r
µ k
Z
r −2
r0−2
dρ p 2 ρ (a ρ − 1)(1 − b2 ρ)
(5.79)
La soluci´on a esta integral se encuentra en tablas. El resultado es: 1 t = t0 = 2
r
r−2 (a2 + b2 )ρ − 2 0 µ arcsen k ρ(a2 − b2 ) r−2
(5.80)
Incluyendo en t0 la parte que depende de r0 llegamos a: r2 =
a2 + b 2 a2 − b 2 E + sen2ω(t − t0 ) = [1 + e sen2ω(t − t0 )] 2 2 k
(5.81)
l no puede ser arbitrario, est´ a restringido al rango: 0≤l≤
E ω
(5.82)
La ecuaci´ on (5.82) corresponde al comportamiento cu´antico, haciendo la correspondencia con los n´ umeros cu´anticos l → l¯h y E = n¯hω, donde los valores permitidos del n´ umero cu´antico orbital l son: 0 ≤ l ≤ n; o sea l = 0, 1, 2, ...n. Cuando l = E/ω, e =p 0 y ǫ = 0, la ´orbita es circular pues seg´ un (5.81) el radio de la ´orbita es constante: r = E/k. Cuando l = 0, e = 1 y ǫ = 1, la ´orbita es rectil´ınea. Seg´ un (5.81) la variaci´on temporal del radio ser´a de forma pendular, con frecuencia ω y no 2ω como cuando e 6= 1: r=
r
π 2E cos ω(t − t0 − ) k 4ω
(5.83)
Para hallar a r(t) a partir de (5.81) se requiere realizar una expansi´ on en serie infinita. Para l 6= 0 y diferente de un m´aximo valor, r(t) contiene la frecuencia fundamental 2ω y todos sus arm´onicos.
140 / Mec´ anica cl´ asica avanzada
5.3.
El potencial 1/r
Se trata de estudiar el movimiento de la part´ıcula de masa reducida bajo la fuerza: k f~(r) = − 2 eˆr r
(5.84)
Este problema es separable en coordenadas esf´ericas, en coordenadas parab´olicas y tal vez en otras coordenadas. La soluci´on en coordenadas parab´olicas la hallaremos posteriormente con el formalismo de Hamilton-Jacobi. Aqu´ı resolveremos el problema en coordenadas esf´ericas. La ecuaci´ on de la ´ orbita. Es c´ omodo usar la ecuaci´ on diferencial de la ´orbita (5.38). La soluci´on es simple; el resultado es: l2 /µk = 1 + ǫ cos(φ − φ0 ) r
(5.85)
donde ǫ y φ0 son las dos constantes de integraci´ on. Vemos que rmin ocurre cuando φ = φ0 si k es positiva, o sea que en ese caso φ0 determina la direcci´ on del vector rmin . La ´ orbita ser´a sim´etrica respecto a la l´ınea φ = φ0 . Relacionemos a ǫ con las constantes de movimiento E y l. Los puntos de retorno rmin y rmax ocurren cuando r˙ = 0 en: E=
1 2 k l2 − µr˙ + 2 2µr2 r
(5.86)
O sea que: rmin, max
k =− 2E
1±
s
2El2 1+ µk 2
!
(5.87)
Cu´ al de los signos corresponde a rmin o rmax depende del signo de k y del signo de E.3 Si rmax es finito, el movimiento ser´a ligado. Por otra parte, de (5.85) vemos que: rmin, max =
l2 /µk 1±ǫ
Comparando a (5.88) con (5.87) hallamos que: s 2El2 ǫ= 1+ µk 2
(5.88)
(5.89)
El signo de ǫ lo hemos tomado positivo. La ecuaci´ on (5.85) representa una secci´ on c´ onica. Las secciones c´ onicas. Son las curvas que definen la intersecci´on de un cono con un plano. Sobre el plano una curva c´ onica es el lugar geom´etrico de los puntos cuya 3 En
estos puntos cambia el signo de la velocidad radial. Adem´ as, para E ≥ 0, seg´ un veremos, s´ olo existe un punto de retorno.
Movimiento de dos part´ıculas que interact´ uan ... / 141 distancia a un punto dado llamado foco es proporcional a la distancia a una l´ınea dada, la directriz. Si tomamos el origen del sistema de coordenadas polares en el foco y S es la distancia del foco a la directriz (v´ease figura 5.6), se sigue de la definici´on, llamando ǫ a la constante de proporcionalidad: r = ǫ [S − r cos (φ − φ0 )]
(5.90)
y
•
Directriz
r S φ φ0 x Foco
Figura 5.6 Elementos de las secciones c´ onicas ǫ debe ser positivo por ser la relaci´on entre dos distancias. Se sigue de (5.90): ǫS = 1 + ǫ cos (φ − φ0 ) , ǫ>0 (5.91) r La curva es sim´etrica respecto a la l´ınea φ = φ0 . La longitud ǫS se llama par´ ametro de la secci´ on c´ onica y ǫ se llama excentricidad. Hay distintos tipos de secciones c´ onicas dependiendo del valor de ǫ. Si ǫ = 1, se obtiene la par´ abola, es decir, el lugar geom´etrico de los puntos equidistantes del foco y de la directriz. El punto de m´aximo acercamiento al foco se llama v´ertice y est´ a situado a una distancia S/2, en tanto que la m´axima distancia es infinita: 1 S; rmax = ∞; ǫ = 1 (5.92) 2 Si ǫ < 1, se obtiene una elipse: curva con dos directrices y dos focos. Hay en este caso dos distancias absidales finitas: ǫS ǫS ; rmax = ; ǫ<1 (5.93) rmin = 1+ǫ 1−ǫ El promedio entre rmax y rmin lo llamaremos a, de modo que: rmin =
S=a
1 − ǫ2 ; ǫ
ǫS = a(1 − ǫ2 )
(5.94)
142 / Mec´ anica cl´ asica avanzada La ecuaci´ on de una elipse en coordenadas polares con foco en el origen es: r=
a(1 − ǫ2 ) 1 + ǫ cos (φ − φ0 )
(5.95)
La ecuaci´ on de una elipse en coordenadas polares con centro en el origen es (5.72). Las directrices est´ an a distancias a/ǫ del centro (v´ease figura 5.8). Los semiejes son a y √ b = a 1 − ǫ2 . D ε=1 S/2
)φ0
S F
Figura 5.7 Secci´ on c´ onica: la par´abola
D2 S ε<1 εS
D1
εa
F2
•
) φ0
S F1 a /ε
Figura 5.8 Secci´ on c´ onica: la elipse
Si ǫ > 1, la c´ onica es una hip´erbola: curva de dos ramas con sus correspondientes focos, directrices y as´ıntotas. De la definici´on (5.90) se sigue la siguiente ecuaci´ on para la rama 2, respecto al origen de coordenadas mostrado, la cual es consistente con (5.85)
Movimiento de dos part´ıculas que interact´ uan ... / 143
ε<1
2 D2 εS )φ0
D1
F2 S
a aε 1
a/ε
F1
Figura 5.9 Secci´ on c´ onica: la hip´erbola
cuando k > 0 y φ0 se sustituye por φ0 + π: ǫ = −1 − ǫ cos (φ − φ0 ) ; rama 1 (k < 0) r
(5.96)
ǫ = 1 − ǫ cos (φ − φ0 ) ; rama 2 (k > 0) r Cuando φ − φ0 = π, r toma el valor rmin : (1)
rmin =
ǫS ; ǫ−1
(2)
rmin =
ǫS ; 1+ǫ
(2)
(1)
rmin = rmin − 2a
(2)
(5.97) (1)
cuando cos(φ − φ0 ) = 1/ǫ, r = rmax = ∞ y cuando cos(φ − φ0 ) = −1/ǫ, r = rmax = ∞. Si llamamos la distancia entre los v´ertices 2a, tambi´en se cumple que rmin = a(ǫ − 1). Las directrices est´ an a distancias a/ǫ del centro. El par´ ametro S en funci´ on de a vale: S=
ǫ2 − 1 a ǫ
(5.98)
r → ∞ cuando 1 − ǫ cos (φ − φ0 ) = 0, sobre la rama 2. Entonces el ´angulo entre las dos as´ıntotas vale: 2 cos−1 ǫ−1 ;
cos−1 ǫ−1 ≤ φ − φ0 ≤ π − cos−1 ǫ−1
(5.99)
Relaci´ on entre el signo de k y E, y el tipo de c´ onica. La excentricidad y el par´ ametro est´ an relacionados con la energ´ıa y el momento angular: s l2 2El2 (5.100) ; ǫ= 1+ ǫS = µ|k| µk 2 Si el potencial es repulsivo, k es negativo. En este caso, s´olo es posible que la energ´ıa sea positiva, pues de lo contrario rmin ser´ıa negativo. Entonces ǫ es mayor que
144 / Mec´ anica cl´ asica avanzada la unidad y la trayectoria de la part´ıcula es hiperb´ olica, o sea que el movimiento es no ligado. Esto es consistente con el an´alisis de la curva de energ´ıa potencial efectiva cuando k es negativo: la energ´ıa potencial no tiene un m´ınimo y el movimiento resulta no acotado, con s´olo un punto de retorno. Es el caso cuando la part´ıcula llega desde el infinito y “rebota” en la barrera de potencial. Este comportamiento incluye tambi´en el caso l´ımite en que la energ´ıa es cero. Si el potencial es atractivo, k es positiva. En este caso se presentan tres posibilidades. Si E > 0, entonces ǫ > 1 y el movimiento es hiperb´ olico. No hay l´ımite al valor m´aximo que puede tomar l: 0≤l<∞
si
E>0
(5.101)
A este caso, y al caso en que k es negativo, corresponden las dos ramas de la hip´erbola: si k es negativo, la part´ıcula se mueve sobre la hip´erbola correspondiente a D1 ; si k es positivo y E > 0, se mueve sobre la hip´erbola correspondiente a D2 . Si E = 0 entonces ǫ = 1. l se conserva pero no es cero porque el par´ ametro de impacto es infinito y en r → ∞ la velocidad es cero: 0≤l<∞
si
E=0
(5.102)
El movimiento es no ligado y r → ∞ para dos valores de φ: φ = φ0 ± π. La trayectoria es parab´olica y no tiene as´ıntotas (ser´ıan las rectas y = ±∞). De (5.92) se sigue que: rmin =
1 l2 S= ⇒ l 6= 0 2 2µk
(5.103)
Este caso se presenta cuando la part´ıcula parte del reposo desde el infinito. Si E < 0, entonces ǫ < 1. En este caso: s 2|E|l2 <1 ǫ= 1− µk 2 Es claro que el rango de valores posibles de l es finito: r µ 0≤l≤ k 2|E|
(5.104)
(5.105)
Esto es an´alogo al comportamiento del n´ umero cu´antico orbital en el ´atomo de hidr´ogeno: l = 0, 1, ...n − 1. ǫ cos (φ − φ0 ) nunca vale uno y por eso r nunca es infinito: el movimiento es ligado. En este caso: rmin, max =
k (1 ∓ ǫ) ; 2|E|
a=
k 2|E|
(5.106)
Si ǫ = 0 siendo E < 0 entonces la trayectoria es circular con radio: r=
l2 k = =a µk 2|E|
(5.107)
Movimiento de dos part´ıculas que interact´ uan ... / 145 Como r es constante, se sigue de (5.31) que φ˙ tambi´en es constante. Si ǫ = 1, entonces l = 0 y la trayectoria es la l´ınea recta φ = φ0 . En este caso: rmin = 0 ;
rmax = a
(5.108)
Para ǫ < 1 la trayectoria es una elipse rotada en un ´angulo φ0 y con semiejes mayor y menor dados por: a=
k ; 2|E|
b=a
p l 1 − ǫ2 = p 2µ|E|
(5.109)
respectivamente. Vemos que b est´ a comprendido, dependiendo de l, entre: 0≤b≤a
(5.110)
El hecho de que las trayectorias sean el´ıpticas es consecuencia de la primera ley de Kepler (cuando k = GM m). Las figuras desde 5.10 hasta 5.13 muestran las curvas de energ´ıa potencial efectiva para cada uno de los casos. Del an´alisis de las mismas se obtiene cualitativamente el comportamiento descrito. Vef
E
r mín
k<0
r
Figura 5.10 Energ´ıa potencial efectiva. Trayectoria hiperb´olica.
La tercera ley de Kepler. El ´area de la elipse es: s p l 2 kl 2 = πa2 A = πab = πa 1 − ǫ2 = π 4|E| µ|E| lmax
(5.111)
Recordando la ecuaci´ on (5.31) para la velocidad areolar, obtenemos que: r πk p µ 3/2 A −2µE = 2π a (5.112) = τ= 2 ˙ 2E k A
146 / Mec´ anica cl´ asica avanzada Vef
E
r mín
r k > 0, E > 0
Figura 5.11 Energ´ıa potencial efectiva. Trayectoria hiperb´olica.
Vef ·
E r
rmín k > 0, E = 0
Figura 5.12 Energ´ıa potencial. Trayectoria parab´ olica.
Vemos que el per´ıodo del movimiento no depende del valor de l. Para la interacci´ on gravitacional entre un planeta (masa m) y el Sol (masa M ), (5.112) toma la forma: s 1 a3/2 (5.113) τ = 2π G(m + M ) Como para los planetas del sistema solar m ≪ M , se sigue que τ ∝ a3/2 , que es el contenido de la tercera ley de Kepler, la cual como se ve, es un resultado aproximado.
Movimiento de dos part´ıculas que interact´ uan ... / 147 Vef
l = l máx
l
l=0
·
r
r mín
r máx
k > 0, E < 0
E
Figura 5.13 Energ´ıa potencial efectiva. Trayectoria el´ıptica.
La ecuaci´ on de Kepler. Encontrar a r(t) es interesante en muchos casos, por ejemplo para predecir el movimiento de un sat´elite. Para hallar a r(t) debemos usar la ecuaci´ on (5.33). Por simplicidad, consideraremos s´olo el caso k > 0, E < 0. Es conveniente expresar a E y l en t´erminos de a y ǫ: p p k (5.114) E=− ; l = µka 1 − ǫ2 2a Entonces (5.33) toma la forma: r Z µa r rdr p t − t0 = 2 k r0 −r + 2ar − (1 − ǫ2 )a2
Usando la expresi´on para τ , ecuaci´ on (5.112), obtenemos: Z r r dr τ p t − t0 = 2πa r0 −r2 + 2ar − (1 − ǫ2 )a2
La soluci´on a esta integral se encuentra en tablas. El resultado es: r−a 1p 2 2πa −r + 2ar − (1 − ǫ2 )a2 + arcsen (t + δ) = − τ a ǫa donde δ es una constante arbitraria. Definamos las siguientes variables:
(5.115)
(5.116)
(5.117)
2π a−r (t + δ) ; ψ = cos−1 (5.118) τ ǫa Las cantidades M , ψ y φ reciben los siguientes nombres en astronom´ıa: M , anomal´ıa media; ψ, anomal´ıa exc´entrica y φ, anomal´ıa verdadera (v´ease figura 5.14). De simples argumentos geom´etricos se sigue a partir de las f´ormulas de la elipse que ψ y M tienen la siguiente interpretaci´ on geom´etrica: M=
148 / Mec´ anica cl´ asica avanzada y R Q P M ψ
r φ
x
Figura 5.14 Variables de la ecuaci´on de Kepler.
ψ es el ´ angulo del vector de posici´on del punto Q, tomando como origen el centro de la elipse. R es un punto que gira uniformemente sobre una circunferencia de radio a, con velocidad angular 2π/τ . φ y M sirven para describir la posici´on del punto p (v´ease el texto de Marion, Classical dynamics of particles and systems, segunda edici´ on, secci´ on 8,8). Expresando a (5.117) en funci´ on de (5.118) obtenemos: r = (1 − ǫ cos ψ)a ;
M = ψ − ǫsenψ
(5.119)
En (5.119) hemos adicionado a M la constante π/2. La ecuaci´ on que relaciona a ψ con M se denomina la ecuaci´ on de Kepler, y permite expresar a r en funci´ on del tiempo. ψ es una funci´ on trascendental de M . Bessel hall´o en 1830 la soluci´on exacta de la ecuaci´ on de Kepler en forma de serie de Fourier. El resultado es: ψ =M +2
∞ X
Jn (nǫ)
n=1
sen(nM ) n
(5.120)
donde Jn son las funciones de Bessel de orden entero. Entonces la expresi´on para r(t) es: ( " r(t) = a 1 − ǫ cos 2πν(t + δ)+ ∞ X
sen{2πnν(t + δ)} 2 Jn (nǫ) n n=1
#)
Ejemplo 5.3.1 Demostrar la soluci´on (5.120) de la ecuaci´ on de Kepler.
(5.121)
Movimiento de dos part´ıculas que interact´ uan ... / 149 ψ es una funci´ on impar de M , luego su expansi´ on de Fourier contendr´a s´olo funciones seno y adem´as contiene una componente no oscilante que ser´a M misma. Entonces busquemos soluciones de la forma: ψ=M+
∞ X
Cn sen(nM )
(5.122)
n=1
La expansi´ on de Fourier de la funci´ on ǫ senψ = f (M ) tiene coeficientes dados por: Z π 2 Cn = f (M ) sen(nM ) dM (5.123) π 0 Utilizando la ecuaci´ on de Kepler, el integrando en (5.123) ser´a: Z π 2ǫ senψ sen[n(ψ − ǫ senψ)](1 − ǫ cos ψ)dψ Cn = π 0
(5.124)
Efectuando los productos y expresando los productos de funciones seno como suma de funciones coseno llegamos a: Z ǫ πn cos[(n − 1)ψ − nǫsenψ] dψ − cos[(n + 1)ψ Cn = π 0 1 (5.125) −nǫsenψ] dψ − ǫ cos[(n − 2)ψ 2 o 1 −nǫ senψ]dψ + ǫ cos[(n + 2)ψ − nǫsenψ] dψ 2 La funci´ on de Bessel entera tiene la siguiente representaci´on integral: Z 1 π Jκ (x) = cos (κθ − xsenθ)dθ ; κ : entero π 0
Con lo cual Cn toma la forma: h Cn = ǫ Jn−1 (nǫ) − Jn+1 (nǫ)
i ǫ ǫ − Jn−2 (nǫ) + Jn+2 (nǫ) 2 2
(5.126)
(5.127)
Las funciones Jκ tienen la siguiente relaci´on de recurrencia: Jκ+1 (x) =
2κ Jκ (x) − Jκ−1 (x) x
(5.128)
El uso de (5.128) nos permite llegar finalmente a: Cn =
2 Jn (nǫ) n
(5.129)
Con lo cual queda demostrada la expresi´on (5.120). Precesi´ on de las ´ orbitas el´ıpticas. Vimos que, bajo fuerzas centrales, las ´orbitas son sim´etricas respecto a cualquier ´abside, por lo tanto el ´angulo entre cualquier par de l´ıneas absidales consecutivas es el mismo. En el problema de Kepler (k > 0, E < 0),
150 / Mec´ anica cl´ asica avanzada las ´ orbitas son cerradas, o sea que el ´angulo de precesi´ on de los ´absides es cero. En el movimiento planetario, por ejemplo, hay efectos “perturbadores”, que hacen que el potencial no sea exactamente de la forma −k/r, aunque lo sea aproximadamente. Para el movimiento de la luna alrededor de la tierra, adem´as de la interacci´ on gravitacional entre estos dos cuerpos tomados como masas puntuales, hay efectos adicionales como una fuerza externa no central debida al campo gravitacional homog´eneo producido por el sol sobre la ´orbita de la luna; esto se traduce en peque˜ nas oscilaciones del plano de la ´ orbita. La tierra y la luna no son masas puntuales y por ello la interacci´ on del tipo −k/r es s´olo el primer t´ermino en una expansi´ on multipolar, que depender´a de la distribuci´ on de masa de los cuerpos; la parte central de esta interacci´ on dar´ a lugar a la precesi´ on de la ´ orbita, o sea al giro del semieje mayor de la elipse, y la parte no central da lugar a movimientos girosc´opicos de la tierra y la luna. En el caso de Mercurio hay efectos de precesi´ on de su ´orbita debidos al efecto combinado de todos los dem´ as cuerpos del sistema solar y efectos residuales que s´olo son explicados por la teor´ıa general de la relatividad. Ejemplo 5.3.2 Analizar la precesi´ on de la ´orbita de una part´ıcula que se mueve en presencia del potencial: V =−
C k + 2; r 2r
C ≪1 ka
(5.130)
γ =2 Figura 5.15 Trayectoria para γ = 2 Tenemos que la fuerza sobre la part´ıcula es central, as´ı que ~l es constante. La ecuaci´ on diferencial de la ´orbita es: µ d2 υ + υ = − 2 2 (−kυ 2 + Cυ 3 ) ; dφ2 l υ
υ=
1 r
(5.131)
Movimiento de dos part´ıculas que interact´ uan ... / 151
γ =3
Figura 5.16 Trayectoria para γ = 3
La soluci´on de (5.131) es: α = 1 + ǫ cos γ(φ − φ0 ) ; r
γ 2 l2 α= ; µk
γ=
r
1+
µC l2
(5.132)
donde ǫ y φ0 son constantes de integraci´ on. φ0 es la direcci´ on del vector absidal rmin y ǫ se puede expresar en t´erminos de las constantes de movimiento comparando las dos expresiones para las distancias de retorno. s ! k α 2El2 2 rmax, min = − = 1± 1+ γ (5.133) 2E µk 2 1±ǫ Se sigue entonces que: rmax − rmin E= = rmax + rmin
s
1+
2El2 2 γ ; µk 2
a=−
k 2E
(5.134)
El efecto del t´ermino adicional es variar ligeramente la excentricidad de la ´orbita e introducir el factor de γ a φ − φ0 . Cuando r = rmin , φ = φ0 y cuando r = rmax , φ = φ0 + φ/γ. Entonces el ´angulo entre los vectores absidades γmin y rmax es: φmax − φmin =
π γ
(5.135)
152 / Mec´ anica cl´ asica avanzada
γ=5
Figura 5.17 Trayectoria para γ = 5
y no π como cuando C = 0. De esta forma, al cumplir un per´ıodo, el vector rmin sufre un desplazamiento angular dado por: 1 (5.136) ∆φ = 2π 1 − γ Si la part´ıcula tarda un tiempo Tr en ir de un valor de rmin al consecutivo, tardar´ a un tiempo mayor en φ dar una vuelta completa. La trayectoria ser´a cerrada solamente si ∆φ es un subm´ ultiplo racional de 2π, o sea, si γ es un n´ umero racional, lo cual ocurrir´ a s´olo accidentalmente. Si r ≥ 1 la ´orbita es esencialmente una elipse que precesa; el semieje menor rmin rota 2π(1 − γ −1) por cada ciclo de variaci´on de r. Ver figuras 5.15 a 5.18. Un ejemplo de aplicaci´ on del m´ etodo variacional. Muchas veces no es posible resolver exactamente un problema mec´anico, pero es deseable obtener informaci´on aproximada sobre el mismo. Supongamos que hay un sistema cuya soluci´on conocemos exactamente y que tiene aspectos similares al sistema original para el cual no conocemos la soluci´on; la soluci´on para el sistema aproximado contendr´a una serie de par´ ametros. El principio variacional de Rayleigh expresa que la energ´ıa del sistema es menor que el valor medio del hamiltoniano tomado sobre la trayectoria del sistema aproximado, de modo que del sistema aproximado se puede obtener una aproximaci´on ´optima al problema original buscando cu´ales son los valores de los par´ ametros que minimizan al valor medio del hamiltoniano. En otras palabras: el sistema original posee un hamiltoniano
Movimiento de dos part´ıculas que interact´ uan ... / 153
γ = 1,33
Figura 5.18 Trayectoria para γ ≈ 1
que es funci´ on de las variables de estado, H(q, p); para cada estado de movimiento (q, p), H tendr´a un valor definido. Si se toman q(t) y p(t) no de la soluci´on exacta sino de una aproximada, el valor de H siempre ser´a en promedio mayor que el que tendr´ıa tomando para q(t), p(t), sus valores exactos. Este m´etodo est´ a relacionado con el m´etodo variacional usado en mec´anica cu´antica para hallar la energ´ıa del estado base de un sistema usando funciones de onda de ensayo. Veamos c´ omo trabaja por medio de un ejemplo. Consideremos un ´ atomo de litio y tratemos de hallar las energ´ıas del electr´on externo usando la vieja mec´anica cu´antica. De acuerdo con el modelo de capas del ´atomo, el Li consta de dos electrones internos y uno externo. E. Schr¨odinger en 1921 propuso el siguiente modelo.4 El resto del ´ atomo –los electrones internos– es reemplazado por una capa esf´erica de distribuci´ on uniforme de carga negativa, externa a la cual hay entonces un campo de fuerza coulombiano, correspondiente a una carga positiva +e del n´ ucleo “apantallado” por dos electrones, y en el interior hay un campo coulombiano, correspondiente a una carga positiva +3e, la del n´ ucleo. Llamemos ρ al radio del cascar´on. Entonces la energ´ıa potencial en este modelo ser´a: 2e2 3e2 − + r<ρ r ρ (5.137) V = 2 −e r>ρ r 4 V´ ease
el texto The mechanics of the atom de Max Born, secci´ on 28.
154 / Mec´ anica cl´ asica avanzada donde la constante 2e2 /ρ asegura la continuidad de V en r = ρ. Para el caso en que la energ´ıa sea lo suficientemente alta, la ´orbita permanecer´ a a distancias del n´ ucleo mayores que ρ, con lo cual la soluci´on ser´a, para el electr´on externo, una trayectoria el´ıptica como en la figura 5.13. Pero cuando el perihelio de la ´orbita resulta menor que ρ, la orbita penetra al interior y no ser´a m´as de forma el´ıptica pues ser´a la correspondiente al ´ potencial (5.137) que no es coulombiano. Si el electr´on externo s´olo permanece dentro de la esfera de radio ρ una fracci´ on peque˜ na de tiempo es de esperarse que la ´orbita sea una elipse que precesa, como en la figura 5.18. Durante un per´ıodo la ´orbita exacta correspondiente al potencial (5.137) diferir´a poco de la ´orbita correspondiente al potencial coulombiano. Tomaremos entonces como soluciones de ensayo las ´orbitas el´ıpticas en un potencial: V =−
ze2 r
(5.138)
donde z ser´a un par´ ametro variacional que se determina por la condici´on de que hHi sea un m´ınimo. Por simplicidad supondremos que el electr´on externo est´ a en un estado s, o sea que tiene l = 0. Para este caso, seg´ un (5.104) la excentricidad ser´a ǫ = 1. Como V es central, el hamiltoniano es de la forma (5.28), o sea que interviene s´olo la coordenada radial. Usando (5.119) y (5.118) obtenemos, tomando δ = 0: r = (1 − cos ψ)a ;
2πνt = ψ − senψ
(5.139)
La ecuaci´ on (5.139) permite escribir a r y r˙ en la forma: r = 2a sen2
ψ ; 2
r˙ = 2πνa cot
ψ 2
(5.140)
La ecuaci´ on (5.140) permite ahora expresar a H en t´erminos de la soluci´on de ensayo as´ı:
H=
3e2 2e2 2 ψ 2 ψ 2 2 2 − csc + 2π mν a cot 2 2a 2 ρ 2 2π 2 mν 2 a2 cot2 ψ − e csc2 ψ 2 2a 2
r<ρ (5.141) r>ρ
El valor medio de H en un per´ıodo ser´a, usando la ecuaci´ on de Kepler: hHi = 2ν
Z
1/(2ν) 0
2 Hdt = π
Z
π 0
ψ Hsen2 dψ 2
(5.142)
Llamando ψ1 al valor de ψ cuando r = ρ obtenemos de (5.140): ψ1 = sen 2
r
ρ 2a
(5.143)
Movimiento de dos part´ıculas que interact´ uan ... / 155 Podemos separar la integral (5.142) en dos, de 0 a ψ1 y de ψ a π, con lo cual obtenemos despu´es de manipulaciones simples: Z 2 ψ1 3e2 2e2 2 2 2 2 ψ 2ψ hHi = 2π mν a cos dψ − + sen π 0 2 2a ρ 2 (5.144) Z 2 e ψ 2 π dψ 2π 2 mν 2 a2 cos2 − + π ψ1 2 2a Efectuando las integraciones llegamos a: 2 2 e e2 e2 e2 hHi = − ψ1 + ψ1 − senψ1 + π 3 mν 2 a2 − π π a ρ ρ 2a
(5.145)
Es conveniente expresar a e2 /a en t´erminos del n´ umero cu´antico principal n, la energ´ıa de Rydberg y el par´ ametro z, as´ı: z z e2 = e 2 = 2R a n a0 n
(5.146)
donde a0 es el radio de Bohr y R = e2 /a0 . Como a = n2 a0 /z, notamos por analog´ıa que ρ ser´a el radio de la ´ orbita de los electrones internos, que se mueven en presencia del n´ ucleo que tiene carga 3e, y est´ an en la primera ´orbita que tiene n = 1; entonces ρ = a0 /3. De esta forma (5.143) es: r 1 z ψ1 = (5.147) sen 2 n 6 Usando (5.112) con k = ze2 obtenemos: π 2 mν 2 a2 =
π z2 R 4 n2
de modo que (5.145) tomar´a la forma: " r 2z 1 z 2R 6 − 2 arcsen hHi = π n n 6 r # 1 z2 π z2 − 6z − 2 + −z n n 2n 2
(5.148)
(5.149)
z es un par´ ametro que se determina por la condici´on de que minimice a hHi, es decir, por la condici´on: ∂hHi =0 ∂z
(5.150)
Efectuando las manipulaciones algebraicas llegamos a que z satisface la siguiente ecuaci´ on trascendental: r π 1 z = sen (z − 1) (5.151) n 6 4
156 / Mec´ anica cl´ asica avanzada de (5.151) se sigue que z debe ser positiva. Una vez hallada z de (5.151) se reemplaza en (5.149) para obtener la energ´ıa: " R n E= 2z(z − 1) 1 − 2 2n 2 # r 4n z2 +zn(1 − 6n) + 6n + 6z − 2 (5.152) π n De acuerdo con el principio variacional, la aproximaci´on ´optima por medio de ´orbitas de Kepler al movimiento bajo el potencial (5.137) se halla por medio del potencial coulombiano −ze2/r, donde z es el n´ umero que se obtiene de (5.151) para cada n. Los resultados que se obtienen al resolver num´ericamente a (5.151) son aproximados, dando errores grandes para n = 2 y errores que van disminuyendo a medida que n aumenta; las energ´ıas variacionales siempre ser´an mayores que las experimentales. As´ı, por ejemplo, algunos resultados son: (n, Evar , Eexp )= (2; −0, 29; −0, 58); (8; −0, 06; -0, 12); (15; −0, 03; −0, 06); (40; -0, 01; −0, 03). Los resultados no son muy buenos pero ilustran el m´etodo variacional que es usado extensivamente en muchas ramas de la f´ısica; las discrepancias se deben en parte al modelo –suponer que el potencial es central y dado por (5.137)–, en parte al m´etodo variacional en s´ı, y en parte al uso de la aproximaci´on cl´asica.
5.4.
El problema de la dispersi´ on bajo fuerzas centrales
Esta secci´ on trata con las soluciones que describen estados no ligados; tales son los casos k < 0, k > 0 y E > 0 en el movimiento bajo el potencial −k/r. Cuando el problema es causal, es decir se conocen exactamente las constantes de movimiento y φ0 , las ecuaciones de la ´orbita nos dan la evoluci´ on de la part´ıcula; este problema es estrictamente mec´anico. En f´ısica microsc´opica, cuando se trabaja con ´atomos, mol´eculas o electrones, entre otros, una descripci´on mec´anica es muy dif´ıcil; entonces se acude a conceptos estad´ısticos. En esta secci´ on en gran parte trabajaremos con los conceptos estad´ısticos de la secci´ on eficaz, aptos para sistemas microf´ısicos, aunque tambi´en se aplican por ejemplo en cosmolog´ıa. La secci´ on eficaz de dispersi´ on. Un experimento t´ıpico de dispersi´ on consiste en estudiar el efecto de un centro dirpersor sobre un haz de part´ıculas. Se entiende por dispersi´ on el proceso de colisi´ on en el cual la direcci´ on del movimiento de las part´ıculas incidentes cambia al azar, como resultado de la interacci´ on con el centro dispersor. En el estudio estad´ıstico se hacen las siguientes suposiciones: todas las part´ıculas del haz incidente son de la misma naturaleza y tienen la misma energ´ıa y direcci´ on de la velocidad inicialmente. La interacci´ on es de corto rango, de modo que a partir de distancias mayores que cierta cantidad α es esencialmente cero. El haz de part´ıculas
Movimiento de dos part´ıculas que interact´ uan ... / 157 incidentes tiene una secci´ on transversal A que es mucho mayor que el ´area efectiva de interacci´ on σ = πα2 , las part´ıculas se distribuyen al azar sobre el ´area de la secci´ on transversal del haz. El haz tiene un n´ umero muy grande de part´ıculas para permitir un tratamiento estad´ıstico, pero no tan grande como para que una part´ıcula del haz interfiera con otra. Toda part´ıcula que se acerque al centro dispersor a una distancia menor que α es dispersada; la probabilidad a priori de una part´ıcula ser dispersada es: p=
σ ; A
σ = πα2
(5.153)
donde σ se llama secci´ on eficaz total de dispersi´ on y es una medida de la dispersi´ on en cualquier ´ angulo. Llamaremos θ al ´angulo entre la direcci´ on del haz incidente y la del movimiento final de una part´ıcula dispersada. Las part´ıculas que incidan sobre el blanco con un par´ ametro de impacto s ser´an dispersadas en un ´ angulo θ; las que incidan con un par´ ametro de impacto s + ds ser´an dispersadas en un ´ angulo θ + dθ donde dθ es negativo. Todas las part´ıculas que incidan sobre una corona circular de radios s y s + ds ser´an dispersadas dentro del rango angular θ y θ + dθ. Todas las part´ıculas que incidan sobre el ´area dσ (´ area rayada en la figura 5.19) se dispersar´an con ´ angulos entre θ y θ + dθ y φ + dφ. Como suponemos que r ≫ α, rd θ A dσ
r
dϕ θ
θ + dθ
dϕ
ds
Figura 5.19 Secci´ on eficaz de dispersi´ on entonces hemos notado que no hay diferencia esencial en suponer que las part´ıculas emergen del centro dispersor en vez del centro del ´area rayada dσ. Estas part´ıculas ser´an dispersadas dentro de un ´ angulo s´olido dΩ dado por: dΩ = senθ dθ dφ
(5.154)
La probabilidad de dispersi´ on dentro del ´angulo dΩ se expresa en funci´ on de la llamada secci´ on eficaz dσ. dp =
dσ s ds dφ = A A
(5.155)
Supongamos que la intensidad del haz incidente es I: I=
∆N A ∆t
(5.156)
158 / Mec´ anica cl´ asica avanzada donde ∆N es el n´ umero de part´ıculas incidentes que pasan por el ´area A durante el tiempo ∆t. De las ∆N que en ∆t pasan a trav´es de A, solamente dN (θ) incidir´ an sobre el ´ area dσ y ser´an dispersadas dentro de dΩ en el tiempo ∆t. Entonces la probabilidad de dispersi´ on dentro de dΩ durante el tiempo ∆t ser´a: dp =
dN (θ) dσ = ∆N A
(5.157)
Se sigue entonces de (5.156) y (5.157) que: dN (θ) = Idσ ∆t
(5.158)
Definimos la secci´ on eficaz diferencial σ(θ), como: σ(θ) =
dσ dΩ
(5.159)
Se sigue entonces que: σ(θ) =
1 dN (θ) I(θ) = I I ∆t dΩ
(5.160)
Es decir, σ(θ) es igual al n´ umero total de las part´ıculas dispersadas dentro de dΩ por unidad de tiempo y unidad de ´angulo s´olido, dividido por el n´ umero de part´ıculas incidentes por unidad de ´area por unidad de tiempo. Como esta definici´on de σ(θ) incluye s´olo conceptos macrosc´opicos, o sea conceptos de cantidades observables experimentalmente, entonces es v´alido tambi´en en mec´anica cu´antica. La siguiente expresi´on mec´anica que resulta de (5.159) al reemplazar a dσ y dΩ en funci´ on de θ, φ y s s´olo es v´alida en mec´anica cl´ asica, σ(θ) =
dσ −s ds = dΩ senθ dθ
(5.161)
La ecuaci´ on (5.161) est´ a expresada en funci´ on de s, que en microf´ısica no es accesible directamente al experimento. La relaci´ on entre las tres definiciones de secci´ on eficaz (secci´on eficaz, secci´ on eficaz total y secci´ on eficaz diferencial) es: Z Z σ = dσ = σ(θ) dΩ (5.162) Ejemplo 5.4.1 Sea una esfera dura de radio a y masa infinita. Sobre ella incide un haz de part´ıculas de masa m y radio b tambi´en duras, que se dispersan el´asticamente al chocar. Hallar la secci´ on eficaz diferencial (v´ease figura 5.20). El par´ ametro de impacto est´ a dado por: s = (a + b) senα = (a + b) cos
θ 2
(5.163)
Movimiento de dos part´ıculas que interact´ uan ... / 159
a
z S
b
α α
θ
Figura 5.20 El haz part´ıculas de masa m y radio b incide sobre una esfera de masa infinita y radio a
Entonces: σ(θ) =
1 (a + b)2 ; 2
σ = π(a + b)2
(5.164)
σ(θ) no depende de θ ni de la energ´ıa. Cu´ anticamente se halla que σ es cuatro veces mayor debido a efectos de difracci´ on. Secci´ on eficaz diferencial de Rutherford. Es la secci´ on eficaz diferencial de dispersi´ on coulombiana, cuando inciden part´ıculas cargadas sobre un blanco de masa infinita y cargado el´ectricamente. Asumamos que las cargas son positivas, ze y z ′ e, de modo que k es negativo, igual a −zz ′e2 . La figura 5.21 muestra la trayectoria de una de las part´ıculas, que es hiperb´ olica. Tomamos por simplicidad a φ0 = 0 con lo cual obtenemos de acuerdo con la figura 5.9, la figura 5.21. De acuerdo con la definici´on de secci´ on c´ onica, la ecuaci´ on de la hip´erbola (rama 1 en la figura 5.9) es: QF2 = ǫQD2
(5.165)
donde Q es el punto cuyo vector de posici´on es ~r, F2 es el foco de la derecha y D2 la directriz de la derecha. Entonces la ecuaci´ on de la trayectoria es: ǫs ǫs l2 /mk = −1 − ǫ cos φ ⇒ φ = π → rmin = = r ǫ−1 1−ǫ
(5.166)
Que tambi´en se obtiene directamente de (5.85) cuando k < 0 y φ0 se sustituye por φ0 + π. r → ∞ cuando −1 − ǫ cos φ = 0, o sea cuando φ toma el valor: 1 (5.167) φmin = cos−1 − ǫ φmin est´ a relacionado con el ´ angulo de dispersi´ on θ: φ π θ + θ = φmin ; θ + φ = π ⇒ φmin = + 2 2 2
(5.168)
160 / Mec´ anica cl´ asica avanzada y
•
z′e
Q
θ / 2
r Θ
O
ϕ
•ze
x
v∞
•u
S
Figura 5.21 Dispersi´ on de Rutherford. La trayectoria de las part´ıculas es hiperb´olica.
Entonces: 1 θ θ cos φmin = −sen = − ⇒ ǫ = csc 2 ǫ 2
(5.169)
Por otra parte ǫ est´ a relacionado con E y l, o sea con υ∞ y con s: l = mυ∞ s ; E =
1 mυ∞ 2 2
(5.170)
Como, seg´ un (5.89), ǫ2 = 1 + 2El2 /(mk 2 ), vemos que: s2 =
k2 2 (ǫ − 1) 4E 2
(5.171)
De (5.169) y (5.171) se sigue que: s=
k θ cot 2E 2
Reemplazando a (5.172) en (5.161) obtenemos para σ(θ): 2 θ k csc4 σ(θ) = 4E 2
(5.172)
(5.173)
que es la f´ ormula de Rutherford.5 Como el resultado no depende del signo de k, la f´ ormula tambi´en es v´alida cuando el potencial es atractivo. 5 Hallada
en 1911. En el tomo I del Berkeley physics course, al final del cap´ıtulo 15, puede verse el trabajo original de Rutherford.
Movimiento de dos part´ıculas que interact´ uan ... / 161 La f´ ormula (5.173) coincide exactamente con la formula cu´antica no relativ´ıstica; es uno de los varios resultados en que para potenciales del tipo 1/r hay una identidad con los resultados cu´anticos. La secci´ on eficaz total que se calcula de (5.173) resulta infinita. Como σ es una medida de la dispersi´ on, el ´ area efectiva para la dispersi´ on de Coulomb es infinita por ser un potencial de rango largo α = ∞. No importa a que distancia pase el proyectil del blanco siempre habr´ a dispersi´ on en alguna direcci´ on. Sistemas de referencia de centro de masa y de laboratorio. Hasta aqu´ı las consideraciones de las ´ orbitas se han hecho suponiendo que el centro de fuerzas es inm´ovil, lo que equivale a decir que trabajamos en un sistema de referencia donde se mueve una part´ıcula de masa reducida µ, que puede asumirse que est´ a colocada en vez de la part´ıcula 2, en tanto que el centro de fuerzas, inm´ovil, est´ a donde estaba la part´ıcula 1. El radio vector ~r describe el movimiento de la part´ıcula µ, as´ı como el movimiento relativo de las dos part´ıculas originales [ecuaciones (5.9) a (5.13)]. Aqu´ı analizaremos m´as en detalle la transformaci´ on de coordenadas, de manera adecuada a los procesos de dispersi´ on bajo fuerzas centrales. Experimentalmente los procesos de dispersi´ on se trabajan en el sistema de referencia de laboratorio. Los c´ alculos te´oricos se hacen en el sistema de centro de masa, donde la din´ amica de los problemas consiste en el movimiento de la part´ıcula de masa µ. Es necesario encontrar la conexi´on entre los resultados te´oricos y los experimentales. Todas las f´ ormulas anteriores de (5.153) a (5.173) han sido obtenidas suponiendo que el centro dispersor es fijo (v´ease figura 5.22). En el laboratorio usualmente una de las dos part´ıculas, que llamaremos el blanco, est´ a inicialmente en reposo y sobre ella incide el proyectil con cierta velocidad. La velocidad inicial del proyectil, cuando la separaci´on de las dos part´ıculas es mucho mayor que el rango de la interacci´ on α, es ~υ y la del blanco ~ = 0. En el centro de masa estas dos velocidades son ~υc y V ~c respectivamente. La es V m
-v
v
m
m
c.m. Laboratorio: inicial
M1
vc
x
x c.m.
v=0
vc
Laboratorio: final
Figura 5.22 Sistemas de referencia de centro de masa y de laboratorio velocidad del centro de masa respecto al laboratorio es constante, la llamaremos ~υ . m ~υ = ~υ (5.174) m+M Los momentos lineales de las part´ıculas inicialmente, cuando su separaci´on es muy grande de modo que no interact´ uan, son en el laboratorio: p~P L = m~υ ;
pBL = 0
y en el centro de masa son: p~P C = m(~υ − ~υ) = µ~υ ;
(5.175) ~pBC = M (0 − ~υ) = −µ~υ
(5.176)
162 / Mec´ anica cl´ asica avanzada Las energ´ıas cin´eticas totales de acuerdo con lo hallado en (5.11) a (5.13) son: TL =
1 mυ 2 ; 2
TC =
1 2 µυ 2
(5.177)
La energ´ıa cin´etica del centro de masa, que es constante, es: TC.M =
1 (M + m)υ 2 2
(5.178)
De modo que si p ~ es el momento lineal relativo, las energ´ıas cin´eticas est´ an conectadas por: TL =
p~2 P~ 2 + = TC.M + Tc 2(M + m) 2µ
(5.179)
o sea que en la regi´ on asint´ otica (r → ∞): TL = EL ;
EC.M = TC.M =
µ EL ; M
EL =
m EC µ
(5.180)
El momento lineal total anterior a la colisi´ on (r → ∞), es igual al momento lineal total despu´es de la colisi´ on (r → ∞). Usaremos primas para denotar las cantidades en la regi´ on asint´ otica despu´es de la colisi´ on. En el centro de masa el momento lineal total es cero, de modo que: ~C = 0 ; m~υC + M V
′ ~′ =0 m~υC + MV C
(5.181)
La ecuaci´ on de la conservaci´ on de la energ´ıa total en el centro de masa es: 1 1 ~2 1 1 ~ ′2 2 ′2 m~υC + MV υC + MV C = m~ C 2 2 2 2 La f´ ormula (5.182) se puede escribir, usando (5.181), en la forma: m ′ m ′ ′ · ~υC + ~υC = ~υC ~υ ~υC · ~υC + M M C
(5.182)
(5.183)
Se sigue entonces que: 2 ′2 υC = υC ;
VC2 = VC′2 ;
′ mυC = mυC = M VC = M VC′
(5.184)
es decir, las magnitudes de los cuatro momentos lineales, incidentes y emergentes, son iguales, de modo que en el centro de masa cada part´ıcula queda despu´es de la colisi´ on con la misma energ´ıa inicial.6 En el proceso de colisi´ on no interviene el ´angulo φ, porque con fuerzas centrales el movimiento ocurre en un plano (v´ease figura 5.23). Analicemos ahora la relaci´ on entre los ´ angulos de dispersi´ on θL y θC . La relaci´on de las velocidades de centro de masa y laboratorio es: ′ ′ ~υL = ~υC + ~υ ; 6 Se
V~L′ = V~C′ + ~υ
(5.185)
ve que la part´ıcula µ no coincide con m cuando se toma el origen de ~ r en el centro de masa. Como s´ olo interesa θC , es irrelevante saber d´ onde est´ a el origen de ~ r.
Movimiento de dos part´ıculas que interact´ uan ... / 163
v2′
m
Vc′ m
r Θc
Θ2
v
vc
v
r
C.M.
Centro de mesa
M
C.M.
vc
v=0 Laboratorio
v2′
vc′
Figura 5.23 Sistemas laboratorio y centro de masa
Sabemos que: υC = ~
M~ ~BC p = υ; m m
~C ′ = p~BC = −~υ V M
(5.186)
′ Como υC = υC y VC′ = VC , la ecuaci´ on (5.186) nos dice que: ′ υC =
M υ; m
VC′ = −υ
(5.187)
′ ′ O sea que si M > m entonces υC > υ = VC′ y si M < m, entonces υC < υ = VC′ . Podemos distinguir dos casos, M > m y M < m. Si m > M , de acuerdo con las figuras 5.24 y 5.25, θL es m´aximo cuando ~υC ′ es perpendicular a ~υL ′ , luego:
senθLmax =
′ M υC = υ m
(5.188)
o sea que hay una regi´ on angular en el laboratorio que est´ a prohibida cuando m > M . Si m < M , todos los valores de θL son posibles. La relaci´on entre θC y θL es com´ un para los casos m > M y m < M . Dicha relaci´on se obtiene a partir de: υL senθL = υC senθC ;
υL cos θL = υ + υC cos θC
(5.189)
Se sigue entonces que: tan θL =
senθC ; cos θC + γ
γ=
m M
(5.190)
Vemos que si m ≪ M , entonces θL ≃ θC . Si m ≃ M y γ ≃ 1, entonces θL ≃ (1/2)θC . Hallemos ahora la relaci´ on entre las secciones eficaces diferenciales σL (θL ) y σc (θc ). La secci´ on eficaz dσ es invariante por ser perpendicular a la direcci´ on del movimiento del proyectil en los dos sistemas de referencia: dσC = dσL
(5.191)
164 / Mec´ anica cl´ asica avanzada
v ′L
vi′C
ΘL
ΘC
v
γ>1 Figura 5.24 Relaci´on entre los ´angulos de dispersi´ on θC y θL con γ > 1
v ′L ΘL
vi′C ΘC
v
γ<1 Figura 5.25 Relaci´on entre los ´angulos de dispersi´ on θC y θL con γ < 1
de (5.159) se sigue entonces que: σC (θC )dΩC = σL (θC )dΩL ;
σL (θL ) = σC (θC )
d(cos θC ) d(cos θL )
(5.192)
Movimiento de dos part´ıculas que interact´ uan ... / 165 Para hallar el factor en (5.192), notemos que de (5.190) se sigue: tan θC =
senθL cos θL −
γ 1+γ
(5.193)
Entonces usamos: d(cos θC ) d(cos θC ) d(tan θC ) = = d(cos θL ) d(tan θC ) d(cos θL ) Para obtener finalmente:7 2 p 2 sen2 θ + γ cos θ 1 − γ L L d(cos θC ) p = fγ (θL ) = d(cos θL ) 1 − γ 2 sen2 θL
(5.194)
(5.195)
La f´ ormula σL (θL ) = fγ (θL )σC (θC ) da la conexi´on entre los c´ alculos te´oricos, centro de masa, y las medidas experimentales, laboratorio. Si γ = 1, vemos que f1 (θL ) = 4 cos θL , y si γ = 0, f0 (θL ) = 1. Ejemplo 5.4.2 Hallar la secci´ on eficaz diferencial de dispersi´ on en el laboratorio para la colisi´ on de dos esferas duras de masas m y M , y radios b y a respectivamente. En el centro de masa la dispersi´ on es como en la figura 5.20, de modo que: σC (θC ) =
1 (a + b)2 4
(5.196)
El resultado se obtiene usando la siguiente consideraci´on: el problema es como si reemplaz´aramos la esfera de masa m por una de masa µ, y la esfera de masa M por una de masa infinita. Como la interacci´ on es la misma, entonces el radio de la esfera de masa µ debe ser b y el de la esfera de masa infinita debe ser a. Como la ecuaci´ on (5.164) no depende del valor de la masa, se sigue el resultado (5.196). En el sistema de referencia de laboratorio la secci´ on eficaz diferencial es: σL (θL ) =
1 (a + b)2 fγ (θL ) 4
(5.197)
La secci´ on eficaz diferencial en el centro de masa es isotr´opica, en tanto que en el laboratorio s´ı habr´ a una dependencia angular. En virtud del resultado (5.188), la funci´ on fγ (θL ) debe definirse id´enticamente igual a cero para ´angulos θL mayores que θL m´aximo, cuando γ > 1. Ejemplo 5.4.3 Hallar la secci´ on eficaz diferencial de Rutherford en el laboratorio cuando la masa de la carga ze es finita. 7 Ver
la demostraci´ on en el texto Classical dynamics of particles and systems de Marion, 2a ed., ¯ secci´ on 9.4.
166 / Mec´ anica cl´ asica avanzada En el centro de masa σC (θC ) est´ a dada por (5.173): 2 k θC σC (θC ) = csc4 ; k = −zz ′ e2 4E 2 En el laboratorio ser´a: σL (θL ) =
k 4E
2 1 +
cos θL −
γ 1+γ sen2 θL
2 −2
fγ (θL )
(5.198)
(5.199)
o sea que la dependencia angular en el laboratorio es mucho m´as complicada que en el centro de masa. Cuando γ = 1 sin embargo, los resultados son simples debido a que θC = 2θL y f1 (θL ) = 4 cos θL : 2 cos θL k ; γ=1 (5.200) σL (θL ) = 2E sen4 θL
6 Peque˜ nas oscilaciones de sistemas de varios grados de libertad En vez de exponer el formalismo general, resolveremos en detalle algunos problemas que ilustran los aspectos principales del mismo. Veremos que las f´ormulas que se obtienen en forma de matrices se generalizan f´acilmente. Al respecto, el lector puede ver los correspondientes cap´ıtulos en los textos de Goldstein, Hauser, Marion, Gantmacher, entre otros, donde adem´as se explica en qu´e consiste la “peque˜ nez” de las oscilaciones.
6.1.
Modos normales de oscilaci´ on. Caso no degenerado
La mol´ ecula triat´ omica lineal. Oscilaciones longitudinales. La mol´ecula triat´ omica lineal consta de dos ´ atomos de masa m y uno de masa M , ligados entre s´ı por fuerzas interat´ omicas de modo que en la configuraci´on de equilibrio la mol´ecula es lineal, y al oscilar se conserva la forma lineal (v´ease figura 6.1). Supondremos que las interacciones m´as importantes se presentan entre los ´atomos 1 y 2, y 2 y 3; m´as adelante incluiremos una interacci´ on un poco m´as general. La energ´ıa potencial de interacci´ on entre dos ´ atomos puede variar como un pozo de potencial, a grandes distancias es atractiva y a peque˜ nas distancias es repulsiva, con un m´ınimo en una distancia dada. Nos interesaremos en los movimientos que consisten en peque˜ nas oscilaciones alrededor de la posici´on en que la energ´ıa potencial tiene un m´ınimo, que es una posici´on de equilibrio estable. m
M
m
x1
x2
x3
Figura 6.1 Mol´ecula triat´omica lineal
167
168 / Mec´ anica cl´ asica avanzada Para estos movimientos se cumple: (a) La energ´ıa potencial es del tipo de un “resorte” con peque˜ nas elongaciones; (b) La energ´ıa cin´etica no depende de la posici´on, o sea, es funci´ on cuadr´atica homog´enea de las velocidades, con coeficientes que no dependen de la posici´on. Ver la discusi´ on detallada de lo anterior, por ejemplo en Gantmacher, numeral 40. El n´ umero de grados de libertad necesarios para especificar las oscilaciones longitudinales es 3 − 1 = 2 descontando la traslaci´on del centro de masa. La longitud del “resorte” que une los ´ atomos 1 y 2 es x2 − x1 . Supondremos que en la posici´on de equilibrio la longitud de este “resorte” es b, o sea que x20 − x10 = b, siendo xi0 la coordenada de la part´ıcula i en la configuraci´on de equilibrio. La elongaci´ on del resorte 1−2 ser´a entonces: (x2 − x1 ) − b = (x2 − x20 ) − (x1 − x10 )
(6.1)
ηi = xi − xi0
(6.2)
Si llamamos a η1 , η2 y η3 la cantidad en que se separa cada ´atomo de su posici´on de equilibrio: podemos escribir las elongaciones de los resortes 1 − 2 y 2 − 3 como: η2 − η1
y
η3 − η2
(6.3)
de modo que la energ´ıa potencial para peque˜ nas oscilaciones ser´a: 1 1 k(η2 − η1 )2 + (η3 − η2 )2 V = 2 2
(6.4) 1 2 2 2 k(η1 + 2η2 + η3 − 2η1 η2 − 2η2 η3 ) 2 donde k es la “constante de resorte”, cuyo valor depende de factores que no entraremos a considerar aqu´ı, pero que supondremos conocido. En (6.4) no se incluye interacci´ on entre los ´ atomos 1 y 3. Las coordenadas η1 , η2 , η3 , no son todas vibracionales pues sabemos que las vibraciones longitudinales requieren s´olo dos coordenadas. V puede escribirse en la forma: 3 1 X kij ηi ηj (6.5) V = 2 i,j=1 ˜ donde kij son los elementos de la matriz 3 × 3, k: 1 −1 0 −1 2 −1 k˜ = k 0 −1 1
(6.6)
k˜ es una matriz sim´etrica, kij = kji . La energ´ıa cin´etica es: 1 1 1 mx˙ 21 + M x˙ 22 + mx˙ 23 T = 2 2 2 =
3 1 X mij η˙ i η˙ j 2 i,j=1
(6.7)
Peque˜ nas oscilaciones de sistemas de varios grados de libertad / 169 donde mij son los elementos de la matriz 3 × 3, m, ˜ que es diagonal y por lo tanto sim´etrica: m 0 0 m ˜ = 0 M 0 (6.8) 0 0 m El lagrangiano del problema es: L=
3 1 X (mij η˙ i η˙ j − kij ηi ηj ) 2 i,j=1
(6.9)
Para hallar las ecuaciones de Lagrange se requiere conocer las derivadas parciales de L respecto a ηi y η˙ i . Para ello evaluemos a dL: dL =
3 1 X (mij dη˙ i η˙ j + mij η˙ i dη˙ j − kij dηi ηj + kij ηi dηj ) 2 i,j=1
(6.10)
usando la simetr´ıa de k˜ y m, ˜ un cambio adecuado de los ´ındices mudos de la suma permite escribir, 3 3 3 X X X mij η˙ j dη˙i − kij ηj dηi (6.11) dL = i=1
j=1
j=1
con lo cual obtenemos:
3 3 X X ∂L ∂L kij ηj ; mij η˙ j ; i = 1, 2, 3 =− = ∂ηi ∂ η˙ i j=1 j=1
(6.12)
Teniendo en cuenta que las mij son constantes, las ecuaciones de Lagrange son: 3 X
(mij η¨j + kij nj ) = 0; i = 1, 2, 3
(6.13)
j=1
Si definimos los vectores en el espacio de configuraci´on del sistema, 0 η¨1 η1 ¨ ~ η= ~ η2 ; ~η = η¨2 ; 0 = 0 0 η¨3 η3
(6.14)
las ecuaciones de Lagrange (6.13) toman la forma condensada: ˜η = ~0 m ˜~ η¨ + k~
(6.15)
170 / Mec´ anica cl´ asica avanzada Veremos que (6.15) es la forma de la ecuaci´ on de movimiento para cualquier sistema de muchos grados de libertad con peque˜ nas oscilaciones. El sistema que consideramos tiene s´olo oscilaciones en una dimensi´ on; sin embargo, por tener tres grados de libertad para los movimientos longitudinales, el espacio de configuraci´on de tales movimientos es tridimensional. El problema que sigue es buscar las soluciones de (6.15) que describir´ an el movimiento del punto del espacio de configuraci´on. La ecuaci´ on para el vector ~η , (6.15), es lineal, luego la soluci´on general puede expresarse como una combinaci´ on lineal de las soluciones linealmente independientes. Como el vector ~ η es tridimensional, existir´an tres soluciones linealmente independientes, en t´erminos de las cuales puede expandirse a ~η ; tales soluciones las llamaremos ~ηα con α = 1, 2, 3, de modo que la soluci´on general de (6.15) ser´a de la forma: ~η = C1 ~ η1 + C2 ~η2 + C3 ~η3
(6.16)
Como la ecuaci´ on de movimiento es de segundo orden, la soluci´on contendr´a dos constantes de integraci´ on arbitrarias por cada grado de libertad. En total hay seis constantes de integraci´ on que son C1 , C2 , C3 , φ1 , φ2 , φ3 . Busquemos soluciones de la forma: ~ηα = ~ µα sen(ωα t + φα ); α = 1, 2, 3
(6.17)
~ α es un vector tridimensional constante y φα es una constante de integraci´ µ on. Las componentes de ~ µα son µα1 , µα2 , µα3 . En t´erminos de las componentes, (6.17) ser´a: ηαi = µαi sen(ωα t + φα ) ;
i, α = 1, 2, 3
(6.18)
En (6.18) el ´ındice i se refiere a los grados de libertad, en tanto que α numera las soluciones diferentes. ωα es una constante que no debe depender de las constantes de integraci´ on. Debido a que sen(ωα t + φα ) y sen(ωβ t + φβ ) son linealmente independientes cuando ωα 6= ωβ , las ~ηα ser´an linealmente independientes cuando ωα 6= ωβ . Las soluciones de la forma (6.17) y (6.18) representan los movimientos en los cuales todas las part´ıculas oscilan con la misma frecuencia y tienen una definida relaci´on entre sus amplitudes de oscilaci´on. La pregunta que sigue es: ¿cu´ anto valen las ωα y cu´ales son las relaciones que deben existir entre las µαi ?. Para responderla, reemplacemos a (6.18) en (6.15): ˜ µα = ~0 , (−ωα2 m ˜ + k)~
3 X
(ωα2 mij + kij )µαj = 0;
i, α = 1, 2 , 3
(6.19)
j=1
La ecuaci´ on (6.19) es un sistema de tres ecuaciones lineales algebraicas homog´eneo, con las tres inc´ ognitas µα1 , µα2 , µα3 , que tendr´a soluci´on para ciertos valores de ωα . Hallar a ~ µα equivale a realizar la siguiente operaci´ on con matrices: ˜ −1~0 µα = (−ωα2 m ~ ˜ + k)
(6.20)
Vemos que ~ µα ser´a no trivial, es decir, diferente del vector ~0 solamente si la matriz k) es singular, o sea si su determinante es cero. Esto introduce una condici´on que permite determinar las ωα : (−ωα2 m +
˜ =0 det(ωα2 m ˜ − k)
(6.21)
Peque˜ nas oscilaciones de sistemas de varios grados de libertad / 171 La ecuaci´ on (6.21) se llama ecuaci´ on secular o determinante secular. El t´ermino secular proviene del latin seculum, o sea, referente a los siglos; se usa a partir de una ecuaci´ on an´aloga en astronom´ıa que aparece al realizar c´ alculos perturbativos que predicen efectos sobre las ´ orbitas apreciables s´olo en tiempos muy largos. De acuerdo con las ecuaciones (6.6) y (6.8) se tiene que:
ωα2 m ˜
mωα2 − k
˜ −k =
k
0
k
M ωα2
k
0
k
− 2k
mωα2 − k
(6.22)
El determinante de la matriz (6.22) es:
det ωα2 m ˜ − k˜ = mωα2 − k (M ωα2 − 2k)(mωα2 − k) − k 2 −k
k(mωα2
− k)
(6.23)
Por tanto la ecuaci´ on (6.21) es una ecuaci´ on algebraica de tercer grado en ωα2 , que 2 2 2 tendr´a tres ra´ıces que ser´an ω1 , ω2 y ω3 :
M + 2m k (ω 2 − 0) ω 2 − k det ωα2 m ˜ − k˜ = m2 M ω 2 − m Mm
(6.24)
= m2 M (ω 2 − ω22 )(ω 2 − ω12 )(ω 2 − ω32 ) En conclusi´ on, las frecuencias con las cuales puede ocurrir la oscilaci´on simult´ anea de las tres coordenadas son:
ω12 = 0; ω22 =
k m k 1+2 ; ω32 = m m M
(6.25)
Si m ≪ M entonces ω2 ≈ ω3 present´ andose una cuasidegeneraci´ on. Hay una matriz
172 / Mec´ anica cl´ asica avanzada de la forma (6.22) por cada una de las frecuencias (6.25):
ω12 m ˜ − k˜ =
ω22 m ˜
− k˜ =
−k
k
k 0
k
k k
ω32 m ˜ − k˜ =
2
0
k m k M k
k
0
k
M − 2m k m
0
k −k
−2k
0
0
(6.26)
0
k
0
M m
k
k
2
m k M
Entonces las ecuaciones (6.19), que nos dan las relaciones entre las componentes de los vectores ~ µ1 , µ ~ 2 y ~µ3 , son:
−k k 0
0
k
2
0
µ11 k µ12 µ13 −k
−2k k
0
k k k
0
M m k
k 2
µ21
µ31
µ22 k µ23 0
M − 2m k m
m k M k
0
k
0
k
m k M
µ32 µ33
=
=
=
0
0 0
0
0 0
0
0 0
(6.27)
Peque˜ nas oscilaciones de sistemas de varios grados de libertad / 173 Siendo m´as expl´ıcitos, respectivamente estas ecuaciones toman la forma: µ11 = µ12 ; µ11 − 2µ12 + µ13 = 0; µ12 = µ13 µ22 = 0; µ21 + µ23 = 0; µ22 = 0 2
(6.28)
m M 2m µ31 + µ32 = 0; µ31 + µ32 + µ33 = 0; µ32 + µ33 = 0 M m M
Las relaciones buscadas entre los componentes de los vectores ~µα para los movimientos en que las tres part´ıculas oscilan con la misma frecuencia son: ω1 : µ11 = µ12 = µ13 ω2 : µ21 = −µ23 ; µ22 = 0 ω3 : µ31 = µ33 ; µ32 = −
(6.29)
2m µ31 M
Cada vector µα resulta indeterminado por una constante arbitraria, aunque las relaciones entre sus componentes est´ an bien definidas:1 1 1 1 2m (6.30) µ1 = µ11 1 ; ~ ~ µ2 = µ21 0 ; ~µ3 = µ31 − M 1 −1 1
Notamos que ~ µ1 , ~ µ2 y ~ µ3 no son ortogonales, puesto que: ~µ1 · ~µ2 = 0; ~µ1 · ~µ3 = 2µ11 µ31 (1 − m/M ); ~ µ2 · ~ µ3 = 0. Es deseable, sin embargo, trabajar con vectores ortogonales. Los vectores siguientes son ortogonales: √ √ m m √ 1/2 1/2 m ˜ ~ µ1 = µ11 M ; m ˜ ~µ2 = µ21 0 √ √ − m m √ m −2m m ˜ 1/2 µ ~ 3 = µ31 √ M √ m
(6.31)
1 Las trayectorias descritas en el espacio de configuraci´ on son rectil´ıneas. ~ η1 corresponde a una l´ınea infinita, describe una translaci´ on no acotada a lo largo del vector ~ µ1 . ~ η2 y ~ η3 describen oscilaciones sobre segmentos rectos finitos a lo largo de los vectores ~ µ2 y ~ µ3 respectivamente.
174 / Mec´ anica cl´ asica avanzada En vez de trabajar con estos vectores, es c´ omodo quedarse con los vectores (6.30), pero cambiando la definici´on del producto escalar. Definiremos el producto escalar de dos vectores ~ µ y ~ν as´ı: (~ µ, ~ν ) = (m ˜ 1/2 ~µ).(m ˜ 1/2 ~ν ) = ~µ.(m~ ˜ ν) =
3 X
mij µi νj
(6.32)
i,j=1
Podemos ahora escoger las constantes arbitrarias µ11 , µ21 y µ31 de modo que los vectores ~ µα formen una tr´ıada ortonormal bajo el producto escalar (6.32), es decir, normalizar los vectores a la unidad: (~µα , ~να ) = 1; α = 1, 2, 3. Este procedimiento nos conduce inmediatamente a: 1 1 1 1 0 1 ; µ1 = √ ~ ~µ2 = √ 2m + M 2m −1 1
1
−2m µ3 = r ~ m M 2m(1 + 2 ) M 1 1
(6.33)
La definici´on (6.32) se hace por comodidad matem´atica, pero nos aleja un poco del sentido f´ısico original. La exigencia de ortonormalidad nos conduce a vectores que no tienen dimensiones de desplazamiento y a soluciones que no dependen de las condiciones iniciales: contienen informaci´on sobre la relaci´on de amplitudes pero no de su valor absoluto. Por esto se les llama “modos normales de oscilaci´on”. Se dice que los movimientos longitudinales de la mol´ecula triat´ omica lineal son no degenerados porque las frecuencias de los tres modos normales son diferentes; en otras palabras, no hay dos modos normales diferentes con la misma frecuencia. La frecuencia w1 , que es nula, no corresponde a una oscilaci´on. Esto es consistente con la forma del vector propio correspondiente: las tres part´ıculas se desplazan la misma cantidad en todo momento, o sea que la mol´ecula se traslada. En sentido estricto s´olo µ2,3 son modos normales de oscilaci´on, de acuerdo con lo dicho anteriormente acerca de ~ que s´olo hay dos coordenadas vibracionales longitudinales. En el modo ~µ2 la part´ıcula 2 se queda quieta y las part´ıculas 1 y 3 oscilan en contrafase. En el modo ~µ3 las part´ıculas 1 y 3 oscilan en fase, pero la part´ıcula 2 se desplaza respecto a 1 − 3 una cantidad que depende de las masas y es en sentido opuesto. En el modo ~µ2 cada “resorte” act´ up a independientemente sobre una masa m; por esto la frecuencia correspondiente vale k/m. Si se quiere indicar la magnitud de las oscilaciones es conveniente definir otras soluciones, llamadas “coordenadas normales”, que, veremos, representan otro conjunto de coordenadas generalizadas independientes para describir el estado del sistema y contienen informaci´ on sobre las condiciones iniciales.
Peque˜ nas oscilaciones de sistemas de varios grados de libertad / 175 Coordenadas normales para la mol´ ecula triat´ omica lineal. Las ecuaciones de movimiento (6.13) son tres ecuaciones diferenciales de segundo orden acopladas. La soluci´on (6.18) fue obtenida por “tanteo”. Un m´etodo directo de soluci´on consiste en realizar una transformaci´ on de coordenadas donde las nuevas ecuaciones de movimiento resulten desacopladas. El lagrangiano (6.9) puede escribirse en forma compacta usando la notaci´ on matricial. Si ~η es un vector columna, ~η T es un vector fila: L=
1 ˙T ˙ 1 T ˜ η η m ~ ˜~ η − ~η k~ 2 2
(6.34)
L es una forma cuadr´atica no diagonal en η˙ i y en ηi pues la matriz k˜ es no diagonal. Esto conduce a que las ecuaciones de movimiento sean acopladas. Si se realiza una transformaci´ on lineal de coordenadas que diagonalice a L, las correspondientes ecuaciones de movimiento ser´an no acopladas, pues en ese caso L consta de una suma de t´erminos que dependen de s´olo una de las coordenadas. Llamemos ~θ a las nuevas coordenadas generalizadas y A˜T la matriz de la transformaci´ on: η = A˜T ~ ~ θ
(6.35)
˜ En las nuevas variables L toma la forma: donde A˜T es la matriz transpuesta de A. L=
1 ~˙ T ˜ ˜T ~˙ θ Am ˜A θ − 2
1 ~T ˜˜ ˜T ~ θ Ak A θ 2
(6.36)
Ahora exigimos que A˜ sea tal que m ˜ ′ = A˜k˜A˜T y k˜′ = A˜m ˜ A˜T sean ambas diagona′ ′ ′ ′ les, es decir, tales que mij = mi δij y kij = ki δij para i, j = 1, 2, 3 de modo que (6.36) queda as´ı: 3 1 X ′ ˙2 (m θ − kα′ θα2 ) L= 2 α=1 α α
(6.37)
La ecuaci´ on de movimiento (6.37), ser´a ahora: m′α θ˙α2 − kα′ θα2 = 0
(6.38)
Las soluciones para las nuevas coordenadas, en funci´ on de las constantes de integraci´ on Cα y φα , ser´an: s ! kα′ (6.39) t + φα kα′ θα2 = 0; α = 1, 2, 3 θα = Cα sen m′α De (6.35) y (6.39) se sigue que: s ! 3 X kα′ ηi = Aαi Cα sen t + φα ; i = 1, 2, 3 m′α α=1
(6.40)
Las coordenadas θα con α = 1, 2, 3, se llaman las coordenadas normales del sistema. El problema matem´atico ahora consiste en hallar las nueve componentes de la
176 / Mec´ anica cl´ asica avanzada ˜ que se obtienen resolviendo para las Aαi las ecuaciones que resultan de las matriz A, condiciones: (A˜m ˜ A˜T )ij = m′i δij ; (A˜k˜A˜T )ij = ki′ δij (6.41) A partir de (6.16) y (6.17) vemos que ~ηi toma la forma: ηi =
3 X
Cα µαi sen(ωα + φα )
(6.42)
α=1
Las expresiones (6.40) y (6.42) coinciden si se cumple que: kα′ ; i, α = 1, 2, 3 (6.43) m′α Llegamos a la conclusi´ on de que los vectores propios, o modos normales de oscila˜ o sea las columnas de la matriz A˜T que realiza la cion ~ µα , son las filas de la matriz A, ~ transformaci´ on de ~η a θ seg´ un (6.35). Como los vectores ~µα son ortogonales y ortonormales seg´ un el producto escalar (6.32): Aαi = µαi
y
(µα , µβ ) = δαβ ;
ωα2 =
α, β = 1, 2, 3
(6.44)
Podemos escribir (6.44) tambi´en en la forma: ~ Tα m~ µ ˜ µβ = δαβ ;
α, β = 1, 2, 3
(6.45)
Expl´ıcitamente (6.45) es: 3 X
mij µαi µβj = δαβ ;
α, β = 1, 2, 3
(6.46)
i,j=1
Notamos la identidad entre las filas de A˜ y los vectores ~µTα , y por lo tanto podemos escribir a (6.46) como: A˜m ˜ A˜T = I˜ (6.47) donde I˜ es la matriz unidad 3 × 3, o sea que m′i = 1 para i = 1, 2, 3. Entonces las condiciones que nos definen las frecuencias ωα2 y la matriz A˜ son de (6.41), (6.43) y (6.47): (A˜m ˜ A˜T )ij = δij ; (A˜k˜A˜T )ij = ωi2 δij ; i, j = 1, 2, 3 (6.48) Las columnas de A˜T son los vectores ~µα y las ωα2 son los elementos diagonales de la matriz k˜′ = A˜k˜A˜T . La ecuaci´ on (6.47) es la condici´on de que la matriz A˜ sea ortogonal, o sea que preserve el producto escalar (6.32) en una transformaci´ on de coordenadas generalizadas. Expl´ıcitamente la matriz A˜T es: −1/2 −1/2 M 2m 1 1+ 1 + 2m M −1/2 −1/2 1 M 2m 2m (6.49) A˜T = √ 1+ 1+ 0 − 2m 2m M 2M −1/2 −1/2 2m M −1 1+ 1+ 2m M
Peque˜ nas oscilaciones de sistemas de varios grados de libertad / 177 y la matriz k˜′ es:
0
0 ′ k˜ = 0
0
0
0 k 2m 1+ m M
k m 0
(6.50)
No es exacto que la coordenada normal correspondiente a ω1 = 0 sea de la forma (6.39). En efecto, para esta frecuencia la ecuaci´ on de movimiento es: θ¨1 = 0
(6.51)
cuya soluci´on es: θ1 = At + B
(6.52)
donde A y B son constantes de integraci´ on, aunque podr´ıa llegarse a (6.52) de (6.39) mediante una expansi´ on en serie de Maclaurin alrededor de ω1 = 0. Las otras dos coordenadas normales son: θα = Cα sen(ωα t + φα ) ; α = 2, 3
(6.53)
donde Cα y φα se determinan de las condiciones iniciales. Las ecuaciones (6.52) y (6.53) nos permiten expresar los desplazamientos generales de las part´ıculas, usando (6.35) y (6.49):
η2 =
t + φ3 ) 1 rAt + B + C2 sen(ω2 t + φ2 ) + C3 sen(ω √ r 3 2m 2m M 1+ 1+ M 2m
η3 =
η1 =
t + φ3 ) 1 rAt + B − 2m C3 sen(ω √ r 3 M 2m 2m M 1+ 1+ M 2m
(6.54)
1 t + φ3 ) rAt + B − C2 sen(ω2 t + φ2 ) + C3 sen(ω √ r 3 2m 2m M 1+ 1+ M 2m
Esto nos dice que el movimiento m´as general de las part´ıculas consiste en una traslaci´ on uniforme y en una superposici´on de oscilaciones de frecuencias ω2 y ω3 . La oscilaci´ on de la part´ıcula 2 es de frecuencia ω2 en tanto que las oscilaciones de las
178 / Mec´ anica cl´ asica avanzada part´ıculas 1 y 3 se caracterizan por una diferencia de fase de π en la componente de frecuencia ω2 .2 Las constantes A, B, C2 , C3 , φ2 y φ3 se pueden expresar en t´erminos de los valores en t = 0 de η1 , η2 , η3 , η˙ 1 , η˙ 2 y η˙ 3 a trav´es de las f´ormulas: ˙ ~ θ = (AT )−1 ~ η ; θ~ = A˜m~ ˜ η ; ~θ = A˜m ˜ ~η˙
(6.55)
La matriz A˜m ˜ expl´ıcitamente es: −1/2 −1/2 M m −1/2 M M 1+ m 1+ m 1+ 2m 2m 2M 1 m 0 −m A˜m ˜ = √ 2m −1/2 −1/2 −1/2 2m 2m 2m m 1+ −2m 1+ m 1+ M M M ˙ En tanto que θ~ y θ~ en t = 0 son: B A ˙ ~ θ~ = C2 senφ2 θ = ω2 C2 cos φ2 C3 senφ3 ω3 C3 cos φ3
(6.56)
(6.57)
Los modos normales de oscilaci´on no son entonces m´as que casos particulares de la soluci´on general (6.54) en que s´olo contribuye una de las componentes normales. As´ı por ejemplo, el “modo 1” se obtiene haciendo C1 = C3 = 0. La transformaci´ on a coordenadas normales puede interpretarse como la correspondencia con un sistema equivalente que consiste en un conjunto de osciladores arm´onicos lineales no acoplados. La descomposici´on en modos normales es muy u ´til en otras ramas de la f´ısica como la teor´ıa de campos, la cual tendremos ocasi´on de estudiar con un campo mec´anico unidimensional. Los modos normales para la mol´ecula triat´ omica lineal en oscilaciones longitudinales los podemos representar gr´aficamente (v´ease figura 6.2). Generalizaci´ on del formalismo anterior. Si se tiene un conjunto de osciladores acoplados con peque˜ nas oscilaciones, de l grados de libertad oscilatorios, con frecuencias no degeneradas, podemos f´acilmente generalizar el anterior formalismo. No es dif´ıcil ver que en general la matriz m ˜ es sim´etrica, aunque no necesariamente diagonal. k˜ tambi´en es sim´etrica. De esto se deducen importantes propiedades de los vectores propios y frecuencias propias. Las matrices m ˜ y k˜ son de dimensi´ on l × l y los vectores del espacio de configuraci´on son de l componentes. La ecuaci´ on (6.19) puede escribirse en cualquiera de las formas siguientes: ˜ µα = ω 2 ~µα (m ˜ −1 k)~ α
˜ −1/2 )(m ˜ 1/2 µ ~ α ) = ωα2 (m ˜ 1/2 ~µα ) ´o (m ˜ 1/2 k˜m
(6.58)
2 El vector η ~ con componentes (6.54) describe el movimiento de un punto del espacio de configuraci´ on. En el plano formado por µ ~2 y ~ µ3 , la proyecci´ on del movimiento da una figura de Lissajous. O sea que la trayectoria de configuraci´ on se obtiene al desplazar dicha proyecci´ on a lo largo de ~ µ1 . Por ejemplo, si m ≪ M , la trayectoria ser´ a una h´ elice el´ıptica alrededor de µ1 .
Peque˜ nas oscilaciones de sistemas de varios grados de libertad / 179 1
2
3
ω1 = 0
x Traslación: η1 = η2 = η3
ω2 =
ω3 =
m
√m ( 1 + M ( k
ns
√k
x Vibración simétrica: η1= –η3 , η2 = 0
2m
x Vibración asimétrica: η1 = η3 , η2 = –2m/M η1
Figura 6.2 Modos normales para la mol´ecula triat´omica lineal en oscilaciones longitudinales
Con la primera forma podemos definir el producto escalar en t´erminos del “tensor m´etrico” de cierto espacio Riemanniano, mij :
~ ~η ) = (ζ,
l X
mij ζi ηj
(6.59)
i,j=1
La ecuaci´ on (6.58) tiene la forma de una ecuaci´ on de valores propios y vectores propios de una matriz sim´etrica. En efecto, m ˜ −1 k˜ es el producto de matrices sim´etricas que, seg´ un es f´ acil mostrar, da una matriz sim´etrica. Entonces se cumplen los siguientes teoremas del algebra lineal: (a) los valores propios, ωα2 , de m ˜ −1 k˜ son reales y (b) los vectores propios, ~ µα , correspondientes a valores propios diferentes son ortogonales y linealmente independientes. La ecuaci´ on correspondiente a la (6.16) representa la expansi´ on de un estado arbitrario de oscilaci´on en un conjunto completo de vectores propios ˜ La prueba de la ortogonalidad de los vectores propios es simple. de la matriz m ˜ −1 k. Escribamos las ecuaciones de valores propios para ωα2 y ωβ2 :
˜ µα = ω 2 ~ (m ˜ −1 k)~ α µα ;
˜ µβ = ω 2 ~µβ (m ˜ −1 k)~ β
(6.60)
Tomemos el producto escalar de la primera por ~µβ y de la segunda por µ ~ α:
˜µα ) = ω 2 (~ (~ µβ , m−1 k~ µα ) α µβ , ~ ˜ µβ , ~ µβ , ~µα ) µα ) = ωβ2 (~ (m−1 k~
(6.61)
180 / Mec´ anica cl´ asica avanzada Como m ˜ −1 k˜ es sim´etrica, los lados izquierdos en (6.61) son iguales. En efecto: l l X X
˜ µα ) = (~ µβ , m ˜ −1 k~
µβi mij krs µαs (m) ˜ −1 jr
i,j=1 r,s=1 l X
=
µβr krs µαs =
r,s=1
krs µβr µαs
r,s=1
l l X X
˜ µβ , ~ (m ˜ −1 k~ µα ) =
l X
(6.62)
(m) ˜ −1 ir krs µβs mij µαj
i,j=r r,s=1 l X
=
krs µβs µαr =
r,s=1
l X
ksr µβr µαs
r,s=1
Entonces se sigue que: (ωα2 − ωβ2 )(~ µβ , ~µα ) = 0
(6.63)
Si ωα2 6= ωβ2 entonces ~µα y ~µβ son ortogonales. Si α = β, (~µα , ~µα ) tiene alg´ un valor que tomamos igual a 1, entonces, (~ µα , ~ µβ ) = δα,β
α , β = 1, 2, l
(6.64)
Ahora, si definimos con las componentes de las µα una matriz A˜ de dimensi´ on l × l: Aαi = µαi ; α, i = 1, 2, ...l
(6.65)
Entonces la ecuaci´ on (6.64) no es m´as que la condici´on de ortogonalidad de A˜ en el espacio riemanniano de configuraci´on: A˜m ˜ A˜T = I˜
(6.66)
La ortogonalidad ordinaria de una matriz es A˜A˜T o A˜−1 = A˜T . La ecuaci´ on de ˜µα = ω 2 m~ valores propios k~ erminos de la matriz diagonal ω ˜ , con α ˜ µα puede escribirse en t´ elementos ωα2 , ωαβ = ωα2 δαβ de la siguiente forma: A˜k˜ = ω ˜ A˜m ˜
(6.67)
˜ (6.67) toma la forma: Si multiplicamos por A˜T y usamos la ortogonalidad de A, A˜k˜A˜T = ω ˜
(6.68)
vemos que la matriz A˜ realiza sobre k˜ una transformaci´ on que la diagonaliza, siendo las frecuencias propias los elementos diagonales. Las expresiones (6.66) y (6.68) nos dicen ˜ m que A˜ diagonaliza simult´ aneamente a m ˜ y a k. ˜ es el tensor m´etrico en el espacio de configuraci´on. Podemos entonces interpretar a A˜ como la matriz de una transformaci´ on lineal en el espacio de configuraci´on que nos hace pasar de unos ejes oblicuos, ηi , (con m ˜
Peque˜ nas oscilaciones de sistemas de varios grados de libertad / 181 no diagonal; el producto escalar, en particular el lagrangiano, contiene productos cruza˜ dos de las componentes de los vectores) a unos ejes cartesianos ortogonales, θα (m ˜ = I, de ah´ı que el lagrangiano en coordenadas normales tenga t´erminos independientes entre ˜ k˜ se transforma s´ı). Estos nuevos ejes son los ejes principales de k˜ porque mediante A, en ω ˜ que es diagonal. Las coordenadas normales son un sistema de “ejes principales” en el espacio de configuraci´on donde m ˜ y k˜ son ambas diagonales.3 Esto tiene como consecuencia que las ecuaciones de movimiento de las coordenadas normales sean desacopladas: θ¨α +ωα2 θα = 0; α = 1, 2, ...l.
6.2.
Modos normales de oscilaci´ on. Caso degenerado
Las oscilaciones transversales de la mol´ecula del tipo “CO2 ” no se pueden considerar con un modelo de “resortes”, pues con tal modelo estas oscilaciones son intr´ınsecamente no lineales. La demostraci´on de esto se propone como ejercicio. Como el potencial tiene un m´ınimo en la posici´on de equilibrio aun para desplazamientos transversales, es v´alida una aproximaci´on por un potencial parab´olico, aunque la constante k no ser´a la misma que en las oscilaciones longitudinales. Otro aspecto de las oscilaciones transversales es la degeneraci´ on de los modos normales que a continuaci´on analizamos cualitativamente. Para especificar completamente la mol´ecula, constituida a partir de tres part´ıculas puntuales, se requieren nueve coordenadas. Hay un grado de libertad correspondiente a traslaciones a lo largo de la mol´ecula (el modo ~µ1 analizado anteriormente) y dos grados de libertad traslacionales en direcciones perpendiculares al eje de la mol´ecula. Adem´as, para una posici´on dada del centro de masa, hay dos rotaciones alrededor de ´el, pues no tiene sentido una rotaci´on alrededor del eje de la mol´ecula. En total, pues, hay tres grados de libertad traslacionales y dos rotacionales, quedando cuatro grados de libertad vibracionales (dos longitudinales y dos transversales). La simetr´ıa de rotaci´on alrededor de la mol´ecula implica que la constante k es la misma para cualquier desplazamiento transversal y como hay dos modos de oscilaci´on transversales, ´estos tendr´an la misma frecuencia, es decir, la frecuencia de las oscilaciones transversales es degenerada. Los dos modos los podemos llamar modo “z” y modo “y”, como se representan en la figura 6.3. y
y x z
Modo y
x z
Modo z
Figura 6.3 Modos de oscilaci´on transversales. 3 En
˜ determinan los vectores unitarios de los “ejes principales”, o sea los ~ efecto, las filas de A µα .
182 / Mec´ anica cl´ asica avanzada Un movimiento transversal arbitrario ser´a una combinaci´ on de los modos “y” y “z”. Si las dos oscilaciones est´ an en fase, el movimiento ser´a lineal; si no, el movimiento ser´a el´ıptico. Si la diferencia de fase es de 900 las part´ıculas se mover´an en trayectorias circulares, como se ve en la figura 6.4. Al aplicar el formalismo general al problema completo de la mol´ecula del tipo “CO2 ”, se encuentra una ecuaci´ on secular de grado nueve en ω 2 pero a priori esperamos que los cinco grados de libertad no vibracionales den lugar a modos normales con frecuencia ω 2 = 0, que los dos grados de libertad oscilatorios longitudinales tengan dos frecuencias diferentes, y que los dos grados de libertad oscilatorios transversales den lugar a modos normales con frecuencia doble. Es decir, el problema completo tedr´a una frecuencia qu´ıntuple nula, dos frecuencias simples y una frecuencia doble; en total cuatro ra´ıces diferentes. y
En fase: oscilaciones lineales
y
En desfase: rotaciones
x z
x z
Figura 6.4 Modos normales de oscilaci´on: dos frecuencias simples y una frecuancia doble.
La mol´ ecula triat´ omica lineal. Oscilaciones longitudinales y transversales. Consideraremos s´olo el problema de hallar los modos normales de oscilaci´on, ya que los modos traslacionales y rotacionales permiten un tratamiento trivial. Las coordenadas vibracionales se llaman coordenadas internas. Si imponemos la condici´on de que el centro de masa est´e fijo y no haya rotaciones netas de la mol´ecula, quedar´an solamente las coordenadas internas. El c´ alculo lo realizaremos en tres dimensiones. ~ri es el vector de posici´on de la part´ıcula i = 1, 2, 3 y ~ri0 el de la posici´on de equilibrio. La separaci´on de la posici´on de equilibrio es para la part´ıcula i es: d~i = ~ri − ~ri0 ; i = 1, 2, 3
(6.69)
~ 0 = m~r10 + M~r20 + m~r30 ~ = m~r1 + M~r2 + m~r3 = R R 2m + M 2m + M
(6.70)
d~i y ~ri son vectores ordinarios tridimensionales; no son vectores del espacio de configu~ y la consideraremos fija, es decir: raci´ on. La coordenada del centro de masa es R
Se sigue entonces que las componentes de los d~i no son independientes sino que est´ an sometidos a las condiciones: md~1 + M d~2 + md~3 = 0
(6.71)
La condici´on sobre la no rotaci´on de la mol´ecula alrededor del centro de masa es que el momento angular total sea cero: ~ = m~r1 × ~r˙ 1 + M~r2 × ~r˙ 2 + m~r3 × ~r˙ 3 L ˙ ˙ ˙ = m(~r10 + d~1 ) × d~1 + M (~r20 + d~2 ) × d~2 + m(~r30 + d~3 ) × d~3 = 0
(6.72)
Peque˜ nas oscilaciones de sistemas de varios grados de libertad / 183 Las coordenadas de la posici´on de equilibrio son, tomando el origen de coordenadas en la posici´on de la part´ıcula 2: ~r10 = −bˆi; ~r20 = 0; ~r30 = bˆi. Por lo tanto la ecuaci´ on (6.72) es: ~ = mbˆi × (d~˙ 3 − d~˙ 1 ) + m(d~1 × d~˙ 1 + d~3 × d~˙ 3 ) + M d~2 × d~˙ 2 = 0 L
(6.73)
para peque˜ nas oscilaciones se cumple que di ≪ b, lo cual nos permite escribir en vez de (6.73): ˆi × (d~˙ 3 − d~˙ 1 ) = 0
(6.74)
o m´as expl´ıcitamente: d˙3y = d˙1y ; d˙3z = d˙1z
(6.75)
Integrando (6.75) obtenemos: d3y = d1y + Constante; d3z = d1z + Constante; las constantes deben anularse porque estas ecuaciones se deben cumplir aun en la posici´on de equilibrio: d3y = d1y ; d3z = d1z
(6.76)
La condici´on (6.71) vale tambi´en para las velocidades, de donde: m m ˙ ˙ ˙ d~2 = − (d~1 + d~3 ) ; d~2 = − (d~1 + d~3 ) M M
(6.77)
En conclusi´ on, existen las siguientes cinco relaciones entre los nueve desplazamientos, lo cual nos deja con 9 − 5 = 4 grados de libertad internos: d1y = d3y ; d2y = −
2m d1y ; M
d2x = −
m (d1x + d3x ) M
d1z = d3z d2z = −
2m d1z M
(6.78)
Existen adem´as cinco relaciones similares a (6.78) para las velocidades de los desplazamientos. Tomaremos como coordenadas generalizadas independientes vibracionales a d1x , d3x , d1y , d1z , y las llamaremos η1 , η2 , η3 y η4 : η1 = d1x , η2 = d3x , η3 = d1y , η4 = d1z
(6.79)
Los otros cinco desplazamientos pueden expresarse en t´erminos de los desplazamientos internos por medio de las relaciones (6.78). El espacio de configuraci´on del sistema completo es 9-dimensional. El subespacio correspondiente a las oscilaciones puras es 4-dimensional. El vector del espacio de configuraci´on que describe los movimientos de la mol´ecula en que el centro de masa permanece fijo y no hay rotaci´on de la misma es ~η . Tambi´en: η~T = (η1 , η2 , η3 , η4 )
(6.80)
184 / Mec´ anica cl´ asica avanzada Ahora debemos expresar el lagrangiano en funci´ on de ~η y ~η˙ . La energ´ıa cin´etica es: 2 1 1 ˙2 ˙2 ˙ T = m d~1 + d~3 + M d~2 2 2 (6.81) m2 2 1 ˙2 ˙ ~˙ ˙2 ˙ 2 2 2 ~ ~ ~ ˙ ˙ ˙ d1 + d3 + 2d1 · d3 m d1x + d3x + 2d1y + 2d1z + = 2 2M
Si usamos (6.78) y (6.79) para expresar todos los d~i en funci´ on de los η˙ ν , ν = 1, 2, 3, 4 obtenemos para T (~η˙ ): m2 1 2m m 2 T = m 1+ η˙ 1 + η˙ 22 + m 1 + η˙ 32 + η˙ 42 + η˙ 1 η˙ 2 (6.82) 2 M M M puede escribirse as´ı con notaci´ on matricial: 1 ˙T ˙ η m ~ ˜~ η 2 o usando la notaci´ on de producto escalar: T =
1 ˙ ˙ (~ η , ~η ) 2 donde m ˜ es la matriz sim´etrica no diagonal siguiente: m m2 m 1 + 0 0 M M m m2 0 0 m 1+ M M m ˜ = 2m 0 0 2m 1 + 0 M 2m 0 0 0 2m 1 + M
(6.83)
(6.84)
T =
(6.85)
En el c´ alculo de la energ´ıa potencial vamos a considerar un modelo m´as realista. Llamaremos k la constante de fuerza para los desplazamientos longitudinales relativos a la part´ıcula 2; k ′ la constante de fuerza para los desplazamientos longitudinales de la part´ıcula 1 relativos a la part´ıcula 3, y a K a la constante de fuerza para los desplazamientos transversales. La constante K no se puede expresar en funci´ on de k y k ′ mediante un modelo de resortes. La energ´ıa potencial de interacci´ on entre las part´ıculas para peque˜ nas oscilaciones es: 1 1 V = k (d1x − d2x )2 + (d3x − d2x )2 + k ′ (d1x − d3x )2 2 2 1 + K (d1y − d2y )2 + (d3y − d2y )2 2 +(d1z − d2z )2 + (d3z − d2z )2
(6.86)
Peque˜ nas oscilaciones de sistemas de varios grados de libertad / 185 Si usamos a (6.78) y (6.79) para expresar todos los d~i en funci´ on de los ην , ν = 1, 2, 3, 4 obtenemos para V (~ η ): 1 2m2 2m ′ V = k 1+ + k (η12 + η22 ) + 2 M2 M i 1h m m 4k 1+ − 2k ′ η1 η2 2 M M " 2 # 2m 1 (η32 + η42 ) + 2K 1 + 2 M +
(6.87)
En notaci´ on matricial V puede escribirse as´ı: V =
1 T˜ η k~η ~ 2
(6.88)
o usando la notaci´ on de producto escalar: V =
1 ˜η) (~ η, m ˜ −1 k~ 2
donde k˜ es la siguiente matriz sim´etrica no diagonal 4 × 4: 2m 2m2 m m ′ 2k (1+ )−k ′ 0 0 k(1+ M + M 2 )+k M M m 2m 2m2 m 2k (1+ )−k ′ k(1+ 0 0 + 2 )+k ′ M M M M ˜ k= 2m 2 0 0 2K(1+ ) 0 M 2m 2 0 0 0 2K(1+ ) M El lagrangiano ser´a: L=
1 1 ˙ ˙ ˜η) (~ η , ~η ) − (~ η, m ˜ −1 k~ 2 2
(6.89)
(6.90) (6.91)
La ecuaci´ on de movimiento para ~η es: m ˜~ η¨ + k˜~η¨ = 0
(6.92)
Buscamos soluciones propias de la forma: ηα = ~ ~ µα sen(ωα t + φα ); α = 1, 2, 3, 4
(6.93)
Al reemplazar (6.93) en (6.92) obtenemos: ˜ µα = ~0 (mω ˜ α2 − k)~
(6.94)
186 / Mec´ anica cl´ asica avanzada La ecuaci´ on (6.94) admite soluciones no triviales para los ~µα s´olo si las ωα son tales que satisfacen la ecuaci´ on secular: ˜ = 0; det(mω ˜ α2 − k)
α = 1, 2, 3, 4
(6.95)
Si usamos la siguiente notaci´ on (Classical mechanics, Corben-Stehle, cap´ıtulo 8): 2 2m m α = 2K 1 + ; α′ = 2m 1 + M M (6.96) m m2 2m β′ = + 2 2; β= M M M Podemos escribir: mω ˜ 2 − k˜ =
m(1+β ′ )ω 2 −k(1+β)−k ′ ′
2
mβ ω −kβ +k
′
mβ ′ ω 2 −kβ +k ′ ′
2
m(1 +β )ω −k(1+β)−k
′
0
0
0
0
0
0
α′ ω 2 − α
0
0
0
0
α′ ω 2 −α
˜: Usando la regla para el c´ alculo del determinante de una matriz M ˜ = detM
n X
Mij Cij
(6.97)
(6.98)
i=1
donde Cij es el determinante de la matriz de los cofactores del elemento Mij : Cij = (−1)i+j Dij
(6.99)
donde Dij es el determinante menor complementario del elemento, entonces la ecuaci´ on secular es: n 2 o 2 m(1 + β ′ )ω 2 − k(1 + β) − k ′ − mβ ′ ω 2 − kβ + k ′ (α′ ω 2 − α)2 = 0
(6.100)
Entonces el determinante consta de tres factores, dos de ellos lineales en ω 2 y uno cuadr´atico en ω 2 . Hay dos ra´ıces dobles que son: α 2m K ω32 = ω42 = ′ = 1+ (6.101) α m M Las otras dos ra´ıces son: ω12 =
k + 2k ′ k ; ω22 = m m
2m 1+ M
(6.102)
Peque˜ nas oscilaciones de sistemas de varios grados de libertad / 187 ω1 y ω2 coinciden con las halladas cuando consideramos las oscilaciones longitudinales por separado, cuando k ′ = 0. La ecuaci´ on de valores propios (6.94) es de la forma: 0 Aα Bα 0 0 µα1 Bα Aα 0 0 µα2 0 = (6.103) 0 µα3 0 0 C 0 α 0 µα4 0 0 0 Cα Los valores de las Aα , Bα y Cα son: 2m ′ m m A1 = 1+ k −k ; A2 = − k ′ − k M M M A3 =
m 2m 2m 2m2 K 1+ 1+ −k 1+ − k′ + M M M M2
C1 =
2m 2m ′ k + 2k − K 1 + 2 1+ M M
C2 =
2 2m 2 1+ (k − K) ; C3 = 0 M
B1 =
m m 2m ′ k −k ; B2 = −k ′ − k 1+ M M M
B3 =
K
m M
(6.104)
2m m m 1+ − 2k 1+ + k′ M M M
La ecuaci´ on (6.103) da lugar a los cuatro siguientes sistemas de ecuaciones algebraicas: Aα µα1 + Bα µα2 = 0 ; Bα µα1 + Aα µα2 = 0 (6.105) Cα µα3 = 0 ; Cα µα4 = 0 ; α = 1, 2, 3, 4 Las primeras ecuaciones (6.105), dado que Aα y Bα no son cero, son: Aα µα2 µα1 =− =− ⇒ µα1 = ±µα2 Bα µα1 µα2
(6.106)
Como se cumple que: A1 = B1 ; A2 = −B2 y A3 6= ±B3
(6.107)
Entonces µα2 y µα1 deben necesariamente tener las relaciones: µ11 = −µ12 ; µ21 = µ22 ; µ31 = µ41 = µ32 = µ42 = 0
(6.108)
188 / Mec´ anica cl´ asica avanzada Como C1 y C2 no son cero, en tanto que C3 es cero, se cumple: µ13 = µ23 = µ14 = µ24 = 0 (6.109) µ33 , µ43 , µ34 , µ44 : Arbitrarias Tenemos en este problema seis cantidades indeterminadas. O sea que aqu´ı no hay simplemente una indeterminaci´on por un factor arbitrario en los vectores ~µ3 y ~µ4 . Los vectores propios para este problema son de la forma siguiente: 1 1 1 −1 µ1 = µ11 ~ 0 ; ~µ2 = µ21 0 0 0
µ3 = µ33 ~
0 0 1 µ34 µ33
~ 4 = µ43 ; µ
0 0 1 µ44 µ43
(6.110)
Como en las ecuaciones (6.30), µ11 , µ21 , µ33 y µ43 pueden definirse por la condici´on de normalizaci´ on, sin embargo µ43 y µ44 quedan a´ un indeterminadas. Hay un n´ umero infinito de vectores propios normalizados correspondientes a la frecuencia propia degenerada ω3 = ω4 . La condici´on de normalizaci´ on es: ~ Tα m~ µ ˜ µα = 1 ; α = 1, 2, 3, 4
(6.111)
donde m ˜ es la matriz (6.85). Esto nos conduce a los siguientes valores para µ11 , µ21 , µ33 y µ43 : 1 ; µ11 = √ 2m
µα3
v u =u u t
1 2m 2m 1 + M
µ21 = s 1
− µ2α4 ; 2m 2m 1 + M
(6.112)
α = 3, 4
Debido a que µ34 y µ44 son arbitrarios, µ ~ 3 y ~µ4 son linealmente independientes. ~3 y µ µ ~ 4 generan entonces un espacio de dimensi´ on dos, siendo cualquier vector de este espacio un vector propio correspondiente al valor propio ω3 = ω4 . Podemos decir que a la frecuencia propia doblemente degenerada, ω3 = ω4 , le corresponde un conjunto infinito de vectores propios normalizados en un espacio bidimensional. Cualquier par de vectores linealmente independientes genera el espacio; por esto podemos sin perder generalidad escoger los vectores ~ µ3 y ~µ4 de modo que sean ortogonales entre s´ı, bajo el producto escalar (6.59): µ33 µ43 + µ34 µ44 = 0
(6.113)
Peque˜ nas oscilaciones de sistemas de varios grados de libertad / 189 Como definimos a µ33 y µ43 positivos en (6.113), entonces µ34 y µ44 deben tener signos opuestos; (6.112) y (6.113) conducen a: µ234 + µ244 =
1 2m 2m 1 + M
(6.114)
Todav´ıa los vectores no est´ an bien definidos pues a´ un hay infinitos pares de vectores ortonormales en el mencionado espacio bidimensional. ~µT3 y ~µT4 pueden escribirse en la forma: µ ~ T3
=
µ ~ T4
=
r
1
(0, 0, cos δ, senδ) 2m 2m(1 + ) M 1 r (0, 0, senδ, − cos δ) 2m 2m(1 + ) M
(6.115)
donde δ est´ a comprendido entre 0 y π/2 de acuerdo con la elecci´on del signo de µ33 y µ43 . Los vectores ~ µ3 y µ ~ 4 generan todas las posibles oscilaciones transversales con la frecuencia degenerada ω3 = ω4 . Los modos normales de oscilaci´on transversales son: η~3T = µ ~ T3 sen(ω3 t + φ3 ) → (0, 0, d1y , d1z )
(6.116)
η~4T = η~4T sen(ω3 t + φ4 ) Vemos que δ es esencialmente el ´angulo de los vectores de desplazamientos en el plano y − z donde las oscilaciones normales tienen diferencia de fase arbitraria. z
d1 (Modo µ3) δ y
δ d1 (Modo µ4)
Figura 6.5 Modos de oscilaci´on transversales en el espacio de configuraci´ on
190 / Mec´ anica cl´ asica avanzada Podemos tomar δ = 0, con lo cual ~µ3 corresponde a las oscilaciones en “y” y ~µ4 a las oscilaciones en “z”. Una oscilaci´on transversal general ser´a de la forma: ~η = C3 ~ η3 + C4 ~η4
(6.117)
Sin perder generalidad η~T puede escribirse en la forma: ~η T = C [0, 0, senγ sen(ω3 t + φ3 ), cos γ sen(ω3 t + φ4 )]
(6.118)
φ3 y φ4 son arbitrarias. Si tomamos φ3 = φ4 obtenemos oscilaciones longitudinales en una direcci´ on que hace un ´angulo γ con el eje z. Si tomamos φ3 = 0 y φ4 = π/2, el movimiento ser´a una circunferencia y en general ser´a una elipse, donde γ ser´a la direcci´ on del eje mayor de la elipse. Recordando las f´ormulas (6.78), d2y = −
2m 2m d1y ; d2z = − d1z M M
(6.119)
d3y = d1y ; d3z = d1z Vemos que el desplazamiento del ´atomo central es siempre contrario al de los laterales. En general, el ´atomo central gira en sentido contrario a los laterales, en una trayectoria el´ıptica, con una amplitud tal que el momento angular es cero. El movimiento transversal general es pues una rotaci´on de cada ´atomo. V´ease figuras 6.3 y 6.4. Si quisi´eramos describir las nueve coordenadas del sistema, deber´ıamos usar vectores 9dimensionales y matrices 9 × 9. As´ı por ejemplo, en vez de ~µ3 y µ ~ 4 tendr´ıamos, usando las f´ ormulas (6.78): ~eT3 =
~eT4
=
2m 1 (0, 1, 0; 0, − M , 0; 0, 1, 0) 2m 2m 1 + M
s
1
2m s (0, 0, 1; 0, 0, − M ; 0, 0, 1) 2m 2m 1 + M
(6.120)
En el tratamiento completo aparecer´ an adem´as los cinco vectores propios de frecuencia cero correspondientes a las tres traslaciones y las dos rotaciones. La degeneraci´on puede ser removida por ejemplo introduciendo alg´ un efecto que rompe la simetr´ıa de rotaci´on de la interacci´ on alrededor del eje de la mol´ecula (de la cual se deriv´o que K no depende de la direcci´ on del desplazamiento). Si existiera alg´ un efecto direccional (como una interacci´ on entre espines), ya no habr´ıa la simetr´ıa rotacional en la interacci´ on y desaparecer´ıa la degeneraci´on. Este tema es susceptible de un estudio m´as completo usando la teor´ıa de grupos de simetr´ıas. Los vectores propios constituyen representaciones del grupo de simetr´ıas. El subespacio generado por ~µ3 y µ ~ 4 es una representaci´on irreductible bidimensional del grupo de simetr´ıas (rotaciones alrededor del eje de la mol´ecula). En otros sistemas de osciladores acoplados las ligaduras pueden dar lugar a cambio de frecuencia y a supresi´ on
Peque˜ nas oscilaciones de sistemas de varios grados de libertad / 191 de la degeneraci´ on. Tratamiento usando el m´ etodo de diagonalizaci´ on. Buscaremos una matriz ˜ de acuerdo con las f´ormulas (6.66) y (6.68). que diagonalice simult´ aneamente a m ˜ y a k, Tanto m ˜ como k˜ son diagonales en bloques de matrices 2 × 2; es razonable suponer que ˜ A sea de la misma forma: D E 0 0 F G 0 0 A˜ = (6.121) 0 0 H K 0 0 L J ˜ Se requiere Llamaremos A, B y C a los elementos de la matriz m ˜ o de la matriz k. entonces que mediante el siguiente producto se obtenga una matriz diagonal, con unos en la diagonal si A, B y C son los elementos de m, ˜ y con las ω 2 si son los elementos de ˜ k: D F 0 0 A B 0 0 D E 0 0 F G 0 0 B A 0 0 E G 0 0 0 0 H K 0 0 C 0 0 0 H L 0 0 K J 0 0 0 C 0 0 L J (6.122) d e 0 0 f g 0 0 = 0 0 h l 0 0 k j
donde hemos llamado las variables d = A(E 2 +D2 )+2BDE, e = A(AD+EG)+B(DG+ EF ), f = A(F D + EG) + B(EF + GD), g = A(F 2 + G2 ) + 2BF G, h = C(H 2 + K 2 ), l = C(HL + JK), k = C(HL + JK) y j = C(J 2 + L2 ). Asumimos que los elementos de A˜ no dependen de las constantes k, k ′ y K entonces, como los elementos de la matriz k˜ son combinaciones de las constantes, A˜k˜A˜T ser´a diagonal s´olo si: DF + EG = 0 ; DG + EF = 0 ; HL + JK = 0
(6.123)
Esto implica las relaciones siguientes entre los elementos de A: G = F , D = −E
o
G = −F , D = E
(6.124)
192 / Mec´ anica cl´ asica avanzada ˜ Por Cuando A, B y C son los elementos de m, ˜ entonces (6.122) debe ser igual a I. tanto se cumple, usando las relaciones de la izquierda en (6.124), que: 2D2 A − 2BD2 = 1 ; 2F 2 A + 2F 2 B = 1
(6.125)
C(H 2 + K 2 ) = C(J 2 + L2 ) = 1 Recordando la expresi´on para A y B en m, ˜ ecuaci´ on (6.85), obtenemos para D y F: D=√
1 1 = −E ; F = s =G 2m 2m 2m 1 + M
(6.126)
En (6.126) por convenci´on tomamos las ra´ıces cuadradas positivas. Por otra parte, para H, K, L, J, obtenemos las relaciones: K = L , H = −J o K = −L , H = J
(6.127)
Como hay s´olo tres ecuaciones para determinar las cuatro inc´ ognitas H, K, J, L, podemos asignar el valor a una de ellas arbitrariamente. Sea que: cos δ π ; ≤δ≤ 2 2m 2m 1 + M
H=s
(6.128)
Con ello obtenemos las siguientes expresiones para J, K, L: sen δ =L 2m 2m 1 + M
J = −H ; K = s
Entonces la matriz A˜ tiene la siguente expresi´on expl´ıcita: r r 2m 2m 1+ 0 0 1+ M M 1 1 1 0 0 A˜ = r 2m ) 2m(1 + 0 0 cos δ senδ M 0 0 senδ cosδ
(6.129)
(6.130)
Vemos que las filas de A˜ coinciden con los vectores propios ~µα hallados anteriormente. Cuando tomamos como A, B y C los elementos de k˜ de la ecuaci´ on (6.96), encontramos: A(E 2 + D) + 2BDE = ω12 ; A(F 2 + G2 ) + 2BF G = ω22 (6.131) C(H 2 + K 2 ) = C(J 2 + L2 ) = ω32
Peque˜ nas oscilaciones de sistemas de varios grados de libertad / 193 donde ω12 , ω22 y ω32 est´ an dados en las ecuaciones (6.101) y (6.102). En este problema el procedimiento de diagonalizaci´on se simplific´o debido a la forma de m ˜ y k˜ que nos ˜ permiti´ o partir de la forma (6.121) para la matriz A. Para sistemas m´as complicados no es ˜ A pesar de esto, muchas veces la ecuaci´ tan simple la elecci´on de la forma de A. on secular resulta mucho m´as complicada, por requerir primero la evaluaci´on de un determinante y luego el c´ alculo de las ra´ıces de una ecuaci´ on algebraica de grado l. En estos casos, donde l es grande y m ˜ y k˜ complicadas, es m´as conveniente el m´etodo de la diagonalizaci´on, que se realiza usualmente en forma num´erica, por ejemplo mediante el m´etodo num´erico de diagonalizaci´on de Jacobi. Ejemplo 6.2.1 Una part´ıcula se mueve en presencia de un potencial central de la forma: V (r) = −
A
(6.132)
rn−1
suponiendo que la ´ orbita es circular, hallar los valores de n para los cuales hay peque˜ nas oscilaciones estables. Este es un ejemplo de peque˜ nas oscilaciones alrededor de un movimiento estable. Se entiende por estabilidad el hecho de tender al estado de equilibrio al ser sometido el sistema a una distorsi´ on. En fuerzas centrales la ´orbita es plana, con lo cual podemos describir la part´ıcula con las coordenadas polares r, θ. El lagrangiano es: L=
1 ˙ + A m(r˙ 2 + r2 θ) 2 rn−1
(6.133)
Las ecuaciones de movimiento de Lagrange son: m¨ r − mrθ˙2 + (n − 1)Ar−n =
0
mr2 θ¨ + 2mrr˙ θ˙ =
0
(6.134)
El movimiento de “equilibrio” es circular uniforme, o sea que son constantes: r = r0
y
θ˙ = ω0
(6.135)
Si se hacen peque˜ nas alteraciones a este movimiento estable, ρ al radio y φ˙ a la velocidad angular, habr´ a oscilaciones si el movimiento es estable, r = r0 + ρ
y
θ˙ = ω0 + φ˙
(6.136)
En el movimiento de equilibrio se cumple que: mr0 ω02 = (n − 1)Ar0−n
(6.137)
˙ Entonces las ecuaciones de movimiento para los peque˜ nos desplazamientos ρ y φ, al primer orden en los mismos, son: m¨ ρ − mω02 ρ − 2mr0 ω0 φ˙ − n(n − 1)Ar0−n−1 ρ = 0 mr02 φ¨ + 2mr0 ω0 ρ˙ = 0
(6.138)
194 / Mec´ anica cl´ asica avanzada ˙ Buscamos ahora los “modos normales estas son ecuaciones lineales acopladas para ρ y φ. ˙ de oscilaci´ on” de ρ y φ: ρ = ρ0 sen(ωt + α) ;
φ˙ = φ˙ 0 sen(ωt + α)
(6.139)
donde ω es la frecuencia propia del modo normal (esperamos que haya dos frecuencias), y α la fase, como en la ecuaci´ on (6.93). ρ0 y φ˙ 0 son las componentes de los vectores propios ~ µ, que satisfacen las ecuaciones algebraicas: −m(ω 2 + ω02 ) − n(n − 1)Ar0−n−1 −2mω0 ωr0 2mω0 ωr0 mr02 ω ρ0 0 = × (6.140) ˙ 0 φ0 El sistema (6.140) tiene soluciones no triviales s´olo si:
mωr02 [−m(ω 2 + ω02 ) − n(n − 1)Ar0−n−1 + 4mω02 ω] = 0
(6.141)
Las ra´ıces de (6.141) son: ω2 = 0
y
ω 2 = (3 − n)ω02
(6.142)
La segunda ra´ız si n < 3 conduce a una ω real, y si n > 3 es imaginaria. Si n=3 el movimiento es degenerado con dos ra´ıces ω = 0. El movimiento ser´a, pues, estable solamente si n < 3. Para una ´orbita de Kepler, por ejemplo n = 2. Entonces: ω02 = ω 2
(6.143)
ω0 es la frecuencia de rotaci´on de la part´ıcula. ω es la frecuencia de las oscilaciones en el radio de la ´ orbita y en la velocidad angular que coinciden con ω0 . Para un potencial central arm´onico, V = Ar2 , n = −1, entonces: ω = 2ω0
(6.144)
La frecuencia ω 2 = 0 corresponde a un desplazamiento de una ´orbita circular a otra, o sea, a otro movimiento estable; no hay oscilaciones sino simplemente un cambio constante en el radio de la ´orbita y en la velocidad angular. Hay una forma simple de calcular directamente la frecuencia de las peque˜ nas oscilaciones. La part´ıcula se mueve radialmente dentro un “pozo” que consta del potencial centr´ıfugo y el potencial externo: Vef (r) = −
A rn−1
1 A l2 + mr2 θ˙2 = − n−1 + 2 r 2mr2
(6.145)
En el movimiento estable el potencial tiene un m´ınimo. Para peque˜ nos desplazamientos del movimiento estable, el “pozo” de potencial puede aproximarse a un pozo
Peque˜ nas oscilaciones de sistemas de varios grados de libertad / 195 par´ abolico. El problema consiste en determinar para qu´e valores de n es posible la formaci´ on del potencial par´ abolico. Vef (r) puede expandirse alrededor de r0 para peque˜ nos desplazamientos: dVef (r) 1 d2 Vef (r) Vef (r) ≈ Vef (r0 ) + ρ2 = ρ + dr r=r0 2 dr2 r=r0 (6.146) 1 2 Vef (r0 ) + kρ 2 donde el t´ermino lineal en ρ se anula en el equilibrio y k es la “constante de resorte”: d2 Vef (r) (6.147) k= dr2 r=r0 La frecuencia de las peque˜ nas oscilaciones en r ser´a: 1 d2 Vef (r) ω2 = m dr2 r=r0
(6.148)
Efectuando las operaciones indicadas en (6.148), usando la relaci´on (6.137) que se cumple en la posici´on de equilibrio, y notando que la magnitud del momento angular es l = mω0 r02 , llegamos finalmente al resultado ω 2 = (3 − n)ω02 , que nos da directamente la frecuencia de las peque˜ nas oscilaciones alrededor de la ´orbita circular estable.
6.3.
Un campo mec´ anico unidimensional: la cuerda uniforme
Primero estudiaremos el sistema de n part´ıculas de masa m unidas entre s´ı por cuerdas el´ asticas sin masa. La cuerda uniforme se obtendr´ a del problema anterior como un caso l´ımite en que las masas se distribuyen uniformemente formando un continuo. La cuerda estirada sin masa con un conjunto discreto de masas. Sea una cuerda de longitud L a la cual se adhieren n masas iguales equidistantemente. La cuerda est´ a estirada y fija en sus extremos. Estudiaremos las oscilaciones transversales. La longitud de cada segmento de cuerda en la posici´on de equilibrio es d = xi − xi−1 ; i = 1, 2, ...n + 1. Entonces L = (n + 1)d. Para los desplazamientos longitudinales, la energ´ıa potencial resulta de la elasticidad de la cuerda k. Para los desplazamientos transversales, la contribuci´on de la elasticidad de la cuerda es de cuarto orden en la elongaci´ on, la demostraci´on se propone como un ejercicio; as´ı que la contribuci´on cuadr´atica viene directamente de la tensi´ on de la cuerda τ . La tensi´ on es independiente de los desplazamientos transversales si estos son infinitesimales. El trabajo realizado para estirar un segmento es igual a la tensi´ on (constante) por la elongaci´ on. De modo que la energ´ıa potencial del segmento i cuando la part´ıcula i − 1 se desplaza transversalmente ηi−1 , y la part´ıcula i en ηi , es: i hp d2 + (ηi − ηi−1 )2 − d (6.149) Vi = τ
196 / Mec´ anica cl´ asica avanzada
η1
η2
x1 x0 = 0
x2
ηi – 1 xi – 1
ηi xi
ηi + 1 xi + 1
ηi + 1 xi + 2
d
ηn – 1 xn – 1
ηn xn
x xn – 1 = L
Figura 6.6 Cuerda estirada sin masa con un conjunto discreto de masas
de modo que para peque˜ nos desplazamientos la energ´ıa potencial total es: V =
n+1 1τ X (ηi − ηi−1 )2 2d
(6.150)
i=1
El espacio de configuraci´on es n-dimensional y las matrices m ˜ y k˜ son de dimensi´ on n × n. En notaci´ on matricial: 1 V = ~η T k~η (6.151) 2 donde ~ η T = (η1 , η2 , ...ηn ) y la matriz k˜ es: 2 −1 0 0 ··· 0 0 −1 2 −1 0 · · · 0 0 0 −1 2 −1 · · · 0 0 τ 0 −1 2 · · · 0 0 (6.152) k˜ = 0 d .. .. .. .. .. .. .. . . . . . . . 0 0 0 0 · · · 2 −1 0 0 0 0 · · · −1 2 La energ´ıa potencial es: T T = ~η˙ m ˜ ~η˙
(6.153)
donde la matriz m ˜ es un m´ ultiplo de la matriz unidad: m ˜ = mI˜
(6.154)
La ecuaci´ on de valores propios es: ˜ µα = ~0; α = 1, 2, ...n (−ωα2 m ˜ + k)~
(6.155)
Peque˜ nas oscilaciones de sistemas de varios grados de libertad / 197 Expl´ıcitamente las ecuaciones de valores propios son: τ τ τ − µαi−1 + 2 − mωα2 µαi − µαi+1 = 0; i = 1, 2, ...n d d d
(6.156)
En (6.156) se debe cumplir µα0 = µα n+1 = 0. La matriz n × n en (6.155) es:
τ 2 ˜ −mω ˜ α+k = d
λ
−1
0
0
···
−1
λ
−1
0
···
0
−1
λ
0
0
−1
λ
···
.. .
.. .
.. .
.. .
.. .
0
0
0
0
···
0
0
0
0
···
−1 · · ·
donde λ depende de ωα : λ = 2 − mωα2
0
0
0 0 0 0 0 ˜τ =D d .. .. . . λ −1 −1 λ 0
d τ
(6.157)
(6.158)
˜ que es un polinomio de grado n Llamemos Dn al determinante de la matriz D, en λ. Haciendo tomar a n los valores 1, 2, 3, ..., obtenemos la siguiente secuencia de polinomios: D1 =
λ
D2 =
λ2 − 1
D3 =
λ3 − 2λ = λD2 − D1
D4 =
λ4 − 3λ2 + 1 = λD3 − D2
D5 =
λ5 − 4λ3 + 3λ = λD4 − D3
D6 = .. .
λ6 − 5λ4 + 6λ2 − 1 = λD5 − D4 .. .
(6.159)
Notamos la siguiente relaci´ on de recurrencia entre los polinomios: Dk = λDk−1 − Dk−2 ;
k = 1, 2, ...n
(6.160)
198 / Mec´ anica cl´ asica avanzada Los coeficientes de las potencias de λ pueden escribirse en t´erminos de los n´ umeros combinatorios. As´ı por ejemplo: 9 8 7 D9 = λ9 − λ7 + λ5 9 7 5 − D10 =
−
6 3
10 10
7 4
λ3 + 10
λ
4
−
λ +
5 1 9 8 6 2
λ 8
λ +
2
λ −
8 6 5 0
(6.161) 6
λ
De (6.161) se puede obtener f´acilmente una generalizaci´ on. Las f´ormulas resultantes se demuestran f´ acilmente por el m´etodo matem´atico de inducci´on, n n/2 +k X 2 k+1 2k Dn = (−1) λ si n es par k=0 2k (6.162) n + 1 (n−1)/2 +k X 2 k 2k+1 Dn = si n es impar (−1) λ k=0
2k + 1
Es conveniente el siguiente cambio de variable: λ = 2 cos β
(6.163)
En t´erminos de β obtenemos la secuencia siguiente de los Dk : D1 =
2 cos β
D2 =
2 cos 2β + 1
D3 =
2(cos 3β + cos β)
D4 =
2(cos 4β + cos 2β) + 1
D5 =
2(cos β + cos 3β + cos 5β)
D6 =
2(cos 6β + cos 4β + cos 2β) + 1
(6.164)
Se pasa de (6.159) a (6.164) usando identidades trigonom´etricas (f´ ormulas 5.53 a 5.67 del manual de f´ ormulas matem´aticas de Spiegel). La generalizaci´ on de (6.164) es
Peque˜ nas oscilaciones de sistemas de varios grados de libertad / 199 simple; el resultado es: Dn =
2
n/2 X
cos 2kβ + 1 ;
si n es par
k=1
(6.165)
(n−1)/2
Dn =
2
X
cos(2k + 1)β ;
si n es impar
k=0
Las f´ ormulas (6.165) se pueden simplificar usando cos 2kβ =
(ei2β )k + (e−i2β )k 2
(6.166)
y similarmente para (2n + 1)β. Notamos luego que se obtienen series geom´etricas de potencias. La expresi´on para la suma cerrada de una serie geom´etrica es conocida. En este caso la raz´ on de la serie es e±2β : 1 + ei2β + (ei2β )2 + ...(ei2β )r =
1 − (ei2β )r+1 1 − ei2β
(6.167)
que vale si ei2β 6= 1. As´ı, si n es par: Dn = 2Re
1 − (ei2β )(n/2+1) −1 1 − ei2β
(6.168)
El resto es un c´ alculo trigonom´etrico. Para n impar el procedimiento es similar. El resultado final es que, para todo n: Dn =
sen(n + 1)β ; senβ
n par o impar
(6.169)
Se sigue entonces que la ecuaci´ on secular correspondiente a (6.156) es: sen(n + 1)βα = 0; α = 1, 2, ...n
(6.170)
Esta ecuaci´ on tiene n ra´ıces, (n + 1)βα = απ, o sea: βα = α
π ; α = 1, 2, ...n n+1
(6.171)
Entonces los λ ser´an, usando (6.163): λα = 2 cos
απ ; α = 1, 2, ...n n+1
(6.172)
Recordando la relaci´ on entre las λα y las ωα , ecuaci´ on (6.158), obtenemos para las frecuencias propias: r απ τ ωα = 2 sen ; α = 1, 2, ...n (6.173) md 2(n + 1)
200 / Mec´ anica cl´ asica avanzada Para hallar los λα −1 −1 λα 0 −1 0 0 .. .. . . 0 0 0 0
vectores propios, reemplazamos a (6.157) en (6.155): 0 0 ··· 0 0 µα1 0 µα2 0 −1 0 · · · 0 0 λα −1 · · · 0 0 µα3 0 −1 λα · · · 0 0 = .. .. .. .. .. .. .. . . . . . . . 0 0 · · · λα −1 µαn−1 0 0 0 · · · −1 λα µαn 0
(6.174)
La ecuaci´ on (6.174) representa el siguiente sistema de ecuaciones lineales: µα2 µα3 µα4 µα5
= = = = .. .
µαk =
λα µα1 (λ2α − 1)µα1 (λ3α − 2λα )µα1 (λ4α − 3λ2α + 1)µα1 (6.175) Dk−1 (λα )µα1
.. .
senkβα µα1 = senβα
α, k = 1, 2, ...n La u ´ltima l´ınea de (6.175) tambi´en puede obtenerse comparando a (6.160) con la relaci´ on de recurrencia para los µαk , (6.156): µα,k+1 = λα µα,k − µα,k−1 ; α, k = 1, 2, ...n
(6.176)
Entonces los vectores propios son: ~ Tα = µ
µα1 (senβα , sen2βα , ...sennβα ); α = 1, 2, ...n senβα
(6.177)
µα1 es una constante que se determina por normalizaci´ on: (~ µα , ~ µα ) = m~µTα · ~µα = m
n µ2α1 X sen2 kβα = 1 sen2 βα
(6.178)
k=1
La sumatoria en (6.178) se puede tratar como una serie geom´etrica: n X
n
sen2 kβα =
1X (1 − cos 2kβα ) 2 k=0
k=1
n
=
n + 1 1 X i2βα k ) − Re (e 2 2 k=1
=
n + 1 sen(n + 1) βα cos 2nβα − 2 2senβα
(6.179)
Peque˜ nas oscilaciones de sistemas de varios grados de libertad / 201 como, seg´ un (6.170), sen(n + 1)βα = 0, se sigue que: µ2α1 =
2 sen2 βα (n + 1)m
(6.180)
llamando M a la masa total, M = nm, (6.180) y (6.175) nos dan: r 2 αk π µαk = sen = µkα ; α, k = 1, 2, ...n M +m n+1
(6.181)
Como debe ser, las ~ µα son ortogonales pues todas las frecuencias propias ωα son no degeneradas: n
(~ µα , ~ µα ) = m~µα · µ ~β =
2 X senkβα senkββ = δαβ n+1
(6.182)
k=1
Las coordenadas normales para este problema son: r τ απ θα = Cα sen 2 sen t + φα ; α = 1, 2, ...n md 2(n + 1) ˜ on p La matriz A que realiza la transformaci´ 2/(M + m) sen[αβπ/(n + 1)]: 2π π sen n + 1 sen n + 1 4π sen 2π sen r n+1 n+1 2 A˜ = M +m .. .. . . nπ 2nπ sen sen n+1 n+1
(6.183)
de ~η a ~θ, η~ = A˜θ~ es sim´etrica, Aαβ = nπ n+1 2nπ · · · sen n+1 .. .. . . 2 n π · · · sen n+1 · · · sen
(6.184)
Una oscilaci´ on arbitraria del sistema est´ a descrita por una superposici´on de las oscilaciones propias: r τ αiπ απ ηi (t) = Cα sen sen 2t sen + φα n+1 md 2(n + 1) α=1 n X
(6.185)
En los modos normales de oscilaci´on todas las part´ıculas est´ an sobre una curva sinusoidal cuya longitud de onda depende del orden del modo, o sea de la frecuencia ωα . Es una soluci´on del tipo “onda estacionaria”, determinada por las condiciones de frontera µα0 = µαn+1 . Corben y Stehle obtienen a partir de esta soluci´on la soluci´on para una onda viajera, imponiendo las condiciones de frontera peri´odicas, µα0 = µαn y µα1 = µαn+1 .
202 / Mec´ anica cl´ asica avanzada La cuerda uniforme. Lagrange demostr´ o que mediante un procedimiento de paso al l´ımite las oscilaciones de la cuerda uniforme pueden obtenerse a partir de las de la cuerda cargada. La densidad lineal de masa ρ es: M nm n m ρ= = = (6.186) L L n+1 d en (6.173) puede obtenerse en el l´ımite en que n → ∞, m → 0, d → 0 manteniendo m/d constante: m (6.187) l´ım ρ = n→∞ d Entonces el l´ımite de ωα cuando n → ∞ es: r απ τ (n + 1)n sen ωα = 2 ρ L2 2(n + 1) (6.188) r r 2 τ απ π τ → =α ; α = 1, 2, ...∞ L ρ 2 L ρ p Esto expresa la Ley de Mersenne. ω1 = (π/L) τ /ρ es la frecuencia del tono fundamental de una cuerda y ωα es el arm´onico de orden α. Cuando n → ∞, el n´ umero de modos normales de oscilaci´on es infinito aunque es contable. En cambio el ´ındice que numera las part´ıculas se convierte en una variable continua: x → kd ;
k = 0, 1, 2, ...∞ ;
d→0
(6.189)
x es una variable que define la posici´on de la part´ıcula k. Entonces la f´ormula (6.181) se convierte en: r πx 2 µα,k → µα (x) = ; α = 1, 2, ...∞ (6.190) sen α M L Una oscilaci´ on general de la cuerda estar´ a dada por: r ∞ X απx απ τ η(x, t) = Cα sen (6.191) sen t + φα L L ρ α=1
donde Cα y φα es un conjunto contable infinito de constantes arbitrarias. A˜ ya no ser´a una matriz, pues si bien las filas siguen siendo contables, las columnas forman un continuo. Las f´ ormulas de transformaci´ on entre las coordenadas ~η y las coordenadas ~θ son: ∞ X η(x, t) = µα (x)θα (t) (6.192) α=1
En vez de la matriz m ˜ con elementos mij = mδij debemos tener una funci´ on delta de Dirac, de modo que A˜m ˜ A˜T = I˜ se convierte en: Z L Z L Z L ρ dx dy µα (x)δ(x − y)µβ (y) = ρµα (x)µβ (x)dx = 0
0
0
2 L
Z
o
L
βπx απx sen = δαβ dx sen L L
(6.193)
Peque˜ nas oscilaciones de sistemas de varios grados de libertad / 203 ˜ debemos tener: En vez de los elementos de m ˜ y k, m(x, x′ ) = k(x, x′ ) = =
ρδ(x − x′ ) τ [2δ(x − x′ ) − δ(x − x′ − d) − δ(x − x′ + d)] d2 d2 −τ 2 δ(x − x′ ) dx
(6.194)
A˜k˜A˜T = ω ˜ se convierte en: Z L Z L τ dx dx′ µα (x) 2δ(x − x′ ) − δ(x − x′ + d)− 2 d 0 0 δ(x − x′ − d) µβ (x) τ = 2 d
(
τ d2
(
=
2 τ = ρ d2
1 2 δαβ − ρ
Z
)
L
µα (x) [µβ (x − d) + µβ (x + d)] dx
0
2 2 δαβ − ρ M
Z
0
L
sen
(6.195)
)
βπx βπd απx 2sen cos dx L L L
4τ πβd βπd δαβ = 2 sen2 1 − cos δαβ L ρd 2L
Entonces, los elementos diagonales de A˜k˜A˜T son, tomando d → 0: ωβ2 = β 2
π2 τ L2 ρ
(6.196)
como debe ser. En vez de las ecuaciones algebraicas (6.156) tendremos ahora una ecuaci´on diferencial. En efecto, (6.156) se convierte en: τ τ 2τ − µα (x − d) + − ρdωα2 µα (x) − µα (x + d) = 0 (6.197) d d d Podemos escribir a (6.197) en la forma: τ τ [µα (x) − µα (x − d)] − [µα (x + d) − µα (x)] = ρdωα2 µα (x) d d
(6.198)
En el l´ımite cuando d → 0, en el lado izquierdo obtenemos: −τ [µ′α (x) − µ′α (x + d)] = ρ dωα2 µα (x)
(6.199)
Tomando una vez m´as el l´ımite cuando d tiende a cero obtenemos: d2 µα (x) ρ 2 + ωα µα (x) = 0; α = 1, 2, ...∞ dx2 τ
(6.200)
204 / Mec´ anica cl´ asica avanzada Reemplazando a (6.196) en (6.200) vemos que efectivamente (6.190) es la soluci´on de (6.200). De (6.188) podemos obtener la ecuaci´ on diferencial que obedece la amplitud dependiente del tiempo. En efecto: r ∞ απ 2 X ∂2η απx απ τ sen = − Cα sen t + φα ∂x2 L L L ρ α=1 (6.201) r ∞ απ 2 τ X ∂2η απx απ τ = − C sen sen t + φα ∂t2 L ρ L L ρ α=1 De donde: ρ ∂2η ∂2η − =0 2 ∂x τ ∂t2
(6.202)
Esta ecuaci´ on se obtiene tambi´en directamente de (6.15) y (6.195). Es la ecuaci´ on de onda en una dimensi´ on. Hemos llegado a la teor´ıa de las ondas mec´anicas. No seguiremos con el tema, que nos aleja del prop´ osito del presente cap´ıtulo.
7 Cinem´ atica del cuerpo r´ıgido
7.1.
Definici´ on de cuerpo r´ıgido
Es un sistema de part´ıculas sometidas a las siguientes ligaduras hol´ onomas: |~ri − ~rj | = lij = Constante; i, j = 1, 2, ...N
(7.1)
El n´ umero de relaciones de este tipo es:
N 2
=
1 N (N − 1) 2
(7.2)
Para N > 7 el n´ umero de ligaduras excede el n´ umero de coordenadas 3N . En realidad, para N ≥ 4 el n´ umero de ligaduras independientes es menor que el n´ umero dado por (7.2). Sea un cuerpo r´ıgido formado por m´as de tres part´ıculas no colineales. Dados tres puntos no colineales del cuerpo r´ıgido, las ligaduras fijan las posiciones de todos los dem´ as puntos, pues para ubicar un punto en el espacio bastan s´olo las distancias a tres puntos no colineales (v´ease figura 7.1). Luego, para especificar los grados de libertad de un cuerpo r´ıgido, basta determinar el n´ umero de coordenadas independientes necesarias para ubicar la posici´on de tres puntos del cuerpo r´ıgido. Como entre los tres puntos dados, no colineales, hay tres condiciones de ligadura, r12 = l12 , r23 = l23 , r13 = l13 , se necesitan 9 − 3 = 6 coordenadas independientes para especificar la posici´on de tres puntos no colineales del cuerpo r´ıgido. En consecuencia el n´ umero de grados de libertad de un cuerpo r´ıgido es seis. Otra manera de hallar lo anterior es la siguiente. Para especificar la posici´on del punto 1 se requieren tres coordenadas. Para especificar la posici´on del punto 2, dado el punto 1 y la distancia r12 se requieren dos coordenadas. Para especificar la posici´on del punto 3, dados los puntos 1 y 2 y las distancias r23 y r13 , se requiere s´olo una coordenada. O sea que en total se requieren seis coordenadas para ubicar los tres puntos.
205
206 / Mec´ anica cl´ asica avanzada
i
2
l12 1
l23 l13
3
Figura 7.1 Posici´ on de un punto respecto de tres puntos no colineales del cuerpo r´ıgido
7.2.
Sistemas de coordenadas espacial y del cuerpo r´ıgido
Para especificar la posici´on de un cuerpo r´ıgido es suficiente: (a) Especificar la posici´on en el espacio de un punto cualquiera del cuerpo, para ello se requieren tres coordenadas; (b) Especificar la orientaci´on del cuerpo respecto a unas coordenadas fijas en el punto mencionado, para ello se requieren tres coordenadas dado que seis es el n´ umero total de grados de libertad. El sistema de coordenadas η, ξ, ζ, est´ a fijado al cuerpo r´ıgido (v´ease figura 7.2). El sistema de coordenadas x′ , y ′ , z ′ , se obtiene del sistema x, y, z, s´olo por translaci´ on al origen de coordenadas fijado al cuerpo r´ıgido. z′ ζ z
r′
r
y′
a η y x′
ξ
x
Figura 7.2 Sistemas de coordenadas espacial y del cuerpo r´ıgido
Cinem´atica del cuerpo r´ıgido / 207 Para una part´ıcula del cuerpo r´ıgido se tiene: ~r = ~r′ + ~a
(7.3)
En el sistema de coordenadas del cuerpo r´ıgido la part´ıcula tiene coordenadas η, ξ, ζ y en el sistema de coordenadas trasladado tiene coordenadas x′ , y ′ , z ′ . Estas coordenadas difieren por una rotaci´on, o sea que est´ an relacionadas entre s´ı mediante una transformaci´ on lineal: ′ x η ξ = A˜ y ′ (7.4) z′ ζ donde A˜ es la matriz de la transformaci´ on. Llamemos las coordenadas as´ı: x1 = x x′1 = x′ x1 = η a1 = ax x2 = y
x′2 = y ′
x2 = ξ
a2 = ay
x3 = z
x′3 = z ′
x3 = ζ
a3 = az
(7.5)
Con lo cual podemos describir: xi =
x′i
+ ai ;
xi =
3 X
aij x′j ;
i = 1, 2, 3
(7.6)
j=1
˜ La transformaci´ donde aij son los elementos de la matriz A. on de las coordenadas espaciales (x) a las coordenadas del cuerpo r´ıgido (x) son: xi =
3 X
a−1 ij xj + ai
i = 1, 2, 3
(7.7)
j=1
−1 donde a−1 ˜−1 . Obviamente aij no es l/aij ·. a−1 ij son los elementos de la matriz inversa a ij son un conjunto de nueve n´ umeros que especifican la direcci´ on de los ejes de coordenadas fijos al cuerpo respecto a los ejes de coordenadas situados en el mismo punto de los anteriores pero no rotados respecto a los espaciales. Como la descripci´ on del movimiento translacional del cuerpo r´ıgido es posible usando los m´etodos de la cinem´ atica de part´ıculas, podemos sin perder generalidad hacer coincidir los sistemas de coordenadas (x) y (x′ ). Nos interesaremos pues, en la relaci´on entre las coordenadas (x) y (x). La longitud del vector ~r es la misma en los dos sistemas de coordenadas con origen com´ un: r2 = r 2 . Por tanto: ! 3 3 3 3 X X X X −1 −1 2 aij xj a xk xi xi = r = ik
i=1
i=1
j=1
3 X
3 X 3 X
k=1
(7.8)
r2 =
i=1
xi xi =
j=1 k=1
δjk xj xk
208 / Mec´ anica cl´ asica avanzada Igualando las ecuaciones (7.8) obtenemos: ! 3 X 3 3 X 3 3 X X X −1 −1 δjk xj xk = aij aik xj xk j=1 k=1
j=1 k=1
(7.9)
i=1
Como las x son independientes por definici´on, se sigue que: 3 X
−1 a−1 ij aik = δjk
(7.10)
i=1
En t´erminos de los elementos (A˜−1 T )lm de la matriz traspuesta de la matriz A˜−1 , que se obtiene por intercambio de filas y columnas, podemos escribir (7.10) como: 3 X
˜ jk (A˜−1 T )ij (A˜−1 )ik = (I)
(7.11)
i=1
donde I˜ es la matriz identidad 3 × 3. En forma de matriz (7.11) es: A˜−1 T A˜−1 = I˜ ⇒ A˜−1 = A˜T
(7.12)
donde hemos usado el hecho de que: A˜−1 A˜ = I˜ y (A˜−1 T )T = A˜−1 . Llegamos a la conclusi´ on que: A˜−1 = A˜T . Una matriz para la cual su inversa coincide con su transpuesta se llama ortogonal. La matriz de rotaci´on A˜ contiene nueve par´ ametros, pero entre ellos hay las relaciones: 3 X i=1
aji aTik = δjk ⇒
3 X
aji aki = δjk
(7.13)
i=1
Tres relaciones se obtienen cuando j = k: 3 X
(aji )2 = 1;
j = 1, 2, 3
(7.14)
i=1
Hay seis relaciones cuando j 6= k: 3 X i=1
aji aki = 0 j 6= k;
j, k = 1, 2, 3
(7.15)
Pero de (7.15) tambi´en se sigue que: 3 X i=1
aki aji = 0 j 6= k;
j, k = 1, 2, 3
(7.16)
O sea que s´olo hay tres relaciones independientes para j 6= k. En total hay seis ˜ Como era de esperarse, A˜ contiene s´olo relaciones entre los elementos de la matriz A. tres par´ ametros independientes.
Cinem´atica del cuerpo r´ıgido / 209 x2
x2
r,r x1 θ θ φ
x1
Figura 7.3 Rotaci´on de los ejes (x) alrededor del eje x3 = x3 .
Ejemplo 7.2.1 Supongamos que los ejes (x) y (x) difieren simplemente por una rotaci´on por un ´ angulo φ alrededor del eje x3 = x3 (v´ease figura 7.3). Encontrar las f´ormulas de transformaci´ on. Las f´ ormulas de transformaci´ on se obtienen f´acilmente de la figura 7.3, que representa el plano x1 − x2 : x=
r cos θ
x=
r senθ
(7.17) donde hemos usado que r = r. Como θ = θ − φ podemos escribir: cos θ =
cos θ cos φ + senθ senφ (7.18)
senθ =
senθ cos φ − cos θ senφ
Teniendo en cuenta que: x1 = r cos θ ; x2 = r senθ
(7.19)
Se sigue inmediatamente que las f´ormulas de transformaci´ on son: x1 = x1 cos φ + x2 senφ x2 = −x1 senφ + x2 cos φ x3 = x3
(7.20)
210 / Mec´ anica cl´ asica avanzada O en forma de matriz: cos θ senφ x1 x2 = −senφ cos φ x3 0 0
0
x1
0 x2 x3 1
(7.21)
Esta matriz satisface id´enticamente las relaciones de ortogonalidad (7.13). Para j = k: j=
primera fila ,
cos2 φ + sen2 φ + 02 =
1
j=
segunda fila , sen2 φ + cos2 φ + 02 =
1
j=
tercera fila ,
02 + 02 + 12 =
1
(7.22)
satisface tambi´en las relaciones para j 6= k (ortogonalidad de las filas entre s´ı o de las columnas entre s´ı): j = 1, k = 2 ( 1a y 2a filas) : − cos φ senφ + senφ cosφ + 0 = 0 j = 1, k = 3 ( 1a y 3a filas) :
0
+0
+0 =0
j = 1, k = 2 ( 2a y 3a filas) :
0
+0
+0 =0
(7.23)
y similarmente para la ortogonalidad entre columnas. En general, las relaciones (7.13) pueden expresarse en la siguiente manera. Para una matriz ortogonal A˜ se cumple que el producto escalar de una fila por s´ı misma, o de una columna por s´ı misma, es igual a la unidad. Dos filas diferentes o dos columnas diferentes son ortogonales entre s´ı. No es cierto sin embargo que una fila sea ortogonal a una columna. Es claro en el ejemplo anterior que A˜−1 = A˜T .
7.3.
Los cosenos directores
Sean dos sistemas de ejes cartesianos con origen com´ un (x) y (x). Los ejes (x) est´ an rotados respecto a los ejes (x). Sean ~e1 , ~e2 y ~e3 tres vectores unitarios a lo largo de los ejes x1 , x2 y x3 respectivamente. Sean ~e′1 , ~e′2 y ~e′3 los tres vectores unitarios a lo largo de los ejes x1 , x2 y x3 respectivamente. Se definen los cosenos directores de los ejes (x) respecto a los ejes (x) como los cosenos de los ´angulos que hacen cada uno de los ejes (x) con cada uno de los ejes (x). Los denotaremos αij . De su definici´on se sigue que: αij = ~e′i · ~ej ;
i, j = 1, 2, 3
(7.24)
Es claro que αij es el coseno del ´angulo entre el eje xi y el eje xj . En total hay nueve cosenos directores, que no son independientes. Es claro que la transformaci´ on de los vectores ~ei a los vectores ~e′i es: ~e′i =
3 X j=1
αij ~ej =
3 X j=1
(~e′i · ~ej )~ej
(7.25)
Cinem´atica del cuerpo r´ıgido / 211 en efecto: ~e′i · ~ek =
3 X j=1
(~e′i · ~ej )(~ej · ~ek ) =
3 X j=1
(~e′i · ~ej )δjk = ~e′i · ~ek
(7.26)
Un vector cualquiera V~ puede expresarse de dos maneras equivalentes: 3 X
V~ =
Vi~ei =
3 X
Vi′~e′i
(7.27)
i=1
i=1
Multiplicando escalarmente (7.27) a ambos lados por ~e′k : 3 X i=1
3 X
Vi~ek · ~ei =
i=1
Vi′~e′k · ~e′i = Vk′
(7.28)
~ se transforman de la siguiente manera: Por tanto se tiene que las componentes de V Vk′ =
3 X
αkj Vj
(7.29)
j=1
En tanto que: ~e′k
=
3 X
αkj ~ej
(7.30)
j=1
Es decir, las componentes de los vectores se transforman de la misma manera que los vectores unitarios. Notamos que las componentes Vi y Vi′ de V~ se pueden escribir como: Vi = ~ei · V~ ;
Vi′ = ~e′i · V~
(7.31)
De acuerdo con (7.29): ~ = Vi′ = ~e′i · V
3 X j=1
(~e′i · ~ej )(~ej · V~ )
(7.32)
~ como ~e′ , seg´ Tomando V un (7.32): i 1=
3 X j=1
(~e′i · ~ej ) →
3 X
α2kj = 1 ;
i = 1, 2, 3
(7.33)
j=1
~ como ~e′ con k 6= i, seg´ un (7.32): Tomando V k 0=
3 X j=1
(~ei · ~ej )(~ej · ~e′k ) →
3 X j=1
αij αkj = 0 ;
i, k = 1, 2, 3
(7.34)
212 / Mec´ anica cl´ asica avanzada Vemos que la f´ ormula de transformaci´ on de los vectores ~e′i a los vectores ~ei es: ~ei =
3 X
αij ~e′j =
j=1
puesto que:
~ei · ~e′k =
3 X j=1
3 X j=1
(~e′j · ~ei )~e′j
(~e′j · ~ei )δjk = (~e′k · ~ei )
(7.35)
(7.36)
Esto nos dice que la matriz traspuesta de (αij ) produce la rotaci´on de los ejes (x) a los ejes (x). Las componentes de un vector se transforman seg´ un: Vk =
3 X
αjk Vj′ =
3 X
αTkj Vj′
(7.37)
j=1
j=1
Las relaciones (7.33) y (7.34) entre los cosenos directores pueden escribirse como: 3 X
αij αkj =
j=1
3 X
αij αTjk = δik
(7.38)
j=1
En s´ıntesis, vemos que la matriz de los (αij ) es ortogonal y cumple todas las propie˜ Los cosenos directores son los elementos de la matriz A. ˜ dades de la matriz de rotaci´on A. D´ıadas y di´ adicos. Se define un di´adico como una entidad algebraica que se representa por una matriz 3 × 3, de la misma manera que un vector es una entidad algebraica que se representa por una matriz columna 3 × 1. De acuerdo con (7.27) un vector unitario se puede expresar como: ~e1 =
1 · ~e1 + 0 · ~e2 + 0 · ~e3
~e2 =
0 · ~e1 + 1 · ~e2 + 0 · ~e3
~e3 =
0 · ~e1 + 0 · ~e2 + 1 · ~e3
(7.39)
Entonces los vectores unitarios se pueden representar por las tres matrices columna siguientes: 0 0 1 (7.40) ~e1 → 0 ; ~e2 → 1 ; ~e3 → 0 1 0 0 ~ se puede representar mediante una matriz columna: Un vector arbitrario V 0 0 1 V1 ~ → V2 = V1 0 + V2 1 V3 0 (7.41) V 1 0 V3 0
Cinem´atica del cuerpo r´ıgido / 213 An´alogamente podemos suponer que una matriz 3 × 3 es la representaci´on de cierta entidad que llamaremos di´adico. Una d´ıada unitaria es el an´alogo de un vector unitario y un di´adico es el an´alogo de un vector cualquiera. Definimos la d´ıada unitaria como una entidad algebraica ~ei~ej que se puede representar por una matriz 3 × 3 que tiene un 1 en la fila i columna j, y cero en todos los otros lugares. Podemos formar nueve d´ıadas unitarias. As´ı por ejemplo: 1 0 0 0 0 0 ~e1~e1 → 0 0 0 ~e2~e3 → 0 0 1 (7.42) 0 0 0 0 0 0 Notamos que ~ei~ej se puede representar por el producto de una matriz columna por una matriz fila: 1 0 0 1 (1 0 0) = 0 0 0 0 ~e1~e1 → 0 0 0 0 (7.43) 0 0 0 0 (0 0 1) = 0 0 1 1 ~e2~e3 → 0 0 0 0
~B ~ como un poliEs de notarse que en general ~ei~ej 6= ~ej ~ei . Definimos una d´ıada A nomio de d´ıadas unitarias as´ı: 3 X 3 X ~B ~ = Ai Bj ~ei~ej A i=1 j=1
(7.44)
~A ~= B
3 X 3 X
Bi Aj ~ei~ej
i=1 j=1
Un di´adico en general es un polinomio de d´ıadas unitarias, pero no necesariamente ~ B: ~ de la forma A 3 3 X X ~~ Dij ~ei~ej (7.45) D = i=1 j=1
~~ Es claro que la representaci´on de D es: D11 D12 D13 ~~ D → D21 D22 D23 D31 D32 D33
(7.46)
214 / Mec´ anica cl´ asica avanzada As´ı como el producto de un vector fila por una matriz da un vector fila y el producto de una matriz por un vector columna da un vector columna, definimos por analog´ıa el producto de un vector por un di´adico y de un di´adico por un vector para obtener vectores. Definimos los productos entre d´ıadas unitarias y vectores as´ı: ~ = ~ei (~ej · V ~ ) = ~ei Vj ~ei~ej · V V~ · ~ei~ej =
(7.47)
~ · ~ei )~ej = ~ej Vi (V
y el producto entre di´adicos y vectores as´ı: ~~ ~ D ·V =
3 X 3 X
~~ V~ · D =
3 3 X X
i=1 j=1
i=1 j=1
3 3 X X ~ = Dij Vj ~ei Dij ~ei ~ej · V i=1
j=1
! 3 3 X X ~ · ~ei ~ej = Dij Vi ~ej Dij V j=1
i=1
Se define el di´adico unidad como: ~ ~1 = ~e ~e + ~e ~e + ~e ~e 1 1
2 2
(7.48)
3 3
(7.49)
~ ~1 claramente tiene las propiedades: ~ ~= ~1 · A
3 3 X X ~ ~= ~ei Ai = A ~ei~ei · A i=1
i=1
~ ·~ ~1 = A
3 X
3 X
i=1
~ · ~ei~ei = A
(7.50)
~ Ai~ei = A
i=1
La d´ıada ~ei~ej tiene la propiedad de proyecci´ on. Al multiplicarla por un vector se obtiene la componente del vector en la direcci´ on ~ei : ~=A ~ · ~ei~ei = ~ei~ei · A
3 X j=1
Aj (~ei · ~ej )~ei = Ai~ei
(7.51)
Se define el producto escalar de dos matrices as´ı: ˜= A˜ : B
3 X 3 X
Aij Bij
(7.52)
i=1 j=1
que corresponde al producto escalar de dos di´adicos: ~~ ~~ ˜ A : B = A˜ : B
(7.53)
Para el di´adico (7.44) y uno similar tenemos: ~B ~ :C ~D ~ = A
3 X i=1
~ · C)( ~ B ~ · D) ~ Ai Bj Ci Dj = (A
(7.54)
Cinem´atica del cuerpo r´ıgido / 215 Vemos que esto es lo mismo que: ~ ·A ~B ~ ·D ~ = C
=
3 3 X X
~ · ~ei )(~ej · D) ~ Ai Bj (C
3 X 3 X
~ · A)( ~ B ~ D) ~ Aj Bj Ci Dj = (C
i=1 j=1
i=1 j=1
(7.55)
Por tanto: ~B ~ :C ~D ~ =C ~ ·A ~B ~ ·D ~ A
(7.56)
Veremos que existe completa correspondencia entre los di´adicos y los tensores. Un tensor es una entidad algebraica, con componentes Tij tales que bajo rotaciones se transforma as´ı: Tij′ =
3 X 3 X
αik αjl Tkl
(7.57)
k=1 l=1
donde (αij ) son los elementos de la matriz de rotaci´on. En efecto, Tij son los elementos ~ de la matriz que representa a cierto di´adico T~ : ~ ~ Tij′ = T~ · ~e′i~e′j = ~e′i · T~ · ~e′j
(7.58)
~ T~ se puede expresar bien en t´erminos de ~ei~ej o de ~e′i~e′j : 3
3
3
3
XX XX ~ Tij′ ~e′i~e′j Tij ~ei~ej = T~ =
(7.59)
i=1 j=1
i=1 j=1
Por tanto (7.57) se puede escribir como: Tij′ =
3 X 3 X
k=1 l=1
Tlk ~ei · ~ek ~el · ~ej =
3 X 3 X
αik αjl Tkl
(7.60)
k=1 l=1
Se denomina relaci´ on de completidad de la base ~ei a: X ~ ~ei~ei = I~
(7.61)
i=1
y relaci´ on de ortonormalidad de la base ~ei a: ~ei · ~ej = δij ;
i, j = 1, 2, 3
(7.62)
En mec´anica cu´antica la notaci´ on de Dirac es la notaci´ on di´adica en el espacio de Hilbert. Dos forma. Se define el di´adico antisim´etrico: ~ei ∧ ~ej = ~ei~ej − ~ej ~ei
(7.63)
216 / Mec´ anica cl´ asica avanzada se cumple que ~ei ∧ ~ei = 0 y adem´as:
~e1 ∧ ~e2 =
~e2 ∧ ~e3 =
0
1
−1 0 0 0
0
0 0
0
0
0 , ~e1 ∧ ~e3 = 0 0
0
0
0 0 −1 0
1
0 , 0
(7.64)
0 1 −1 0
Una 2-forma entre dos vectores es: ~∧B ~ = A
3 X 3 X i=1 j=1
Ai Bj ~ei ∧ ~ej =
3 X 3 X i=1 j=1
(Ai Bj − Aj Bi )~ei~ej
(7.65)
Se cumplen las propiedades: ~ ·A ~∧B ~ ·D ~ = (C ~ · A)( ~ B ~ · D) ~ − (C ~ · B)( ~ A ~ · D) ~ C
(7.66)
~∧B ~ :C ~ ∧D ~ = 2(D ~ · B)( ~ A ~ · C) ~ − 2(C ~ · B)( ~ A ~ · D) ~ A El deteminante de la matriz de rotaci´ on. Sabemos que la matriz de los cosenos directores de un sistema de ejes (x) rotado respecto a otro sistema de ejes (x) es ortogonal: A˜T A˜ = I˜
(7.67)
Tomando el determinante a cada lado de (7.67) y teniendo en cuenta el teorema matem´atico que dice que el determinante de un producto de matrices es igual al producto de los determinantes, tenemos que: ˜ = det A˜T · det A˜ = det I˜ det(A˜T A)
(7.68)
otro teorema matem´atico dice que los determinantes de una matriz y de su traspuesta son iguales, entonces: ˜ 2 = 1 ⇒ det A˜ = ±1 det(A)
(7.69)
Es f´ acil ver que det A˜ = −1 ocurre cuando la matriz A˜ contiene una inversi´ on del sistema de coordenadas. Entonces los desplazamientos de un s´olido r´ıgido con un punto fijo s´olo pueden ser descritos mediante una matriz de determinante +1.
Cinem´atica del cuerpo r´ıgido / 217
7.4.
El teorema de Euler acerca del movimiento de un cuerpo r´ıgido
El teorema dice: el desplazamiento general de un cuerpo r´ıgido con un punto fijo es un giro alrededor de cierto eje. En otras palabras: es suficiente un solo giro para pasar de los ejes (x) fijos al cuerpo, a los ejes espaciales (x). El teorema se demuestra teniendo estas dos propiedades de una rotaci´on alrededor de un eje: (a) El eje de rotaci´on permanece inalterado; (b) La rotaci´on no cambia la longitud de los vectores. El teorema de Euler ˜ podemos queda demostrado si para una rotaci´on arbitraria, descrita por la matriz A, hallar siempre un vector que no cambie, es decir, que tenga las mismas componentes en los dos sistemas: ~ =V ~ V~ ′ = A˜V
(7.70)
Esta ecuaci´ on es un caso particular de: ~ = λV ~ V~ ′ = A˜V
(7.71)
Como A˜ es unitaria (ortogonal) pero no herm´ıtica (no sim´etrica), sus valores propios no tienen por qu´e ser reales. Esto nos permite enunciar el teorema de Euler de otra manera: “la matriz real y ortogonal que determina el movimiento f´ısico de un cuerpo r´ıgido con un punto fijo siempre tiene el valor propio +1”. La ecuaci´on de valores propios (7.71) puede escribirse: ˜V ~ = ~0 (A˜ − λI)
(7.72)
Es un sistema homog´eneo de tres ecuaciones lineales, donde las inc´ognitas son las componentes de V~ : (a11 − λ)V1 + a12 V2 + a13 V3 =
0
a21 V1 + (a22 − λ)V2 + a23 V3 =
0
a31 V1 + a32 V2 + (a33 − λ)V3 =
0
(7.73)
Como es conocido, habr´ a soluci´on no trivial s´olo si el determinante de la matriz ˜ es igual a cero. Esto hace que exista soluci´on solamente para ciertos valores de (A˜ − λI) λ: a11 − λ a12 a13 a22 − λ a23 (7.74) det a21 =0 a31 a32 a33 − λ La ecuaci´ on (7.74) es de tercer grado en λ con coeficientes reales: λ3 + bλ2 + cλ + d = 0
(7.75)
218 / Mec´ anica cl´ asica avanzada donde: b = −a11 − a22 − a23 c = a22 a11 + a33 a11 + a21 a33 − a23 a32 − a12 a21 − a13 a31
(7.76)
d = a23 a32 a11 + a12 a21 a33 + a13 a31 a22 −a22 a33 a11 − a12 a23 a31 − a13 a21 a32 cuyas principales propiedades son: ~ podr´ıa ser (a) λ puede ser complejo pero con m´ odulo 1. Si λ es complejo, V 2 ~ ~ ~ ~ complejo. En este caso escribimos el m´odulo de V como |V | = V · V donde V~ † es la ~ y tomando el complejo conjugado: V ~ † = (V ~ T )⋆ . matriz fila que se obtiene trasponiendo V ′ ~ es la misma de V~ : La longitud de V ~ ′ |2 = V ~ ′† · V ~ ′ = (A˜V ~ )† · (A˜V~ ) = V ~ † A˜T A˜V~ |V
(7.77)
~ ′ |2 = | V ~ |2 . Por otra parte, V ~ ′ = λV ~ , por Como A˜ es ortogonal, se sigue que |V tanto: ~ ′ |2 = V ~ ′† · V ~ ′ = (λV ~ )† · (λV ~ ) = λ⋆ λV ~†·V ~ = |λ|2 |V ~ |2 |V
(7.78)
En conclusi´ on: |λ|2 = 1
(7.79)
(b) La ecuaci´ on secular (7.75) tiene al menos una ra´ız real. Grafiquemos la ecuaci´ on real: f (x) = x3 + bx2 + cx + d
(7.80)
asumiremos x real. De la ecuaci´ on (7.76) sabemos que b, c y d son reales. Claramente: f (x) → ∞
para x → ∞
f (x) → −∞
para x → −∞
(7.81)
Como f (x) es continua debe en alguna parte cruzar el eje x. Llamemos x = λ el punto donde corta el eje, o sea el cero de f (x): λ3 + bλ2 + cλ + d = 0
(7.82)
Como por (a) sabemos que |λ| = 1, se sigue que el valor propio real debe ser λ = −1 o λ = +1 (v´ease figura 7.4). (c) Si λ es un valor propio compleio, λ⋆ tambi´ en es un valor propio. Como a, b, c y d son reales, si λ es complejo y satisface (7.75) entonces λ⋆ tambi´en la satisface: de (a), (b) y (c) se sigue que la matriz A˜ tendr´a tres valores propios λ, λ⋆ , +1 o −1. Para cada valor propio habr´ a un vector propio: ~α = λα V~α ; A˜V
α = 1, 2, 3
con λα = λ, λ⋆ , 1 o − 1
(7.83)
Cinem´atica del cuerpo r´ıgido / 219 y
λ
x
Figura 7.4 Gr´afico de la funci´on real f (x) = x3 + bx2 + cx + d
En t´erminos de las componentes podemos escribir a (7.83) como: 3 X
aij Vαj = λα Vαj =
j=1
3 X
λβ Vβi δαβ
(7.84)
β=1
Definimos las siguientes matrices formadas con las componentes de los vectores propios y con los valores propios: V˜ = (Vαi ) ,
˜ = (λβ δαβ ) λ
(7.85)
Entonces (7.84) puede reinterpretarse como productos de matrices: ˜ iα ˜T )iα = (V˜ T λ) ˜V ~ )αi = (V˜ T λ (A˜V˜ T )iα = (λ
(7.86)
O tambi´en: ˜ ⇒ (V˜ T )−1 A˜V˜ T = λ ˜ A˜V˜ T = V˜ T λ
(7.87)
Es decir, los vectores propios forman una matriz que diagonaliza a A˜ siendo los elementos de la diagonal los valores propios. (d) El producto de las ra´ıces de la ecuaci´ on secular es ±1. Tomando determinantes a ambos lados de (7.87) y teniendo en cuenta que el determinante de una matriz es igual al inverso del determinante de la matriz, obtenemos: 1 ˜ ⇒ det A˜ = det λ ˜ det A˜ det V˜ = det λ det V˜
(7.88)
De (7.69) se sigue que: ˜ = ±1 det λ
(7.89)
220 / Mec´ anica cl´ asica avanzada Hemos dicho que para rotaciones se debe cumplir que det A˜ = +1 y para inversiones det A˜ = −1. Entonces, cuando A˜ representa rotaciones: ˜ = λ1 λ2 λ3 = |λ|2 λ3 = +1 det λ (7.90) Como |λ|2 = +1 se sigue que siempre el valor propio real debe ser igual a +1. Esto es lo que afirma el teorema de Euler: existe un vector que no cambia al realizar una transformaci´ on cualquiera A˜ (corresponde al valor propio +1). ~: Los vectores propios. El vector invariante bajo rotaciones es V ~ =V ~ A˜V
(7.91)
~α formamos la matriz V˜ que diagonaliza a A: ˜ Con las componentes de V T ˜ V˜ A˜V˜ = λ
(7.92)
˜ es: La traza de λ tr λ = λ1 + λ2 + λ3 = λ + λ⋆ + 1 Como |λ| = 1, podemos escribir: λ = eiΦ
De donde: ˜ = 2 cos Φ + 1 tr λ
(7.93) (7.94) (7.95)
Como, seg´ un un teorema matem´atico, la traza es invariante bajo transformaciones ˜ de semejanza (V˜ A˜V˜ T es una transformaci´ on de semejanza sobre A): ˜ = 1 + 2 cos Φ tr A˜ = tr λ (7.96) Es decir, a11 + a22 + a33 = 1 + cos Φ
(7.97)
Podemos mediante una transformaci´ on de semejanza rotar los ejes de modo que ~ , de modo que la matriz de rotaci´on tendr´a la forma dada por x3 est´e a lo largo de V (7.21): cos φ senφ 0 −senφ cos φ 0 A˜ = (7.98) 0 0 1
Vemos entonces de (7.97) y (7.98) que cos φ = cos Φ, luego Φ puede identificarse ~ . La ecuaci´ como el ´ angulo de rotaci´on alrededor del eje determinado por V on de valores ˜ propios para la matriz A es: V1 V1 cos Φ senΦ 0 −senΦ cos Φ 0 V2 = V2 (7.99) V3 V3 0 0 1
Cinem´atica del cuerpo r´ıgido / 221 Con lo cual obtenemos: V1 cos Φ + V2 senΦ = V1 −V1 senΦ + V2 cos Φ = V2
(7.100)
V3 = V3 Esto nos da, multiplicando la primera por V2 y la segunda por V1 y restando: (V12 + V22 ) senΦ = 0
(7.101)
Como Φ es arbitrario, los vectores propios deben cumplir V1 = V2 = 0, quedando ~ = V3~e3 . Para una elecci´on general de los ejes, seguir´a siendo V3 indeterminado, luego V ~ , pero no quedar´a determinado comv´alido que Φ representa la rotaci´on alrededor de V ~ sino s´olo su direcci´ pletamente el vector V on: su magnitud quedar´a indeterminada. En cualquier caso la traza de A˜ nos determina el ´angulo de rotaci´on. Teorema de Chasles. El desplazamiento m´as general de un cuerpo r´ıgido consiste en una translaci´ on m´as una rotaci´on. Este teorema se demuestra en el texto Dynamics of a rigid body, de Routh.
7.5.
El rotador r´ıgido
Es un s´olido r´ıgido que se mueve sometido a la condici´on de ligadura que un punto permanezca fijo. Los movimientos de un rotador r´ıgido quedar´an especificados por medio de las tres componentes de la matriz A˜ que relaciona las componentes de los vectores en el sistema de ejes espacial con el sistema de ejes unido al s´olido r´ıgido: ˜r ~r = A~
o xi =
3 X
aij xj
(7.102)
j=1
En efecto, es suficiente especificar las tres coordenadas de un punto arbitrario del s´olido r´ıgido respecto al sistema de ejes espacial para conocer completamente la ubicaci´on de todos los dem´ as puntos del s´olido r´ıgido. Es decir, los tres par´ ametros independientes de la matriz A˜ sirven para especificar las posiciones de un rotador r´ıgido. Es claro que estos tres par´ ametros ser´an funciones del tiempo. El grupo de rotaciones. El conjunto de todas las infinitas rotaciones de un cuerpo r´ıgido con un punto fijo constituye un grupo. Cada rotaci´on A˜ est´ a especificada por tres par´ ametros independientes q1 , q2 y q3 . Un grupo es la siguiente estructura algebraica: ˜ (i) Existe un conjunto de elementos g = {A(q), ∀q1 , q2 , q3 }. ˜ ˜ ˜ ˜ (ii) Si A1 y A2 ∈ g entonces A1 A2 ∈ g. ˜ (iii) Si A˜ ∈ g, ∃A˜−1 ∈ g tal que A˜A˜−1 = I. ˜ ˜ ˜ ˜ ˜ (iv) ∃I ∈ g tal que I A = A, ∀A ∈ g. ˜ B, ˜ C˜ ∈ g se cumple A( ˜B ˜ C) ˜ = (A˜B) ˜ C. ˜ (v) ∀ A,
222 / Mec´ anica cl´ asica avanzada Estas propiedades se siguen del hecho de que las matrices de rotaci´on son ortogonales. Es sencillo demostrar a partir de lo anterior que: (a) El producto de dos matrices ortogonales es ortogonal. (b) Como para toda matriz de rotaci´on det A˜ = 1, se sigue que toda matriz de rotaci´on tiene inverso. (c) I˜ es ortogonal. (d) El producto de matrices obedece la ley asociativa. Las rotaciones consideradas en abstracto como simples transformaciones geom´etricas forman un grupo. El conjunto de matrices ortogonales 3 × 3 constituye una representaci´on del grupo de rotaciones.
7.6.
Los ´ angulos de Euler
Los nueve cosenos directores no son independientes, s´olo tres lo son. Podemos pensar que todos los cosenos directores sean expresados en t´erminos de tres par´ ametros independientes φ, θ, ψ: αij = αij (φ, θ, ψ) ;
i, j = 1, 2, 3
(7.103)
La elecci´on de estos tres par´ ametros independientes no es u ´ nica. Una conveniente elecci´on de φ, θ y ψ, es la siguiente (v´ease figura 7.5). Se puede efectuar la transformaci´ on de (x) a la posici´on del cuerpo r´ıgido dada por (x) por medio de las siguientes rotaciones: una rotaci´on por un ´ angulo φ alrededor del eje x3 , con lo cual los ejes cambian de (x) a (µ). Una rotaci´on por un ´angulo θ alrededor de µ1 , con lo cual los ejes se cambian de (µ) a (µ′ ). Finalmente una rotaci´on por un ´angulo ψ, alrededor del eje µ′3 , con lo cual los ejes se cambian de (µ′ ) a (x).1 Para expresar la matriz de rotaci´on S˜ en t´erminos de los ´ angulos φ, θ y ψ (´ angulos de Euler) debemos calcular los cosenos directores en t´erminos de estos ´ angulos. x3, µ 3
x3 µ3′
µ2′
µ2 ϕ
x1
ϕ µ1
χ3, µ3′
θ
x2
x2
x3
θ x2
x1
ϕ µ1, µi
x2 x1
ϕ
ψ x1
Línea de nodos
Figura 7.5 Angulos de Euler 1 (θ,
φ − π/2) son los a ´ngulos esf´ ericos de x3 respecto a los ejes x1 , x2 , x3 , y (θ, π/2 − ψ) son los angulos esf´ ´ ericos de x3 respecto a los ejes x1 , x2 , x3 .
Cinem´atica del cuerpo r´ıgido / 223 Para hallar α11 = ~e′1 · ~e1 tomemos los planos que se cortan en la l´ınea de nodos y que contienen los ejes x1 − x2 y x1 − x2 como en la figura 7.6. Vemos que: x3 x3
π- θ
α a
φ
ψ
x2
x2 b
l x1 θ
x1
Figura 7.6 Planos que se cortan en la l´ınea de nodos
a cos φ = b cos ψ
(7.104)
l2 = a2 + b2 − 2ab cos α
(7.105)
l2 = (a senφ)2 + (b senψ)2 − 2(a senφ)(b senψ) cos (π − θ)
(7.106)
Igualando (7.105) y (7.106) llegamos a: −b cos α = −a cos2 φ + b senφ senψ cos θ
(7.107)
Ahora, reemplazando (7.104) en (7.107) obtenemos finalmente: α11 = cos α = cos ψ cos φ − senφ senψ cos θ
(7.108)
α12 = ~e′1 · ~e2 se obtiene de α11 reemplazando a φ por φ + 3π/2: α12 = cos ψ senφ + cos φ senψ cos θ
(7.109)
α21 = ~e′2 · ~e1 se obtiene de α11 reemplazando a ψ por ψ + π/2: α21 = −senψ cos φ − senφ cos ψ cos θ
(7.110)
α22 = ~e′2 · ~e2 se obtiene de α21 reemplazando a φ por φ + 3π/2: α22 = −senψ cos φ + cos φ cos ψ cos θ
(7.111)
224 / Mec´ anica cl´ asica avanzada α33 = ~e′3 · ~e3 se obtiene directamente: α33 = ~e′3 · ~e3 = cos θ
(7.112)
α13 y α23 se obtienen de las relaciones de ortogonalidad siguientes, ecuaci´ on (7.38): α2j1 + α2j2 + α2j3 = 1
(7.113)
Con lo cual se obtiene para α13 : α213 = 1 − (α211 + α212 ) = 1 − (1 − sen2 ψ sen2 θ)
(7.114)
⇒ α13 = senψ senθ Similarmente, α221 + α222 = sen2 ψ + cos2 ψ cos2 θ, con lo cual: α23 = cos ψ senθ
(7.115)
Para calcular a α32 y a α31 usamos la ecuaci´ on (7.38) as´ı: α31 α21 + α32 α22 + α33 α23 = 0
(7.116)
α31 α11 + α32 α12 + α33 α13 = 0
(7.117)
Multiplicando a (7.116) por α11 y a (7.117) por α21 y restando: α32 =
α13 α21 − α23 α11 α33 α22 α11 − α12 α21
(7.118)
Con lo cual se obtiene: α32 = −senθ cos φ
(7.119)
Por otra parte la relaci´on (7.38) para la fila tres: α231 + α232 + α233 = 1
(7.120)
nos permite escribir: α31 = senθ senφ
(7.121)
con lo cual la matriz de rotaci´on es, en definitiva: A˜ =
cos φ cos ψ − senφ cos θ senψ
senφ cos ψ + cos φ cos θ senψ
senθ senψ
(7.122) − cos φ senψ − senφ cos θ cos ψ −senφ senψ + cos φ cos θ cos ψ senθ cos ψ senφ senθ − cos φ senθ cos θ
Por la forma como fue obtenida, a partir de los cosenos directores, se tiene que A˜ ˜ es una matriz ortogonal. Es decir, que A˜−1 se obtiene simplemente trasponiendo a A.
Cinem´atica del cuerpo r´ıgido / 225 Del teorema de Euler se sigue que de alguna manera A˜ representa una rotaci´on u ´nica alrededor de cierto eje n ˆ = c1~e1 + c2~e2 + c3~e3 bajo un ´angulo Φ. El eje de rotaci´on se halla resolviendo la ecuaci´ on de valores propios (7.91), con λ = 1: 3 X j=1
(aij − δij )Cj = 0 ;
i = 1, 2, 3
(7.123)
El resultado para los cosenos directores del eje n ˆ es: C1 =
senθ(cos ψ − cos φ) 2 senΦ
C2 =
senθ(senφ − senψ) 2senΦ
(7.124)
sen(Φ + ψ) (1 + cos θ) 2senΦ Donde Φ es el ´ angulo de rotaci´on alrededor de n ˆ que se halla a partir de la traza ˜ ecuaci´ de A, on (7.97): C3 =
cos φ =
1 − tr A˜ 2
(7.125)
Calculando la traza de A˜ se llega finalmente a: θ ψ+φ Φ (7.126) cos = cos cos 2 2 2 Como C12 + C22 + C32 = 1, vemos que dos cosenos directores de n ˆ y Φ especifican la rotaci´on.2 Se puede ver que A˜ se puede obtener tambi´en a partir de la definici´on de los ´angulos de Euler, de acuerdo con la figura 7.5: x1 cos φ senφ 0 µ1 µ2 = −senφ cos φ 0 x2 o ~µ = A˜φ ~x (7.127) x3 µ3 0 0 1 ′ 1 0 0 µ1 µ1 ′ µ2 = 0 cos θ senθ µ2 o µ~′ = A˜θ ~µ (7.128) µ3 0 −senθ cos θ µ′3 ′ µ1 cos ψ senψ 0 x1 x2 = −senψ cos ψ 0 µ′2 o ~x = A˜ψ µ ~′ (7.129) µ′3 0 0 1 x3 2 Las
ecuaciones (7.124) y (7.126) se obtienen al comparar los elementos de (7.122) y (7.138).
226 / Mec´ anica cl´ asica avanzada De modo que ~x puede obtenerse de ~x a trav´es de: ˜x ~x = A˜ψ A˜θ A˜φ ~x = A~
(7.130)
As´ı que: A˜ = A˜ψ A˜θ A˜φ
(7.131)
Al hacer el producto de matrices se llega al resultado para la matriz A˜ dado por (7.122). Definiciones alternas de los ´ angulos de Euler. La convenci´on usada en mec´anica cu´antica en los textos de teor´ıa de grupos de Wigner, y de momentos angulares de Rose, es diferente a la presentada anteriormente. All´ı la segunda rotaci´on es tomada no alrededor del eje intermedio µ1 sino alrededor de µ2 . Es la llamada “con˜ Es venci´on y” que obviamente dar´ a lugar a expresiones diferentes para la matriz A. f´ acilmente demostrable que para obtener la matriz A˜ en la convenci´on “y” a partir de la matriz A˜ en la convenci´on “x” bastan las sustituciones: π φ →φ+ 2 (7.132) π ψ →ψ− 2 donde se entender´ a a φ como el ´angulo de la primera rotaci´on y a ψ como el ´angulo de la tercera rotaci´on, con lo cual: senφ → cos φ cos φ → −senφ
senψ → − cos ψ
(7.133)
cos ψ → senψ
Se propone como ejercicio probar estas afirmaciones. Otra convenci´on es la llamada convenci´on “xyz”, usada en aeron´autica: la primera rotaci´on es por ´ angulo φ alrededor de x3 , la segunda por ´angulo θ alrededor de x2 y la tercera por ´ angulo ψ alrededor de x1 . Es la llamada secuencia 3 2 1. Por ejemplo, tomando los ejes de coordenadas fijos a un avi´ on de la siguiente manera: x3 perpendicular al avi´ on en el centro de masa, x2 paralelo a las alas y x1 a lo largo del eje principal del avi´ on, una posici´on arbitraria de la nave se puede obtener a partir de la posici´on en que los ejes (x) coinciden con los ejes (x) por medio de la siguiente secuencia de rotaciones: una alrededor de x3 por ´angulo φ, otra alrededor de x2 por ´angulo θ y la tercera alrededor de x1 por un ´ angulo ψ.
7.7.
Descripci´ on de las rotaciones en t´ erminos de n ˆy Φ. Par´ ametros de Euler
Hemos mostrado que los desplazamientos de un cuerpo r´ıgido con un punto fijo se pueden expresar por medio de rotaciones. Cada rotaci´on puede especificarse por tres
Cinem´atica del cuerpo r´ıgido / 227 par´ ametros independientes que pueden ser por ejemplo tres cosenos directores independientes, tres ´ angulos de Euler, o un eje de rotaci´on y un ´angulo. Vimos que las rotaciones constituyen un grupo matem´atico que tiene una representaci´on obvia en t´erminos de matrices 3 × 3 ortogonales (hay un homomorfismo entre las rotaciones f´ısicas y las matrices ortogonales 3 × 3). Queremos buscar una representaci´on de la transformaci´ on de coordenadas en t´erminos de los par´ ametros de una rotaci´on: dos cosenos directores del eje de rotaci´on y el ´angulo de rotaci´on. Formas “activa” y “pasiva” de una rotaci´ on. Hasta ahora hemos considerado ˜r simplemente que la matriz A˜ rota los ejes coordenados, de modo que la ecuaci´ on ~r = A~ expresa c´ omo est´ an relacionadas las componentes de un vector vistas respecto a dos diferentes sistemas de coordenadas: A˜ act´ ua sobre el sistema de coordenadas dejando los vectores inalterados. Hay adem´as la siguiente interpretaci´ on: A˜ puede pensarse como un operador que act´ ua sobre los vectores ~r para cambiarlos por vectores diferentes ~r′ con respecto al mismo sistema de coordenadas. Por ejemplo, en dos dimensiones, en vez de rotar en el sentido contrario a las agujas del reloj al sistema de coordenadas por un ´angulo φ, se puede rotar al vector ~r en el sentido del reloj por un ´angulo φ para obtener el vector ~r′ (v´ease figura 7.7). Las componentes del nuevo vector, ~r′ , estar´ an entonces x2
x2
Pasiva: r = Ar
r
x1
r
x2
Activa r ′ = Ar i
r′
r
i
φ φ
x1
x1
Figura 7.7 Formas activa y pasiva de una rotaci´ on ˜r . En general A˜ relacionadas con las del viejo vector ~r, por medio de la ecuaci´ on ~r′ = A~ corresponde a una rotaci´on en sentido contrario a las agujas del reloj por un ´angulo φ cuando sea aplicada al sistema de coordenadas, y como una rotaci´on en sentido de las agujas del reloj por un ´ angulo φ cuando sea aplicada a los vectores. Rotaciones finitas. Usaremos el punto de vista activo, seg´ un el cual en un sistema de coordenadas dado realizamos una rotaci´on de un vector por un ´angulo Φ alrededor de un eje n ˆ . Se trata de encontrar la matriz A˜ que relaciona las componentes del viejo y del nuevo vector. De las figuras 7.8 y 7.9 se ve que: ~ + N~V + N~Q ~r′ = ON
(7.134)
donde los vectores tienen las siguientes expresiones en t´erminos de ~r, n ˆ y Φ, teniendo en
228 / Mec´ anica cl´ asica avanzada
N
P
V Φ Q
r′ i
r
n O Figura 7.8 Rotaci´on de un vector alrededor de un eje n ˆ . Vista lateral.
N
V Φ
P
r ×n Q Figura 7.9 Rotaci´on de un vector alrededor de un eje n ˆ . Vista en direcci´ on ~n.
Cinem´atica del cuerpo r´ıgido / 229 cuenta que N V = N Q cos Φ y V Q = N Q senΦ: ~ = ON
(ˆ n · ~r)ˆ n
N~Q =
~ ) cos Φ (~r − ON
(7.135)
V~Q = ~r × n ˆ senΦ
Con lo cual obtenemos: ~r′ = ~r cos Φ + n ˆ (ˆ n · ~r)(1 − cos Φ) + ~r × n ˆ senΦ
(7.136)
Esta f´ ormula es v´alida para cualquier rotaci´on finita de un vector. Para Φ infinitesimal, dicha expresi´on toma la forma: ~r′ = ~r + ~r × n ˆΦ
(7.137)
en concordancia con la f´ ormula (3.148). Escrita en forma de matriz, la ecuaci´ on (7.136) es: ′ x1 ′ x2 = x′3 (7.138) x1 C1 C2 c + C3 senΦ C1 C3 c−C2 senΦ cos Φ+C12 c 2 C1 C2 c−C3 senΦ x2 c C C c+C senΦ cos Φ+C 2 3 1 2 x3 C1 C3 c+C2 senΦ C2 C3 c−C1 senΦ cos Φ+C32 c
donde hemos llamado c = (1 − cos Φ). En (7.138) la matriz A˜ depende de los cuatro par´ ametros no independientes C1 , C2 , C3 y Φ. Suele expresarse esta matriz en t´erminos de los llamados par´ ametros de Euler, no independientes, e0 , e1 , e2 , e3 , definidos as´ı: e0 =
cos
Φ 2
(7.139)
Φ ei = Ci sen ; i = 1, 2, 3 2 En t´erminos de estos par´ ametros (7.136) toma la forma: ~r′ = ~r(e20 − e21 − e22 − e23 ) + 2~e(~e · ~r) + 2(~r × ~e)e0 y la matriz A˜ entonces ser´a: 2 e0 + e21 − e22 − e23 2(e1 e2 + e0 e3 ) 2(e1 e3 − e0 e2 ) e20 − e21 + e22 − e23 2(e2 e3 + e0 e1 ) A˜ = 2(e1 e2 − e0 e3 ) 2(e1 e3 + e0 e3 ) 2(e2 e3 − e0 e1 ) e20 − e21 − e22 + e23
(7.140)
(7.141)
230 / Mec´ anica cl´ asica avanzada Usando las ecuaciones (7.124), (7.126) y (7.139) se obtienen las siguientes relaciones entre los par´ ametros de Euler y los ´angulos de Euler: e0 =
cos
θ φ+ψ cos 2 2
e1 =
sen
φ−ψ θ cos 2 2
e2 =
θ φ−ψ sen sen 2 2
e3 =
cos
(7.142)
φ+ψ θ sen 2 2
Los par´ ametros y los ´angulos de Euler fueron hallados por Euler en 1776, quien llam´ o ei a los par´ ametros sim´etricos.
7.8.
Representaci´ on del grupo de rotaciones por medio de matrices 2 × 2. Los par´ ametros de Cayley-Klein
Representaci´ on de un grupo. En el numeral 7.5 hemos mencionado que el conjunto de todos los desplazamientos de un cuerpo r´ıgido con un punto fijo satisface los axiomas de un grupo matem´atico: (i) Dos desplazamientos sucesivos cualesquiera del cuerpo equivalen a un desplazamiento; (ii) Existe el desplazamiento identidad que consiste en no desplazar el cuerpo; (iii) Para todo desplazamiento existe el desplazamiento inverso o sea aquel que retorne el cuerpo a su posici´on original; (iv) Los desplazamientos sucesivos del cuerpo r´ıgido satisfacen la propiedad asociativa. El conjunto de todas las matrices ortogonales 3 × 3 constituyen una representaci´on del grupo de los desplazamientos de un rotador r´ıgido en el sentido de que a cada desplazamiento del rotador se le puede asociar una matriz ortogonal 3 × 3 y s´olo una. Se dice entonces que hay un homomorfismo entre el grupo de los desplazamientos del rotador r´ıgido y el grupo de las matrices ortogonales 3×3. El grupo de matrices ortogonales 3×3 es llamado el grupo O(3). El grupo de las matrices ortogonales 3 × 3 con determinante +1, que en rigor es el que corresponde a los desplazamientos de un rotador r´ıgido, se llama el grupo SO(3). Vectores y di´ adicos en un espacio bidimensional. En un espacio bidimensional, un vector arbitrario V~ puede expresarse en t´erminos de los vectores unitarios ~e1 , e~2 : ~ = V1~e1 + V2~e2 . V ~ y ~ei pueden representarse por matrices 2 × 1: V
V~ →
V1 V2
~e1 →
1 0
~e2 →
0 1
(7.143)
Cinem´atica del cuerpo r´ıgido / 231 Podemos definir las d´ıadas unitarias ~e1~e1 , ~e1~e2 , ~e2~e1 y ~e2~e2 , que pueden representarse por matrices 2 × 2: 1 0 0 1 ~e1~e2 → ~e1~e1 → 0 0 0 0 (7.144) 0 0 0 0 ~e2~e2 → ~e2~e1 → 1 0 0 1 En una d´ıada unitaria el primer vector se representa por una matriz columna y el segundo por una matriz fila. Por ejemplo: 1 0 1 ~e1~e2 → (0 1) = (7.145) 0 0 0 N´ otese que:
0
~e1 ∧ ~e2 = ~e1~e2 − ~e2~e1 =
1
−1 0
~~ Un di´adico D puede expresarse en t´erminos de las d´ıadas unitarias: ~~ D = D11~e1~e1 + D12~e1~e2 + D21~e2~e1 + D22~e2~e2 y puede representarse por medio de una matriz 2 × 2: D11 D12 ~~ D → D21 D22 ~1, es: El di´adico unidad, ~
~ ~1 = ~e1~e1 + ~e2~e2 →
1 0 0 1
Se definen los di´adicos ~ ~σ x , ~ ~σ y y 0 ~ ~σ x = ~e1~e2 + ~e2~e1 → 1
~ ~σ y = −i~e1~e2 + i~e2~e1 →
~ ~σ z = ~e1~e1 − ~e2~e2 →
1
(7.146)
(7.147)
(7.148)
(7.149)
~~σ z de la siguiente manera: 1 =σ ˜x 0
0
−i
i
0 0
0 −1
=σ ˜y
=σ ˜z
(7.150)
232 / Mec´ anica cl´ asica avanzada Las d´ıadas unitarias pueden expresarse en t´erminos de ~~σ i y ~~1: ~e1~e1 =
1 ~ (~1 + ~~σ z ) ; 2
~e1~e2 =
1 ~e2~e1 = (~ ~σ x − i~~σ y ) ; 2
1 ~ (~σ x + i~~σ y ) 2
1 ~ ~e2~e2 = (~1 − i~~σ z ) 2
(7.151)
~ Un di´adico arbitrario puede igualmente expresarse en t´erminos de ~1 y ~~σ i : 1 ~~ ~1 + 1 (V11 − V22 )~~σ z + 1 (V12 + V21 )~~σ x + i (V12 − V21 )~~σ y D = (V11 + V22 )~ 2 2 2 2
(7.152)
O sea que cualquier di´adico de traza cero puede expresarse en t´erminos de ~~σ x , ~~σ y , ~ ~ ~ a cualquier di´adico de traza cero: ~σ z . Llamaremos V ~ ~~σ y ~~σ z ~σ x ~ ~ = Vx √ V + Vy √ + Vz √ 2 2 2
(7.153)
Existe un isomorfismo entre los di´adicos bidimensionales de traza cero y los vectores ~ . En efecto, el conjunto de todos los di´adicos bidimensionales de traza cero ordinarios V satisface las mismas propiedades que el conjunto de todos los vectores ordinarios: (i) La suma de dos di´adicos de traza cero es un di´adico de traza cero, la suma es conmutativa; (ii) El producto de un n´ umero por un di´adico de traza cero es un di´adico de traza cero; (iii) La suma de di´adicos es asociativa; (iv) Existe el di´adico cero. Adem´as, si se define el producto escalar de dos di´adicos como: ~ ~ ~ = V ⋆ W11 + V ⋆ W12 + V ⋆ W21 + V ⋆ W22 ~ : W V 11 12 21 22
(7.154)
Vemos que este producto escalar satisface las mismas propiedades del producto escalar de vectores. Para ello es suficiente mostrar que: ~ ~σ i : ~ ~σ j = 2δij ;
i, j = x, y, z
(7.155)
lo cual es evidente de las ecuaciones (7.150) y (7.154). En resumen, a cada di´adico de traza cero de la forma (7.153) se le puede hacer corresponder el vector ordinario: ~ = Vx~e1 + Vy ~e2 + Vz ~e3 V
(7.156)
Homomorfismo entre las rotaciones en el espacio bidimensional y las ~ es rotado para convertirse en V ~ ′: rotaciones en el espacio ordinario. Si el vector V ~ ′ = A˜V ~ V
(7.157)
donde A˜ es la matriz de rotaci´on 3 × 3, el di´adico correspondiente en el espacio bidimensional deber´ a presentar una transformaci´ on correspondiente en virtud del mencionado homomorfismo. Como: Vi′ =
3 X j=1
aij Vj
(7.158)
Cinem´atica del cuerpo r´ıgido / 233 ~′ entonces V~ ser´a: 3
3
1 ~ ′ XX ~σ i aij Vj √ ~ V~ = 2 i=1 j=1
(7.159)
Por otra parte, una transformaci´ on de un di´adico es de la forma: ~ ′ ~~ ~ ~~ † ~ ·Q V~ = Q ·V
(7.160)
~~ † ~~ donde Q es el adjunto de Q: †
~~ Q = Q⋆11 eˆ1 eˆ1 + Q⋆21 eˆ1 eˆ2 + Q⋆12 eˆ2 eˆ1 + Q⋆22 eˆ2 eˆ2 ′ ~ ~ es: Expl´ıcitamente V 2 2 X X ~′ = Qij eˆi eˆj · V Vkl eˆk eˆl · i,j=1
2 X
k,l=1
2 X
Q⋆mn eˆn eˆm m,n=1
(7.161)
! (7.162)
˜ V˜ Q ˜ † )im eˆi eˆm (Q
i,m=1
~′ Por otra parte V~ est´ a dado por (7.159). Por tanto, seg´ un (7.152) y (7.153): 3
i 1 h ˜ ˜ ˜ † ˜ V˜ Q ˜† QV Q + Q 2 12 21
3
i i h ˜ ˜ ˜ † ˜ V˜ Q ˜† QV Q − Q 2 12 21
1 X √ a1j Vj = 2 j=1 1 X √ a2j Vj = 2 j=1 3
1 X √ a3j Vj = 2 j=1
(7.163)
i 1 h ˜ ˜ ˜ † ˜ V˜ Q ˜† − Q QV Q 2 22 11
~~ ˜ El di´adico Q Estas ecuaciones nos permiten relacionar A˜ con Q. en (7.160) debe ser unitario: ~~ † ~~ ~~ ~~ † Q ·Q=1=Q ·Q
(7.164)
~~ Si llamamos α, β, γ y δ las componentes de Q: ~~ Q = αˆ e1 eˆ1 + βˆ e1 eˆ2 + γˆ e2 eˆ1 + δˆ e2 eˆ2
(7.165)
234 / Mec´ anica cl´ asica avanzada ~~ † ~~ Q .Q =
(α⋆ eˆ1 eˆ1 + γ ⋆ eˆ1 eˆ2 + β ⋆ eˆ2 eˆ1 + δ ⋆ eˆ2 eˆ2 )· (αˆ e1 eˆ1 + βˆ e1 eˆ2 + γˆ e2 eˆ1 + δˆ e2 eˆ2 ) (|α|2 + |γ|2 )ˆ e1 eˆ1 + (α⋆ β + γ ⋆ δ)ˆ e1 eˆ2
=
(7.166)
+(β ⋆ α + δ ⋆ γ)ˆ e2 eˆ1 + (|β|2 + |δ|2 )ˆ e2 eˆ2 eˆ1 eˆ1 + eˆ2 eˆ2 + eˆ3 eˆ3 = ~~1
=
Con lo cual obtenemos:
|α|2 + |γ|2 = 1 α⋆ β + γ ⋆ δ = 0
(7.167)
|β|2 + |δ|2 = 1 Las ecuaciones (7.167) representan cuatro condiciones sobre los elementos α, β, γ y δ, que por ser complejos contienen ocho par´ ametros. Las relaciones (7.167) dejan 8−4 = 4 par´ ametros independientes. Si adem´as se impone la condici´on de que el determinante de ˜ sea +1, obtenemos: Q
αδ − βγ = 1 ⇒ β = −γ ⋆ ; δ = α⋆ ; αα⋆ + ββ ⋆ = 1
(7.168)
Con lo cual quedan s´olo tres par´ ametros independientes de los ocho que contiene ˜ Entenderemos pues, que en (7.165) α, β, γ y δ satisfacen las condiciones de unitaridad Q. (7.167) y de unimodularidad (7.168). ˜ V˜ Q ˜ † . Esto es: En (7.163) se requiere conocer la matriz Q
˜ V˜ Q ˜† = Q =
α
β
γ
δ
V11
V12
V21
V22
α⋆
γ⋆
β⋆
δ⋆
|α|2 V11 +|β|2 V22 +α⋆ βV21 +αβ ⋆ V12
γ ⋆ αV11 +γ ⋆ βV21 +δ⋆ αV12 +βδ⋆ V22
α⋆ γV11 +α⋆ δV21 +β ⋆ γV12 +β ⋆ δV22
|γ|2 V11 +|δ|2 V22 +γ ⋆ δV21 +δ⋆ γV12
!
(7.169)
Cinem´atica del cuerpo r´ıgido / 235 De (7.163) y (7.169) obtenemos las siguientes relaciones: 3 √ X a1j Vj = (γ ⋆ α + α⋆ γ)V11 + (γ ⋆ β + α⋆ δ)V21 2 j=1
+(δ ⋆ α + β ⋆ γ)V12 + (βδ ⋆ + β ⋆ δ)V22 3 √ X a2j Vj = i(γ ⋆ α − α⋆ γ)V11 + i(γ ⋆ β − α⋆ δ)V21 2 j=1
(7.170)
+i(δ ⋆ α − β ⋆ γ)V12 + i(βδ ⋆ − β ⋆ δ)V22 3 √ X a3j Vj = (|α|2 − |γ|2 )V11 + (|β|2 − |δ|2 )V22 2 j=1
+(α⋆ β − γ ⋆ δ)V21 + (αβ ⋆ − δ ⋆ γ)V12 Como por otra parte:
V1 =
1 √ (V12 + V21 ) 2
V1 =
i √ (V12 − V21 ) 2
V1 =
1 √ (V11 + V22 ) 2
(7.171)
Obtenemos usando (7.170) y (7.171) las siguentes relaciones entre las componentes ˜ igualando coeficientes de los Vij : de A˜ y las de Q, a13 =
γ ⋆ α + α⋆ γ
(a11 + ia13 ) =
δ⋆α + β ⋆γ
a23 =
i(γ ⋆ α − α⋆ γ)
(a21 + ia22 ) =
i(δ ⋆ α − β ⋆ γ)
a33 =
|α|2 − |γ|2
(a31 + ia32 ) =
αβ ⋆ − δ ⋆ γ
(7.172)
236 / Mec´ anica cl´ asica avanzada Con lo cual la matriz A˜ toma la forma: 1 i 2 (α2 − γ 2 + δ 2 − β 2 ) (γ − α2 + δ 2 − β 2 ) γδ − αβ 2 2 1 2 i A˜ = (α2 + γ 2 − β 2 − δ 2 ) (α + γ 2 + β 2 + δ 2 ) −i(αβ + γδ) 2 2 βδ − αγ
i(αγ + βδ)
αδ + βγ
(7.173)
donde hemos usado adem´as las relaciones α⋆ = δ, γ ⋆ = −β de la ecuaci´ on (7.168). A˜ es una matriz que est´ a expresada en t´erminos de α, β, γ, δ, o sea que los par´ ametros α, β, γ, δ, sirven para especificar las rotaciones de un cuerpo r´ıgido. Son llamados los par´ ametros de Cayley-Klein, estudiados por estos autores en los a˜ nos 1875-1879. En resumen, hemos mostrado que si al efectuar una rotaci´on un vector V~ ′ se cambia ~ ′ = A˜V ~ , entonces el di´adico V~~ en el espacio bidimensional que corresponde en el vector V
~ ′ ~~ ~~ ~~ † V ·Q . Por tanto, a cada rotaci´on del cuerpo r´ıgido a V~ se transforma en el di´adico V~ = Q· ˜ 2 × 2. La matriz Q ˜ es unitaria, Q ˜Q ˜ † = I, ˜ y le corresponde una matriz A˜ y una matriz Q ˜ = 1. El conjunto de todas las matrices unitarias y unimodulares 2 × 2 unimodular, det Q es llamado el grupo SU (2). Hay pues un homomorfismo entre los grupos SO(3) y SU (2). Si en (7.173) se hacen las siguientes sustituciones de los par´ ametros de Cayley-Klein en t´erminos de e0 , e1 , e2 y e3 : α = e0 + ie3 ; γ = −β ⋆ β = e2 + ie1 ;
(7.174)
δ = α⋆
Se obtiene exactamente la matriz (7.141), o sea que en efecto e0 y ei son los par´ ametros de Euler definidos en (7.142). Usando (7.174) y las expresiones para e0 y ei en t´erminos de los ´ angulos de Euler, ecuaci´ on (7.142), obtenemos para α, β, γ y δ en t´erminos de los ´ angulos de Euler: α = ei(φ+ψ)/2 cos
θ ; 2
β = iei(ψ−φ)/2 sen
θ 2
(7.175)
θ θ γ = ie−(ψ−φ)/2 sen ; δ = e−i(φ+ψ)/2 cos 2 2 ~~ El di´adico Q definido en (7.166) puede escribirse en t´erminos de los di´adicos de ~ Pauli y el di´adico unidad, ~~σ i , ~1, reemplazando (7.151) en (7.165): 1 i 1 ~~ ~ 1 Q = (α + δ)~1 + (α − δ)~~σ z + (β + γ)~~σ x + (β − γ)~~σ y 2 2 2 2
(7.176)
que usando (7.174) toma la forma:3 ~~ ~1 + ie1~~σ x + ie2~~σ y + ie3~~σ z Q = e0~ 3 Los
e0 , ei , forman un sistema de cuaterniones.
(7.177)
Cinem´atica del cuerpo r´ıgido / 237 Para una rotaci´on alrededor del eje x1 , de acuerdo con (7.142) se tiene que e1 = senθ/2, e2 = e3 = 0. Por tanto: θ~ ~~ ~1 + i sen θ ~ ~σ x Q θ = cos 2 2
(7.178)
donde θ es el ´ angulo de rotaci´on. Para una rotaci´on por φ alrededor del eje x3 : φ~ ~~ ~1 + i sen φ ~ Q ~σ z φ = cos 2 2
(7.179)
Cada di´adico de Pauli ~ ~σ i est´ a asociado con una rotaci´on alrededor de un eje particular y puede considerarse como el “rotador unitario” para dicho eje. Ejemplo 7.8.1 Mostrar que los di´adicos de Pauli anticonmutan mutuamente, esto es, que: ~ ~σ i · ~ ~σ j = −~ ~σ j · ~ ~σ i
(7.180)
Hagamos los nueve productos ~~σ i · ~~σ j , usando las definiciones (7.150): ~ ~ ~σ x · ~ ~σ x = eˆ1 eˆ1 + eˆ2 eˆ2 = ~1 ;
~~σ x · ~~σ y = iˆ e1 eˆ1 − iˆ e2 eˆ2 = i~~σ z
~ ~σ x · ~ ~σ z = −ˆ e1 eˆ2 + eˆ2 eˆ1 = −i~~σy ; ~~σ y · ~~σ x = −iˆ e1 eˆ1 + iˆ e2 eˆ2 = −i~~σ z ~ ~1 ; ~σ y · ~ ~σ y = eˆ1 eˆ1 + eˆ2 eˆ2 = ~
~~σ y · ~~σ z = iˆ e1 eˆ2 + iˆ e2 eˆ1 = i~~σ x
~ ~σ z · ~ ~σ x = eˆ1 eˆ2 − eˆ2 eˆ1 = i~ ~σ y ;
~~σ z · ~~σ y = −iˆ e1 eˆ2 − iˆ e2 eˆ1 = −i~~σx
(7.181)
~ ~1 ~σ z · ~ ~σ z = eˆ1 eˆ1 + eˆ2 eˆ2 = ~ Las ecuaciones (7.181) se pueden escribir en forma compacta as´ı: ~ ~1δij + i ~σ i · ~ ~σ j = ~
3 X
ǫijk ~ ~σ k
(7.182)
k=1
donde ǫij es el tensor de Levi-Civita completamente antisim´etrico. Se puede ver directamente que las ~ ~σ i obedecen las relaciones de conmutaci´ on siguientes: ~ ~σ i · ~ ~σ j − ~ ~σ j · ~ ~σ i = 2i
3 X
ǫijk ~~σ k
(7.183)
k=1
y de anticonmutaci´ on: ~ ~1δij ~σ i = 2~ ~σ j · ~ ~σ j + ~ ~σ i · ~ ~~ Ejemplo 7.8.2 Mostrar que Q olicamente como: θ puede escribirse simb´
(7.184)
238 / Mec´ anica cl´ asica avanzada ~~ i~ ~ σx (θ/2) Q θ = e
(7.185)
2 donde el exponencial denota una serie infinita de t´erminos. Como seg´ un (7.181) ~~σ x ≡ 2n 2n+1 ~ ~ ~ ~σ x · ~ ~σ x = ~1, se sigue que ~~σ = ~1 y que ~~σ = ~~σ x para n = 0, 1, 2, ... Por lo tanto: x
x
θ ≡ cos ~ ~σ x 2
2n 1 θ ~~σ x θ (−1)n = ~~1 cos (2n)! 2 2 n=0
θ ~ sen ~σ x ≡ 2
2n+1 1 θ θ n ~ (−1) = ~~σ x sen ~σ x (2n + 1)! 2 2 n=0
∞ X ∞ X
(7.186)
~~ Con lo cual Q θ puede expresarse en la forma: θ θ θ θ ~ ~~ ~ ~ + +i~~σ x sen = cos(~~σ x ) + i sen(~~σ x ) = ei~σ x (θ/2) Q θ = 1 cos 2 2 2 2
(7.187)
† Como ~ ~σ i son herm´ıticos, ~~σ i = ~~σ i , se sigue que:
~~ † −i~ ~ σx (θ/2) Q θ = e
(7.188)
Ejemplo 7.8.3 Hallar la forma de la matriz de rotaci´on para una rotaci´on arbitraria, definida por los ´ angulos de Euler. ~~ Q puede escribirse como el producto de tres rotaciones sucesivas, en virtud del homomorfismo con el grupo de rotaciones: ~ ~ ~ ~~ † Q = ei~σz (ψ/2) ei~σ µ1 (θ/2) ei~σ z (φ/2)
(7.189)
~~ Las tres rotaciones que aparecen en Q son alrededor de los ejes z, µ1 y z. Es deseable expresarlas en t´erminos de rotaciones alrededor de ejes del mismo sistema de coordenadas. Para ello hay que notar que cada uno de los di´adicos que aparece en el operador de rotaci´on est´ a asociado con el respectivo eje de rotaci´on. Como el eje x conduce al eje µ1 por medio de la rotaci´on Aφ , correspondientemente ~ on (7.160): ~σ µ1 ser´a, de acuerdo con la ecuaci´ ~ ~ ~ ~σ µ1 = ei~σ z (θ/2)~~σ x · e−i~σz (θ/2)
(7.190)
Como por otra parte: ~1 cos ei~σµ1 (θ/2) = ~ ~
θ θ + i~~σ µ1 sen 2 2
(7.191)
~~ Se sigue, usando la ecuaci´ on (7.190) y la unitariedad Q φ: ~
~
~
~
ei~σµ1 (θ/2) = ei~σz (φ/2) · ei~σx (θ/2) · ei~σ z (φ/2)
(7.192)
Cinem´atica del cuerpo r´ıgido / 239 ~~ Por tanto Q toma la foma: ~ ~ ~ ~~ Q = ei~σz (ψ/2) ei~σ z (φ/2) ei~σ x (θ/2)
(7.193)
Por otra parte, el eje z se obtiene del eje µ′3 por medio de la rotaci´on Aψ , y µ′1 se obtiene de µ3 = z por medio de A˜θ . Por lo tanto ~~σ z puede escribirse en t´erminos de ~~σ z como: ~ ~ ~ ~ ~ ~σ z = ei~σ z (ψ/2) ei~σ µ1 (θ/2)~ ~σ z e−i~σµ1 (θ/2) e−i~σz (ψ/2)
(7.194)
Usando (7.192): ~ ~ ~ ~ ~ ~ ~σ z = ei~σ z (ψ/2) · ei~σ z (φ/2) · ei~σ x (θ/2) · e−i~σz (φ/2) · σz .ei~σ z (φ/2) ·
e
−i~ ~ σ x (θ/2)
·e
−i~ ~ σ z (φ/2)
·e
(7.195)
−i~ ~ σ z (ψ/2)
~~ ~~ Notando que ~ ~σ z y Q φ conmutan y que Qφ es unitario: ~ ~ ~ ~ ~ ~ ~ ~σ z = ei~σ z (ψ/2) · ei~σ z (φ/2) · ei~σx (θ/2) · σz · e−i~σ x (θ/2) · e−i~σz (φ/2) · e−i~σ z (ψ/2)
(7.196)
Se sigue entonces que: ~
~
ei~σ z (ψ/2) =
~
~
~
~
ei~σz (ψ/2) · ei~σ z (φ/2) · ei~σ x (θ/2) · ei~σ z (ψ/2) · e−i~σ x (θ/2) · ~
(7.197)
~
e−i~σz (φ/2) · e−i~σz (ψ/2) O sea: ~
~
~
~
~
~
ei~σ z (ψ/2) = ei~σ z (φ/2) · ei~σ x (θ/2) · ei~σz (ψ/2) · e−i~σx (θ/2) · e−i~σz (φ/2)
(7.198)
~~ Reemplazando (7.198) en (7.193) obtenemos para Q: ~ ~ ~ ~ ~ ~ ~ ~~ Q = ei~σz (φ/2) ·ei~σ x (θ/2) ·ei~σ z (ψ/2) ·e−i~σ x (θ/2) ·e−i~σ z (φ/2) ·ei~σ z (φ/2) ·ei~σ x (θ/2)
(7.199)
~~ Con lo cual, usando la unitaridad de los operadores, se obtiene finalmente para Q: ~ ~ ~ ~~ Q = ei~σz (φ/2) · ei~σx (θ/2) · ei~σ z (ψ/2)
(7.200)
~~ Hemos conseguido expresar a Q en t´erminos de rotaciones alrededor de los ejes ~~ del sistema de coordenadas espacial. Es posible, de manera an´aloga, expresar a Q en ~~ t´erminos de rotaciones respecto a los ejes fijos al cuerpo r´ıgido Q de donde toma la forma: ~ ~ ~ ~~ Q = ei~σz (φ/2) · ei~σx (θ/2) · ei~σ z (ψ/2)
(7.201)
Ejercicio 7.8.1 Demostrar que si (e0 , ei ) y (e′0 , e′i ) son los par´ ametros de Euler que describen dos rotaciones A y A′ , entonces los par´ ametros de la rotaci´on A” = A′ A est´ an expresados en t´erminos de los par´ ametros de las rotaciones A, A′ , por:
240 / Mec´ anica cl´ asica avanzada e′1 ′ = e1 e′0 + e2 e′3 − e3 e′2 + e0 e′1 e′2 ′ = −e1 e′3 + e2 e′0 + e3 e′1 + e0 e′2
(7.202)
e′3 ′ = e1 e′2 − e2 e′1 + e3 e′0 + e0 e′3 e′0 ′ = e0 e′0 − e1 e′1 − e2 e′2 − e3 e′3 Ejercicio 7.8.2 Demostrar que si (α, β, γ, δ) y (α′ , β ′ , γ ′ , δ ′ ) son los par´ ametros de CayleyKlein que describen dos rotaciones A y A′ , entonces los par´ ametros (α′′ , β ′′ , γ ′′ , δ ′′ ) de la rotaci´on A′′ = A′ A est´ an expresados en t´erminos de los par´ ametros de A, A′ , por: α′′ = αα′ + γ ′ β
β” = αβ ′ + βδ ′
γ ′′ = γα′ + δ ′ γ
δ” = γβ ′ + δδ ′
(7.203) Ejercicio 7.8.3 Interpretaci´ on geom´etrica del homomorfismo entre SO(3) y SU (2). Sea una esfera y una figura geom´etrica F en ella (v´ease figura 7.10). Se coloca la esfera sobre un plano. La normal al plano en el punto de contacto corta a la esfera en el punto T . La proyecci´on estereogr´ afica de F en el plano es P . Al punto T se le llama v´ertice de la proyecci´on. T n
F
P
Figura 7.10 Figura geom´etrica F dentro de una esfera Al rotar la esfera alrededor de n ˆ , en la figura, F se cambia en F ′ y su proyecci´on ′ estereogr´ afica P se cambia en P . Entonces a cada rotaci´on de la esfera le corresponde cierta transformaci´ on en el plano, llamada transformaci´ on homogr´afica. Estas transformaciones cambian c´ırculos en el plano por c´ırculos en el plano. Sea z = x + iy un punto del plano y z ′ = x′ + iy ′ el punto del plano que se obtiene de z mediante la transformaci´ on homogr´afica. (a) Mostrar que: z′ =
az + b cz + d
(7.204)
Cinem´atica del cuerpo r´ıgido / 241 donde a, b, c y d son constantes reales o complejas. (b) Mostrar que el resultado de dos homograf´ıas sucesivas: z′ =
α′ z + β ′ γ ′z + δ′
y
z ′′ =
α′′ z ′ + β ′′ γ ′′ z ′ + δ ′′
(7.205)
Es una homograf´ıa: z ′′′ =
α′′′ Z + β ′′′ γ ′′′ Z + δ ′′′
(7.206)
donde la relaci´ on entre (α′′′ , β ′′′ , γ ′′′ , δ ′′′ ) con (α′ , β ′ , γ ′ , δ ′ ) y (α′′ , β ′′ , γ ′′ , δ ′′ ) est´ a dada por expresiones an´alogas a (7.203). Argumentar que lo anterior muestra cone~~ xi´ on entre las rotaciones y las transformaciones homogr´aficas, y que por tanto las Q del grupo SU (2) corresponden a transformaciones homogr´aficas, donde los par´ ametros de Cayley-Klein son los par´ ametros que caracterizan la transformaci´ on homogr´afica correspondiente a una rotaci´on de un s´olido r´ıgido (v´ease el texto de L.V. Ahlfors, An´ alisis de variable compleja, Aguilar, 1966).
7.9.
Las rotaciones infinitesimales. Cinem´ atica de las rotaciones
Las coordenadas r´ıgidamente unidas al cuerpo r´ıgido permiten representar cualquier punto del mismo ~r = (x1 , x2 , x3 ). La rigidez del cuerpo se puede expresar diciendo que ning´ un punto se puede desplazar con relaci´on al origen. Es decir: ~r˙ = 0
(7.207)
Los desplazamientos del cuerpo son detectables en el sistema de coordenadas espacial relacionado con el del cuerpo r´ıgido por medio de la matriz de rotaci´on A˜T , ~r = A˜T ~r. Como el cuerpo r´ıgido se desplaza respecto al sistema de coordenadas espacial, A˜T habr´ a de ser funci´ on del tiempo, con lo cual: ~r(t) = A˜T (t)~r
(7.208)
Es posible escoger los sistemas de coordenadas de modo que ~r(0) = ~r, lo cual implica que: A˜T (0) = I˜
(7.209)
Podemos decir que el cuerpo r´ıgido en el tiempo t estar´ a descrito por la transformaci´on A˜T (t) que evoluciona de manera continua a partir de la transformaci´ on identidad. Adem´as es posible suponer que para un tiempo infinitesimal, A˜T (∆t) difiere de la identidad I˜ por t´erminos del orden de ∆t.
242 / Mec´ anica cl´ asica avanzada Rotaciones infinitesimales. Al cabo de un tiempo infinitesimal ∆t, un punto del cuerpo se habr´ a desplazado una cantidad infinitesimal ∆~r = ~r(∆t) − ~r(0) = ~r(∆t) − ~r0 , respecto a los ejes espaciales. Por lo tanto: ~r(∆t) = ~r0 + ∆~r
(7.210)
Existe alguna matriz, con componentes infinitesimales, ˜ǫ(∆t), tal que: ∆~r = ǫ˜(∆t)~r0
(7.211)
Por lo cual: ~r(∆t) = (I˜ + ˜ǫ)~r0 = (I˜ + ǫ˜)~r(0)
(7.212)
La matriz I˜ + ǫ˜ describe c´ omo est´ an relacionadas las componentes del vector de posici´on de un punto del cuerpo r´ıgido en los sistemas de coordenadas espacial y del cuerpo r´ıgido, seg´ un la interpretaci´ on pasiva de la matriz de rotaci´on cuando los ejes fijos al cuerpo r´ıgido han rotado alrededor de un eje n ˆ un ´angulo δΦ en el sentido de la mano derecha. Desde el punto de vista activo, I˜ + ǫ˜ describe c´ omo cambia el vector de posici´on de un punto del cuerpo r´ıgido, en el sistema de coordenadas espacial, cuando se rota el cuerpo r´ıgido alrededor del eje n ˆ por un ´angulo δΦ seg´ un la regla de la mano izquierda. De acuerdo con esta u ´ltima interpretaci´ on, para Φ infinitesimal, A˜ = I˜ + ǫ˜ estar´ a dada por la ecuaci´ on (7.138): 1 C3 δΦ −C2 δΦ −C δΦ 1 C δΦ I˜ + ǫ˜ = (7.213) 3 1 C2 δΦ −C1 δΦ 1 donde C1 , C2 y C3 son los cosenos directores del eje de rotaci´on. De acuerdo con (7.210), (7.137) y (7.211), podemos escribir: ∆~r = ǫ˜~r0 = (~r0 × n ˆ )δΦ = −(ˆ nδΦ) × ~r0
(7.214)
Usando el tensor de Levi-Civita para expresar el producto vectorial: 3 X
ǫij x0j =
3 X 3 X
ǫijk x0j Ck δΦ
(7.215)
j=1 k=1
j=1
Como ~r0 es arbitrario, se debe cumplir: ǫij =
3 X
ǫijk Ck δΦ
(7.216)
k=1
Es decir, la matriz ˜ǫ es completamente antisim´etrica: ǫ˜T = −˜ ǫ y proporcional a δΦ. Las rotaciones infinitesimales pr´oximas a la identidad tienen la propiedad conmutativa: (I˜ + ǫ˜a )(I˜ + ǫ˜b ) =
I˜ + ǫ˜a + ˜ǫb + ǫ˜a ǫ˜b
(I˜ + ǫ˜b )(I˜ + ǫ˜a ) =
I˜ + ǫ˜b + ǫ˜a + ǫ˜b ǫ˜a
(7.217)
Cinem´atica del cuerpo r´ıgido / 243 Vemos que al primer orden en la cantidad infinitesimal δΦ las rotaciones conmutan. En general dos rotaciones finitas no conmutan. Tampoco conmuta una rotaci´on finita con una infinitesimal: ˜ I˜ + ǫ˜) = A(
˜ǫ A˜ + A˜
(I˜ + ˜ǫ)A˜ =
A˜ + ǫ˜A˜
(7.218) La rotaci´on inversa a I˜ + ǫ˜ es I˜ − ˜ǫ, al primer orden en δΦ: (I˜ + ǫ˜)(I˜ − ǫ˜) = I˜ − ǫ˜2
(7.219)
O sea que: ~r0 = (I˜ − ˜ ǫ)~r
(7.220)
Por tanto al primer orden en δΦ, ǫ˜~r = ǫ˜~r0 = ∆~r. Generadores infinitesimales del grupo de rotaciones. La matriz ˜ǫ puede escribirse en la forma siguiente, seg´ un (7.213): 0 0 −1 0 0 0 δΦ + C2 0 0 0 δΦ 0 0 1 ǫ˜ = C1 1 0 0 0 −1 0 (7.221) 0 1 0 δΦ −1 0 0 +C3 0 0 0 o tambi´en:
ǫ˜ =
3 X i=1
˜ i δΦ = (C1 eˆ2 ∧ eˆ3 + C2 eˆ3 ∧ eˆ1 + C3 eˆ1 ∧ eˆ2 )δΦ Ci G
(7.222)
˜ i se llaman los generadores infinitesimales del grupo de rotaciones. Las matrices G Satisfacen: 1 ~~ G ˆj ∧ eˆk i = ǫijk e 2
(7.223)
El conmutador de dos generadores obedece la siguiente propiedad: ˜i = ˜j − G ˜j G ˜iG G
3 X
k=1
˜k ǫijk G
(7.224)
244 / Mec´ anica cl´ asica avanzada Las ecuaciones (7.224) definen el ´algebra de Lie del grupo de rotaciones. Con esta notaci´ on podemos escribir a (7.214) como: 3
X d~r ˜ i ~r Ci G = dΦ i=1
(7.225)
Estas f´ ormulas, como hemos dicho, est´ an dentro de la interpretaci´ on activa de las rotaciones. Velocidad angular. Se define el vector velocidad angular como: d~r dΦ ⇒ = −~ω × ~r (7.226) dt dt El vector ~ ω est´ a situado en el eje de la rotaci´on. Esta direcci´ on se conoce como eje instant´ aneo de rotaci´ on: el eje n ˆ no cambia al realizar la rotaci´on infinitesimal por un angulo dΦ. Sin embargo el desplazamiento del cuerpo r´ıgido puede involucrar el cambio ´ del eje n ˆ . Por esta raz´ on ~ω no es en general la derivada temporal de alg´ un vector; en otras palabras, Ci dΦ no es el diferencial de alguna cantidad, a no ser que los Ci no cambien con el tiempo. ω=n ~ ˆ
C´ alculo de d~r/dt cuando n ˆ tambi´ en cambia con el tiempo. En este caso partimos directamente de la expresi´on: ˜ r0 ~r(t) = A(t)~
(7.227)
donde de la matriz A˜ convierte al vector ~r0 en el vector ~r. El vector ~r˙ estar´ a dado por: ˙˜r = A ˙˜A˜T ~r ~r˙ = A~ 0
(7.228)
Por otra parte, ~r0 = A˜T ~r nos da: ˙˜T ~r = −A˜A ˙˜T ~r ˙˜T ~r + A˜T ~r˙ ⇒ ~r˙ = −(A˜T )−1 A 0=A
(7.229)
˙˜T = A ˙˜A˜T ˜ = −A˜A Ω
(7.230)
˙˜T = −(A ˙˜A˜T )T = −Ω ˜ = −A˜A ˜ Ω
(7.231)
˜ as´ı: Definimos la matriz Ω
˜ r0 . Adem´as: De (7.228) y (7.229) vemos que ~r = Ω~
˜ es una matriz antisim´etrica. Sus elementos son entonces de la forma: Por tanto Ω Ωij =
3 X
ǫijk ωk
(7.232)
k=1
Entonces (7.228) se puede escribir como: x˙ i = (Ω~r)i =
3 X 3 X
j=1 k=1
ǫijk ωk xj = (~r × ~ω)i = −(~ω × ~r)i
(7.233)
Cinem´atica del cuerpo r´ıgido / 245 Por tanto: ~r˙ = −~ ω × ~r
(7.234)
Podemos expresar a ωi en t´erminos de las Ωij . Para ello multiplicamos (7.232) por ǫijl y sumamos sobre i, j: 3 3 X X
ǫijl Ωij =
3 X 3 X
ǫijl ǫijk ωk
(7.235)
i=1 k=1
i=1 j=1
Ahora usamos la siguiente propiedad de la densidad de Levi-Civita: 3 3 X X
ǫijl ǫijk = 2δlk
(7.236)
i=1 j=1
con lo cual llegamos a: 3
ωl =
3
1 XX ǫijl Ωij 2 i=1 j=1
(7.237)
˜ (7.230), obtenemos: Usando la definici´on de Ω, 3
ωl =
3
3
1 XXX ˙ Aik Ajk ǫijl 2 i=1 j=1
(7.238)
k=1
donde ~ ω es la velocidad angular de rotaci´on del cuerpo r´ıgido en el sistema de coordenadas espacial, de acuerdo con la interpretaci´ on activa de las rotaciones que estamos utilizando. La ecuaci´ on (7.238) permite hallar las componentes de ω en t´erminos de la ˜ representaci´on que se tenga de la matriz A. ˜ Notamos En t´erminos de los par´ ametros Ci y Φ, usamos la expresi´on (7.138) para A. que los elementos de A˜ son de la forma:
Aij = δij cos Φ + Cj Ck (1 − cos Φ) +
3 X
ǫjkl Cl senΦ
(7.239)
l=1
Con lo cual A˙ ik es: 3 X d ˙ + d [Ci Ck (1 − cos Φ)] + A˙ ik = −δik senΦ Φ ǫjkm (Cm senΦ) dt dt m=1
(7.240)
246 / Mec´ anica cl´ asica avanzada Como ATkj = Ajk , podemos escribir: 3 X
k=1
d A˙ ik Ajk = −δik senΦ cos Φ Φ˙ + cos Φ [Ci Cj (1 − cos Φ)]+ dt 3 X
ǫijm cos Φ
m=1
Cj
d ˙ (Cm senΦ) − Ci Cj (1 − cos Φ)senΦ Φ+ dt
d [Ci n ˆ (1 − cos Φ)] · n ˆ (1 − cos Φ)+ dt
3 X
d ǫikm (Cm senΦ)Cj Ck (1 − cos Φ)− dt m=1 3 X
˙ + ǫjil Cl sen2 Φ Φ
l=1
3 X
3 X l=1
ǫjkl
d [Ci Ck (1 − cos Φ)]Cl senΦ+ dt
(δji δlm − δjm δli )Cl senΦ
l,m=1
(7.241)
d (Cm senΦ) dt
P3 donde hemos usado la conocida propiedad del tensor de Levi-Civita, l=1 ǫkij ǫklm = δil δjm − δim δjl . Las ecuaciones (7.241) se simplifican notando que n ˆ .n ˆ˙ = 0 y n ˆ×n ˆ=0y P3 ~ ~ ǫ A B = ( A × B) . Luego, al multiplicar por ǫ y sumar sobre i y sobre j, noijk i j k ikl k=1 tando adem´as que ǫijk se anula cuando tiene sub´ındices repetidos, obtenemos finalmente para ~ ω: ˙ +n ω=n ~ ˆΦ ˆ˙ × n ˆ (1 − cos Φ) + n ˆ˙ senΦ
(7.242)
En t´erminos de los par´ ametros de Euler, definidos en (7.139): ω = 2e0~e˙ − 2e˙ 0~e + 2~e˙ × ~e ~
(7.243)
Con la interpretaci´ on activa de las rotaciones, la velocidad angular que hemos obtenido nos permite hallar, por medio de (7.234), la forma en que cambia con el tiempo el vector de posici´on de un punto arbitrario del cuerpo r´ıgido. La velocidad angular en la interpretaci´ on pasiva de las rotaciones. En esta interpretaci´ on, ~r(t) es el vector de posici´on de un punto en el sistema de coordenadas espacial, y ~r en el sistema de coordenadas del cuerpo r´ıgido. En este caso: ~r(t) = A˜T (t)~r
(7.244)
y ~r˙ estar´ a dado por: ˜ r = −~ ~r˙ = Ω~ ω × ~r
(7.245)
Cinem´atica del cuerpo r´ıgido / 247 ahora ~ ω es la velocidad angular de los ejes unidos al cuerpo r´ıgido en el sistema de coordenadas espacial. El tratamiento es igual al anterior, con s´olo reemplazar a A˜ por A˜T : ˙˜ = A ˙˜T A˜ ˜ = −A˜T A Ω
(7.246)
donde A˜T se obtiene de (7.138) con s´olo reemplazar a Φ por −Φ. ~ω estar´ a dada en t´erminos de A˜ por: 3
ωl =
3
3
1 X X X ˙T Aik Akj ǫijl 2 i=1 j=1
(7.247)
k=1
Se obtiene entonces que: ω ~ = −ˆ nΦ˙ + n ˆ˙ × n ˆ (1 − cos Φ) − n ˆ˙ senΦ
(7.248)
y en t´erminos de los par´ ametros de Euler: ω ~ = −2e˙ 0~e + 2e0~e˙ + 2~e˙ × ~e
(7.249)
ahora n ˆ es el eje alrededor del cual giran los ejes coordenados unidos al cuerpo r´ıgido, y Φ es el ´ angulo de rotaci´on en el sentido de la regla de la mano derecha (contrario a las agujas del reloj). ~ ω puede tambi´en ser evaluada en t´erminos de los ´angulos de Euler. Para ello hay varias posibilidades de c´ alculo. (a) Considerar que ~ ω tiene componentes a lo largo de los ejes de las rotaciones sucesivas que definen los ´ angulos de Euler: ˙ ez ˙ ez + θˆ ˙eµ + ψˆ ω ~ = φˆ 1
(7.250)
Obviamente (7.250) permite hallar a ω ~ respecto a los ejes espaciales (x, y, z) o respecto a los ejes rotantes (x, y, z). Para hallar a ~ω respecto a los ejes espaciales, basta expresar a ~eµ1 y eˆz en t´erminos de (~ex , ~ey , ~ez ). Usando las expresiones (7.30), podemos escribir: ez ey + (ˆ eµ1 · eˆz )ˆ ex + (ˆ eµ1 · eˆy )ˆ eµ1 · eˆx )ˆ eˆµ1 = (ˆ = cos φ eˆx + senφ eˆy (7.251) eˆz = (ˆ ez · eˆx )ˆ ex + (ˆ ez · eˆy )ˆ ey + (ˆ ez · eˆz )ˆ ez = senθ senφ eˆx + senθ cos φˆ ey + cos θˆ ez donde en (7.251) hemos usado la ecuaci´ on (7.122). Las ecuaciones (7.251) permiten escribir a (7.250) en la forma: ˙ ez + (θsenθ ˙ ω = (φ˙ + cos ψ)ˆ ~ − ψ˙ senψ cos φ)ˆ ey + (θ˙ cos φ + ψ˙ senθ senφ)ˆ ex
(7.252)
248 / Mec´ anica cl´ asica avanzada De manera similar se obtiene para ~ω respecto a los ejes fijos al cuerpo r´ıgido: ~ω = (ψ˙ + φ˙ cos θ)ˆ ey ez + (φ˙ senθ cos ψ − θ˙ senψ)ˆ
(7.253)
+(φ˙ senθ senψ + θ˙ cos ψ)ˆ ex ˜ (b) La otra posibilidad de c´ alculo consiste en usar la ecuaci´ on que define a Ω, (7.246). A˜ se puede expresar como producto de tres rotaciones seg´ un (7.131). Por tanto: ˙˜ ˜ ˙˜ A˜ A˜ + A˜ A ˜ ˜ ˙˜ ˜ = A˜Tφ A˜Tθ A˜Tψ (A Ω ψ θ Aφ + Aψ Aθ Aφ ) ψ θ φ
(7.254)
˜ Usando la ortogonalidad de las matrices A: ˙˜ ˜ ˜ ˙˜ + A˜T A˜T A ˙˜ A˜ + A˜T A˜T A˜T A ˜ = A˜Tφ A Ω φ θ φ θ ψ ψ Aθ Aφ φ θ φ
(7.255)
˙˜ , ... ˜ φ = A˜T A Si llamamos Ω φ φ ˜T ˜T ˜ ˜ ˜ ˜ =Ω ˜ φ + A˜T Ω ˜ ˜ Ω φ θ Aφ + Aφ Aθ Ωφ Aθ Aφ Usando las definiciones (7.127) se llega f´acilmente a: 0 0 0 0 1 0 ˜ ˙ ˜ ˙ Ωφ = φ −1 0 0 Ωθ = θ 0 0 1 0 −1 0 0 0 0
0
1
˜ ψ = ψ˙ −1 0 Ω 0 0
0
(7.256)
(7.257)
0 0
con lo cual (7.256) conduce al resultado (7.252). (c) Otra v´ıa es expresar a ~ω en t´erminos de los ´angulos de Euler usando (7.249) y (7.142), lo cual se deja como ejercicio al lector. Las ecuaciones (7.252) y (7.253) muestran que no hay una relaci´on simple entre las componentes de ~ ω expresadas respecto a los ejes fijos al s´olido r´ıgido y respecto a los ejes espaciales. La ecuaci´ on (7.247) da las componentes de ω ~ respecto a los ejes espaciales. Llamaremos ~ω a la velocidad angular respecto a los ejes fijos al s´olido r´ıgido. Para hallar ˜ r , de (7.245). Como ~r = A˜T ~r, tenemos que: ~ empecemos por notar que ~r˙ = Ω~ ω ˜ A˜T ~r ~r˙ = Ω
(7.258)
De transformar ~r˙ a las coordenadas del s´olido r´ıgido obtenemos: ˜ A˜T ~r A˜~r˙ = A˜Ω
(7.259)
Cinem´atica del cuerpo r´ıgido / 249 Claramente A˜~r˙ no es ~r˙ , puesto que esta u ´ltima es cero. Usando (7.246) y la or˙˜T , matriz que llamaremos Ω ˜ que es Ω ˜ ˜ A˜ = A˜A togonalidad de A˜ obtenemos que A˜ Ω ˜ transformada a las coordenadas fijas al s´olido r´ıgido. La matriz Ω es antisim´etrica: T ˙˜ A˜T = −A˜Ω ˙˜A˜T = A( ˜ A˜T = −Ω ˜ =A ˜ A˜T A) ˜ Ω
(7.260)
por tanto puede expresarse como: Ωij =
3 X
ǫijk ω k
(7.261)
k=1
Esto conduce a: ˜~r = −ω ~ × ~r A˜~r˙ = Ω
(7.262)
Entonces se sigue que: 3
3
3
1 XXX ωl = ǫijk Aik A˙ Tkj 2 i=1 j=1
(7.263)
k=1
~ y ~ω en el punto de vista activo de Comparando a (7.238) y (7.263) vemos que ω las rotaciones son antiparalelas, como es de esperarse, o sea que, de acuerdo con (7.243): ~ = −2e0~e˙ + 2~ee˙ 0 − 2~e˙ × ~e ω
(7.264)
Usando (7.264) y (7.142) se obtiene el resultado (7.253). No existen en general, funciones λi (φ, θ, ψ) tales que: ωi =
d λi (φ, θ, ψ) dλ
(7.265)
Por ejemplo, si ω1 = λ˙ 1 se deber´ıa cumplir que: dλ1 ˙ dλ1 ˙ dλ1 ˙ φ+ θ+ ψ = θ˙ cos θ + ψ˙ senθ senφ dφ dθ dψ
(7.266)
y por tanto: dλ1 dλ1 =0; = cos φ ; dφ dθ
dλ1 = senθ senφ dψ
(7.267)
λ1 no existe puesto que: ∂ 2 λ1 ∂ 2 λ1 = 0 ; en tanto que = −senφ ∂θ ∂φ ∂φ∂θ ∂ 2 λ1 ∂ 2 λ1 = 0 ; en tanto que = cos θ senφ ∂ψ ∂θ ∂θ∂ψ ∂ 2 λ1 ∂ 2 λ1 = 0 ; en tanto que = sen θ cos φ ∂ψ ∂φ ∂φ∂ψ
(7.268)
250 / Mec´ anica cl´ asica avanzada La ecuaci´ on (7.265) se cumple solamente cuando φ = θ = 0 o sea cuando ω1 = 0. ˙ θ, ˙ ψ˙ (o de las derivadas Las componentes de ω ~ son combinaciones no integrables de φ, temporales de los par´ ametros usados para describir la rotaci´on), llamadas las derivadas de cuasicoordenadas, o seudocoordenadas. Las ecuaciones de Appell son las ecuaciones de movimiento cuando se usan seudocoordenadas para describir el sistema (v´ease el texto de Gantmacher, Lectures in analytical mechanics, secci´ on 10). El c´ alculo de ωi implica considerar desplazamientos infinitesimales alrededor de una posici´on dada del s´olido r´ıgido. Pero hay maneras diferentes de realizar esos desplazamientos. Como una rotaci´on finita no conmuta con una infinitesimal, depende del orden en que se efect´ uen las transformaciones. Es de esperarse que ωi sea una derivada total respecto al tiempo s´olo en el caso en que el desplazamiento infinitesimal sea alrededor del mismo eje de rotaci´on en que se hizo la rotaci´on finita. Por ejemplo, si A˜ = A˜φ ˙ y ǫ˜ = ˜ǫφ con θ = φ = 0, entonces ω1 = 0; ω2 = 0; ω3 = φ. Tasa de cambios temporales de un vector. Seguimos con el punto de vista ~ cambia con el tiempo en el sistema de pasivo de las rotaciones. Un vector arbitrario G ~ respecto a los ejes espaciales proviene coordenadas fijo al cuerpo r´ıgido. El cambio de G de dos efectos: de la rotaci´on del sistema de ejes del s´olido r´ıgido y de la rotaci´on ~ Es decir: intr´ınseca de G. ~ ~˙ dG = G dt cuerpo
~ dG
rotacional
cuerpo
=
~ −~ω × G
(7.269)
espacio
dt
En (7.269) ~ ω est´ a dada por (7.248), que es el negativo de la velocidad angular que usan algunos autores para describir las rotaciones desde el punto de vista pasivo y para ~ ~ los cuales dG = −~ω × G dt. rotacional
espacio
~ visto en los ejes espaciales es: Entonces el cambio en G ~ dG
espacio
~ = dG
cuerpo
~ − ~ω × Gdt
(7.270)
o tambi´en: ~ dG dt
!
~ dG dt
= espacio
!
cuerpo
~ − ~ω × G
(7.271)
~ es: La segunda derivada temporal de G ~ d2 G 2 dt
!
espacio
=
~ d2 G 2 dt
!
cuerpo
− 2~ω ×
~ −ω ~ +~ω × (~ω × G) ~˙ × G
~ dG dt
!
espacio
(7.272)
Cinem´atica del cuerpo r´ıgido / 251 La ecuaci´ on (7.270), y por tanto tambi´en (7.271) y (7.272), es v´alida s´olo cuando los ejes espaciales y del cuerpo r´ıgido coinciden instant´ aneamente. Para una posici´on arbitraria del cuerpo r´ıgido se cumple: ~ = G
~ A˜G
~˙ = G
˙˜G ~ + A˜G ~˙ A
~¨ = G
¨ ¨˜G ˙˜G ~ + 2A ~˙ + A˜G ~ A
(7.273)
~˙ y G ~¨ se pueden Las (7.273) pueden expresarse en funci´ on de ~ω . Los vectores G escribir respecto a los ejes espaciales as´ı: ˙˜G ~˙ = G ~ y ~˙ + A˜T A A˜T G
¨~ ¨˜G ˙˜G ~¨ = G ~ ~˙ + A˜T A A˜T G + 2A˜T A
(7.274)
˙˜ obtenemos: ˜ = −A˜T A, Usando la definici´on Ω ˜˙ = Ω ˜2 = Ω
˙˜T A ˙˜ − A˜T A ¨˜ −A ˙˜T A˜ −A˜T A ˙˜ = −A ˙˜T A ˙˜ ⇒ Ω ¨˜ ˜˙ = Ω ˜ 2 − A˜T A A
(7.275)
De (7.275) se sigue que: ~˙ = G ~˙ − Ω ˜G ~ A˜T G
(7.276)
¨~ ~¨ = G ˜G ~˙ + (Ω ˜ 2 − Ω) ˜˙ G ~ − 2Ω A˜T G Usando (7.245) obtenemos: ˜G ~ = −~ ~ Ω ω×G
(7.277)
T ˜˙ = d(Ω ˜ T )/dt = −Ω ˜˙ se sigue tambi´en que: Como Ω
˜˙ G ~ = −~ ~ Ω ω˙ × G Adem´as se cumple que: ˜ 2G ~ =Ω ˜ −~ ~ = −~ ~ Ω ω×G ω × −~ω × G
(7.278)
(7.279)
De (7.277) y (7.278) se obtiene para (7.276): ~˙ = G ~˙ + ~ ~ ω×G A˜T G ¨~ ~¨ = G ~˙ + ω ~ + ~ω˙ × G ~ + 2~ ω×G ~ × (~ω × G) A˜T G
(7.280)
252 / Mec´ anica cl´ asica avanzada Expl´ıcitamente las ecuaciones (7.280) se pueden escribir as´ı: ! ! i h dG ~ ~ d2 G ~ ˜ + ω ~ × G = A dt2 dt espacio
cuerpo
~ d2 G 2 dt
!
cuerpo
h d2 G ~ = A˜ 2 dt
!
espacio
+ 2~ω ×
~ dG dt
!
(7.281) espacio
i ~ + ~ω˙ × G ~ +~ω × (~ω × G)
˜ esto es, cuando Vemos que (7.271) y (7.272) coinciden con (7.281) cuando A˜ = I, escogemos los ejes de modo que coincidan instant´ aneamente. En particular, para el vector de posici´on de una part´ıcula movi´endose en el sistema de coordenadas fijo a la Tierra, siendo ~ω la velocidad angular de la Tierra respecto al ˜ sistema de ejes espacial, (7.281) nos da para A˜ = I: ~¨r = ~¨r + 2~ ω × (~r˙ − ~ω × ~r ) + ~ω × (~ω × ~r ) + ~ω˙ × ~r
(7.282)
= ~¨r + 2~ ω × ~r˙ − ~ω × (~ω × ~r) + ~ω˙ × ~r Como para la Tierra ~ω = −ˆ nΦ˙ podemos escribir: ˙ n × ~r˙ − Φ˙ 2 n ~¨r = ~¨r − 2Φˆ ˆ × (ˆ n × ~r)
(7.283)
~ = m~¨r y F~ = m~¨r se sigue que: Como F ~ = F~ − 2mΦˆ ˙ n × ~r˙ − mΦ2 n F ˆ × (ˆ n × ~r)
(7.284)
En el sistema de coordenadas rotante, fijo a la Tierra, la fuerza efectiva no es F~ = m~g sino que hay otros dos t´erminos de naturaleza inercial. El segundo es la fuerza de Coriolis y el tercero es la fuerza centr´ıfuga. La discusi´ on completa de estos efectos puede verse en el texto Classical mechanics de Goldstein, secci´ on 4-9, o en el texto F´ısica, vol. I de Alonso-Finn, secci´ on 6.5.
8 Din´ amica del cuerpo r´ıgido El fin de la din´ amica del cuerpo r´ıgido es describir la evoluci´ on del cuerpo r´ıgido, o sea, hallar las coordenadas generalizadas de rotaci´on en funci´ on del tiempo cuando son conocidas: (i) La distribuci´ on de masa del cuerpo r´ıgido en reposo y (ii) Las fuerzas y ligaduras que act´ uan sobre ´el. Cuando no hay ligaduras, los ´angulos de Euler constituyen un conjunto adecuado de coordenadas generalizadas independientes. Hay distintas formas de llegar a las ecuaciones de movimiento para los ´angulos de Euler: a partir del lagrangiano, por medio de tres constantes de movimiento o por medio de las ecuaciones de movimiento de Euler. Cu´ al forma se utiliza es algo que depende del problema particular.
8.1.
El tensor de inercia
Un cuerpo r´ıgido puede considerarse como un sistema de part´ıculas sometido a las ligaduras de que cualquier par de part´ıculas permanece siempre a la misma distancia una de la otra. En muchos casos es u ´til considerar una distribuci´ on continua de materia, de acuerdo con cierta funci´ on de densidad de masa ρ(~r). La masa total, para distribuciones discreta y continua respectivamente, es: M=
N X
mi ;
M=
i=1
Z
ρ(~r)d3~r
(8.1)
Las correspondientes expresiones para la energ´ıa cin´etica y el momento angular son: T =
N X 1 i=1
~ = L
N X i=1
2
2
mi~r˙ i ;
mi~ri × ~r˙ i ;
T =
Z
~ = L
1 ρ(~r)~r˙ 2 d3~r 2
(8.2)
Z
(8.3)
ρ(~r)~r × ~r˙ d3~r 253
254 / Mec´ anica cl´ asica Similarmente el torque total es: ~ = K
N X i=1
~ri × F~i ;
~ = K
Z
~r × F~ (~r) d3~r
(8.4)
donde F~ (~r) es la fuerza por unidad de volumen en el punto ~r. Las ecuaciones (8.2), (8.3) y (8.4) son cantidades evaluadas en el sistema de coordenadas espacial; es deseable expresarlas en funci´ on de las coordenadas del cuerpo r´ıgido. ~ la Supondremos que el cuerpo r´ıgido se translada a la vez que rota, siendo V velocidad de translaci´ on del origen de coordenadas fijo al cuerpo y ω ~ la velocidad angular de rotaci´on. Las f´ ormulas de transformaci´ on para la posici´on y la velocidad de un punto arbitrario son, seg´ un las f´ormulas (7.5), (7.244) y (7.245): ~ + AT ~r˙ − ~ω × ~r ′ ~r˙ = V
~r = V~ t + AT ~r ;
(8.5)
~ constante. El vector ~ω est´ Por simplicidad hemos tomado a V a dado por (7.248). Si el punto en consideraci´on es del cuerpo r´ıgido entonces se cumple que ~r˙ = 0. Constancia de ω respecto a diferentes sistemas de coordenadas fijos al cuerpo r´ıgido. Sean O1 y O2 dos puntos del cuerpo r´ıgido en los cuales se toma el ~1 y R ~ 2 son los vectores de origen de dos sistemas de coordenadas fijos al cuerpo r´ıgido. R ~ ~2 −R ~ 1 es el vector posici´on de O1 y O2 respecto a los ejes espaciales, de modo que R = R de posici´on de O2 respecto a O1 . Sea ~ω1 la velocidad angular de los ejes del cuerpo r´ıgido ~2 = R ~ +R ~1 y R ~1 = R ~2 − R ~ se con origen en O1 y ~ ω2 respecto a O2 . De las f´ormulas R sigue que: ~ 2 ~ 1 ~ ~ 1 ~ dR dR dR dR dR ~ ~1 × R (8.6) = + = + −ω dt dt dt dt dt esp
~ 1 dR dt
esp
esp
~ 2 dR = dt
esp
esp
~ dR − dt
esp
esp
~ 2 dR = dt
esp
1
~ dR ~ − ~2 × R +ω dt
en donde usamos los resultados de (7.269) y siguientes. Por tratarse de un cuerpo r´ıgido se sigue que: ~ ~ dR dR = =0 dt dt 1
(8.7)
2
(8.8)
2
Entonces obtenemos de (8.6) y (8.7): ~ 1 ~ 1 dR dR ~ + ~ω2 × R ~ ~1 × R = −ω dt dt esp
(8.9)
esp
Por tanto:
~ =0 (~ ω2 − ω~1 ) × R
(8.10)
Din´ amica del cuerpo r´ıgido / 255 ~ siendo λ arbitraria. Como esta expresi´on debe cumplirse Entonces ~ ω2 − ω~1 = λR, en el caso l´ımite en que el cuerpo r´ıgido est´e en reposo, λ debe anularse, por lo que se llega al resultado importante de que el vector ~ω es independiente del punto del cuerpo r´ıgido que se tome como origen del sistema de coordenadas fijo al cuerpo r´ıgido. Energ´ıa cin´ etica. La energ´ıa cin´etica respecto a los ejes espaciales, ecuaci´ on (8.2), puede descomponerse usando (8.5): h i 1X ~ 2 − 2V ~ · (~ ω × ~ri ) + (~ω × ~ri ′ )2 mi V 2 i=1 N
T =
(8.11)
Si escogemos el origen de coordenadas del sistema de coordenadas del cuerpo r´ıgido (que coincide con el origen de las coordenadas ~r ′ , seg´ un la figura 7.2) en el centro de masa, se cumple que: N X
′ ~ CM mi~ri ′ = M R =0
(8.12)
i=1
Entonces se sigue que: N
T =
1 ~2 1X mi (~ ω × ~ri ′ )2 MV + 2 2 i=r
(8.13)
Cuando los ejes del cuerpo r´ıgido coinciden instant´ aneamente con los espaciales, ~r = ~ri ′ , en vez de (8.13) podemos escribir: N
T =
2 1 ~2 1X ω × ~r i mi ~ MV + 2 2 i=r
(8.14)
La energ´ıa cin´etica, pues, consta de dos partes independientes: la energ´ıa cin´etica del centro de masa y la energ´ıa cin´etica de rotaci´on respecto al centro de masa. Como ~ω depende de la orientaci´on del cuerpo r´ıgido, seg´ un (7.252), se sigue que la energ´ıa cin´etica de rotaci´on depende de los ´angulos de Euler y sus derivadas temporales: ˙ θ, ˙ ψ) ˙ T = Ttraslacional + Trotacional (φ, θ, ψ, φ,
(8.15)
Es conveniente escribir a Trotacional de la siguiente manera. Usamos la expresi´on para el producto cruz en t´erminos del tensor de Levi-Civita: 2 ω × ~ri = ǫmnp ωn rip ǫmst ωs r it ~ (8.16) donde los ´ındices mudos m, n, p, s, t, toman los valores 1, 2, 3, que representan a x, y, z, y usamos la convenci´on de Einstein. El tensor de Levi-Civita tiene la propiedad: ǫmnp ǫmst = δns δpt − δnt δps de la cual se sigue que: 2 2 ~ · ~r i ω × ~ri = ω 2 r 2i − ω ~
(8.17)
(8.18)
256 / Mec´ anica cl´ asica La ecuaci´ on (8.18) permite escribir a Trotacional como: Trotacional =
N X 1 mi r2i δst − ris r it ωs ωt 2 i=1
(8.19)
Definimos el tensor de inercia as´ı: Ist =
N X i=1
mi (r 2i δst − r is r it )
(8.20)
o usando la notaci´ on di´adica, ecuaci´ on (7.45), N ~~ X mi r 2i ~~1 − ~r i r~i I=
(8.21)
i=1
~ donde ~1 es el di´adico unidad; vemos entonces que: 1 ~~ 1 ~ω · I · ~ω = ωs Ist ωt (8.22) 2 2 ~ ~ En la definici´on de I~ tomamos los ejes del cuerpo r´ıgido; I~ es el tensor de inercia respecto a los ejes del cuerpo r´ıgido con origen en el centro de masa. Sin embargo, cuando ~ = 0, T = Trotacional y la f´ormula (8.22) resulta aplicable tambi´en en el caso en que el V origen de coordenadas no est´e en el centro de masa. Trotacional =
Momento angular. El momento angular en el sistema de coordenadas espacial, ecuaci´ on (8.3), puede descomponerse en una parte del centro de masa y una parte respecto al centro de masa. Cuando los ejes ~r ′ y ~r coinciden instant´aneamente, el momento angular de rotaci´on alrededor del centro de masa es: ~ rotacional = L
N X i=1
N h 2 X i mi~r i × ω mi ~ω~ri − r i ω ~ × ~ri = ~ .~r i
(8.23)
i=1
Desarrollando el triple producto vectorial llegamos a una expresi´on que contiene el tensor de inercia: ~ rotacional = ~I~ · ~ω L (8.24) ~ rotacional son, usando los resultados de la secci´ o sea que las componentes de L on 7.3: ~ (Lrotacional )s = ~es · I~ · ~ω ;
s = 1, 2, 3
(8.25)
~ donde I~ es el tensor de inercia respecto a los ejes del cuerpo r´ıgido con origen en el centro de masa. Momentos de inercia y productos de inercia. Los elementos diagonales del tensor de inercia reciben el nombre de momentos de inercia: N 2 X ~~ mi ~r i − r 2is ; s = 1, 2, 3 Iss = ~es · I · ~es = (8.26) i=1
Din´ amica del cuerpo r´ıgido / 257 ~ Los elementos no diagonales de I~ reciben el nombre de productos de inercia (y a veces el de momentos centr´ıfugos respecto a los planos coordenados): Ist = −
N X
mi r is rit ;
s 6= t = 1, 2, 3
i=1
(8.27)
~~ I es un tensor sim´etrico, por lo tanto puede ser diagonalizado mediante una transformaci´ on de semejanza realizada por una matriz ortogonal, sus valores propios son reales y sus vectores propios son ortogonales, de acuerdo con conocidos teoremas del ´algebra de matrices.1 Momento de inercia respecto al eje de rotaci´ on. Por simplicidad tomaremos el caso en que el eje de rotaci´on instant´ aneamente est´ a fijo, de modo que ~ω est´ a dada por la f´ormula (7.226), ω ~ = ωˆ n. Entonces de acuerdo con (8.22), Trotacional puede escribirse como: T =
1 2 Iω 2
(8.28)
donde el n´ umero I est´ a definido as´ı: I =n ˆ·I·n ˆ = In ˆn ˆ=
N X i=1
h 2 i ˆ mi r 2i − ~ri · n
(8.29)
I se denomina el momento de inercia respecto al eje de rotaci´on. De manera similar puede calcularse el momento de inercia respecto a un eje arbitrario, que por supuesto ser´a diferente del I dado en (8.29). La componente de Lrotacional en la direcci´ on de n ˆ es: ~ ~ ·n Lnˆ = L ˆ=n ˆ · I~ · n ˆ
ω = Iω
(8.30)
~ rotacional al cuadrado es: La magnitud de L ~ ~ L2 = ~ ω · I~ · I~ · ω ~ 6= I 2 ω 2
(8.31)
~ ser´a distinto de Lnˆ ; en otras palabras, en general L ~ y ~ω no son o sea que en general L paralelos. De acuerdo con la definici´on elemental, el momento de inercia del cuerpo r´ıgido respecto al eje n ˆ depende de las distancias Ai de las part´ıculas al eje: In =
N X
A2i mi
(8.32)
i=1
De acuerdo con su definici´on: A2i = (~r i × n ˆ )2 = ~r i · n ˆ × ~ri × n ˆ 1 V´ ease
(8.33)
por ejemplo el texto de V. I. Smirnov, A course of higher mathematics, vol. III, numeral 40, Pergamon Press, 1964.
258 / Mec´ anica cl´ asica Utilizando un desarrollo similar al de las ecuaciones (8.16), (8.17) y (8.18): n ˆ × ~r i × n ˆ = ~ri − n ˆ n ˆ · ~r i (8.34)
Reemplazando (8.34) en (8.32) llegamos a: In =
N X i=1
h 2 2 i mi ~r i − ~r i .ˆ n
(8.35)
~ Si n ˆ es el eje de rotaci´on vemos que In coincide con I = n ˆ · I~ · n ˆ. Teorema de Steiner. Es un teorema que permite relacionar los momentos de inercia respecto a ejes diferentes. Se llama tambi´en el teorema de los momentos de inercia respecto a ejes paralelos. Si ~r es el vector de posici´on de la part´ıcula i respecto a los ejes del cuerpo r´ıgido con origen en el centro de masa y ~ri ′ respecto a los ejes ~ respecto al centro de masa, del cuerpo r´ıgido con un origen diferente O′ , colocado en R entonces: ~ + ~r i ′ ~r i = R
(8.36)
Manipulaciones simples nos conducen a la relaci´on: I ′ = I + M a2
(8.37)
donde a2 es: ~ ×n a2 = (R ˆ )2
(8.38)
y I ′ es el momento de inercia respecto a un eje paralelo a n ˆ que se separa de ´el una cantidad a. El teorema de Steiner para el tensor de inercia mismo es: ~~ ′ ~~ ~R ~ I = I + M R2~~1 − R (8.39)
~ ~ donde I~ es el tensor de inercia respecto al centro de masa y I~ ′ es el tensor de inercia ~ respecto a unos ejes del cuerpo r´ıgido con origen en R respecto al centro de masa. ~ ~~ Ejemplo 8.1.1 Expresar a I~ en t´erminos de R ı: i definida as´ 0 z i −y i ~~ ˜ i = −z i o sea : R 0 x R ˆm eˆn i i = ǫmnl xil e y i −xi 0
(8.40)
Utilizando la propiedad del tensor de Levi-Civita dada en (8.17), llegamos a la ~~ ~~ siguiente expresi´on par R i · Ri : ~~ ~~ ~ r i~r i − r 2i ~1 R i · Ri = ~
(8.41)
Din´ amica del cuerpo r´ıgido / 259 ~~ Se sigue entonces la siguiente expresi´on para I: N
X ~ ~ ~~ mi R i · R i I =−
(8.42)
i=1
Ejemplo 8.1.2 Hallar el lagrangiano para una placa uniforme rectangular r´ıgida horizontal que est´ a colocada sobre cuatro resortes iguales, para el caso en el cual el centro de la placa s´olo puede tener movimientos perpendiculares a la placa. La placa s´olo puede desplazarse verticalmente y girar de modo que el centro permanezca fijo. Entonces las correspondientes energ´ıas cin´eticas son: 1 1 ~~ M Z˙ 2 ; Trotacional = ~ω · I.~ ω (8.43) 2 2 Para una placa rectangular homog´enea r´ıgida usamos la f´ormula correspondiente a (8.21) para una distribuci´ on uniforme de masa: Z ~~ M 2~ ~ I= r I − ~r~r d2~r (8.44) A Ttraslacional =
donde A es el ´ area de la placa y d2~r el elemento diferencial de ´area. Tomando el plano x − y sobre la placa, con origen en el centro de la misma, y llamando 2a la longitud de la placa (direcci´on x) y 2b la anchura (direcci´on y), (8.44) toma la forma: Z Z M ~ ~~ (r2 I~ − ~r~r) dx dy (8.45) I= 4ab Con la elecci´on de coordenadas que hemos hecho, los productos de inercia se anulan ~~ (I es diagonal). Los momentos de inercia son: 1 1 1 M b2 ; Iyy = M a2 ; Izz = M (a2 + b2 ) (8.46) 3 3 3 En vez de tomar como coordenadas generalizadas de rotaci´on a los ´angulos de Euler ordinarios, con lo cual la velocidad angular estar´ıa dada por las f´ormulas (7.252) o (7.253), tomaremos los ´ angulos de rotaci´on alrededor de los tres ejes perpendiculares fijos a la placa. Esta es la llamada convenci´on “xyz” de los ´angulos de Euler; ver el final de la secci´ on 7.6. Las componentes de ~ω a lo largo de los ejes de las rotaciones sucesivas que definen los ´ angulos de Euler en la convenci´on “xyz” son: Ixx =
ω ~ = φ˙ eˆz + θ˙ eˆµ2 + ψ˙ eˆµ′1
(8.47)
Con lo cual se obtiene para las componentes de la velocidad angular respecto a los ejes del cuerpo r´ıgido:2 ~ω = (ψ˙ − φ˙ senθ)ˆ ex¯ + (θ˙ cos ψ + φ˙ cos θ senψ)ˆ ey
(8.48)
+(−φ˙ senψ + φ˙ cos θ cos ψ)ˆ ez¯ 2 Las componentes respecto a los ejes espaciales son (ψ˙ cos θ cos φ − θ˙ senφ, φ ˙ cos θ senφ + θ˙ cos φ, φ˙ − ˙ ψ senθ). V´ ease ap´ endice B del texto de Goldstein, Classical mechanics, 2a ed., Addison Wesley, 1980. ¯
260 / Mec´ anica cl´ asica En las f´ ormulas din´amicas hemos supuesto que los ejes espacial y de cuerpo r´ıgido coinciden instant´ aneamente. Por esto debemos tomar nulos los valores de los ´angulos de ~ coinciden instant´ Euler, con lo cual ω ~ yω aneamente: ω = φ˙ eˆz + θ˙ eˆy + ψ˙ eˆx ~
(8.49)
Entonces Trotacional ser´a: Trotacional =
1 1 1 ˙2 ψ Ixx + θ˙2 Iyy + φ˙ 2 Izz 2 2 2
(8.50)
˙ Con la convenci´on ordinaria para los a´ngulos de Euler aparecer´ an t´erminos en φ˙ ψ. La energ´ıa potencial en funci´ on de z y de los ´angulos de Euler es: V =
1 1 1 1 (4k)z 2 + (4k)(aθ)2 + (4k)(bψ)2 + (4k ′ )(a2 + b2 )φ2 2 2 2 2
(8.51)
En (8.51), k es la constante de estiramiento de los resortes, en tanto que k ′ es la constante asociada a los desplazamientos horizontales, en que no se estiran los resortes y por lo tanto k ′ no se puede expresar en funci´ on de k. El lagrangiano buscado es: L=
M 2 ˙2 1 |b ψ + a2 φ˙ 2 + (a2 + b2 )φ˙ 2 | + M z˙ 2 − 2kz 2 6 2 2 2
2
2
′
2
2
(8.52)
2
−2ka θ − 2kb ψ − 2k (a + b )φ
Vemos que z, φ, θ, ψ, son coordenadas normales.
8.2.
Diagonalizaci´ on del tensor de inercia
El tensor de inercia es sim´etrico, Ist = Its , con lo cual sus valores propios son reales y los vectores propios correspondientes a valores propios diferentes son ortogonales. En ~ depende general los productos de inercia no son nulos, o sea que cada componente de L de todas las componentes de ω ~: Ls = Is1 ω1 + Is2 ω2 + Is3 ω3 ;
s = 1, 2, 3
(8.53)
~ ser´a proporcional a la si se anulan los productos de inercia, cada componente de L respectiva velocidad angular y T ser´a una forma cuadr´atica en las componentes de ~ω sin t´erminos cruzados. ~ Como I~ es sim´etrico, siempre es posible hallar un sistema de coordenadas fijo al cuerpo r´ıgido en que sea diagonal. Esto se logra resolviendo el problema de valores ~~ propios y vectores propios para I: ~~ ~ ~α ; I · Xα = Iα X
α = 1, 2, 3
(8.54)
o en t´erminos de las componentes: 3 X t=1
Irt Xαt = Iα Xαr ;
r, α = 1, 2, 3
(8.55)
Din´ amica del cuerpo r´ıgido / 261 Vamos a admitir que los valores propios Iα puedan ser complejos. Entonces Iβ⋆ satisface: 3 X ⋆ ⋆ ⋆ Xβr = Iβ⋆ Xβt ; t, β = 1, 2, 3 (8.56) Itr r=1
⋆ Multiplicando a (8.55) por Xβr y a (8.56) por Xαt , sumando sobre r y t y restando los resultados obtenemos: 3 X 3 3 X 3 3 X X X ⋆ ⋆ ⋆ ⋆ ⋆ Irt Xαt Xβr − Itr Xβr Xαt = Iα Xαr Xβr Iβ r=1 t=1
t=1 t=1
r=1
(8.57)
−
3 X
⋆ Xαt Xβt
t=1
como Irt es real y sim´etrica, el lado izquierdo de (8.57) es nulo. El lado derecho puede escribirse como un producto escalar ordinario, quedando: ~α · X ~ ⋆ = 0 ; α, β = 1, 2, 3 (8.58) (Iα − Iβ⋆ )X β
~α ·X ~ ⋆ es real y positivo, que I ⋆ = Iα , Para α = β se sigue de (8.58), debido a que X α α ~α y X ~ β corresponden a valores propios o sea que los valores propios son reales. Cuando X ~ α normalizados diferentes, se sigue que son ortogonales. Escogiendo los vectores propios X ~ ~ β puede no ser a la unidad y notando que cuando ocurra que Iα = Iβ entonces Xα · X ~ 1, X ~2 y X ~ 3 , forman cero, pero que puede escogerse cero, obtenemos de esta manera que X una tr´ıada ortonormal de vectores unitarios: ~α · X ~ β = δαβ ; X α, β = 1, 2, 3 (8.59)
Analicemos m´as en detalle el caso en que ocurran valores propios degenerados, Iα = Iβ con α 6= β. De (8.58) se sigue que se debe cumplir, en el caso en que I1 6= I2 = I3 , ~1 · X ~2 = X ~1 · X ~ 3 = 0, pero no necesariamente se debe cumplir que X ~2 · X ~ 3 = 0. que X ~ Todos los vectores perpendiculares a X1 son vectores propios correspondientes al mismo valor propio I2 , formando un espacio bidimensional, o sea que s´olo hay dos vectores propios de I2 linealmente independientes, con lo cual podemos escoger cualquier par de vectores ortogonales, lo cual nos est´ a a su vez indicando que el s´olido r´ıgido posee ~ 1. simetr´ıa de rotaci´on alrededor del eje X ~α Los ejes principales y la transformaci´ on principal. Los vectores propios X constituyen un sistema de tres ejes cartesianos fijos al cuerpo r´ıgido, respecto a los cuales el tensor de inercia es diagonal. Estos ejes se llaman ejes principales de inercia. Los valores propios Iα se llaman momentos principales de inercia. En cualquier caso es posible hallar una transformaci´ on de coordenadas que nos permita pasar a los ejes principales. Tal transformaci´ on se llama transformaci´ on principal y consiste en una rotaci´on. De acuerdo con las f´ ormulas (7.30) y (7.60), las f´ormulas de transformaci´ on para los vectores unitarios y para el tensor de inercia ser´an: ~r = X
3 X s=1
αrs eˆs ;
′ Irs
3 X t,u
αrt αsu Itu ;
r, s = 1, 2, 3
(8.60)
262 / Mec´ anica cl´ asica donde αrs son los cosenos directores de la transformaci´ on. Vemos que las componentes de los nuevos vectores unitarios coinciden con los cosenos directores: Xrs = αrs ;
r, s = 1, 2, 3
(8.61)
Es decir, con los elementos de los vectores propios formamos una matriz que coincide con la matriz de la transformaci´ on principal siendo las filas de tal matriz formadas con las componentes de los vectores propios. Esta matriz es ortogonal. ~ r · eˆs y las Los cosenos directores tambi´en pueden escribirse en la forma αrs = X ~~ ~ ~ ′ ~ componentes del tensor de inercia en las formas Irs = Xr · I · Xs y Itu = eˆt · I~ · eˆu , con lo cual las ecuaciones (8.60) de la derecha quedan en la forma de la identidad siguiente: 3 X ~ s) ~ r · ~I~ · X ~s = ~ r · eˆt ) eˆt · ~I~ · eˆu (ˆ eu · X (8.62) X (X t,u=1
Como
′ Irs
es diagonal, podemos escribir:
′ ~ r · ~I~ · X ~ s = Is δrs ; =X Irs
r, s = 1, 2, 3
(8.63)
~ 3 = ~~1, obtenemos ~2 + X ~ 3X ~1 + X ~ 2X ~ r, X ~ 1X Usando la completidad de los vectores X ~~ ~ r y sumando sobre r la ecuaci´ al multiplicar a (8.63) por X on de valores propios para I. En t´erminos de componentes la ecuaci´ on de valores propios es (8.55): 3 X t=1
(Irt − Iα δrt )Xαt = 0 ;
r, α = 1, 2, 3
(8.64)
El anterior es un sistema de tres ecuaciones homog´eneas en las inc´ ognitas Xαt , que admite soluciones no triviales solamente si los Iα tienen un valor tal que se anule el determinante de la matriz de los coeficientes: ~~ ~ ~ det I − Iα 1 = 0 (8.65) que en forma expl´ıcita es: Ixx − Iα Ixy Ixy Iyy − Iα det Ixz Iyz
Ixz Iyz Izz − Iα
=0
(8.66)
La ecuaci´ on (8.66) es c´ ubica en Iα , que tendr´a tres ra´ıces reales seg´ un hemos visto; esta ecuaci´ on se llama ecuaci´ on secular. Un cuerpo r´ıgido cuyos tres momentos principales de inercia son diferentes es asim´etrico. Si por ejemplo I1 = I2 6= I3 , el ~ 3 . Por simetr´ıa de rotaci´on cuerpo tiene simetr´ıa de rotaci´on alrededor del eje principal X entendemos una rotaci´on que deja inalterado el tensor de inercia; tal rotaci´on puede ~~ representarse mediante cierto di´adico ortogonal R. ~~ ~~ ~~ −1 ~~ R ·I ·R = I
(8.67)
Din´ amica del cuerpo r´ıgido / 263 Mediante (8.67) la ecuaci´ on de valores propios para I1 puede escribirse como: ~~ ~~ ~~ −1 ~ ~~ ~ ~ ~1 = R · I · R · X1 = I1 X I · X1 = I1 X
(8.68)
~~ o por la ortogonalidad de R: ~~ −1 ~ ~~ ~~ −1 ~ · X1 ) I · R X1 = I · (R
(8.69)
~~ ~ ~1 y R Las ecuaciones (8.68) y (8.69) nos dicen que los vectores X X1 son vectores ~~ propios de I con el mismo valor propio I1 ; estos dos vectores no necesariamente son ortogonales pero s´ı son linealmente independientes y permiten escribir cualquier vector ~ 3 . Si I1 = I2 = I3 se dice que el cuerpo en el plano perpendicular al eje de simetr´ıa X ~~ r´ıgido es esf´erico; en este caso I ser´a diagonal respecto a cualquier sistema de ejes del cuerpo r´ıgido con origen en el centro de masa. Ejemplo 8.2.1 Sea un cuerpo r´ıgido formado por once masas discretas iguales distribuidas como se muestra en la figura 8.1. Las ocho masas del plano est´ an sobre una circunferencia de radio a, con un ´ angulo entre s´ı de 45o . Las masas del eje est´ an a una distancia a del centro de la circunferencia. Al rotar el cuerpo alrededor del eje un ´angulo 2π/8, coincide consigo mismo; se dice que posee un eje de simetr´ıa de orden 8. Sobre el plano hay tambi´en cuatro ejes de simetr´ıa de orden 2. Calcular las componentes del tensor de inercia para este cuerpo y mostrar que dos momentos principales de inercia son iguales. z y
x
Figura 8.1 Cuerpo r´ıgido formado por once masas discretas iguales. Podemos elegir los ejes del cuerpo r´ıgido de modo que coincidan con la posici´on de algunas de las masas, digamos, tomando el plano x − y en el plano de la figura y el eje z
264 / Mec´ anica cl´ asica a lo largo del eje de simetr´ıa. Con esta elecci´on se anulan los productos de inercia o sea que dichos ejes forman un conjunto de ejes principales y los momentos de inercia ser´an tambi´en momentos principales de inercia. Los valores de los Iα son: I1 = Ixx = 6ma2 ;
I2 = Iyy = 6ma2 ;
I3 = Izz = 8ma2
(8.70)
Vemos que ninguno de los tres momentos principales de inercia es mayor que la suma de los otros dos y que los momentos principales respecto a los ejes del plano de simetr´ıa son iguales. Se puede demostrar que si en vez de x − y se toma cualquier par de ejes en ese plano, perpendiculares o no entre s´ı, el tensor de inercia resulta diagonal, siempre que un eje pueda obtenerse a partir del otro eje mediante una de las operaciones de simetr´ıa del cuerpo. Es decir, cualquier par de ejes no colineales que hagan entre s´ı un ´angulo que sea un m´ ultiplo de 2π/8, forma parte del conjunto de ejes principales del cuerpo. Usando el lenguaje de la teor´ıa de grupos, decimos que el cuerpo r´ıgido posee un grupo de simetr´ıas de orden 8, el grupo puntual D4 , que consta de cuatro rotaciones alrededor del eje de simetr´ıa de orden 8, y cuatro rotaciones de π alrededor de ejes horizontales. Adem´as posee un conjunto de simetr´ıas de reflexi´on en planos horizontales y verticales. El conjunto de los vectores propios correspondientes al valor propio degenerado I1 constituye una representaci´on irreductible del grupo de simetr´ıas D4 .3 El elipsoide de inercia. Sea n ˆ el vector unitario que define una direcci´ on cualquiera. El momento de inercia respecto al eje n ˆ es: 3 X ~ I =n ˆ · I~ · n ˆ= nr Irs ns
(8.71)
r,s=1
donde nx , ny , nz , son los cosenos directores del eje (v´ease figura 8.2). Si tomamos un punto cualquiera sobre el eje, estar´ a descrito respecto al centro de masa por el vector de posici´on ~r = (x, y, z) = r(nx , ny , nz ); por lo tanto si multiplicamos por r2 ambos lados en (8.71) obtenemos: In r2 = Ixx x2 + Iyy y 2 + Izz z 2 + 2Ixy xy + 2Ixz xz + Iyz yz
(8.72)
Ahora consideremos un conjunto de ejes que pasen por el centro de masa. Entonces podemos hallar el lugar geom´etrico de los puntos ~r para los cuales In r2 toma el mismo valor. Este lugar geom´etrico es una superficie elipsoidal llamada el elipsoide de inercia o elipsoide de momentos de inercia. Es claro que eligiendo adecuadamente el sistema de coordenadas fijo al cuerpo r´ıgido4 se obtiene la ecuaci´ on est´ andar para un elipsoide: x2 y2 z2 + 2 + 2 =1 2 a b c
(8.73)
3 V´ ease el cap´ıtulo de teor´ıa de la simetr´ıa en el libro de Mec´ anica cu´ antica no relativ´ıstica de LandauLifshitz. 4 Que coincide instant´ aneamente con el sistema de coordenadas espacial.
Din´ amica del cuerpo r´ıgido / 265 La ecuaci´ on (8.73) se identificar´a con (8.72) si se satisfacen las relaciones: a2 =
In r2 ; I1
I1 = Ixx ;
b2 =
In r2 ; I2
I2 = Iyy ;
c2 =
In r2 ; I3
I3 = Izz ;
(8.74)
Irs = 0
si r 6= s
Es claro que tal sistema de coordenadas coincide con el sistema de ejes principales ortogonales del cuerpo r´ıgido y que I1 , I2 , I3 , coinciden con los momentos principales de inercia.
Cuerpo rígido
r n
Elipsoide de inercia: In r 2 = constante
Figura 8.2 Superficie elipsoidal
El elipsoide de inercia es una superficie de la forma: F (x, y, z) = 0
(8.75)
La normal a F en un punto es el gradiente de F en ese punto. En los ejes principales de un elipsoide el gradiente es paralelo al eje: ∂F = Kn ˆ ∂~r En forma expl´ıcita (8.76) es:
(8.76)
∂F = 2xIxx + 2yIxy + 2zIxz = Knx ∂x ∂F = 2xIxy + 2yIyy + 2zIyz = Kny ∂y
(8.77)
∂F = 2xIxz + 2yIyz + 2zIzz = Knz ∂z Si estas ecuaciones las dividimos por 2r, luego multiplicamos la primera por nx y la tercera por nz , el resultado que se obtiene al sumarlas coincide con (8.72) si la constante
266 / Mec´ anica cl´ asica K se identifica con K = 2rIn . Entonces (8.77) coincide con el siguiente sistema de ecuaciones: (Ixx − In )nx + Ixy ny + Ixz nz = 0 Ixy nx + (Iyy − In )ny + Iyz nz = 0
(8.78)
Ixz nx + Iyz ny + (Izz − In )nz = 0 O sea que las ecuaciones (8.76), (8.77) y (8.78) nos dan los ejes principales y los momentos principales de inercia, ya que los ejes principales de inercia coinciden con los ejes principales del elipsoide de inercia. La construcci´ on del elipsoide de inercia permite interesantes an´alisis cualitativos del movimiento del cuerpo r´ıgido. Es la base de la representaci´on de Poinsot para el estudio del movimiento de un cuerpo r´ıgido no sometido a torques. Ejemplo 8.2.2 ¿Cu´ al es la relaci´on entre el di´ametro y la altura de un cilindro circular recto tal que el elipsoide de inercia en el centro del cilindro es una esfera? Tomamos el origen en el centro de masa. En virtud de la simetr´ıa de rotaci´on, cualquier par de ejes perpendiculares al eje y del cilindro forman un sistema de ejes principales. El momento de inercia Izz = I3 , siendo z el eje del cilindro, es: Z Z Z M I3 = (y 2 + x2 ) d3~r (8.79) V donde M es la masa total y V el volumen. Tomando el elemento de volumen como un anillo cil´ındrico de radios ρ y ρ + dρ y altura dl: d3~r = 2πρ dρ dl
(8.80)
Entonces una integraci´ on elemental nos lleva a: I3 =
1 M R2 2
siendo R el radio de la circunferencia de la base del cilindro. El momento de inercia Ixx = I1 es: Z Z Z M I1 = (z 2 + y 2 ) d3~r V
(8.81)
(8.82)
En las dos integrales que aparecen en (8.79) y (8.82) es c´ omodo tomar respectivamente los siguientes elementos de volumen: p (8.83) d3~r = πr2 dz y d3~r = 2lx dy = 2l R2 − y 2 dy Entonces obtenemos para I1 , que adem´as ser´a igual a I2 : 2 1 l I1 = M + R2 4 3
(8.84)
Din´ amica del cuerpo r´ıgido / 267 El elipsoide de inercia ser´a una esfera si I1 = I2 = I3 , de acuerdo con las f´ormulas (8.74). De (8.81) y (8.84) se sigue entonces que: l2 = 3R2
(8.85)
Ejemplo 8.2.3 Tres masas iguales est´ an en los puntos (a, 0, 0), (0, a, 2a) y (0, 2a, a), hallar los momentos principales de inercia y un conjunto de ejes principales respecto al origen de coordenadas. Los elementos del 5 0 ~~ 0 3 I= 0 −2
tensor de inercia para este problema son: 0 −2 2ma2 3
El valor del determinante secular, ecuaci´ on (8.66), es: ~ ~ det I~ − I~1 ⇒ (5 − i)[(3 − i)2 − 4] = 0
(8.86)
(8.87)
donde hemos llamado: i=
I 2ma2
(8.88)
Las tres ra´ıces de la ecuaci´ on secular son entonces i = 5, 5, 1, con lo cual los tres momentos principales de inercia valen: I1 = 2ma2 ;
I2 = 10ma2 ;
I3 = 10ma2
(8.89)
~ ~ ~ ıcitamente son: Las ecuaciones de valores propios son ~i · X α = iα Xα , que expl´ (5 − iα )Xα1 = 0; (3 − iα )Xα2 − 2Xα3 = 0; −2Xα2 + (3 − iα )Xα3 = 0 ~ 1: X
(8.90)
Para i1 obtenemos las siguientes relaciones entre los componentes del vector propio X11 = 0 ;
X12 = X13
(8.91)
~ 1 normalizado a la unidad es entonces: El vector propio X ~ 1 = 0, √1 , √1 X 2 2
(8.92)
Para la ra´ız doble i2 = i3 = 5 las relaciones entre los componentes de los vectores ~ 2, X ~ 3 , son: propios X 0.Xα1 = 0 ;
Xα2 = −Xα3 ;
α = 2, 3
(8.93)
Vemos que los Xα1 pueden asignarse arbitrariamente, ya que la condici´on de normalizaci´ on s´olo nos permite expresar a Xα2 en funci´ on de Xα1 . Este comportamiento es caracter´ıstico de los problemas de valores propios cuando hay degeneraci´on. Una pareja
268 / Mec´ anica cl´ asica posible de vectores propios normalizados y ortogonales correspondientes al valor propio degenerado i2 = i3 = 5 es: 1 1 ~ 3 = (1, 0, 0) ~ √ √ ; X (8.94) X2 = 0, − , 2 2 La matriz de la correspondiente transformaci´ on principal es: 1 1 √ √ 0 2 2 1 A˜T = 0 − √1 √ 2 2 1
0
(8.95)
0
~ 1 se puede construir Es claro que con cualquier par de ejes perpendiculares a X igualmente un sistema de ejes principales respecto al origen de coordenadas (v´ease figura 8.3). Otro problema ser´ıa hallar los momentos principales y los ejes principales respecto al centro de masa que est´ a localizado en el punto: a ~ = R , a, a (8.96) 3 z
m
m x2 x1
x
m
y
x3
Figura 8.3 Ejes principales de sistema de masas puntuales
8.3.
Las ecuaciones de movimiento de Euler
Vamos a suponer que el cuerpo r´ıgido no tiene ligaduras adicionales a la de poderse mover s´olo de modo que un punto permanezca fijo; entonces los ´angulos de Euler son coordenadas generalizadas para la descripci´on del movimiento del cuerpo r´ıgido.
Din´ amica del cuerpo r´ıgido / 269 El lagrangiano del cuerpo r´ıgido. La energ´ıa cin´etica es puramente rotacional y est´ a dada por la ecuaci´ on (8.22). La energ´ıa potencial depender´a de la orientaci´on del cuerpo, con lo cual la lagrangiana ser´a: ˙ θ, ˙ ψ) ˙ = 1 (I1 ω 2 + I2 ω 2 + I3 ω 2 ) − V (φ, θ, ψ) L(φ, θ, ψ; φ; x y z 2
(8.97)
donde se supone que los ejes fijos al cuerpo r´ıgido son ejes principales. Las fuerzas generalizadas de este problema son: Fφ = −
∂V ; ∂φ
Fθ = −
∂V ; ∂θ
Fψ = −
∂V ∂ψ
(8.98)
Fφ , Fθ y Fψ representan respectivamente el torque externo alrededor del eje espacial z, el torque alrededor de la l´ınea de nodos y el torque alrededor del eje principal del cuerpo r´ıgido z. Las ecuaciones de movimiento de Euler. Son las ecuaciones de movimiento. La ecuaci´ on de Lagrange que contiene el torque alrededor de la coordenada z del cuerpo r´ıgido es: ∂T ∂V d ∂T − =− = Kz dt ∂ ψ˙ ∂ψ ∂ψ
(8.99)
~ obtenemos que: Recordando las f´ ormulas (7.253) para las componentes de ω ∂T ∂ωx ∂T ∂ωy ∂T = + = ωx ωy (I1 − I2 ) ∂ψ ∂ωx ∂ψ ∂ωy ∂ψ
(8.100)
Por otra parte: ∂T ∂T ∂ωz ∂T = I3 ωz = = ˙ ˙ ∂ω ∂ω ∂ψ z ∂ψ z
(8.101)
Entonces la ecuaci´ on de Lagrange (8.99) toma la forma: I3 ω˙ z − ωx ωy (I1 − I2 ) = Kz
(8.102)
La ecuaci´ on (8.102) no depende de las coordenadas generalizadas espec´ıficas que se usen para describir el movimiento; en particular no depende de la convenci´on usada para definir los ´ angulos de Euler, ya que esta s´olo influye en las expresiones para las ω. Si hubi´eramos usado convenciones para los ´angulos de Euler en que componentes de ~ se intercambiaran los papeles de los ejes z y x, y z y y respectivamente, las ecuaciones de movimiento ser´ıan en vez de (8.102), las siguientes: I2 ω˙ y − ωx ωz (I3 − I1 ) =
Ky
I1 ω˙ x − ωy ωz (I2 − I3 ) =
Kx
(8.103)
Por tanto las ecuaciones (8.102) y (8.103) son tres ecuaciones diferenciales independientes que no dependen de la convenci´on usada para definir los ´angulos de Euler. En la convenci´on adoptada en el numeral 7.6, las ecuaciones (8.103) no son las ecuaciones
270 / Mec´ anica cl´ asica de lagrange para φ y θ, en tanto que (8.102) es la ecuaci´ on de Lagrange para ψ. No vale tampoco que Fφ y Fθ correspondan a Ky y Kx pues como digimos representan el torque alrededor de z, Kz , y el torque alrededor de la l´ınea de nodos, Kµ1 , respectivamente. Una deducci´ on m´as simple de las ecuaciones de Euler es la siguiente: el torque total ~ respecto a los ejes espaciales: es igual a la rata de cambio temporal de L ~ d L ~ = K (8.104) dt esp
~ respecto a los ejes rotantes se introduce mediante la f´ormula: La derivada de L ~ ~ dL dL ~ (8.105) = + ~ω × L dt dt esp
rot
donde hemos tomado los ejes coincidiendo instant´ aneamente. Las ecuaciones (8.104) y (8.105) nos dan: dLr + ǫr st ωs ωt Lt = Kr ; dt
r = 1, 2, 3
(8.106)
Como escogemos los ejes rotantes coincidiendo con los ejes principales se cumple que Lr = Ir ωr , de modo que obtenemos de (8.106) directamente las ecuaciones de Euler: Ir ω˙r + ǫr st ωs ωt Is = Kr ;
r = 1, 2, 3
(8.107)
Principales casos en que las ecuaciones de Euler se pueden reducir a cuadraturas. Las ecuaciones de Euler han sido reducidas a cuadraturas para valores arbitrarios de las constantes de movimiento en los siguientes casos: (a) El punto fijo es el centro de gravedad del cuerpo, de modo que no hay torques externos. Los valores de los momentos de inercia son arbitrarios. Es el problema del cuerpo r´ıgido libre. Para el cuerpo r´ıgido asim´etrico (I1 6= I2 6= I3 ) el problema se reduce a cuadraturas en t´erminos de funciones el´ıpticas y fue resuelto por Euler en 1758. Para el cuerpo r´ıgido sim´etrico (I1 = I2 6= I3 ) la soluci´on est´ a dada en t´erminos de funciones trigonom´etricas. Para el cuerpo libre esf´erico (I1 = I2 = I3 ) la soluci´on es trivial. (b) El caso en que dos momentos principales de inercia alrededor de un punto del cuerpo que no coincide con el centro de masa y fijo en el espacio son iguales (trompo sim´etrico con un punto fijo). Tanto el punto fijo como el centro de masa est´ an sobre el eje de simetr´ıa. No hay torques de fricci´on en el punto fijo y el u ´ nico torque es producido por un campo gravitatorio homog´eneo. El problema se reduce a cuadraturas en t´erminos de funciones el´ıpticas y fue resuelto por Lagrange en 1788. (c) En 1887 la se˜ nora S.V. Kovalevski hall´o otro ejemplo soluble. Es el caso en que dos momentos principales de inercia alrededor del punto fijo que no coincide con el centro de masa son iguales entre s´ı, y dos veces m´as grandes que el tercero (I1 = I2 = 2I3 ). Adem´as, el centro de masa est´ a sobre el plano formado por los ejes principales correspondientes a los momentos principales iguales, y el u ´ nico torque externo es el de la gravedad. La soluci´on est´ a expresada en t´erminos de las funciones hiper-el´ıpticas.
Din´ amica del cuerpo r´ıgido / 271 Ejemplo 8.3.1 Sea un sistema de ejes primados que coinciden en el origen con un sistema de ejes inercial pero que rota con respecto a los ejes inerciales con una velocidad angular fija ω ~ 0 . Hallar las ecuaciones de movimiento de Euler para un cuerpo r´ıgido que se mueve respecto a este sistema de ejes rotantes en el caso en que no haya torques externos, V = 0. El lagrangiano del sistema, considerado como un sistema de part´ıculas, es: N
L=
1 X ˙2 mi~ri 2 i=1
(8.108)
Transformemos primero el lagrangiano de los ejes espaciales a los ejes rotantes, usando f´ ormulas de la secci´ on 7.8. Llamemos A˜ a la matriz de rotaci´on de los ejes rotantes respecto a los ejes espaciales, m´as adelante usaremos la notaci´ on A˜′ para denotar la matriz de rotaci´on de los ejes del cuerpo r´ıgido respecto a los ejes rotantes. La velocidad ˜ ′ + A˜′ Ω ˜Ω ˜ ′T y por esto no podemos decir a priori que el vector velocidad angular total es Ω angular sea ω ~ +~ ω0 . Si ~r ′ es el vector de posici´on en los ejes rotantes, sabemos que: ˜r ; ~r ′ = A~
˙˜T ~r˙ ′ + A˜T ~r˙ ′ ~r˙ = A
(8.109)
de modo que: 2 ˙˜A ˙˜T ~r ′ ˙˜A˜T ~r˙ ′ + ~r˙ ′T A˜A ˙˜T ~r ′ + ~r ′T A ~r˙ = ~r˙ ′T A˜A˜T ~r˙ ′ + ~r ′T A
(8.110)
˜ ′ y las propiedades de A: ˜ Usando la siguiente definici´on de Ω 0 A˜A˜T = I˜ ;
˙˜A˜T + A˜A ˙˜T = 0 ; A
˙˜A˜T ; ˜′ = A Ω 0
˙˜A ˙˜T ˜ ′2 = −A Ω 0
(8.111)
llegamos a: 2 ˜ ′0 ~r˙ ′ − ~r ′T Ω ˜ ′2 r′ ~r˙ = ~r˙ ′2 + 2~r ′T Ω 0 ~
(8.112)
˜ ′0 en t´erminos del vector velocidad Expresando ahora la matriz antisim´etrica Ω angular respecto a los ejes rotantes: ˜ ′ ~r ′ = −~ Ω ω0′ × ~r ′ ; 0
˜ 2~r ′ = ω Ω ~ 0′ × (ω0′ × ~r ′ ) 0
(8.113)
Entonces podemos escribir a (8.112) como: 2 2 ~r˙ = ~r˙ ′ − 2~ ω0′ · (~r˙ ′ × ~r ′ ) − ω ~ 0 · [(~ω0′ × ~r ′ ) × ~r ′ ]
La ecuaci´ on (8.114) puede llevarse a la forma: 2 2 ~r˙ = ~r˙ ′ + 2~ ω0′ · (~r ′ × ~r˙ ′ ) + ω ~ 0′ · ~~1 × ~r ′2 − ~r ′~r ′ · ~ω0′
(8.114)
(8.115)
con lo cual llegamos a la siguiente expresi´on para L: ~ ~′ + 1ω ~ ′ · I~ · ~ω0 L = T′ + ω ~ 0′ · L 2 0
(8.116)
272 / Mec´ anica cl´ asica ~ ′ es el momento angular total respecto a los ejes rotantes e ~I~ es el momento de donde L inercia respecto a dichos ejes. Si ahora el cuerpo r´ıgido se mueve respecto a los ejes primados con velocidad angular ~ ω , es claro que: T′ =
1~ ~ ω · ~I · ~ω 2
(8.117)
~ donde ~I es el momento de inercia respecto a los ejes del cuerpo r´ıgido, que podemos tomarlos como ejes principales. Ahora se cumple que: ~r ′ = A˜′T ~r ;
~r = A˜′~r ′ ;
˙˜ ′ A˜′T ; ˜ =A Ω
˜ r = −~ω × ~r Ω~
(8.118)
˜ la matriz Ω ˜ ′0 respecto a los ejes del cuerpo r´ıgido: Llamamos adem´as Ω 0 ˜ ′ A˜′T ˜ = A˜′ Ω Ω 0 0
(8.119)
Entonces el segundo t´ermino de la derecha en (8.112) puede escribirse as´ı: ˙˜ ′T ~r = 2(ω ˜′ A ˜ ′0~r˙ ′ = 2~rT A˜′ Ω ~ 0 × ~r) · (~ω × ~r) 2~r ′T Ω 0 El tercer t´ermino de (8.115) puede escribirse como: ~ ~1(~r ′ · ~r ′ ) − ~r ′~r ′ = ~~1r 2 − A˜′T ~r ~rA˜′ = A˜′T ~~1r2 − ~r ~r A˜′
(8.120)
(8.121)
Con lo cual construimos el tensor de inercia respecto a los ejes del cuerpo r´ıgido. Finalmente, L toma la forma: L=
N X ~ ~ 1~ ~ ~ × ~r i + 1 ω ~+ ~0 ~ 0 · ~I · ω mi ~ω 0 × ~ri · ω ω·I ·ω 2 2 i=1
(8.122)
que a´ un puede transformarse en el segundo miembro para dar: L=
~ ~ 1~ ~ ~ + ~ω · ~I · ω ~0 + ω·I ·ω 2
1 ~ ~~ ~ ω0 · I · ω 0 2
(8.123)
Vamos a suponer que ω ~ 0′ est´ a en la direcci´ on del eje x′3 , de modo que las componentes de ~ω 0 ser´an: ~ 0 = (senθ senψ, senθ cos φ, cos θ)ω0 ω
(8.124)
Entonces los t´erminos que contienen a ~ω0 en (8.123) son de la forma: ~ ~ ~ · ~I · ~ω 0 + 1 ~ω0 · ~I · ~ω0 = ωx ω0 senθ senψ I1 ω 2 +ωy ω0 senθ cos ψ I2 + ωz ω0 cos θ I3 1 + (sen2 θ sen2 ψ I1 + sen2 θ cos2 ψ I2 + cos2 θI3 )ω02 2
(8.125)
Din´ amica del cuerpo r´ıgido / 273 La derivada parcial de (8.125) respecto a ψ es: ω0 (ωy senθ senψ + ωx senθ cos ψ + ω0 sen2 θ senψ cos ψ)I1 +ω0 (−ωx senθ cos ψ − ωy senθ senψ − ω0 sen2 θ cos ψ senψ)I2
(8.126)
= ω0 ωy senθ senψ(I1 − I2 ) + ω0 ωx senθ cos ψ(I1 − I2 ) +ω02 sen2 θ senψ cos ψ(I1 − I2 ) La derivada de estos t´erminos respecto a ψ˙ es I3 ω0 cos θ de modo que la ecuaci´ on de Lagrange para ψ es: (ωx ωy + ωy ω0 senθ senψ + ωx ω0 senθ cos ψ +ω02 sen2 θ senψ cos ψ)(I1 − I2 ) − (ω˙z − θ˙ ω0 senθ)I3 = 0
(8.127)
Esta ecuaci´ on podemos expresarla en t´erminos de las componentes de ~ω 0 : (ωx + ω0x )(ωy + ω0y )(I1 − I2 ) − (ω˙ z + ω˙ 0z )I3 = 0
(8.128)
Usando los mismos argumentos que en las ecuaciones (8.102) y (8.103), podemos concluir que las otras dos ecuaciones de Euler son: (ωx + ω0x )(ωz + ω0z )(I3 − I1 ) − (ω˙ y + ω˙ 0y )I2 =
0
(ωy + ω0y )(ωz + ω0z )(I2 − I3 ) − (ω˙ x + ω˙ 0x )I1 =
0
(8.129)
El resultado exhibe una dependencia “aditiva” con las velocidades angulares. Ejemplo 8.3.2 Si en el lagrangiano de un cuerpo r´ıgido se realiza el siguiente cambio de variables: ˙ θ, ˙ ψ) ˙ → (φ, θ, ψ; ω 1 , ω 2 , ω2 ) (φ, θ, ψ; φ,
(8.130)
encontrar las ecuaciones de Lagrange correspondientes a las nuevas variables, o sea las ecuaciones de Euler.5 De acuerdo con las f´ ormulas (7.253), las f´ormulas de transformaci´ on son: ω 1 = cos ψ θ˙ + senθ senψ φ˙ ; ω 2 = −senψ θ˙ + senθ cos ψ φ˙ ;
(8.131)
ω 3 = ψ˙ + cos θ φ˙ y las inversas: φ˙ = ψ˙ = 5 Ver
senψ ω 1 + cos ψ ω2 ; senθ
θ˙ = cos ψ ω1 − senψ ω2
− cot θ(senψ ω 1 + cos ψ ω 2 ) + ω3
el texto de Corben y Stehle, Classical mechanics, secci´ on 77, cap´ıtulo 13, 1960.
(8.132)
274 / Mec´ anica cl´ asica ˙ q˙2 = θ, ˙ q˙3 = ψ, ˙ estas f´ormulas pueden escribirse en forma de Si llamamos q˙1 = φ, matrices: ~ω = α ˜ ~q˙ ;
~ q~˙ = β˜ω
donde α ˜ y β˜ son:
senθ senψ
α ˜= senθ cos ψ cos θ
β˜ =
(8.133)
cos ψ
0
−senψ 0
0 1
senψ senθ
cos ψ senθ
cos ψ
−senψ
−senψ cot θ
− cos ψ cot θ
0
(8.134)
0 1
˜ ω) a L[q, q(ω)] Si llamamos L(q, ˙ obtenemos que: ˜ ˜ ∂αsu ∂L ∂L ∂L = + q˙u ∂qr ∂qr ∂ωs ∂qr
(8.135)
˜ d ∂L d ∂L = αsr dt ∂ q˙r dt ∂ωs
(8.136)
y que:
Multiplicando a (8.135) y (8.136) por βrt y sumando sobre r llegamos a la siguiente ˜ expresi´on para las ecuaciones de Lagrange en L: ˜ ∂αsu ˜ ∂L ∂L βrt + βrt βuυ ω υ = ∂qr ∂ωs ∂qr βrt
˜ ˜ ∂αsr d ∂L ∂L αsr + βuυ ωυ βrt dt ∂ω s ∂ωs ∂qu
(8.137)
Usando la propiedad α ˜ β˜ = I˜ obtenemos finalmente: ˜ ˜ ˜ ∂L d ∂L ∂L βrt − = γtυs ωυ ; ∂qr dt ∂ωt ∂ω s donde: γtυs =
∂αsr ∂αsu − ∂qu ∂qr
t = 1, 2, 3
βrt βuυ
(8.138)
(8.139)
Para nuestro caso, el lagrangiano est´ a dado por la ecuaci´ on (8.97): ~ ˜ ω) = 1 ω ~ · ~I · ω ~ − V (q) L(q, 2
(8.140)
Din´ amica del cuerpo r´ıgido / 275 y as´ı: ˜ ∂L ∂V =− = Kr ; ∂qr ∂qr
˜ ∂L = ωr Ir ∂ωr
(8.141)
Por tanto obtenemos de (8.138): Kr βrt − ω˙ t It =
3 X
γtυs ωυ ω s Is ;
t = 1, 2, 3
(8.142)
υ,s=1
Notemos que γtυs puede escribirse como Astυ − Atsυ , donde: Astυ =
∂αsm βmt βnυ ∂qn
(8.143)
que tambi´en puede escribirse como: ∂α ˜ ˜ β βnυ Astυ = ∂qn st
(8.144)
De la expresi´on expl´ıcita para α ˜ obtenemos que: cot θ sen2 ψ cot θ senψ cos ψ 0 ∂α ˜ ˜ ˜ ∂α ˜ ˜ 2 cot θ cos ψ 0 β = 0; β = cot θ senψ cos ψ ∂q1 ∂q2 −senψ − cos ψ 0 ∂α ˜ ˜ β= ∂q3
0
+ −1 0
1 0
1
−1 0 0 0
Se sigue entonces que: cot θ sen2 ψ Astυ = cot θ senψ cos ψ −senψ
0
0
(8.145)
0 0
cot θ senψ cos ψ 2
cot θ cos ψ − cos ψ
0
0 (cos ψ, senψ, 0)υ 0 st
(8.146)
0 0 (−senψ cot θ, − cos ψ cot θ, 1)t 0 0 sυ
Es simple concluir a partir de (8.146) que: γtυs = ǫtυs
(8.147)
276 / Mec´ anica cl´ asica Por tanto las ecuaciones (8.142) son: ω˙ t It +
3 X
ǫtυs ωυ ω s Is = Kr βrt ;
t = 1, 2, 3
(8.148)
υ,s=1
Kr son los torques alrededor de los ejes z, µ1 y z, en tanto que los lados derechos de (8.148) son los torques alrededor de los ejes x, y, z. Ejemplo 8.3.3 Otra variante de soluci´on del ejemplo 8.3.1 puede obtenerse partiendo de las ecuaciones de Lagrange (8.138). Para este problema tenemos que: ˜ ∂L ~ ∂ω0 ω + ~ω 0 ) · I~ · = (~ ; ∂~q ∂~q
˜ ∂L ~ + ~ω 0 ) · ~I~ = (ω ~ ∂ω
(8.149)
En t´erminos de componentes, las ecuaciones (8.138) son: 3 X
r,m=1
βrt
∂ω0m (ω 0m + ωm )Im − ω˙ 0t + ω˙ t It = ∂qr 3 X
ǫtυs (ω s + ω0s )Is ω υ
(8.150)
υ,s=1
O en otra forma: (ω˙ 0t + ω˙ t )It =
3 X ∂ω0m βrt − ǫt,m,r ω r (ω 0m + ω m )Im ∂qr r,m=1
Para cualquier funci´ on F se cumple que: senψ/senθ cos ψ −senψ cot θ ∂F ˜ β= cos ψ/senθ −senψ cos ψ cot θ ∂~q 0 0 1
∂F/∂φ
∂F/∂θ ∂F/∂ψ
~ 0 , hallamos que: Usando la expresi´on (8.124) para ω 0 −ω03 ω 02 ∂ ~ω0 ˜ ω 0 −ω β= 03 01 ∂~q 0 −ω 02 ω 01
(8.151)
(8.152)
(8.153)
O en forma m´as expl´ıcita: ∂ ~ω0m βrt = −ǫmrt ω0r ∂qr
(8.154)
Din´ amica del cuerpo r´ıgido / 277 Con lo cual concluimos que (8.151) toma la forma: (ω˙ 0t + ω˙ t )It =
3 X
r,m=1
ǫtrm (−ω0r − ωr )(ω 0m + ω m )Im
(8.155)
que coinciden con las ecuaciones (8.128) y (8.129)
8.4.
El movimiento de un cuerpo r´ıgido libre
En este caso en las ecuaciones (8.102) y (8.103) no aparecen torques, Kr = 0. Esto se presenta, por ejemplo, cuando el centro de masa coincide con el punto fijo de modo que la gravedad no produce torques. El cuerpo r´ıgido esf´ erico. Se define por la condici´on I1 = I2 = I3 = I. ~ yω Es el u ´nico caso en el cual los vectores L ~ son paralelos: ~ = I~ L ω
(8.156)
~ como ~ω ser´an constantes en magnitud y direcci´ Si no hay torques, tanto L on. Cada punto del cuerpo r´ıgido se mover´ a sobre trayectoria circular. No hay precesi´ on de ~ω . La representaci´ on de Poinsot. Es una construcci´ on geom´etrica que permite analizar el movimiento de un cuerpo r´ıgido libre, el cual puede ser asim´etrico. Fue elaborada por Poinsot (Par´ıs, 1834) y se basa en el elipsoide de inercia, descrito en la secci´ on 8.2. La ecuaci´ on del elipsoide de inercia est´ a dada en (8.73). La normal al elipsoide en un punto cualquiera tiene la direcci´ on del vector gradiente de F , siendo F la superficie (8.75): ∂F = (2xI1 , 2yI2 , 2zI3 ) = 2r(n1 I1 , n2 I2 , n3 I3 ) ∂~r
(8.157)
donde hemos tomado un sistema de ejes principales. Si escogemos el punto (x, y, z) sobre el eje de rotaci´on, entonces: ω ~ = ω(n1 , n2 , n3 )
(8.158)
De modo que (8.149) toma la forma: ∂F 2r 2r ~ = (ω1 I1 , ω2 I2 , ω3 I3 ) = L ∂~r ω ω
(8.159)
Hay dos puntos donde el eje de rotaci´on corta la superficie del elipsoide de inercia. De (8.159) podemos concluir que en esos dos puntos siempre se cumple que la normal ~ Cuando no hay torques se cumple que L ~ y por a la superficie est´ a en la direcci´ on de L. ~ son constantes, independientemente de la forma que tenga el movimiento lo tanto ∇F del elipsoide de inercia, el cual se mueve solidariamente con el cuerpo r´ıgido. La energ´ıa cin´etica se puede escribir en la forma: T =
1 ~ = ω ~r · L ~ ω·L ~ 2 2r
(8.160)
278 / Mec´ anica cl´ asica Cuerpo rígido
Elipsoide de inercia
b a 0
c r P L
∆
ω
F
Figura 8.4 Elipsoide de inercia
que se puede llevar a la forma: ~ ·L ~ =0 (~r − d)
(8.161)
donde d~ es un vector definido por la relaci´on: ~ = 2r T d~ · L ω
(8.162)
~ entonces adquiere la forma: si escogemos a d~ paralelo a L, ~ L 2r T 2 d~ = ω L
(8.163)
~ y es la normal al plano La expresi´on (8.161) es la ecuaci´ on de un plano, donde L y ~r es un punto del mismo. Como ~r es un punto particular (el punto donde se cortan el eje de rotaci´on y el elipsoide de inercia) que puede estar cambiando con el tiempo, vemos entonces que el elipsoide se mueve de tal manera que el punto donde se corta con el eje de rotaci´on siempre permanece sobre un plano (v´ease figura 8.4). d~ es un vector constante, pues usando las relaciones: Ir2 = constante y T =
1 2 Iω = constante 2
~ podemos escribir el vector d~ como una expresi´on que solo depende de T y L: √ 2Ir2 T ~ L d~ = L2
(8.164)
(8.165)
Din´ amica del cuerpo r´ıgido / 279 ~ son constantes, el plano es constante y se llama plano invariable. d~ Como d~ y L es la perpendicular trazada desde el centro del elipsoide al plano tangente, o sea que es ~ la l´ınea que contiene a d~ se llama l´ınea invariable. igual a la proyecci´on de ~r sobre L; Línea invariable Polodia Plano invariable
0 r d P
Herpolodia
r –d ω
L
Figura 8.5 El elipsoide de inercia rueda sin deslizar sobre el plano invariable Podemos concluir que el elipsoide de inercia toca al plano invariable en el punto donde el eje de rotaci´on corta al elipsoide. El radio vector de O a P, ~r, est´ a sobre el eje instant´ aneo de rotaci´on; no hay movimiento relativo entre un punto del elipsoide y un punto del plano; por lo tanto el elipsoide de inercia rueda sin deslizar sobre el plano invariable; en efecto, P est´ a sobre el eje de rotaci´on y por ello es el u ´ nico punto del elipsoide de inercia que est´ a en reposo instant´ aneamente (v´ease figura 8.5). Como ω ~ es ~ es proporcional a d: ~ proporcional a ~r, la proyecci´on de ~ω sobre L ~ ω ~ ·L ~ = 2T L ~ = L 2 L L2
r
2T ~ d Ir2
(8.166)
~ es constante; es decir, ω ~ o sea que la proyecci´on de ~ ω sobre L ~ precesa alrededor de L, pero sin mantenerse constante el a´ngulo entre estos dos vectores, cuyo coseno est´ a dado por: ~ ω ~ ·L Ir2 ω = ωL L r2
(8.167)
~ tambi´en puede Como ω y r pueden cambiar, se sigue que el ´angulo entre ~ω y L cambiar, lo cual ocurre cuando el cuerpo es asim´etrico. La curva trazada por el punto de contacto sobre el elipsoide de inercia se llama polodia (de odos, camino y polein, girar) y la curva correspondiente sobre el plano invariable se llama herpolodia (de herpeton, reptil). ~ no es constante, ver ecuaci´ Respecto a los ejes del cuerpo r´ıgido L on (8.105). De modo que (8.160) ya no representa un plano, sino un elipsoide que es precisamente
280 / Mec´ anica cl´ asica el elipsoide de inercia. Es f´acil demostrar que respecto a los ejes del cuerpo r´ıgido la ~ es una constante: magnitud de L d 2 ~ =0 ~ ·L ~˙ = −2L ~· ω ~ ×L (8.168) L = 2L dt Esto implica que respecto a los ejes del s´olido r´ıgido ~r est´ a adem´as sobre el elipsoide: I12 x2 + I22 y 2 + I32 z 2 =
Ir2 L2 2T
(8.169)
La polodia es, en consecuencia, el lugar geom´etrico de los puntos del elipsoide de inercia que satisfacen simult´ aneamente las ecuaciones (8.73) y (8.169); es decir, es el lugar geom´etrico de la intersecci´on de dos elipsoides cuyos semiejes est´ an dados respectivamente por: a2 :
Ir2 Ir2 L2 Ir2 Ir2 L2 Ir2 Ir2 L2 , ; b2 : , ; c2 : , I1 I1 2T I1 I2 I2 2T I2 I3 I3 2T I3
(8.170)
La existencia de una intersecci´on est´ a asegurada por las desigualdades evidentes: ~ I = ~n · I~ · ~n ≥ I1 ;
I ≤ I3 ⇒ 2T I1 < L2 < 2T I3
(8.171)
siendo I1 el m´as peque˜ no de los tres momentos principales de inercia e I3 el mayor. El cuerpo r´ıgido sim´ etrico libre en la representaci´ on de Poinsot. Cuando I1 = I2 6= I3 , dos de los semiejes del elipsoide de inercia son iguales, siendo ´este un elipsoide de revoluci´ on. Las ecuaciones de la polodia son (8.169) y (8.73): I1 (x2 + y 2 ) + I3 z 2 = Ir2 ;
I12 (x2 + y 2 ) + I32 z 2 =
De estas ecuaciones obtenemos las siguientes: L2 (I1 I3 − I32 )z 2 = Ir2 I1 − 2T 2
2
I1 (I1 − I3 )(x + y ) = Ir
2
L2 − I3 2T
Ir2 L2 2T
(8.172)
(8.173)
Vemos que la polodia est´ a situada a una distancia constante del origen, sobre el eje de simetr´ıa, y es una circunferencia. El elipsoide rueda sin deslizar sobre el plano siendo la polodia una circunferencia, o sea que ~r es paralelo ~ω (el vector de posici´on del centro de la polodia). El vector forma el mismo ´angulo con ~ω, es decir que est´ a a lo largo del eje de simetr´ıa, siempre tienen el mismo ´angulo; es decir, el eje de simetr´ıa y ~ω forman un ´ angulo que permanece constante, lo cual significa que ω ~ efect´ ua un movimiento de precesi´ on alrededor del eje de simetr´ıa. La proyecci´on de ~ω sobre el eje z es constante y las proyecciones sobre los ejes x y y ejecutan movimientos arm´onicos simples con cierta frecuencia Ω. Respecto a los ~ (v´ease figura 8.6). El vector ~ω ejes espaciales, como se dijo, ~ω precesa alrededor de L precesa en los dos sistemas de ejes generando dos conos. En el sistema espacial ~ω precesa
Din´ amica del cuerpo r´ıgido / 281
Cono del cuerpo rígido 0
Cono fijo
ω z L
Figura 8.6 El cono del cuerpo r´ıgido rueda sin deslizar sobre el cono fijo
~ y en el sistema del cuerpo r´ıgido precesa alrededor del alrededor del vector constante L eje de simetr´ıa. En conclusi´ on, el movimiento del cuerpo r´ıgido puede obtenerse a partir del movimiento del cono del cuerpo r´ıgido que rueda sin deslizar sobre el cono fijo. Es claro que para un cuerpo no sim´etrico la polodia no ser´a una circunferencia, ~ω ~ En el cuerpo r´ıgido no ser´a constante, como tampoco el ´angulo entre los vectores ~ω y L. asim´etrico se presentar´ an estos tres movimientos: rotaci´on alrededor del eje instant´ aneo ~ de rotaci´on; precesi´ on del eje instant´ aneo de rotaci´on alrededor del vector constante L ~ y nutaci´ on del eje instant´ aneo de rotaci´on al cambiar el ´angulo entre los vectores ~ω y L. Es claro que la frecuencia de nutaci´on es el doble de la frecuencia de rotaci´on. Soluci´ on de las ecuaciones de Euler para un cuerpo r´ıgido sim´ etrico libre. Las ecuaciones de Euler para este problema toman la forma: I1 ω˙ x = ωy ωz (I1 − I3 )
(8.174)
I1 ω˙ y = −ωx ωz (I1 − I3 )
(8.175)
I3 ω˙ z = 0
(8.176)
De (8.174) y (8.175) obtenemos las siguientes dos ecuaciones: I12 ω ¨ x + ωx ωz (I1 − I3 )2 = 0 ;
I1 ω˙ y = −ωz ωx (I1 − I3 )
(8.177)
O sea que la soluci´on a las ecuaciones de Euler puede escribirse como: ωx = A sen(|Ω|t + δ) ;
ωy =
Ω A cos(|Ω|t + δ) |Ω|
(8.178)
a definida por: ωz = constante, donde Ω est´ Ω=
I1 − I3 ωz I1
(8.179)
282 / Mec´ anica cl´ asica El resultado nos dice que el vector ~ω precesa alrededor de z a una rata constante |Ω|. Como no hay nutaci´on se dice que la precesi´ on es regular. El resultado est´ a de acuerdo con las conclusiones obtenidas mediante la construcci´ on de Poinsot. Ejemplo 8.4.1 Analizar el movimiento rotacional de la Tierra con un modelo de cuerpo r´ıgido sim´etrico libre. La Tierra puede suponerse aproximadamente como un elipsoide achatado y con una distribuci´ on uniforme de materia. Entonces la masa total puede asumirse que est´ a en el centro de masa, de modo que con esta aproximaci´on los dem´ as cuerpos celestes no realizar´ an torques. Los momentos principales de inercia respecto al centro para un elipsoide son: 1 1 1 I2 = M (a2 + c2 ) ; I3 = M (a2 + b2 ) (8.180) I1 = M (b2 + c2 ) ; 5 5 5 Con este modelo tenemos que para la Tierra se cumple: I3 ≈ I1 = I2 ;
c≈a=b
(8.181)
La relaci´ on entre los di´ametros polar y ecuatorial nos da: c = 0, 9672 (8.182) a Tomando el eje z a lo largo del eje polar y sabiendo que la rotaci´on completa alrededor de un eje es un d´ıa, obtenemos: 2π = 7, 272 × 10−5 rad/s (8.183) d´ıa La magnitud de la precesi´ on, A, depender´a de la medida en que difieran ω y ωz , que es peque˜ na. La frecuencia de precesi´ on est´ a dada por: I1 − I3 ωz ≈ 1 − c ωz = 0, 00328ωz |Ω| = (8.184) I1 a ωz ≈
El per´ıodo de precesi´ on ser´a pues de unos 305 d´ıas. Se ha observado que tal precesi´ on se presenta siendo su amplitud peque˜ na. El “radio” de la polodia es aproximadamente de 5 a 8 metros. La polodia es una curva complicada que exhibe algo as´ı como una nutaci´ on. El per´ıodo observado es de unos 427 d´ıas; es una precesi´ on no atribuible a torques; las discrepancias se deben a la idealizaci´on del modelo. Esta precesi´ on es diferente a la precesi´ on de los equinoccios, debida a los torques ejercidos por el Sol y la Luna, pues en realidad el centro de masa de la Tierra no coincide con el centro geom´etrico, el per´ıodo de esta precesi´ on es de 25.800 a˜ nos. Esta precesi´ on tampoco es la responsable ´ de las estaciones. Estas se deben a que el plano de la el´ıptica hace un ´angulo de 23◦ con el plano ecuatorial de la Tierra. Las funciones el´ıpticas de Jacobi. Haremos un resumen de las principales propiedades de estas funciones que, sabemos, aparecen en la soluci´on general para un cuerpo r´ıgido libre asim´etrico.6 6 V´ ease
el texto de Abramowitz y Stegun, Handbook of mathematical functions, cap´ıtulos 16 a 18, 1965; y las referencias dadas en ´ el, especialmente el curso de an´ alisis de Whittaker y Watson.
Din´ amica del cuerpo r´ıgido / 283 Si z es una variable compleja, en general una funci´ on el´ıptica Fpq (z) es una funci´ on que posee un cero en el punto z = p y un polo en el punto z = q, donde p y q son los puntos de una red rectangular infinita en el plano complejo. En la construcci´ on de esta red se parte de una celdilla elemental constituida por un rect´angulo cuyos v´ertices est´ an en los puntos O, K, K + iK ′ , iK ′ , llamados respectivamente s, c, d, n. Los n´ umeros reales K y K ′ est´ an definidos de la siguiente manera en funci´ on de un par´ ametro real m, 0 ≤ m ≤ 1: K=
Z
π/2
0
dθ √ ; 1 − msen2 θ
K′ =
Z
π/2
0
dθ p 1 − (1 − m)sen2 θ
(8.185)
K se llama el cuartiper´ıodo real e iK ′ el cuartiper´ıodo complejo de la funci´ on el´ıptica Fpq (z). Estas funciones se llaman funciones el´ıpticas de Jacobi y usualmente se denotan en la forma pqz. Hay doce de estas funciones que son sc z, sd z, sn z, cs z, cd z, cn z, ds z, dn z, dc z, ns z, nc z, nd z. La definici´on de las funciones el´ıpticas de Jacobi es: (i) pq z tiene solamente singularidades aisladas; tiene un cero en p y un polo en q; (ii) Las funciones pq z son peri´odicas. Entre p y q hay un semiper´ıodo de la funci´ on pq z, siendo 2K, 2iK ′ , 2K + 2iK ′ los per´ıodos. As´ı por ejemplo, las funciones copolares con polo en iK ′ , sn, cn y dn tienen respectivamente los per´ıodos 2iK ′ , 2K + 2iK ′ y 2K, o equivalentemente los per´ıodos 4K, 4K y 2K. Las funciones el´ıpticas de Jacobi pueden definirse tambi´en con respecto a ciertas integrales. Si: z=
Z
φ 0
dθ √ 1 − m sen2 θ
(8.186)
el ´angulo φ es llamado la amplitud y m el par´ ametro. φ = am z
(8.187)
Entonces se definen las funciones as´ı: sn z = sen φ ;
cn z = cos φ ;
dn z =
p 1 − m sen2 φ
(8.188)
Todas las otras nueve funciones pueden expresarse en funci´ on del trio copolar sn, cn, dn. Estas funciones aparecen al evaluar ciertas integrales, llamadas integrales el´ıpticas, que son de la forma: Z R(x, y) dx (8.189) donde R(x, y) es una funci´ on racional de x, y, donde y 2 es igual a un polimonio en x de grado 3 o de grado 4. Cuando R(x, y) s´olo contiene potencias pares de y, o cuando el polimonio y 2 tiene un factor repetido la integral (8.189) es elemental. En todos los dem´ as casos aparecer´ an las funciones el´ıpticas. Cualquier integral el´ıptica puede expresarse
284 / Mec´ anica cl´ asica en t´erminos de las integrales el´ıpticas de primera, segunda y tercera clase, definidas respectivamente por: Z φp Z φ dθ √ ; 1 − m sen2 θ dθ ; 1 − m sen2 θ 0 0 (8.190) Z φ dθ p (1 − n sen2 θ)(1 − m sen2 θ) 0
Cuando φ = π/2, las integrales (8.190) se llaman integrales el´ıpticas completas de primera, segunda y tercera clase. Cuando el par´ ametro toma el valor cero las funciones el´ıpticas coinciden con funciones circulares. Cuando el par´ ametro es tan peque˜ no que podemos despreciar t´erminos de orden superior a m2 tenemos las aproximaciones: sn z =
1 sen z − m(z − sen z cos z) cos z + ... 4
cn z =
1 cos z + m(z − sen z cos z) sen z + ... 4
dn z =
1 1 − m sen2 z + ... 2
(8.191)
1 z − m(z − sen z cos z) + ... 4 Cuando m tiende a la unidad, las funciones el´ıpticas coinciden con funciones hiperb´ olicas; por ejemplo sn z → tanh z; cn z → 1/ cosh z; dn z → 1/ cosh z. A partir de la ecuaci´ on diferencial que sirve para definir la funci´ on sn podemos obtener buena informaci´ on del comportamiento de las funciones el´ıpticas, para z real. La ecuaci´ on (8.186) equivale a la ecuaci´ on diferencial: 2 dφ = 1 − msen2 φ (8.192) dx an z =
Mediante la sustituci´on y = sen φ, (8.192) se transforma en: 2 dy = (1 − y 2 )(1 − my 2 ) dx
(8.193)
2 Claramente y = sen x es la soluci´on cuando m = 0 (v´ease figura 8.7). (dy/dx) √ es igual a una funci´ on continua de y que se anula en y = ±1 y √ en y = ±1/ m; en m la derivada vale y = ±1 la derivada de esa funci´ o n vale ±2(m − 1) y en y = ±1/ √ ∓2(m − 1)/ m. De (8.193) podemos deducir las siguientes propiedades de la soluci´on, y = s nx: (i) Si y(x) es una soluci´on, y(x + c) es una soluci´on ya que ni y ni dy/dx cambian en una translaci´ on en el eje x. (ii) y(x) est´ a siempre contenida √ entre los valores y = −1 y y = +1 puesto que para valores absolutos de y entre√1 y 1/ m, dy/dx es imaginaria, como tambi´en lo es para valores de y mayores que 1/ m.
Din´ amica del cuerpo r´ıgido / 285 (iii) Como para todos los valores de y entre −1 y +1 la derivada dy/dx es no nula, se sigue que en el intervalo (−1, +1) no hay otros puntos diferentes a y = ±1 donde la pendiente se anule dentro del intervalo. (iv) S´ olo hay una curva y(x) que toca una de las l´ıneas y = −1 o y = +1 en un punto x0 dado. Para x < x0 y para x > x0 la pendiente de y en la vecindad de x0 tiene valores opuestos. Por ejemplo, si (x = x0 , y = −1) es el punto en cuesti´on, se sigue integrando (8.193): Z y dy p x − x0 = − 2 (1 − y )(1 − my 2 ) −1 (8.194) Z y dy p x − x0 = (1 − y 2 )(1 − my 2 ) −1 seg´ un que dy/dx sea negativa o positiva respectivamente. y y=1
dn x sn x x0
x
2K cn x y = –1
Figura 8.7 Funciones circulares cuando se desprecian t´erminos de orden superior a m2 Cuando (x, y) tiende a (x0 , −1), las ecuaciones (8.194) dan la u ´nica curva y(x) que satisface la condici´on de tangencia. (v) La curva y(x) es inalterada mediante una reflexi´on en el origen. Basta con conocer la curva entre y = 0 y y = 1, o equivalentemente entre x = 0 y x = K para construir la curva total. (vi) La distancia en x entre dos sucesivos contactos de y(x) con las l´ıneas y = −1 y y = +1 est´ a dada por: Z +1 dy p (8.195) 2K = 2 (1 − y )(1 − my 2 ) −1
286 / Mec´ anica cl´ asica (vii) De la simetr´ıa de la curva respecto a la normal en el punto de contacto con una de las l´ıneas y = −1 o y = +1, se sigue que y(x) es peri´odica con per´ıodo 4K. Podemos entonces definir a sn x por las siguientes propiedades: 2 dsn x = (1 − sn2 x)(1 − msn2 x) ; sn0 = 0 dx (8.196) dsn x = 1 ; sn(x + 4K) = sn x dx x=0 Podemos definir las funciones cn x y dn x por las ecuaciones: cn2 x = 1 − sn2 x ;
dn2 x = 1 − msn2 x
(8.197)
con la condici´on de que las funciones y sus derivadas sean continuas. Como 0 ≤ m ≤ 1, dnx siempre puede tomarse positiva. El per´ıodo de cn x es 4K y el de dn x es 2K. Se sigue de (8.196) que: dsn x = cn x dn x dx
(8.198)
de (8.196) y (8.197) se sigue entonces que: dcn x = −sn x dn x ; dx
ddn x = −m sn x cn x dx
(8.199)
La figura 8.7 muestra las funciones el´ıpticas de Jacobi sn, cn y dn, para m = 1/2. Con las funciones el´ıpticas es posible hallar f´ormulas an´alogas a las de la trigonometr´ıa ordinaria. Por ejemplo, la f´ormula de adici´ on para la funci´ on sn es: sn(u ± υ) =
sn u cn υ dn υ ± sn υ cn u dn u 1 − m sn2 u sn2 υ
(8.200)
Algunos valores notables de sn son: sn 0 = 0 ;
sn K = 1 ;
1 sn(K + iK ′ ) = √ ; m
sn iK ′ = ∞ sn
K 1 =p √ 2 1 + m1
(8.201)
Con estas f´ ormulas podemos hallar la siguiente relaci´on u ´ ltil: 1 ±√ = ±sn(u ± iK ′ ) m sn u
(8.202)
dada por la f´ ormula 16.8.1 del libro de Abramowitz, Op. cit. Relacionadas con las funciones el´ıpticas est´ an las funciones θ, denotadas por θ1 (z, q), θ2 (z, q), θ3 (z, q), θ4 (z, q), cuyas definiciones est´ an en la secci´ on 16.27 del libro de Abramowitz. Otros autores usan la notaci´ on siguiente para las mismas funciones: θ11 , θ10 , θ00 , θ01 , como en el Tratado de mec´ anica anal´ıtica de Wittaker, o en el texto de mec´anica de
Din´ amica del cuerpo r´ıgido / 287 Landau (ver bibliograf´ıa). Nos interesar´ a la funci´ on θ4 que tiene la siguiente expresi´on como un producto infinito (f´ ormula 16.37.4 del del libro de Abramowitz): 1/2 Y ∞ m θ4 (v) = θ4 (0) (1 − 2q 2n−1 cos 2v + q 4n−2 ) (8.203) 16qm21 n=1 donde m y m1 = 1 − m tienen la misma significaci´ on que en las funciones el´ıpticas, y ϑ y q est´ an definidas por: ′ πu ; q = e−πK /K (8.204) v= 2K La siguiente expresi´on para θ4 (v) como un producto infinito es m´as u ´ til: θ4 (v) = constante
∞ Y
(1 − q 2n−1 e2iv )(1 − q 2n−1 e−2iv )
(8.205)
n=1
Tomando logaritmos en esta expresi´on y derivando respecto a v llegamos a la siguiente f´ ormula para la derivada logar´ıtmica de θ4 : ∞ θ4′ (v) X −2iq 2n−1 e2iv 2iq 2n−1 e−2iv + = (8.206) θ4 (v) n=1 1 − q 2n−1 e2iv 1 − q 2n−1 e−2iv Esta expresi´on tiene polos simples donde θ4 tiene ceros simples, o sea cuando v es tal que: e±2iv = ei(2n−1)πiK
′
/K
(8.207)
es decir, cuando u = 2Kv/π, vale: urm = (2r + 1)iK ′ + 2mK ;
r, n = 0, ±1, ±2. . . ± ∞
(8.208)
Con esta expresi´on para los polos de θ4′ /θ4 podemos formar la serie de Laurent para esta funci´ on: +∞ +∞ X X brm θ4′ (v) = θ4 (v) r=−∞ m=−∞ v − vrm
(8.209)
donde brm son los residuos de la funci´ on que obtenemos de: brm = l´ım (v − vrm ) v→vrm
θ4′ (v) θ4 (v)
(8.210)
Evaluando esta expresi´on llegamos finalmente a: +∞ +∞ X X 1 θ4′ (v) = θ4 (v) r=−∞ m=−∞ v − vrm
(8.211)
Soluci´ on de las ecuaciones de Euler para un cuerpo r´ıgido asim´ etrico libre.7 Supondremos que I3 > I2 > I1 . De acuerdo con la representaci´on de Poinsot, 7 Este
problema fue resuelto por Jacobi en 1849.
288 / Mec´ anica cl´ asica las ecuaciones de la polodia est´ an dadas por la intersecci´on del elipsoide de inercia con el elipsoide del momento angular: I1 ω21 + I2 ω 22 + I3 ω 23 = 2E (8.212) I12 ω21 + I22 ω 22 + I32 ω23 = L2 De estas ecuaciones podemos obtener las siguientes expresiones para ω21 y ω23 en funci´ on de ω 22 : ω21 =
1 [(2EI3 − L2 ) − I2 (I3 − I2 ) ω 22 ] I1 (I3 − I1 )
(8.213)
ω23 =
1 [(L2 − 2EI3 ) − I2 (I2 − I1 ) ω 22 ] I3 (I3 − I1 )
(8.214)
La ecuaci´ on de Euler para ω2 , (8.214), toma entonces la forma: ω˙ 2 =
1 √ (2EI3 − L2 ) − I2 (I3 − I2 )ω 22 · I2 I1 I3 1/2 2 (L − 2EI1 ) − I2 (I2 − I1 )ω 22
(8.215)
Al separar variables e integrar obtenemos una expresi´on que se puede reducir a una integral el´ıptica incompleta de primera clase en la forma normal, llamando: b2 =
2EI3 − L2 ; I2 (I3 − I2 )
a2 =
L2 − 2EI1 I2 (I2 − I1 )
(8.216)
Si para precisar suponemos que 2EI3 > L2 > 2EI2 , encontramos entonces que a2 y b son positivas. Notamos que al expresar a L y a E en funci´ on del momento de inercia alrededor del eje de rotaci´on I, esta condici´on nos dice que I3 > I > I2 > I1 , con lo cual obtenemos que a es mayor que b. Con estas sustituciones, y escogiendo t = 0 de modo que ω 2 sea igual a cero, la integral de (8.215) es de la forma: 2
I1 I2 I3 t= (I3 − I2 )(L2 − 2EI1 )
1/2 Z
0
ω2
a dω 2 p 2 (a − ω 22 )(b2 − ω 22 )
(8.217)
Mediante la f´ ormula 17.4.45 del Handbook of mathematical functions de Abramowitz y Stegun, la integral en (8.217) puede llevarse a la forma de una integral el´ıptica de primera clase con par´ ametro m dado por: m=
I2 − I1 2EI3 − L2 b2 = 2 a I3 − I2 L2 − 2EI1
(8.218)
Esta integral puede expresarse en t´erminos de la funci´ on el´ıptica sn de acuerdo con (8.188). En efecto, haciendo en (8.217) la sustituci´on se˜ nalada en la f´ormula del Handbook: ω2 = b sn v
(8.219)
Din´ amica del cuerpo r´ıgido / 289 y teniendo en cuenta que, seg´ un (8.198): dω 2 = b cn v dn v dv
(8.220)
obtenemos en el lugar de la integral de (8.217): Z v dn v dv ω2 √ = v = sn−1 2 b 1 − msn v 0
(8.221)
Si llamamos: 1/2 (I3 − I2 )(L2 − 2EI1 ) c= I1 I2 I3
(8.222)
entonces (8.217) se reduce, llamando b2 = b, a: ω 2 = b2 sn ct
(8.223)
Reemplazando a ω2 (t) en (8.213) y (8.214) obtenemos para ω 1 y ω 3 : ω1 =
b1 sn ct
ω3 =
b3 sn ct
(8.224) donde b1 y b3 est´ an dadas por: b21 =
2EI3 − L2 ; I1 (I3 − I1 )
b23 =
L2 − 2EI1 I3 (I3 − I1 )
(8.225)
Al reemplazar la soluci´on (8.224) en las ecuaciones de Euler, ´estas resultan compatibles si el producto b1 b2 b3 es negativo. ω1 y ω2 son peri´odicas con per´ıodo 4K y ω3 es peri´odica con per´ıodo 2K, donde K es la integral el´ıptica completa de primera clase. El per´ıodo que nos interesa es con respecto al tiempo que est´ a dado por: T =
4K c
(8.226)
~ De acuerdo con la construcci´ on de Poinsot, al cabo de un tiempo T el vector ω completa un ciclo de precesi´ on alrededor del eje z, es decir, ω 1 y ω 2 coinciden consigo mismas, en tanto que al cabo de un tiempo T /2, ω 3 coincide consigo misma. El problema no termina hallando a ω r (t), pues interesa describir el movimiento absoluto del cuerpo r´ıgido en el espacio, o sea hallar los ´angulos de Euler en funci´ on del tiempo. Reemplazando las expresiones (8.224) y (8.225) en (8.131), obtenemos tres ecuaciones diferenciales para θ, φ y ψ, cuya soluci´on es complicada cuando los ejes espaciales se toman arbitrariamente, pero se simplifica un poco tomando el eje z en la direcci´ on de ~ Como el ´angulo polar y el ´angula l´ınea invariable definida por el vector constante L. ~ que coincide con el eje z, son respectivamente θ y π/2 − ψ, lo acimutal del vector L, podemos sin m´as escribir: L1 = L senθ senψ ;
L2 = L senθ cos ψ ;
L3 = L cos ψ
(8.227)
290 / Mec´ anica cl´ asica Como Lr = Ir ω r obtenemos que: 1/2 I3 (L2 − 2EI1 ) I3 ω 3 = dn ct cos θ = L L2 (I3 − I1 ) tan ψ =
I1 ω 1 I1 (I3 − I2 ) = I2 ω 2 I2 (I3 − I1 )
1/2
(8.228)
cn ct sn ct
θ y ψ al igual que las componentes de ~ω son funciones peri´odicas, con per´ıodo igual al de la funci´ on dn, o sea T /2. En efecto, dn z y cn z/sn z = cs z son coperi´odicas con per´ıodo 2K. El ´ angulo φ se puede obtener de (8.132) y (8.228). El resultado para φ˙ en funci´ on de las componentes de ~ω solamente es: I1 ω 2 + I2 ω 22 L φ˙ = 2 12 I1 ω 1 + I22 ω22
(8.229)
φ˙ es peri´odica con per´ıodo T /2. En general, φ no se incrementar´ a por un m´ ultiplo de 2π en un per´ıodo y por ello el movimiento del cuerpo r´ıgido como un todo no es peri´odico, o sea que el cuerpo r´ıgido en general no vuelve nunca a su posici´on inicial. En efecto, reemplazando en (8.229) las expresiones (8.224) y (8.225) obtenemos: φ˙ = L
(I3 − I2 ) + (I2 − I1 )sn2 ct I1 (I3 − I2 ) + I3 (I2 − I1 )sn2 ct
(8.230)
Ahora, podemos definir una cantidad real β por medio de estas expresiones que son mutuamente consistentes: 1/2 1/2 I(I3 − I1 ) I3 (I − I1 ) ; cn iβ = sn iβ = i I1 (I3 − I) I1 (I3 − I) (8.231) 1/2 I2 (I3 − I1 ) dn iβ = I1 (I3 − I2 ) I que no es el momento de inercia respecto al eje de rotaci´on, est´a dado por:
L2 2E de modo que la expresi´on para m toma la forma: I=
m=
I3 − I I2 − I1 I − I1 I3 − I2
(8.232)
(8.233)
φ˙ toma la siguiente forma al reemplazar a (8.231) en (8.230): L I2 + (I1 dn2 iβ − I2 )sn2 ct φ˙ = I1 I2 1 − m sn2 iβ sn2 ct
(8.234)
Esta expresi´on es de la forma (Ax + Bsn2 ct)/(Cx + Dsn2 ct) o sea es el cociente de dos funciones lineales de x. Al efectuar el cociente llegamos a: 1 dn2 iβ sn2 ct 1 L +L − (8.235) φ˙ = I1 I2 I1 1 − m sn2 iβ sn2 ct
Din´ amica del cuerpo r´ıgido / 291 Examinemos la estructura anal´ıtica del segundo t´ermino en (8.235). Tiene singularidades en los valores de ct tales que se anula el denominador: ±1 sn ct = √ = sn (±iβ + iK ′ ) m sn iβ
(8.236)
donde hemos usado la f´ ormula (8.202). Usando la propiedad de la funci´ on sn de ser doblemente peri´odica, con per´ıodos 2iK ′ , 4K y 4K + 4iK ′, podemos concluir de (8.236) que snu = (−1)r sn (u + 2mK + 2riK ′ ) y por lo tanto: (−1)r ct = ±iβ + (2r + 1)iK ′ + 2mK ;
r, m = 0, ±1, ±2, ...
(8.237)
Estos ceros del denominador son simples, o sea que la funci´ on puede expandirse en series de Laurent de la forma (8.209): " X +∞ +∞ X 1 1 arm L − I2 I1 r=−∞ m=−∞ (−1)r ct + iβ − urm (8.238) # brm − + constante (−1)r ct − iβ − urm Para evaluar los residuos, expandimos el denominador en (8.235) en serie de Taylor alrededor de los ceros, (8.237): 1 − m sn2 iβ sn2 ct = 1 − m sn2 iβ sn2 (±iβ + iK ′ ) + [(−1)r ct − (±iβ + urm )] 2m sn2 iβ sn(±iβ + iK ′ )·
(8.239)
cn(±iβ + iK ′ ) dn(±iβ + iK ′ ) donde hemos usado la periodicidad de las funciones el´ıpticas. Usando (8.236) y luego las expresiones (8.231), llegamos a que arm y brm valen respectivamente: ±
1/2 dn iβ 1 I1 I2 (I3 − I2 )(I − I1 ) =± 2m sn iβ cn iβ 2i II3 (I2 − I1 )
(8.240)
Los residuos del segundo t´ermino de (8.235) son entonces: ±i
c 2
(8.241)
Por tanto el segundo t´ermino del lado derecho de (8.235) es: " +∞ +∞ 1 c X X i r 2 r=−∞ m=−∞ (−1) ct + iβ − urm −
#
1 + constante (−1)r ct − iβ − urm
(8.242)
292 / Mec´ anica cl´ asica Es f´ acil ver que u−r,−m = ur−1,m , con lo cual es posible hacer que los t´erminos con r impares tengan la misma forma de los t´erminos con r pares. Entonces (8.242) es igual a una expresi´on que no contiene el (−1)r . Usando la expresi´on (8.226) para c y luego multiplicando numeradores y denominadores por π/(2K), obtenemos: " +∞ +∞ π X X 1 i T r=−∞ m=−∞ π (ct + iβ) − vrm 2K (8.243) # 1 + constante − π (ct − iβ) − vrm 2K Comparando ahora a (8.243) con (8.236), obtenemos finalmente la siguiente expresi´ on para φ˙ en t´erminos de las funciones θ: " L iπ θ4′ [(ct + iβ)π/(2K)] ˙ φ= + I1 T θ4 [(ct + iβ)π/(2K)] # θ4′ (iβπ/2K) θ4′ [(ct − iβ)π/(2K)] (8.244) −2 − θ4 [(ct − iβ)π/(2K)] θ4 (iβπ/(2K) La integraci´ on ahora es simple:
2π t + iα L i 2πi θ4′ (iα) T φ(t) = t + ln − 2π I1 T θ4 (iα) 2 θ4 t − iα T
θ4
(8.245)
donde definimos a α = πβ/(2K). De acuerdo con la expresi´on (8.203), la funci´ on θ4 (v) tiene per´ıodo π y adem´as es funci´ on par de v, de modo que al completarse un per´ıodo de θ y ψ, o sea cuando t = T /2, el t´ermino logar´ıtmico de φ se anula. Entonces: T L T θ′ (iα) φ = − πi 4 (8.246) 2 I1 2 θ4 (iα) Como θ4 tiene la expansi´ on: θ4 (v) = 1 − 2q cos v + 2q 4 cos4 v − ... Entonces: T LT q senh2α − 2 q 4 senh4α + ... φ = + 4π 2 2I1 1 − 2q cosh 2α + 2q 4 cosh 4α − ...
(8.247)
(8.248)
s´olo en circunstancias muy especiales esta expresi´on ser´a un m´ ultiplo entero de 2π; por esta raz´ on el cuerpo r´ıgido no vuelve nunca a su posici´on inicial. Ejemplo 8.4.2 Estudiar la estabilidad de las rotaciones de un cuerpo r´ıgido asim´etrico libre alrededor de cada uno de los ejes principales.
Din´ amica del cuerpo r´ıgido / 293 Asumamos que el cuerpo inicialmente gira alrededor del eje x1 y que adem´as I3 > I2 > I1 . Por efecto de alguna peque˜ na perturbaci´on el cuerpo adquiere rotaciones nas alrededor de los otros ejes; asumiremos que ω2 y ω3 son entonces cantidades peque˜ on de Euler para ω1 contendr´a el producto ω2 ω3 , o sea en comparaci´ on con ω1 . La ecuaci´ que al primer orden en estas cantidades ω 1 es constante. Esto permite resolver f´acilmente las otras dos ecuaciones de Euler: I3 − I1 I1 − I2 ω˙2 = ω 1 ω 3 ; ω˙3 = ω1 ω 2 (8.249) I2 I3 De aqu´ı obtenemos la siguiente ecuaci´ on diferencial para ω2 : (I1 − I3 )(I1 − I2 ) 2 2 ω¨2 + ω1 ω2 = 0 I2 I3
(8.250)
Esta ecuaci´ on tiene como soluci´on: ω 2 = A sen(Ω1 t + δ)
(8.251)
donde A es una cantidad peque˜ na y Ω1 satisface: 1/2 (I3 − I1 )(I2 − I1 ) ω1 Ω1 = I2 I3
(8.252)
Como Ω1 es real, entonces ω 2 y ω 3 tendr´an movimientos oscilatorios con frecuencia Ω1 . La rotaci´on alrededor de x1 es estable. De manera similar, cuando el cuerpo rota inicialmente alrededor de x3 , el movimiento es estable con frecuencia: 1/2 (I3 − I2 )(I3 − I1 ) ω3 (8.253) Ω3 = I1 I2 Sin embargo, cuando el cuerpo rota inicialmente alrededor de x2 el movimiento es inestable porque Ω2 resulta imaginario. O sea que para rotaciones alrededor del eje de menor momento de inercia o del eje de mayor momento de inercia hay estabilidad, siendo inestable la rotaci´on alrededor del eje correspondiente al momento de inercia intermedio. Para un cuerpo r´ıgido sim´etrico, digamos para el cual I1 = I2 , es f´acil mostrar que solamente es estable la rotaci´on alrededor del eje x3 . Ejemplo 8.4.3 Calcular los diferentes per´ıodos asociados con el movimiento libre de un elipsoide homog´eneo asim´etrico cuyos semiejes tienen las longitudes a = 0, 1m, b = 0, 2m, c = 0, 3m y cuya masa es de 1 kg. Los valores iniciales de las componentes de la velocidad angular alrededor de los ejes principales son ω1 = πs−1 , ω 2 = 10πs−1 , ω 3 = πs−1 , asumiendo que I1 < I2 < I3 . De acuerdo con las f´ ormulas (8.180), los valores de los momentos principales de inercia son: I1 = 0, 010 kg m2 ;
I2 = 0, 020 kg m2 ;
I3 = 0, 026 kg m2
(8.254)
Los valores de las constantes de movimiento 2E y L son: 2E = 2, 036π 2J ;
L2 = 0, 040776π 2J2 s2
(8.255)
294 / Mec´ anica cl´ asica Reemplazando estos valores en (8.232) hallamos que I vale: I = 0, 0200275 kg m2
(8.256)
Definiendo el ´ angulo modular γ como m = sen2 γ, y usando la f´ormula (8.218) para m hallamos que m y γ valen: m = 0, 9926866 ;
γ = 85, 09◦
(8.257)
La tabla 17.2 del texto de Abramowitz y Stegun nos da los siguientes valores para q, K y K ′ , usando interpolaci´ on lineal: K = 3, 8516333 ;
K ′ = 1, 5736950 ;
q = 0, 2770075
(8.258)
La cantidad c, dada por (8.222), vale: c = 4, 8535462 πs−1
(8.259)
El per´ıodo de los ´angulos θ y ψ es T = 4K/c, que tiene el valor 1,010 s. Para hallar el per´ıodo de φ debemos calcular el valor de β. La f´ormula (8.231) nos da que: dn iβ = 2, 3094003
(8.260)
La transformaci´ on imaginaria de Jacobi dice que dn iβ = dc1 β, donde el sub´ındice indica que el m´odulo de la funci´ on el´ıptica es m1 . Notando que dc1 = dn1 /cn1 y luego expresando a cn1 y dn en funci´ on de sn1 , obtenemos que: sn21 β =
1 − dn2 iβ = 0, 8136155 1 − m − dn2 iβ
(8.261)
Entonces sn1 β = 0, 9020063. β ser´a igual al valor de la integral el´ıptica incompleta de primera clase con ´angulo modular γ1 = 90◦ − 85, 09◦ = 4, 91◦ y amplitud igual a arcsen(0, 9020063) = 64, 45◦. De la tabla 17.5 del manual hallamos el valor mediante interpolaci´ on: β = 1, 1258087
(8.262)
Entonces α = πβ/(2K) = 0, 459134. Reemplazando este valor en (8.248) obtenemos:
T φ = 7, 303 × 2π 2
(8.263)
O sea que al movimiento en φ hay asociado otro per´ıodo T ′ cuyo valor es T ′ = 0, 069 s, que es el per´ıodo precesional alrededor de la l´ınea invariable, o sea el movimiento medio de φ. Este problema pertenece al caso tercero del ejemplo 8.4.2, donde se se˜ nal´ o que Ω22 resulta negativa. En efecto: Ω22 = ω22
(I2 − I1 )(I2 − I3 ) = −227, 759 s−2 I1 I3
a lo cual corresponde un tiempo caracter´ıstico de 0, 0662 s.
(8.264)
Din´ amica del cuerpo r´ıgido / 295
8.5.
El trompo con el punto inferior fijo en un campo gravitacional homog´ eneo
Whittaker en su tratado de din´amica anal´ıtica define un trompo como un cuerpo r´ıgido sim´etrico alrededor de un eje, que termina en una punta en un extremo del eje. Aqu´ı estudiaremos el movimiento del trompo bajo la acci´on de la gravedad cuando la punta permanece fija. Este problema fue estudiado por Lagrange en 1788. La figura 8.8 muestra el sistema de ejes empleados. Los ejes x, y, z, son un sistema z z y c.g. l θ
mg
y 0 ψ x
φ x
Figura 8.8 Trompo con el punto inferior fijo en un campo gravitacional. Sistema de ejes. de ejes principales en el punto fijo O. Si los momentos principales respecto al centro de gravedad son I1c , I2c , I3c , podemos usar el teorema de Steiner para evaluarlos respecto al punto O: I1 = ml2 + I1c ;
I2 = ml2 + I2c ;
I3 = I3c
(8.265)
como el cuerpo r´ıgido es sim´etrico entonces I1 = I2 . Las ecuaciones de movimiento. El lagrangiano respecto a los ejes x, y, z, es: L=
1 1 I1 (ωx2 + ωy2 ) + I3 ωz2 − mgl cos θ 2 2
(8.266)
Usando las ecuaciones (8.131) que expresan las ωi en funci´ on de los ´angulos de Euler podemos expresar a L en t´erminos de los ´angulos de Euler: L=
1 1 I1 (θ˙2 + φ˙ 2 sen2 θ) + I3 (ψ˙ + φ˙ cos θ)2 − mgl cos θ 2 2
(8.267)
296 / Mec´ anica cl´ asica φ y ψ son coordenadas c´ıclicas y por lo tanto sus momentos can´onicos conjugados son constantes de movimiento: pφ =
(I1 sen2 θ + I3 cos2 θ)φ˙ + I3 ψ˙ = Lz ≡ I1 b
pψ =
I3 (ψ˙ + φ˙ cos θ) = Lz = I3 ωz ≡ I1 a
(8.268)
a, b y ωz son constantes. El torque de la gravedad produce rotaciones s´olo alrededor de la l´ınea de nodos, en tanto que alrededor de z y z no hay torques, raz´ on por la cual Lz y ~ no son constantes pero s´ı la energ´ıa Lz han de conservarse. Las otras componentes de L total: 1 1 I1 (θ˙2 + φ˙ 2 sen2 θ) + I3 (ψ˙ + φ˙ cos θ)2 + mgl cos θ 2 2
E=
(8.269)
Las ecuaciones (8.268) y (8.269) constituyen un conjunto de tres ecuaciones diferenciales simult´ aneas para θ, φ, ψ; por lo tanto son equivalentes a las ecuaciones de Lagrange para estas cantidades. En efecto, φ˙ y ψ˙ pueden expresarse en funci´ on de θ solamente: φ˙ =
b − a cos θ sen2 θ
ψ˙ =
I1 a b − a cos θ − cos θ I3 sen2 θ
(8.270)
˙ θ, ˙ φ˙ y θ, puede expresarse en t´erminos de θ˙ y θ dando Como E depende s´olo de ψ, una ecuaci´ on diferencial para θ: 1 1 (b − a cos θ)2 1 I3 ωz2 + I1 θ˙2 + I1 sen2 θ + mgl cos θ 2 2 2 sen4 θ
(8.271)
1 1 1 (b − a cos θ)2 E ′ = E − I3 ωz2 = I1 θ˙2 + I1 + mgl cos θ 2 2 2 sen2 θ
(8.272)
E= o sea que:
Vemos que la variaci´on de θ es la misma que se presentar´ıa en un sistema din´amico con un grado de libertad para el cual las energ´ıas cin´etica y potencial son respectivamente: 1 ˙2 I1 θ ; 2
1 (b − a cos θ)2 I1 + mgl cos θ 2 sen2 θ
(8.273)
Llamando u = cos θ la ecuaci´ on (8.272) toma la forma: u˙ 2 = (α − βu)(1 − u2 ) − (b − au)2 = f (u)
(8.274)
donde se definen a α y β como: α=
2E ′ ; I1
β=
2mgl I1
(8.275)
Din´ amica del cuerpo r´ıgido / 297 La energ´ıa potencial efectiva. Est´ a dada por la segunda expresi´on en (8.273), que en t´erminos de u toma la forma: 1 (b − au)2 Vef (u) = I1 + βu (8.276) 2 1 − u2 Podemos entonces escribir a f (u) como: f (u) =
2 [E ′ − Vef (u)] (1 − u2 ) I1
(8.277)
Las figuras 8.9 y 8.10 muestran las funciones Vef (θ), Vef (u) y f (u).
Vef (u)
f (u)
E′ E′0 u –1
u1
u0
0
u2
+1
u3
Figura 8.9 Funciones Vef (u) y f (u) Vemos que para un valor dado de E ′ habr´ a dos valores de u, u1 y u2 para los cuales ´ E = Vef (u), o sea para los cuales u˙ = 0 (θ˙ = 0). Estos son los puntos de retorno de la coordenada θ. Vemos que en general θ oscilar´a entre θ1 y θ2 esto es, habr´ a nutaci´on. Cuando E ′ = E0′ entonces u1 = u2 = u0 y no habr´ a nutaci´on; este caso corresponde a la precesi´ on estable o regular. u1 y u2 corresponden a los ceros de la funci´ on f (u) en el intervalo entre u = −1 y u = 1. La funci´ on f (u) es un polimonio c´ ubico en u que tiene el siguiente comportamiento. En u = ±1 la funci´ on f es negativa, puesto que f (±1) = −(b ∓ a)2 . Para algunos valores de u entre −1 y +1, f (u) debe de ser positiva porque el lado izquierdo en (8.274) es positivo. Cuando u → ∞, f (u) es positiva y cuando u → −∞, f (u) es negativa. La figura 8.9 muestra el comportamiento de f (u), la cual tiene por lo tanto dos ra´ıces reales u1 y u2 que se sit´ uan entre −1 y +1, y la tercera ra´ız u3 es tambi´en real y mayor que +1 (que corresponde a un valor de θ imaginario puro). Llamemos a esas ra´ıces cos θ1 , cos θ2 , cosh θ3 , donde hemos convenido en designar con θ3 al m´odulo del ´angulo correspondiente a u3 y donde cos θ2 > cos θ1 , con lo cual θ1 > θ2 . E0′ es el valor de E ′ para el cual θ1 y θ2 son iguales, o sea, el valor de E ′ en el cual Vef tiene un m´ınimo. Este caso es an´alogo al de las ´orbitas circulares en el problema de ′
298 / Mec´ anica cl´ asica
Vef (θ)
E′ E′0
0
θ2
θ0
θ1 π θ
Figura 8.10 Energ´ıa ptencial efectiva Vef (θ) y Vef (u)
las fuerzas centrales entre dos part´ıculas. Integraci´ on de la ecuaci´ on diferencial para θ. Realicemos la siguiente transformaci´ on (Whittaker, Op. cit., p. 157): u=
α + a2 4 z+ β 3β
(8.278)
Al sustituir esta expresi´on en (8.274) obtenemos: z˙ 2 = 4z 3 − g2 z − g3 = 4s(z)
(8.279)
Si u1 , u2 y u3 son las ra´ıces del polinomio c´ ubico f (u) entonces las ra´ıces del polinomio c´ ubico s(z) son: zi =
β α + a2 ui − = ei ; 4 12
i = 1, 2, 3
(8.280)
Los coeficientes g2 y g3 pueden expresarse en funci´ on de los ei mediante las f´ormulas 18.1 del texto de Abramowitz y Stegun: g2 =
2(e21 + e22 + e23 )
g3 =
4e1 e2 e3
(8.281) La conexi´on entre z y t est´ a dada en consecuencia por medio de una funci´ on el´ıptica
Din´ amica del cuerpo r´ıgido / 299 de Weierstrass, de acuerdo con la f´ormula 18.1.6 del libro de Abramowitz:8 zi = P(t + ǫ)
(8.282)
donde ǫ es una constante de integraci´ on. En consecuencia: cos θ = u(t) =
2I1 2E ′ + I1 a2 P(t + ǫ) + mgl 6mgl
(8.283)
La funci´ on el´ıptica de Weierstrass puede expresarse en t´erminos de la funci´ on el´ıptica sn de Jacobi, seg´ un la f´ ormula 18.9.11 de dicho manual, para el caso en que e1 , e2 , e3 , son reales y tomando e3 > e2 > e1 : e3 − e1 (8.284) P(x) = e1 + 2 √ sn (x e3 − e1 )
donde el par´ ametro de la funci´ on sn es: e2 − e1 m= e3 − e1
(8.285)
Conociendo las ra´ıces ei podemos calcular el per´ıodo de la funci´ on sn y en consecuencia el per´ıodo del ´ angulo θ, llamado el per´ıodo nutacional. Integraci´ on de las ecuaciones diferenciales para φ y ψ. φ˙ y ψ˙ est´ an dados por las ecuaciones (8.270). Notamos que θ no depende del valor de I3 , puesto que a no es m´as que una constante de integraci´ on. En consecuencia la expresi´on para ψ˙ difiere de la correspondiente expresi´on para un trompo esf´erico s´olo por una constante (I1 a/I3 − a). En el c´ alculo de la parte no trivial de ψ podemos asumir que el trompo es esf´erico (I1 = I2 = I3 ), para el cual se cumple: a − b cos θ ψ˙ = sen2 θ Podemos expresar a φ˙ y ψ˙ en la forma: b − a cos θ ; φ˙ = sen2 θ
φ˙ =
a−b a+b + 2(cos θ + 1) 2(cos θ − 1)
ψ˙ =
a+b b−a + 2(cos θ + 1) 2(cos θ − 1)
(8.286)
(8.287)
Podemos ahora sustituir la expresi´on para cos θ en funci´ on del tiempo, ecuaci´ on (8.283). De (8.283) y (8.284) se sigue que el argumento de P debe ser complejo cuando cos θ = 1 y cos θ = −1. Para θ = 0 y θ = π, seg´ un (8.283) P vale respectivamente: P(iγ) =
mgl 2E ′ + I1 a2 − 2I1 12I1
P(iδ) =
mgl 2E ′ + I1 a2 − − 2I1 12I1
(8.288)
8 V´ ease tambi´ en el texto de E. T. Whittaker y G. N. Watson, A course of modern analysis, cap´ıtulo XX, Cambridge University Press, 1965; A treatise on analytical dynamics de E. T. Whittaker, cap´ıtulo VI, Cambridge University Press, 1960.
300 / Mec´ anica cl´ asica donde γ y δ son reales. Reemplazando a (8.288) y a (8.283) en las f´ormulas (8.287) obtenemos: mgl(a + b) 1 φ˙ = 4I1 P(t + ǫ) − P(iδ) − mgl(a + b) 1 ψ˙ = 4I1 P(t + ǫ) − P(iδ) +
1 mgl(b − a) 4I1 P(t + ǫ) − P(iγ)
(8.289)
1 mgl(b − a) 4I1 P(t + ǫ) − P(iγ)
Cuando θ = 0 y θ = π la ecuaci´ on (8.274) nos dice que u˙ 2 vale: u˙ 2 θ=π = −(b + a)2 u˙ 2 θ=0 = −(b − a)2 ;
(8.290)
˙ ˙ En consecuencia P(iγ) y P(iδ) valen, usando (8.278): i ˙ P(iγ) = β(b − a) ; 4
i ˙ P(iδ) = β(b + a) 4
(8.291)
Este resultado nos permite escribir a (8.290) en la forma: 2iφ˙ =
˙ ˙ P(iγ) P(iδ) − P(t + ǫ) − P(iδ) P(t + ǫ) − P(iγ)
2iψ˙ =
˙ ˙ P(iγ) P(iδ) + P(t + ǫ) − P(iδ) P(t + ǫ) − P(iγ)
(8.292)
De acuerdo con (8.284), la funci´ on P tiene un polo doble en el origen, o sea que la funci´ on: ˙ P(iδ) P(x) − P(iδ)
(8.293)
tiene ceros en x = 0, tiene polos en x = iδ y x = −iδ, y en todos los puntos congruentes a estos, es decir, que se obtengan por translaciones en m´ ultiplos enteros de los per´ıodos de la funci´ on el´ıptica P(x), que son ciertos ω1 y ω2 , an´alogos a 2K y 2iK ′ en las funciones el´ıpticas de Jacobi. Los residuos de la funci´ on (8.293) en ´esos polos son +1 y −1. En la teor´ıa de las funciones el´ıpticas de Weierstrass existe una funci´on, de la familia de las funciones θ, que tiene una estructura anal´ıtica id´entica a la de la funci´ on (8.293). En efecto, la funci´ on σ(x + iδ) tiene ceros en x = −iδ y en los puntos congruentes a ´este, y la funci´ on σ ′ (x + iδ)/σ(x − iδ) tiene polos en los puntos congruentes a x = −iδ y residuo igual a −1, en tanto que σ ′ (x − iδ)/σ(x − iδ) tiene polos en x = iδ y residuo igual a +1. En consecuencia la funci´ on (8.293) puede escribirse en la forma: ˙ σ(x ˙ − iδ) σ(x ˙ + iδ) σ(iδ) ˙ P(iδ) = − +2 P(x) − P(iδ) σ(x − iδ) σ(x + iδ) σ(iδ)
(8.294)
Din´ amica del cuerpo r´ıgido / 301 Llamando ς(iδ) = σ(iδ)/σ(iδ) ˙ y usando el resultado (8.294), las ecuaciones (8.292) pueden ser integradas inmediatamente para dar a φ y ψ en funci´ on de logaritmos de la funci´ on σ. Finalmente, φ y ψ pueden escribirse en la forma: e2i(φ−φ0 ) = e2[ς(iδ)−ς(iσ)]t
σ(t + ǫ − iδ) σ(t + ǫ + iδ) σ(t + ǫ + iδ)σ(t + ǫ − iδ)
e2i(ψ−ψ0 ) = e2[ς(iδ)+ς(iσ)]t
σ(t + ǫ − iδ) σ(t + ǫ − iδ) σ(t + ǫ + iδ)σ(t + ǫ + iδ)
(8.295)
donde φ0 y ψ0 son constantes de integraci´ on. Expresi´ on para los par´ ametros de Cayley-Klein de un trompo esf´ erico en funci´ on del tiempo. Los par´ ametros de Cayley-Klein especifican la posici´on del cuerpo r´ıgido y est´ an expresados en funci´ on de los ´angulos de Euler mediante las f´ormulas (7.175) de la secci´ on 7.8: α′ = cos
θ i(φ+ψ)/2 e ; 2
θ β ′ = i sen ei(ψ−φ)/2 2
(8.296) θ −i(φ+ψ)/2 θ −i(φ−ψ)/2 ′ ; δ = cos e γ = i sen e 2 2 Para expresar a cos(θ/2) en funci´ on de t, notemos que 2 cos2 (θ/2) = 1 + cos θ. Ahora, usando (8.283) y (8.288) llegamos f´acilmente al resultado siguiente usando la f´ormula 18.4.4 del citado manual: 2I1 θ [P(t + ǫ) − P(iδ)] 2 cos2 = 2 mgl (8.297) 2I1 σ(t + ǫ + iδ)σ(t + ǫ − iδ) = − mgl σ 2 (iδ) σ 2 (t + ǫ) ′
Para 2 sen2 (θ/2) hallamos una expresi´on similar reemplazando δ por γ. Combinando (8.297) con (8.295), obtenemos: r I1 ei(φ0 +ψ0 )/2 σ(t + ǫ − iδ) tς(iδ) ′ α = i e mgl σ(iδ) σ(t + ǫ) β′ = i
γ′ = i
′
δ = i
r
r
r
I1 ei(ψ0 −φ0 )/2 σ(t + ǫ − iγ) tς(iγ) e mgl σ(iγ) σ(t + ǫ) (8.298) I1 ei(φ0 −ψ0 )/2 σ(t + ǫ + iγ) tς(iγ) e mgl σ(iγ) σ(t + ǫ) I1 e−i(φ0 +ψ0 )/2 σ(t + ǫ + iδ) −tς(iδ) e mgl σ(iδ) σ(t + ǫ)
Para un trompo no esf´erico las f´ormulas correspondientes a (8.295) y (8.298) se obtienen simplemente por reemplazar la funci´ on ς por ς + i(I3 − I1 )a/(2I3 ).
302 / Mec´ anica cl´ asica La precesi´ on estable o regular. Es el movimiento que se presenta cuando no hay nutaci´ on, o sea cuando θ es constante. En este caso θ˙ y θ¨ son permanentemente cero. Se sigue de las ecuaciones (8.270) que φ˙ y ψ˙ tambi´en son constantes. El valor de u0 = cos θ0 se obtiene resolviendo la ecuaci´ on algebraica dVef /dt = 0. De acuerdo con (8.276) esto nos da: 2(a − ub)(b − au) − β(1 − u2 )2 = 0
(8.299)
De aqu´ı obtenemos el valor de u0 , y en consecuencia el valor que debe tomar la constante E ′ para que se produzca la precesi´ on sin nutaci´on. La ecuaci´ on (8.299) es la condici´on para que la “fuerza” en θ sea nula, o sea que es la condici´on para que θ¨ sea cero, que junto con θ˙ = 0 caracteriza la precesi´ on regular. Esta ecuaci´ on debe ser compatible con la ecuaci´ on (8.270). Si sustituimos en (8.299) a b − au0 por su valor φ˙ 0 (1 − u20 ) y a ˙ − u2 ) + au0 , obtenemos: b por φ(1 0 β φ˙ 20 u0 − aφ˙ 0 + = 0 2 Esta ecuaci´ on nos da para φ˙ los valores: ! s 4mglI a 1 1± 1− u0 φ˙ 0 = 2u0 p2ψ
(8.300)
(8.301)
Como φ˙ 0 debe ser real, debe cumplirse que: −∞ <
4mglI1 u0 2βu0 ≤1 ≤ 1 → −∞ < p2ψ a2
(8.302)
Esta expresi´on limita dr´asticamente los posibles valores de la velocidad angular del trompo ωz alrededor de su eje de simetr´ıa z: 4mglI1 u0 ≤ ωz2 I32
(8.303)
φ˙ 0 es la velocidad angular de precesi´ on alrededor del eje espacial z. La ecuaci´ on (8.301) nos dice que hay dos posibles valores de la velocidad angular de precesi´ on que (+) (−) llamaremos φ˙ 0 (precesi´on r´apida) y φ˙ 0 (precesi´on lenta). El trompo r´ apido. Si ωz es tan grande que 2βu0 /a2 es mucho menor que la unidad tenemos el caso del trompo r´apido. De (8.303) vemos que la condici´on de trompo r´apido puede escribirse en la forma: I3 1 mgl ≪ (8.304) I3 ωz2 I1 2 Expandiendo al primer orden la ra´ız cuadrada en (8.301) obtenemos para las frecuencias de precesi´ on de un trompo r´apido: I3 ωz (+) ; φ˙ 0 = I1 u0
mgl (−) φ˙ 0 = I3 ωz
(8.305)
Din´ amica del cuerpo r´ıgido / 303 Para el caso en que θ0 > π/2 (u0 negativo), la condici´on de precesi´ on estable (8.302) se cumple para todos los valores de ωz . Este es el caso en que el trompo “cuelga” (+) (−) del punto fijo O. Seg´ un (8.305), cuando u0 < 1, φ˙ 0 y φ˙ 0 tienen signos opuestos. Precesi´ on con nutaci´ on. Ocurre cuando E > E ′ ; en este caso θ oscila entre θ1 y θ2 . La frecuencia angular de precesi´ on est´ a dada por (8.270): b − a cos θ b/a − cos θ φ˙ = =a sen2 θ sen2 θ
(8.306)
˙ Se pueden presentar varios casos en cuanto al signo de φ: ˙ (a) φ tiene el mismo signo para todos los valores de θ. Ocurre que es positivo para todos los valores de θ si: b > cos θ (8.307) a El trompo precesa siempre en la misma direcci´ on alrededor del eje z en tanto que el eje z oscila entre θ1 y θ2 . La precesi´ on es monot´ onica con φ˙ siempre positivo. Si se toma una esfera fija en el espacio, con centro en O, la “marca” que dejar´ıa el eje z sobre la esfera se representa en la figura 8.11. z
Z θ2 θ1
θ2 θ1
θ2 θ1
φ
a
b
c
Figura 8.11 “Marcas” que dejar´ıa el eje z sobre la esfera: a. para b/a > cos θ, b. para cos θ1 < b/a < cos θ2 y c. para cos θ2 = b/a (b) φ˙ cambia de signo cuando el eje va de θ2 a θ1 . Si ocurre que: b < cos θ2 (8.308) a entonces cuando θ = θ1 , φ˙ es positivo y cuando θ = θ2 , φ˙ es negativo. Por lo tanto la precesi´ on no es monot´ onica, sino que se da un avance neto en forma de rizo como en la figura 8.11b. Es claro que en este movimiento φ˙ no se anula en la media. (c) Puede ocurrir que: cos θ1 <
cos θ2 =
b a
(8.309)
304 / Mec´ anica cl´ asica Esto implica que φ˙ es positivo para todo θ mayor que θ2 y se anula para θ = θ2 . Entonces, como θ = θ2 es un punto de retorno, all´ı θ˙ es igual a cero. En θ = θ2 el eje z se encontrar´a simult´ aneamente sin precesi´ on y sin nutaci´on, o sea que se encuentra instant´ aneamente en reposo. El movimiento se representa en la figura 8.11c. Esta situaci´ on corresponde al m´etodo m´as simple de dejar girando un trompo. Primero se hace girar alrededor del eje z y luego se suelta haciendo un ´angulo θ2 con la vertical. Las condiciones para t = 0 son entonces θ = θ2 y θ˙ = φ˙ = 0. Las ecuaciones (8.272) y (8.309) nos dicen entonces que la constante E ′ vale: E ′ = mgl cos θ2
(8.310)
Como en (8.272) los t´erminos que contienen a I1 son positivos, para tiempos mayores que cero la energ´ıa potencial debe disminuir o sea θ debe aumentar hasta alcanzar el valor θ1 y seg´ un (8.306) entonces φ˙ aumenta a partir de cero hasta alcanzar el valor m´aximo positivo dado por: cos θ2 − cos θ1 a φ˙ 1 = sen2 θ1
(8.311)
O sea que el trompo al dejarse caer desde θ = θ2 con θ˙ = φ˙ = 0 en t = 0, en un tiempo mayor adquiere precesi´ on y nutaci´on. Ocurre cuando el trompo es r´apido y hay rozamiento en el punto O que la nutaci´on se amortigua r´apidamente, dando la impresi´on de que las condiciones iniciales se˜ naladas no dan lugar a precesi´ on con nutaci´on sino a una precesi´ on regular. Los comportamientos descritos en (a), (b) y (c) est´ an contenidos en la expresi´on anal´ıtica (8.295). El producto que contiene las funciones σ es puramente peri´odico, de modo que el exponencial del lado derecho da el movimiento medio de φ, esto es el movimiento precesional neto. La ecuaci´ on (8.295) nos dice que ψ tiene un comportamiento an´alogo al de φ o sea una rotaci´on neta acompa˜ nada de fluctuaciones peri´odicas. La precesi´ on seudoregular. Es el comportamiento usual de un trompo r´apido, que de acuerdo con (8.304) se presenta cuando el efecto de la gravedad es peque˜ no y puede asimilarse a una peque˜ na perturbaci´on. En la aproximaci´on cero se presentar´ a la precesi´ on regular propia de un cuerpo r´ıgido sim´etrico libre, ecuaci´ on (8.179). El efecto de la gravedad es perturbar ligeramente ese movimiento dando lugar a una peque˜ na nutaci´ on. Los valores de las constantes de movimiento para la precesi´ on con nutaci´on en el ˙ ˙ caso (c), correspondientes a las condiciones iniciales θ(0) = θ2 , θ(0) = φ(0) = 0, seg´ un las ecuaciones (8.268) son: ˙ cos θ2 = I3 ψ(0)
I1 b
˙ = I3 ψ(0)
I1 a
E′ =
(8.312)
mgl cos θ2
que pueden expresarse en t´erminos de la energ´ıa de rotaci´on, inicialmente dada por: R=
1 1 I3 ωz2 = I3 ψ˙ 2 (0) 2 2
(8.313)
Din´ amica del cuerpo r´ıgido / 305 Entonces: √ 2RI3 I3 a= = ωz ; I1 I1
b = a cos θ2 (8.314)
I1 β E = mgl cos θ2 = cos θ2 2 Entonces podemos escribir a f (u) en la forma: ′
f (u) = β(1 − u2 )(u2 − u) − a2 (u2 − u)2 Las ra´ıces de f (u) son: s " # a2 4β β u3,1 = 1± 1+ 2 − u2 2β a a2
(8.315)
(8.316)
a2 /β est´ a dado por: I3 R a2 = β I1 mgl
(8.317)
O sea que cuando el trompo es r´apido podemos escribir a (8.316) en la forma aproximada: 2β 2β 2 a2 2 1 ± 1 − 2 u2 + 4 (1 − u2 ) (8.318) u3,1 = 2β a a lo cual nos da inmediatamente: u3 ≈
a2 ; β
u1 ≈ u2 −
β (1 − u22 ) a2
(8.319)
La magnitud de la nutaci´ on est´ a dada por: β sen2 θ2 (8.320) a2 O sea que cuando θ2 = 0, el eje z permanece vertical (trompo “dormido”). Adem´as, la magnitud de la nutaci´ on var´ıa como R−1 ; cuanto m´as r´apido gire el trompo menor ser´a la nutaci´ on. Calculemos ahora la frecuencia de la nutaci´on para un trompo r´apido. Llamemos cos θ al promedio de cos θ, o sea a: cos θ2 − cos θ1 ≈
cos θ1 + cos θ2 β (8.321) = cos θ2 − 2 sen2 θ2 2 2a Podemos especificar la magnitud del desplazamiento del eje z en un tiempo t por: cos θ =
x = cos θ − cos θ = u − u
(8.322)
Usando las ra´ıces de la funci´ on f (u) podemos escribir la ecuaci´ on diferencial para u en la forma aproximada: β a2 u˙ 2 = β(u − u2 ) u − u2 + 2 (1 − u22 ) u − (8.323) a β
306 / Mec´ anica cl´ asica Como para un trompo r´apido se cumple que a2 /β ≫ u, podemos aproximar a´ un m´as a (8.323). Luego expresamos a u en t´erminos de x para obtener: β2 2 2 2 (8.324) x˙ = − 4 sen θ2 − x 4a Derivando (8.324) respecto a t llegamos a: x ¨ + a2 x = 0
(8.325)
La soluci´on que satisface la condici´on θ(0) = θ2 es, en consecuencia: x=
β sen2 θ2 cos at ; 2a2
cos θ = cos θ2 −
β at sen2 θ2 sen2 a2 2
(8.326)
La frecuencia angular de la nutaci´on es: 1 I3 ωz a= 2 2I1
(8.327)
O sea que la frecuencia de las nutaciones es mayor a medida que ωz es mayor. (8.306) nos da la frecuencia angular de precesi´ on. Como seg´ un (8.326) x es del orden de β/(2a2 ), podemos escribir aproximadamente a φ˙ como: u2 − u u2 − u β at φ˙ = a≈ a = sen2 2 2 1−u 1 − u2 a 2
(8.328)
un (8.305), coincide con la velocidad angular de preceβ/(2a2 ) = mgl/(I3 ωz ), seg´ si´ on lenta del trompo r´apido, lo cual nos permite escribir a φ˙ como: at (−) φ˙ = 2φ˙ 0 sen2 2
(8.329)
La frecuencia angular de precesi´ on media durante un ciclo de la nutaci´on es: (−) φ˙ = φ˙ 0
(8.330)
Vemos que mientras mayor sea ωz , menor ser´a la velocidad angular de precesi´ on. Para un trompo r´apido el movimiento es una nutaci´on peque˜ na y una precesi´ on peque˜ na que coincide con la velocidad angular de precesi´ on lenta de un trompo r´apido. Esta precesi´ on se llama precesi´ on seudoregular, pues aunque las condiciones iniciales no son las de la precesi´ on regular, en la pr´actica se comporta como ´esta porque la fricci´on amortigua r´apidamente la nutaci´on y aparentemente el eje z del trompo empieza ins´ tant´ aneamente a precesar, con movimiento normal a la gravedad. Esta es la paradoja de Klein-Sommerfeld quienes explicaron que esta precesi´ on no implica aceleraciones infinitas sino que se trata de una precesi´ on con una imperceptible nutaci´on. El trompo “dormido”. Es el caso cuando el eje z permanece vertical, sin precesi´ on ni nutaci´ on, o sea cuando: θ(t) = 0 ;
˙ =0 θ(t)
(8.331)
Din´ amica del cuerpo r´ıgido / 307 f (u)
u1 = u2 = 1 –1
0
u3 u
+1
Figura 8.12 Comportamiento de f (u) para u1 = u2 = 1
f (u)
0 –1 u1
+1 u2 = u 3 = 1
u
Figura 8.13 Comportamiento de f (u) para u2 = u3 = 1
Esta situaci´ on es un caso l´ımite de la precesi´ on estable cuando el m´ınimo de Vef (u) est´ a en u0 = 1. Como cuando E ′ = E0′ , los dos puntos de retorno coinciden, la funci´ on f (u) tiene el comportamiento mostrado en las figuras 8.12 y 8.13. Para este caso los valores de las constantes de movimiento son: ˙ ; I1 a = I3 (ψ˙ + φ)
b = a;
E ′ = mgl
(8.332)
Se sigue de (8.275) y (8.332) que: α=β
(8.333)
308 / Mec´ anica cl´ asica La ecuaci´ on (8.274) tiene entonces la forma: u˙ 2 = (1 − u)2 α(1 + u) − a2
(8.334)
Las ra´ıces de f (u) son en consecuencia: 1,
1,
a2 −1 α
(8.335)
Veamos qu´e condiciones se requieren en cada uno de los casos mostrados en las figuras 8.12 y 8.13. Para ello examinemos la curvatura de f (u) en la ra´ız doble: 2 a ′′ f (1) = 2α 1 − −1 (8.336) α Claramente en el caso de la figura 8.12, donde (a2 /α) − 1 es mayor que 1, la curvatura es negativa y en la figura 8.13 la curvatura es positiva. Los resultados de la precesi´ on estable en general se aplican en este caso en que u0 = 1. La condici´on (8.303) en este caso es: a2 ≥1 2α
(8.337)
que se˜ nala la velocidad angular cr´ıtica ωc debajo de la cual cesa la precesi´ on regular, o sea: ωc2 =
4mglI1 I32
(8.338)
Vemos pues que el caso de la figura 8.12 es en rigor el de precesi´ on regular en tanto que el caso de la figura 8.13 es inestable y mediante una peque˜ na perturbaci´on degenera en el de precesi´ on con nutaci´on; para este caso ωz < ωc y para el caso de la figura 8.12, ωz > ωc . Cuando ωz sea igual a ωc entonces a2 /α = 2 y seg´ un (8.335) las tres ra´ıces de f (u) coinciden y el movimiento a´ un es estable. Ejemplo 8.5.1 A partir de la soluci´on anal´ıtica hallar los valores de la frecuencia angular de nutaci´ on y de la velocidad angular de precesi´ on media para la precesi´ on con nutaci´on de un trompo pesado bajo las condiciones iniciales (8.312), caso (c). De acuerdo con las f´ormulas (8.283) y (8.284), el per´ıodo de la nutaci´on coincide con el per´ıodo de la funci´ on el´ıptica ns2 que es 2K. O sea que: √ T e3 − e1 = 2K (8.339) El par´ ametro de la funci´ on, seg´ un (8.285) y (8.280) es: √ u2 − u1 λu2 − 1 + 1 + λ2 − 2λu2 2β √ m= = ; λ= 2 u3 − u1 a 2 1 + λ2 − 2λu2
(8.340)
donde hemos usado (8.316). Para precisar, asumamos que: u2 =
1 ; 2
λ=1
(8.341)
Din´ amica del cuerpo r´ıgido / 309 Entonces los valores de m y de √ a e3 − e1 = m = 0, 25 ; 2
√ e3 − e1 son: (8.342)
De la tabla 17.1 del manual de Abramowitz y Stegun obtenemos: K(0, 25) = 1, 685
(8.343)
con lo cual el valor exacto del per´ıodo T es: T =
4K 6, 74 = a a
(8.344)
y el valor exacto de la frecuencia de nutaci´on es: Ωnut = 0, 932 a
(8.345)
Promediando sobre un per´ıodo de las funciones P obtenemos que el t´ermino de φ˙ que en (8.292) da lugar a precesi´ on neta es: 2iφ˙ = 2
σ(iγ) ˙ σ(iδ) ˙ −2 σ(iδ) σ(iγ)
(8.346)
Seg´ un (8.288) y (8.314) se cumple para este caso que: P(iγ) =
βu2 + a2 5λ − 4 2 1 2 β − = a = a 4 12 48 48
P(iδ) =
βu2 + a2 7λ + 4 2 11 β =− a = − a2 − − 4 12 48 48
(8.347)
Seg´ un la expansi´ on en serie para P(x) el t´ermino dominante es x−2 de modo que: P(iγ) ≈ −
1 ; γ2
P(iδ) ≈ −
1 δ2
Entonces hallamos que: r √ 48 48 1 ; iγ ≈ −i iγ ≈ a 11 a
(8.348)
(8.349)
Por otra parte, el t´ermino dominante en la expansi´ on en serie para ς(x) es x−1 lo cual nos dice que: r 11 1 1 1 ς(iδ) ≈ ≈i a ; ς(iγ) ≈ ≈√ a (8.350) iδ 48 iγ 48 Entonces resulta que φ˙ vale: φ˙ ≈ 0, 48a + 0, 14ai
(8.351)
El resultado nos indica que para las condiciones iniciales (8.341) no hay precesi´ on neta estable; que el movimiento en φ dura menos de un per´ıodo de P, en tanto que
310 / Mec´ anica cl´ asica (8.346) supone que existe movimiento en φ durante m´as de un per´ıodo. En efecto, para λ mayor que 0,8 domina el efecto de la gravedad y el trompo cae. La f´ormula (8.340) resulta aplicable para λ < 0,8. El movimiento descrito por la figura 8.11c existe si: I1 2mgl < 0, 8 I3 R
(8.352)
Si tomamos λ = 0, 1 y u2 = 0, 5, mediante id´enticos procedimientos llegamos a los siguientes resultados: e1 = −0, 079659a2 ;
e2 = −0, 079166a2 ;
e3 = 0, 1188257a2
(8.353)
En consecuencia: m = 0, 6659781 ;
K(m) = 2, 025
(8.354)
Entonces un valor para la frecuencia de nutaci´on m´as exacto que el resultado (8.327) es: Ωnut = 0, 691a
(8.355)
Sin embargo en el c´ alculo de la velocidad angular de precesi´ on entran en juego las aproximaciones hechas para evaluar las ς. Para iδ y iγ obtenemos: i iγ ≈ −3, 7032803 ; a
iδ ≈ −3, 1957416
i a
(8.356)
lo cual nos conduce a: φ˙ = 0, 04 a
(8.357)
que esta vez no tiene la contribuci´on imaginaria. Seg´ un (8.330) que es aplicable en este caso pues λ ≪ 1, φ˙ debe valer: β = 0, 0025 a φ˙ ≈ 2a
8.6.
(8.358)
Movimiento en un sistema de referencia no inercial
Ya a lo largo del texto hemos considerado varios casos de sistemas de referencia no inerciales. En el ejemplo 4.1.5, secci´ on 4.1, encontramos las ecuaciones de movimiento para una part´ıcula en un sistema de referencia que rota uniformemente con velocidad angular ~ ω . Encontramos que la rotaci´on a˜ nade a la energ´ıa un t´ermino que depende s´olo de las coordenadas de la part´ıcula y es proporcional al cuadrado de la velocidad angular. Este t´ermino adicional, −m(~ω × ~r)2 /2 se llama energ´ıa potencial centr´ıfuga. En la ecuaci´ on de movimiento aparecen dos t´erminos adicionales de tipo inercial. La fuerza 2m~r˙ × ~ ω se llama fuerza de Coriolis; es una fuerza no disipativa que depende de la velocidad de la part´ıcula, pero no da contribuci´on a la energ´ıa. La fuerza m~ω × (~ω × ~r) se llama fuerza centr´ıfuga; est´ a en el plano formado por ~r y ~ω , siendo perpendicular al
Din´ amica del cuerpo r´ıgido / 311 eje de rotaci´on y alej´ andose de ´el; el m´odulo de esta fuerza es mρω 2 siendo ρ la distancia de la part´ıcula al eje de rotaci´on. Al final de la secci´ on 7.9 encontramos expresiones m´as exactas para las ecuaciones de movimiento, en funci´ on de la matriz de rotaci´on. Encontramos en la ecuaci´ on (7.282) un t´ermino adicional, la fuerza m~r × ~ω˙ debida a la no uniformidad de la rotaci´on. Consideremos ahora el sistema de referencia no inercial m´as general. Consiste en un sistema de referencia que rota no uniformemente y cuyo origen se translada con aceleraci´ on no ~ del origen de coordenadas y la velocidad anuniforme. Se supone que la aceleraci´ on A(t) gular de rotaci´on ω ~ (t) son funciones del tiempo conocidas a priori. Entonces la ecuaci´ on de movimiento m´as general para una part´ıcula que se mueve en un sistema de referencia no inercial es: ∂V ~ + m~r × ~ω˙ + 2m~r˙ × ~ω + m~ω × (~r × ~ω) − mA (8.359) m~¨r = − ∂~r Ya hemos considerado el movimiento de un cuerpo r´ıgido en un sistema de referencia que rota uniformemente. En el ejemplo 8.3.1 hallamos la forma que toman las ecuaciones de Euler en tal sistema de referencia, ecuaciones (8.128) y (8.129). Ejemplo 8.6.1 Resolver el problema del p´endulo de Foucault consider´ andolo como un cuerpo r´ıgido y usando las ecuaciones de Euler en un sistema de referencia rotante. En este problema intervienen tres sistemas de ejes. Los ejes inerciales, los ejes rotantes fijos a la Tierra y los ejes fijos al cuerpo r´ıgido. Llamaremos x′ , y ′ , z ′ , a los ejes fijos a la Tierra y x, y, z, a los ejes fijos al cuerpo r´ıgido. El vector de velocidad angular de la Tierra, que asumiremos constante respecto a los ejes inerciales, vale: ω ~ 0 = ω0~k
(8.360)
donde ~k est´ a en la direcci´ on de la l´ınea sur-norte que asumiremos fija en el espacio (ver la figura 8.14). El p´endulo est´ a suspendido de un punto O fijo respecto a la Tierra. En ese punto tomaremos el origen com´ un de los ejes fijos a la Tierra y al cuerpo r´ıgido. Este es un cuerpo r´ıgido trivial que consiste en una part´ıcula mantenida a distancia fija de O por medio de un hilo sin masa y longitud l. El eje z lo tomamos a lo largo del hilo, de modo que la posici´on de la part´ıcula respecto a los ejes fijos al cuerpo r´ıgido est´ a en (0, 0, l). Los momentos principales de inercia de este cuerpo r´ıgido son: I1 = ml2 ;
I2 = ml2 ;
I3 = 0
(8.361)
Los ejes x y y son perpendiculares a z pero pueden tomarse arbitrariamente, pues este cuerpo r´ıgido no permite especificarlos. Podemos, sin perder generalidad, tomar el eje y perpendicular al plano de oscilaci´on del p´endulo y el eje x en el plano de oscilaci´on ˙ asumir del p´endulo y cuando aparezca la velocidad de rotaci´on alrededor del eje z, ψ, que es cero, lo mismo que ψ. Las componentes del vector de velocidad angular de la Tierra respecto a los ejes primados son: ω0 ′ = ~ =
ω0 [(~k · ~i ′ )~i ′ + (~k · ~j ′ )~j ′ + (~k · ~k ′ )~k ′ ] ω0 (cos λ, 0, −senλ)
(8.362)
312 / Mec´ anica cl´ asica N i
0 φ j′ j
j′
i′
i′
k
k′
0 k
k′
θ
ω0 l
φ
λ m
S b
a
Figura 8.14 P´endulo de Foucault considerado como un cuerpo r´ıgido: a. Sistema de ejes y b. Componentes del vector de velocidad angular de la tierra respecto a los ejes primados.
La energ´ıa potencial vale V = −mgz ′ = −mgl cos θ. Entonces los torques alrededor de los ejes z ′ y z, y de la l´ınea de nodos, son respectivamente: Kφ = 0 ;
Kψ = 0 ;
Kθ = −mgl senθ
(8.363)
Las ecuaciones de Euler en un sistema de referencia rotante fueron halladas en los ejemplos 8.3.1 y 8.3.3, en la secci´ on 8.3. Las ecuaciones requeridas para este problema deben incluir los torques, o sea que a las ecuaciones (8.155) debemos adicionar en el lado derecho: 3 X
Kr βrt ;
t = 1, 2, 3
(8.364)
r=1
donde las Kr est´ an dadas por (8.363) y βrt es la matriz (8.134). Los torques (8.364), que llamaremos K1 , K2 , K3 , son en consecuencia: K1 = −mgl senθ cos ψ ;
K2 = mgl senθ senψ ;
K3 = 0
(8.365)
para escribir las ecuaciones (8.155) se requiere adem´as conocer las componentes del vector ~ ω0′ respecto a los ejes fijos al cuerpo r´ıgido. Para ello debemos evaluar: ˜ω0′ ~ 0 = A~ ω
(8.366)
donde A˜ es la matriz de rotaci´on entre los ejes con primas y los ejes con barras, dada por la ecuaci´ on (7.122) secci´ on 7.6. Las ecuaciones (8.128) y (8.129) con torques, con los
Din´ amica del cuerpo r´ıgido / 313 momentos de inercia (8.361) nos dan: (ω˙ z + ω˙ 0z ) · 0 =
0
(ω˙ y + ω˙ 0y ) =
g −(ωx + ω0x )(ωz + ω0z ) + senθ senψ l
(ω˙ x + ω˙ 0x ) =
g (ωy + ω0y )(ωz + ω0z ) − senθ cos ψ l
(8.367)
Debido a que I3 = 0 y I1 = I2 , la ecuaci´ on (8.367) da un valor indeterminado para ω˙ z + ω˙ 0z y en consecuencia para ωz + ω0z , la indeterminaci´on proviene del hecho ya se˜ nalado al definir las coordenadas x, y, z. En efecto, como la masa m es puntual, carece de sentido hablar de rotaci´on alrededor de z, por ello el lagrangiano (8.123) no ˙ Entonces, como se se˜ contiene ni a ψ ni a ψ. nal´ o, podemos tomar ceros los valores de ψ ˙ y ψ. De la ecuaci´ on (7.122), junto con las ecuaciones (8.366) y (8.131) podemos escribir ~ , cuando ψ = 0 y ψ˙ = 0: para el vector ~ω 0 y ω θ˙ + ω0 cos φ cos λ ~ + ~ω0 = senθ φ˙ − ω0 cos θ senφ cos λ − ω0 senθ senλ (8.368) ω cos θ φ˙ + ω0 senθ senφ cos λ − ω0 cos θ senλ Las derivadas de este vector respecto al tiempo son: ¨ ˙ θ−ω0 senφ cos λ φ
˙ ~ 0 =φ¨ senθ+ θ˙ φ˙ cos θ+ω0 θ(senφ ~ω + ω senθ
cos λ−cos θ senλ)−ω0 φ˙ cos θ cos φ cos λ
(8.369)
˙ φ¨ cos θ− θ˙ φ˙ senθ+ω0 θ(senφ cos θ cos λ+senθ senλ)+ω0 φ˙ senθ cos φ cos λ
Ciertamente las ecuaciones (8.367) son consistentes cuando ωz + ω0z valga cero. En efecto, las dos u ´ltimas igualdades de (8.367) se convierten en: g θ¨ − ω0 φ˙ senφ cos λ + senθ = 0 l
(8.370)
senθ φ˙ − ω0 cos θ senφ cos λ − ω0 senθ senλ = constante Si tomamos cero el valor de la constante en (8.370), esta ecuaci´ on ser´a consistente con la ecuaci´ on ωz + ω0z = 0, cos θ φ˙ + ω0 senθ senφ cos λ − ω0 cos θ senλ = 0
(8.371)
solamente si se cumple que: φ˙ = ω0 senλ ;
φ=0
(8.372)
Esto quiere decir que tomar simult´ aneamente ceros los valores de ωy + ω0y y ωz + ω0z da aneamente. La ecuaci´ on lugar a la soluci´on cuando los ejes x′ −y ′ y x−y coinciden instant´
314 / Mec´ anica cl´ asica (8.372) muestra una rotaci´on uniforme del plano de oscilaci´on del p´endulo alrededor del eje z, en sentido positivo. En efecto, si el p´endulo oscilara en el polo norte, donde senλ = 1, un observador en la Tierra ver´ıa rotar el plano del p´endulo uniformemente en sentido contrario al de la rotaci´on de la Tierra y con una velocidad angular igual a ω0 ; esto se ve claramente al notar que el plano de oscilaci´on del p´endulo en un sistema de referencia inercial no cambia, o sea que los ejes x − y no cambian en un sistema de referencia inercial y respecto a ellos los ejes x′ − y ′ rotan uniformemente. Para un p´endulo de 100 m, g/l vale aproximadamente 10−1 s−2 en tanto que ω0 ≈ −8 −1 10 s , de modo que las ecuaciones (8.367) pueden resolverse f´acilmente, sin hacer las suposiciones: ωz + ω0z = ωy + ω0y = 0, despreciando los t´erminos que contengan a ω02 ˙ El resultado es que el plano de oscilaci´on del p´endulo rota uniformemente con y ω0 φ. una velocidad angular ω0 senλ, aun en donde los ejes x′ − y ′ y x − y no coinciden, y en que la rotaci´on de la Tierra no tiene efecto sobre la coordenada θ sino con un t´ermino centr´ıfugo, que es del orden de ω02 . Ejemplo 8.6.2 Un gir´oscopo es un cuerpo r´ıgido sim´etrico montado sobre anillos de suspensi´on de card´an de modo que el cuerpo r´ıgido se puede mover libremente con el centro de gravedad fijo, por lo cual no hay torque gravitacional. La br´ ujula girosc´opica es un gir´oscopo al cual se le impone la ligadura que consiste en impedir que el eje de simetr´ıa se mueva fuera del plano horizontal. Demu´estrese usando las ecuaciones de Euler que cuando la velocidad angular del gir´oscopo es grande comparada con la de la Tierra, este gir´oscopo oscilar´a alrededor de un meridiano, pudiendo utilizarse como br´ ujula (br´ ujula girosc´opica de Foucault). Los ejes principales del gir´oscopo x, y, z, los definimos de modo que el eje de simetr´ıa es el eje z, que permanecer´ a en el plano horizontal. La figura 8.15a muestra los ejes fijos a la Tierra x′ , y ′ , z ′ , y la figura 8.15b los ejes x, y, z. Línea de nodos (φ = 0)
N
x′
0
z
ψ
j′ k′
x
Vertical
z′ Norte
θ
i′
k′
y′ 0
ω0 λ
Este
Línea del meridiano
S
y a
b
Figura 8.15 Ejes principales del gir´oscopo: a. Ejes x′ , y ′ y z ′ fijos a la Tierra, b. Ejes principales x, y y z del gir´oscopo.
Din´ amica del cuerpo r´ıgido / 315 La condici´on de ligadura impuesta a la suspensi´on de Card´ an es: φ=0
(8.373)
´ Esta implica que φ˙ = 0, o sea que la ligadura impuesta a las velocidades angulares ωx , ωy , ωz , de acuerdo con las ecuaciones (8.132) es: senψ ωx + cos ψ ωy = 0
(8.374)
Usando la notaci´ on de la secci´ on 2.8, escribimos la ligadura en la forma a1 ωx + a2 ωy + a3 ωx donde a1 = tan ψ, a2 = 1, a3 = 0. Entonces los componentes de la fuerza de ligadura son: Rx = λ tan ψ ;
Ry = λ ;
Rz = 0
(8.375)
donde λ es un multiplicador indeterminado de Lagrange. Las ecuaciones de movimiento son las ecuaciones de movimiento de Euler en un sistema de referencia rotante, ecuaciones (8.128) y (8.129), donde de acuerdo con los resultados de la secci´ on 2.8, debemos incluir los t´erminos de torque debidos a la ligadura, (8.375). Por lo anterior, tales ecuaciones son: (ω˙ z + ω˙ 0z )I3 = 0 (ω˙ y + ω˙ 0y )I1 = (ωx + ω0x )(ωz + ω0z )(I3 − I1 ) + λ
(8.376)
(ω˙ x + ω˙ 0x )I1 = (ωy + ω0y )(ωz + ω0z )(I1 − I3 ) + λ tan ψ Las componentes de la velocidad angular de la Tierra en los ejes primados son: ω ~ 0′ = ω0 (senλ, 0, cos λ)
(8.377)
˜ ecuaci´ ~ 0 debemos usar la matriz de rotaci´on A, on (7.122) de la Para hallar a ω secci´ on 7.6, tomando φ = 0: senλ cos ψ + cos λ senψ senθ ~ ω 0 = ω0 −senλ senψ + cos λ cos ψ senθ (8.378) cos λ cos θ ~ seg´ un (8.131) es: En tanto que ω, ˙ −senψ θ, ˙ ψ) ˙ ~ = (cos ψ θ, ω
(8.379)
~ω˙ + ~ω˙ 0 est´ a dada por: ¨ ˙
θcψ− θsψ(e−ω0 cλ cθ)+ω0 (−sλ sψ+cλ cψ sθ)(e − ω0 cλ cθ)+ω0 θ˙ cλ sψ cθ
¨ ˙ ˙ ~˙ 0 =−θsψ− ~˙ ω θcψ(e−ω ω+ 0 cλ cθ)+ω0 (−sλ cψ−cλ sψ sθ)(e − ω0 cλ cθ)+ω0 θ cλ cψ cθ ˙ 0 cλ sθ −θω
(8.380)
316 / Mec´ anica cl´ asica donde usamos s y c en vez de sen y cos, y e es el valor de la constante que se obtiene de (8.376) o sea un esp´ın axial neto que incluye una componente de la rotaci´on de la Tierra: e = ωz + ω0z
(8.381)
Reemplazando las ecuaciones (8.378) a (8.381) en las ecuaciones (8.376) obtenemos: θ¨ cψ + θ˙ sψ(−e + 2ω0 cλ cθ + A) +ω0 sψ(−e sλ + ω0 sλ cλ cθ + sλ A)
(8.382)
+ω0 cψ(e cλ sθ − ω0 c2 λ sθ cθ − A cλ sθ) = Λ tan ψ −θ¨ sψ + θ˙ cψ(−e + 2ω0 cλ cθ + A) +ω0 cψ(−e sλ + ω0 sλ cλ cθ + sλ A)
(8.383)
+ω0 sψ(−e cλ sθ + ω0 c2 λ sθ cθ + A cλ sθ) = Λ donde Λ es igual a λ/I1 y A est´ a defnida por: A=
I1 − I3 e I1
(8.384)
Multiplicando (8.382) por cos ψ y (8.383) por senψ y restando las ecuaciones resultantes, obtenemos: I3 θ¨ + ω0 e cos λ senθ − ω02 cos2 λ senθ cos θ = 0 I1
(8.385)
Para un lugar que no est´e en los polos, cos λ 6= 0, y para una alta velocidad de rotaci´on del gir´oscopo, e ≫ ω0 , la ecuaci´ on (8.385) se puede aproximar a: I3 eω0 cos λ senθ = 0 θ¨ + I1
(8.386)
´ Esta es una ecuaci´ on similar a la de un p´endulo simple. Indica que el eje del gir´oscopo oscila alrededor de la l´ınea del meridiano, siendo el per´ıodo de peque˜ nas oscilaciones: r I1 (8.387) T = 2π I3 eω0 cos λ es decir, el mecanismo indica el norte, por lo tanto sirve de br´ ujula que indica el norte verdadero, a diferencia de una br´ ujula magn´etica que indica el norte magn´etico. Para una discusi´ on m´as detallada que incluye el caso en que el gir´oscopo est´ a montado sobre un barco, v´ease el texto de Atkin, Din´ amica cl´ asica, John Willey, 1959, o referencias especializadas sobre el gir´oscopo. La ecuaci´ on de ligadura (8.374) permite obtener a ψ(t) al reemplazar el resultado de integrar a (8.386), y la ecuaci´ on (8.376) permite entonces hallar a λ, y en consecuencia la fuerza de ligadura. Como la soluci´on de (8.386) es una funci´ on el´ıptica, sn, las ecuaciones (8.374), (8.376) y (8.386) permiten expresar a θ, ψ y λ en t´erminos de funciones el´ıpticas.
Din´ amica del cuerpo r´ıgido / 317 Ejercicio 8.6.1 Integrar las ecuaciones (8.374), (8.376) y (8.386) para hallar expl´ıcitamente a θ, ψ y λ en funci´ on del tiempo. Analizar los resultados.
318 / Mec´ anica cl´ asica avanzada
9 Las transformaciones can´ onicas
9.1.
La acci´ on en funci´ on de las variables de estado
Seg´ un el principio de Hamilton, entre todas las trayectorias en el espacio de configuraci´on que parten de un punto (q1 ) en t = t1 y terminan en un punto (q2 ) en t = t2 , el sistema sigue efectivamente a trav´es de la trayectoria que extremaliza la integral de acci´on o, equivalentemente, por aquella que satisface las ecuaciones de Lagrange. Para expresar la acci´on en funci´ on de las coordenadas, debemos considerar todas las posibles trayectorias reales y circuitosas en el espacio de configuraci´on y no solamente aquellas que pasan por dos puntos dados. Entre un par de puntos dados, (q1 ) en t = t1 y (q2 ) en t = t2 , s´olo pasa una trayectoria recta (o real). O sea que a una familia de parejas de puntos [(q1 ) en t = t1 , (q2 ) en t = t2 ], definida de acuerdo con cierta regla, le corresponde una familia de trayectorias en “l´ınea recta” (o reales). As´ı por ejemplo, para un sistema de dos grados de libertad las trayectorias estar´ an situadas en un plano. Para precisar, asumamos que se trata de part´ıculas en presencia del campo gravitacional, el cual act´ ua a lo largo de la direcci´ on y. La figura 9.1 muestra la familia de puntos extremos (x1 , y1 en t1 ; x2 , y2 en t2 ), definida de la siguiente manera: r π 2a senθ ; 0 ≤ θ ≤ x1 = a cos θ ; y1 = a senθ ; t1 = g 2 x2 = b ;
1 y2 = a senθ + g 2
b − a cos θ t2 = + vx
r
b − a cos θ vx
2
(9.1)
2a senθ g
Este ejemplo muestra que para a, b, dados se puede definir una familia de trayectorias por hacer variar a θ entre 0 y π/2, con lo cual se var´ıan adem´as los tiempos t1 y t2 . Los correspondientes puntos inicial y final est´ an sobre un arco de circunferencia y sobre un segmento de l´ınea recta respectivamente. Obviamente para un par de puntos 319
320 / Mec´ anica cl´ asica avanzada b
0 θ′ θ a
x P1 (x1, y1, t1)
P1′ (x1′, y1′, t1′) P2 (x2, y2, t2)
P2′ (x2′, y2′, t2′)
y
Figura 9.1 Familia de trayectorias dependiente de θ entre 0 y π/2
inicial y final dados, P1 , P2 , o sea para un valor dado de θ, se puede encontrar una familia de trayectorias circuitosas que pasan por esos dos puntos en t = t1 y t = t2 . Haciendo variar la tripleta de par´ ametros (a, b, θ) sobre todo el rango de sus valores posibles podr´ıamos obtener todas las posibles trayectorias “rectas” en el plano x − y; para definir las trayectorias circuitosas requerir´ıamos de par´ ametros adicionales. En general, sea (α) un conjunto completo de par´ ametros que define una familia de trayectorias rectas en el espacio de configuraci´on. A esa familia de trayectorias le corresponde una familia de puntos iniciales y finales P1 , P2 y de tiempos t1 y t2 , dada por: t1 = t1 (α) ;
qν1 = qν1 (α)
t2 = t2 (α) ;
qν2 = qν2 (α)
(9.2)
ν = 1, 2, ...l Debemos definir desplazamientos virtuales entre una trayectoria real y las correspondientes trayectorias circuitosas y entre trayectorias reales. Esto se logra considerando: (a) Cambios virtuales en las qν , como antes y (b) Cambios virtuales en el tiempo, con lo cual los tiempos de los puntos inicial y final son distintos para cada trayectoria. Queremos evaluar el cambio en la integral de acci´on: Z t2 L dt (9.3) S= t1
cuando se pasa de una trayectoria real a otra de la familia. La diferencia de las coordenadas de las dos trayectorias la denotaremos ∆qν = qν (α + ∆α) − qν (α). Tal cambio consta de dos partes, uno virtual producido con t fijo y otro debido al cambio virtual en el tiempo: ∆qν = δqν + q˙ν δt ;
ν = 1, 2, ...l (9.4)
∆t = t(α + ∆α) − t(α)
Las transformaciones can´onicas / 321 La figura 9.2 muestra dos trayectorias reales en el espacio de configuraci´on que difieren por cantidades peque˜ nas. C1 y C2 son dos curvas que describen la familia de puntos extremos, o sea definidas por las ecuaciones (9.2). C2 P2 t C1
P1
t1 + ∆t1
t1 t1 + ∆t1
(∆q)
t2
(α)
t2 + ∆t2
(∆q) q∆t
t + ∆t
t (q + δq) (q + ∆q)
P2′
t2 (α + ∆α)
P1′
Figura 9.2 Trayectorias reales en el espacio de configuraci´ on A cada una de las dos trayectorias reales le corresponde un valor de la integral de acci´on (9.3). La diferencia de los valores de S es: S′ − S
∆S =
Z
=
t2 +∆t2
t1 +∆t1
dt L(q + δq, q˙ + δ q, ˙ t) −
Z
(9.5)
t2
dt L(q, q, ˙ t)
t1
Para ∆t1 y ∆t2 lo suficientemente peque˜ nos se cumple: Z t2 Z t2 +∆t2 L dt + L(t2 ) ∆t2 − L(t1 ) ∆t1 Ldt ≈
(9.6)
t1
t1 +∆t1
t t1
t1 + ∆t1
t2
t2 + ∆t2
Figura 9.3 Cambio en el tiempo ∆t al variar (α) Entonces (9.5) se puede escribir como: ∆S =
Z
t2
t1
−
Z
t2
t1
t2 L(q + δq, q˙ + δ q, ˙ t)dt + L(q + δq, q˙ + δ q, ˙ t)∆t t1
L(q, q, ˙ t)dt
(9.7)
322 / Mec´ anica cl´ asica avanzada Por otra parte sabemos que: L(q + δq, q˙ + δ q, ˙ t) − L(q, q, ˙ t) = l X ∂L ν=1
d δqν + (pν δqν ) − p˙ ν δqν ∂qν dt
(9.8)
al primer orden en (δq). Entonces: ∆S =
Z
t2
t1
l X ∂L ν=1
∂qν
− p˙ν δqν +
l X
ν=1
t2 t2 pν ∆qν + L ∆t t1
(9.9)
t1
donde despreciamos todos los t´erminos de orden superior al primero en (δq) y (q˙ ∆t). Como los (p) corresponden a la trayectoria real P1 P2 , de acuerdo con las ecuaciones de Lagrange la integral en (9.9) es cero, luego: ∆S =
l X
ν=1
! t2 pν δqν + L ∆t
(9.10)
t1
Debido a que δqν = δqν − q˙ν ∆t, obtenemos: ! t2 l X ∆S = pν ∆qν − H ∆t ν=1
(9.11)
t1
Esta expresi´on nos dice que: pν =
∂S ∂S ∂S ∂S , H=− , H= en t = t2 ; pν = − en t = t1 ∂qν ∂t ∂qν ∂t
(9.12)
Es claro que ∆S es la diferencia de dos t´erminos infinitesimales, evaluados en t1 y t2 . Ahora, si llamamos t a t2 y escogemos a C1 de modo que se reduzca a un punto, es decir, tomamos fijo el punto p1 : δqν (t1 ) = 0, ∆t1 = 0; ν = 1, 2, ...l
(9.13)
Obtenemos: ∆S =
l X
ν=1
pν ∆qν − H ∆t
(9.14)
Esta expresi´on nos da la diferencial total de cierta funci´ on S de las coordenadas y del tiempo sobre la curva C2 . De P1 sale un haz de trayectorias reales que cortan la curva C2 . La ecuaci´ on (9.14) nos da la diferencia en la acci´on para dos trayectorias reales diferentes cuando cortan la curva C2 . Es claro entonces que: pν =
∂S ; ∂qν
ν = 1, 2, ...l; H = −
∂S ∂t
(9.15)
Las transformaciones can´onicas / 323 Siendo S = S(q, t) la acci´on en funci´ on de las coordenadas y del tiempo: Z t2 L dt S(q, t) =
(9.16)
t1
Si se impone la condici´on de que las variaciones en el l´ımite superior se anulen, obviamente lo que se obtiene es ∆S = 0, y de ah´ı las ecuaciones de movimiento. A la funci´ on S[q(t), t] se le denomina la acci´on en funci´ on de las coordenadas: es el n´ umero que se asocia a la trayectoria que comienza en P1 y termina en q(t), t, o sea sobre la l´ınea C2 . Como q y t dependen de (α), S es una funci´ on de (α).
9.2.
La integral invariante de Poincar´ e-Cart´ an
En lugar del espacio de configuraci´on l-dimensional, consideramos el espacio de fases 2l-dimensional, en el cual cada punto en el tiempo t se especifica por (q, p). En este espacio definamos dos curvas cerradas, C1 y C2 , cuyos puntos sean el comienzo y el final de una familia de trayectorias rectas en el espacio de fases; es decir, tales que si el sistema inicialmente estaba descrito por un punto de C1 evolucionar´a de acuerdo con las ecuaciones can´ onicas hasta llegar a cierto punto final sobre C2 . Las ecuaciones que definen las curvas cerradas C1 , C2 , son an´alogas a (9.2): t1 =
t1 (α);
qν1 = qν1 (α) ;
p1ν = p1ν (α)
t2 =
t2 (α) ;
qν2 = qν2 (α) ;
p2ν = p2ν (α) ;
(9.17) α = 1, 2, ...l
donde ahora los par´ ametros (α) son tales que var´ıan entre (αi ) y (αf ) de modo que las funciones de (α) definidas por (9.17) son peri´odicas, es decir toman el mismo valor cuando (α) = (αi ) que cuando (α) = (αf ). Por ejemplo, para el oscilador tridimensional ligado a moverse sobre un cilindro, la familia de trayectorias correspondiente a (9.17) es mostrada en la figura 9.4. (V´ease el ejemplo 4.3.1 en la secci´ on 4.3). Es claro que C1 y C2 deben estar sobre la hipersuperficie Ez constante. En general, la familia de trayectorias tiene la apariencia de un “tubo”1 donde C1 y C2 son las curvas que describen la forma de las “puntas”. Por la causalidad, es claro que las trayectorias no se intersectan. A cada valor de las (α) le corresponde uno y s´olo un punto sobre C1 , un punto sobre C2 y una trayectoria y s´olo una. Cada trayectoria tiene un valor dado de la acci´on: Z t2 (α) ˜ ˜ [q(α, t), q(α, S= L ˙ t), p(α, t), p(α, ˙ t), t] (9.18) t1 (α)
˜ es definido en (3.77), seg´ donde L un: ˜ (q, p, q, L ˙ p, ˙ t) =
l X
ν=1 1 Llamado
pν q˙ν − H(q, p, t)
tambi´ en “tubo de l´ıneas caracter´ısticas”.
(9.19)
324 / Mec´ anica cl´ asica avanzada Pz C1
θ z C2
Figura 9.4 Familia de trayectorias para el oscilador tridimensional ligado a moverse sobre un cilindro
Por un procedimiento an´alogo al que conduce a (9.9), hallamos para la diferencia de la acci´on entre dos trayectorias vecinas:
∆S˜ =
(
l Z X
ν=1
dt
"
∂H q˙ν − ∂pν
!
δpν
# ) t2 d ∂H δqν + (pν ∆qν ) + L ∆t − p˙ ν + ∂qν dt
(9.20)
t1
Teniendo en cuenta que las trayectorias en el espacio de fases son “rectas”, definidas por las ecuaciones de Hamilton, se sigue:
∆S˜ =
"
l X
ν=1
# t2 pν δqν + L ∆t
(9.21)
t1
Ahora, usando (9.4) en (9.21) obtenemos que ∆S˜ = ∆S, ecuaci´ on (9.11):
∆S˜ =
"
l X
ν=1
# t2 pν ∆qν − H ∆t
(9.22)
t1
∆S˜ es el cambio en la acci´on al cambiar infinitesimalmente de una trayectoria de fases real a otra, o sea al variar infinitesimalmente las (α). Podemos integrar cada t´ermino en (9.22) respecto a (α), desde (α) = (αi ) hasta (α) = (αf ), o sea sobre todas
Las transformaciones can´onicas / 325 las trayectorias que comienzan y terminan en las curvas cerradas C1 y C2 : # t2 Z (αf ) "X l pν ∆qν − H ∆t S(αf ) − S(αi ) = (αi ) ν=1
=
Z
l X
(αf )
p2ν ν=1
(αi )
−
=
Z
(αf )
(αi )
I
C2
−
I
C1
l X
ν=1
∆qν2
p1ν
2
− H ∆t2
∆qν1
ν=1
l X
ν=1
l X
1
C1
l X
ν=1
!
!
pν ∆qν − H ∆t
Hemos demostrado que la integral de l´ınea, ! I X l pν ∆qν − H ∆t I=
(9.23)
!
pν ∆qν − H ∆t
ν=1
!
− H ∆t1
pν ∆qν − H ∆t
Como S(αi ) = S(αf ) obtenemos: ! I I l X pν ∆qν − H ∆t − C2
t1
!
=0
(9.24)
(9.25)
ν=1
no cambia su valor tomada sobre un contorno arbitrario del espacio f´asico, a trav´es del cual pasan trayectorias reales que lo deforman al desplazarse sobre la “manguera” de trayectorias reales. I es una integral invariante, llamada la integral invariante de Poincar´e-Cart´ an (v´ease el texto de Gantmacher, Lectures in analytical mechanics, secci´ on 18). Teorema de Poincar´ e-Cart´ an. I es una integral invariante a lo largo de un haz de trayectorias arbitrario en el espacio de fase si y s´olo si esas trayectorias son soluci´on a las ecuaciones can´ onicas de Hamilton. Hemos demostrado que si las trayectorias son soluci´on a las ecuaciones de Hamilton, I es una integral invariante. Restar´ıa por mostrar que si I es una integral invariante entonces las trayectorias son soluci´on a las ecuaciones de Hamilton. La demostraci´on est´ a en el texto de Gantmacher indicado anteriormente. Como en este teorema se muestra que las ecuaciones de Hamilton son consecuencia de la invariancia de I, ´esta puede plantearse como un principio general de la mec´anica, que fue hallado por Poincar´e en el a˜ no 1890. Las ecuaciones de Whittaker. En la integral de Poincar´e-Cart´ an (9.25), podemos ver que hay analog´ıa entre las pν y −H, y entre las qν y t. Podemos pensar en un
326 / Mec´ anica cl´ asica avanzada formalismo en el cual se intercambien los papeles de (−H, t) y una pareja de variables can´ onicamente conjugadas, digamos (p1 , q1 ),2 en un espacio de fases ampliado 2l + 1dimensional, donde t no es simplemente un par´ ametro. Sean (S = −H, t) las cantidades que cambiaremos por (p1 , q1 ): s = −H(q, p, t)
(9.26)
La ecuaci´ on (9.26) nos permite expresar a p1 en t´erminos de (q), p2 , ...pl , s, t: p1 = −K(q1 , q2 , ...ql , p2 , p3 , ...pl , s, t) Entonces podemos escribir la integral invariante I como: I I = (s∆t + p2 ∆q2 + pl ∆ql − K ∆q1 )
(9.27)
(9.28)
En estas variables, K hace las veces de H y q1 las veces de t. Hemos probado, pues, que el movimiento del sistema con las nuevas variables obedece las ecuaciones: dt = dq1
∂K ; ∂s
∂K ∂s =− dq1 ∂t
dqν = dq1
∂K ; ∂pν
dpν ∂K =− ; dq1 ∂qν
(9.29) ν = 1, 2, ...l
donde ahora q1 es la variable independiente o “tiempo”. Sea ahora un sistema generalizado conservativo (o sea un sistema arbitrario para el cual H no depende del tiempo). En este caso: H(q, p) = h = constante
(9.30)
que sabemos, en general no coincide con E = T + V . Ahora, en la integral invariante I tomemos s´olo aquellos estados para los cuales la constante h toma un mismo valor, h0 . Todas las trayectorias tendr´an la misma energ´ıa. Entonces: I I H ∆t = h0 ∆t = 0 (9.31) La integral invariante ser´a:3 I=
I X l
pν ∆qν
(9.32)
ν=1
Si ahora en (9.30) despejamos p1 obtenemos: p1 = −K(q1 , q2 , ...ql ; p2 , p3 , ...pl , h0 )
(9.33)
2 V´ ease el texto de Whittaker, A treatise on the analytical dynamics of particles and rigid bodies, cap´ıtulo XII, numeral 141. 3 La invariancia de I es an´ aloga a un teorema de hidrodin´ amica que establece que la circulaci´ on en cualquier curva cerrada que se mueve con un fluido no cambia con el tiempo.
Las transformaciones can´onicas / 327 con lo cual (9.32) se puede escribir en la forma: ! I X l pν ∆qν − K∆q1 I=
(9.34)
ν=2
Esta integral toma la forma de la integral invariante de Poincar´e-Cart´ an, tomando como variables de estado a q2 , p2 , q3 , p3 , ...ql , pl , a q1 como el tiempo, y a K en lugar de H. En virtud del teorema mencionado, se cumple que el movimiento de este sistema obedece las ecuaciones de Hamilton siguientes (2l − 2 en total): dqν ∂K = ; dq1 ∂pν
dpν ∂K =− ; dq1 ∂qν
ν = 2, 3, ...l
(9.35)
Las ecuaciones (9.35) son las ecuaciones de Whittaker. O sea que para un sistema generalizado conservativo (para el cual H es constante) se requieren s´olo 2l − 2 ecuaciones para definir la trayectoria del sistema. El sistema de ecuaciones hamiltonianas de Whittaker puede ser expresado en forma lagrangiana: ∂M d ∂M = 0; − dq1 ∂qν′ ∂qν
ν = 2, 3, ...l
(9.36)
donde qν′ = dqν /dq1 y M (la funci´ on an´aloga de la lagrangiana) es el generador de la transformaci´ on de Legendre de las variables (qν , qν′ ) a las variables (qν , pν ). M y K tienen una relaci´ on an´aloga a L y H, v´ease (3.16). M (q2 , q3 , ...ql ; q2′ , q3′ , ...ql′ ; q1 ) = l X
ν=2
pν qν′ − K(q1 , q2 , q3 , ...ql , p2 , p3 , ...h0 )
(9.37)
La integraci´ on de las ecuaciones de Whittaker nos conduce a qν , pν , en funci´ on de q1 , es decir, a las ecuaciones de la trayectoria en el espacio de fases. La soluci´on de (9.35) contendr´a 2l − 2 constantes de integraci´ on y depender´a adem´as de la constante h0 : qν = qν (q1 , h0 , C1 , C2 , ...C2l−2 )
(9.38) pν = pν (q1 , h0 , C1 , C2 , ...C2l−2 ) ;
ν = 2, , 3, ...l
Reemplazando (9.38) en (9.33) llegamos a: p1 = p1 (q1 , h0 , C1 , C2 , ...C2l−2 )
(9.39)
Las expresiones (9.38) y (9.39) constituyen las ecuaciones de las trayectorias en el espacio de fases. La dependencia temporal de las coordenadas se recobra de la ecuaci´ on q˙1 = ∂H/∂p1 : Z dq1 t= + C2l−1 (9.40) ∂H/∂p1 donde ∂H/∂p1 se puede expresar en t´erminos de q1 por medio de las ecuaciones (9.38) y (9.39). Para sistemas que poseen la constante de movimiento h, se puede resolver el problema mec´anico con s´olo 2l − 2 ecuaciones del tipo hamiltoniano o con l − 1 ecuaciones del tipo lagrangiano, (9.35) y (9.36) respectivamente.
328 / Mec´ anica cl´ asica avanzada
9.3.
El principio de m´ınima acci´ on y expresiones equivalentes
El principio de m´ınima acci´ on de Maupertuis-Euler-Lagrange. Como las ecuaciones (9.36) son de tipo lagrangiano, pueden ser obtenidas de un principio variacional, ∆Σ = 0, donde: Σ=
Z
q22 q11
M (q2 , q3 , ...ql ; q2′ , q3′ , ...ql′ ; q1 ) dq1
(9.41)
La variable Σ es llamada la acci´ on de Lagrange, en tanto que S se llama la acci´ on de Hamilton. ∆Σ = 0 caracteriza las trayectorias que pasan por los puntos definidos por q1 = q11 y q1 = q12 , o sea las soluciones de (9.36) tales que ∆qν (q11 ) = ∆qν (q12 ) para ν = 2, 3, ...l. ∆ representa “desplazamientos virtuales” respecto a q1 , es decir, desplazamientos realizados con q1 fijo y que no cambian los extremos de la trayectoria; en cuanto al tiempo la situaci´ on es diferente, pues t1 y t2 pueden variar cuando se pasa de una trayectoria real a una circuitosa. Esto es esquematizado en la figura 9.5, donde B representa una trayectoria real y A una circuitosa, ambas con el mismo valor de la energ´ıa.4 t2 + ∆t2 (q + ∆q) t + ∆t
t
P1
1 q1
P2 2
t2
A
t1 + ∆t1
q1
(∆q)
(q) B
t
t1
Figura 9.5 Paso de una trayectoria real B a una circuitosa A
La funci´ on M se puede expresar en t´erminos de L. En efecto, se sigue de (9.27) y (9.37) que:
M=
l X
ν=2 4 Las
l
pν qν′ + p1 =
1X 1 1 pν q˙ν = (L + H) = (2T2 + T1 ) q˙ ν=1 q˙ 1 q˙ 1
(9.42)
trayectorias A y B que se cortan en P1 y P2 en el espacio de configuraci´ on, son las proyecciones de dos trayectorias en el espacio de fases ampliado, sobre H = h0 , que no se cortan.
Las transformaciones can´onicas / 329 En la igualdad (9.42) se ha usado la ecuaci´ on (3.127). La integral (9.41) se puede escribir como: Z t2 (L + H)dt = S + h(t2 − t1 ) (9.43) Σ= t1
se ve que ∆Σ = ∆S + h(∆t2 − ∆t1 ), cuando tomamos s´olo trayectorias circuitosas con el mismo valor de la energ´ıa. La expresi´on ∆Σ = 0 define la ecuaci´ on de la trayectoria entre todas las que satisfacen la conservaci´ on de la energ´ıa, con ∆qν = 0 en P1 y P2 . Adem´as, se sigue de (9.41) y (9.43): Z t2 X l Σ= pν q˙ν dt (9.44) t1
ν=1
Para un sistema conservativo ordinario (tal que T + V es constante), T1 = 0 y T = T2 , con lo cual (9.42) nos dice que M = 2T /q1 . Entonces: Z t2 N Z ri2 X mi r˙i dri (9.45) 2T dt = Σ= t1
i=1
ri1
Esto nos dice: “dada la configuraci´on inicial y final de un sistema descrito por un hamiltoniano constante, e igual a la energ´ıa total, con un valor dado de la energ´ıa, la trayectoria del sistema en el espacio de configuraci´on es aquella para la cual la integral de la energ´ıa cin´etica es estacionaria, cuando se compara con las trayectorias vecinas que satisfacen dichas condiciones”. Este principio es aplicable s´olo a sistemas conservativos. Los tiempos requeridos para moverse sobre las diferentes trayectorias pueden cambiar pero la energ´ıa es la misma sobre cada curva. En el principio de Hamilton aplicado a sistemas conservativos, se consideran s´olo aquellas trayectorias para las cuales el tiempo de movimiento a lo largo de ellas es el mismo, aunque las energ´ıas asociadas a ellas pueden diferir. Las trayectorias variadas en el principio de Hamilton no corresponden necesariamente con trayectorias posibles del movimiento del sistema, H puede no conservarse sobre ellas. En el principio de m´ınima acci´ on se consideran trayectorias variadas donde el tiempo puede variar pero H s´ı se conserva. En estos dos principios se halla la trayectoria verdadera “escogiendo” entre las trayectorias de dos conjuntos de trayectorias definidas de manera diferente. Otra forma de obtener que ∆Σ = 0 es la siguiente: Z t2 X Z t2 l (L + H) dt = S + h(t1 − t2 ) (9.46) Σ= pν q˙ν dt = t1
t1
ν=1
Tomando variaciones en (9.46) y usando la expresi´on (9.11) para ∆S: t2 " l # t2 X ∆Σ = ∆S + h(∆t1 − ∆t2 ) = pν ∆qν − h∆t + h∆t ν=1 t1 t1 t2 l X = pν ∆qν ν=1
t1
(9.47)
330 / Mec´ anica cl´ asica avanzada Tomando a ∆qν = 0 en t1 y t2 y ν = 1, 2, ...l, se sigue que ∆Σ = 0. A la funci´ on S se le llama acci´ on principal ( o de Hamilton) y a la funci´ on Σ se le llama acci´ on reducida (o de Lagrange). Resumen Hist´ orico. Fermat, matem´atico franc´es (1601-1665), formul´o el principio del m´ınimo tiempo en la ´optica de rayos: un rayo de luz se propaga sobre aquella trayectoria para la cual el tiempo de tr´ansito es m´ınimo. En lenguaje variacional (moderno): Z B Z B dl ∆ dt = 0 ⇒ ∆ =0 (9.48) A A v Maupertuis, especulando con las concepciones filos´oficas de Leibnitz, expres´o en 1744 la conjetura de que la evoluci´ on de una part´ıcula material se da de tal manera que el producto m.v.l es m´ınimo, dio ejemplos en los cuales las trayectorias son rectil´ıneas y por tanto v es constante. El matem´atico suizo Euler (1703-1793) enunci´ o en 1744 el principio de m´ınima acci´on, esta vez como un teorema, basado en sus trabajos sobreRel c´ alculo de variaciones. Tal enunciado es de la forma: la diferencia entre la integral vdl para una part´ıcula, tomada a lo largo de una trayectoria real, y la misma integral sobre una trayectoria vecina (es decir sobre una trayectoria sobre la cual se mueve la part´ıcula sin obedecer las leyes de Newton), que pasan por dos puntos dados, es una cantidad infinitesimal de segundo orden; se supone que la part´ıcula viaja sobre la trayectoria variada con una velocidad para la cual la energ´ıa total tiene un valor dado: Z B ∆E=C v dl = 0 (9.49) A
donde C es una constante. En 1760 Lagrange (1736-1813) extendi´o el principio de Euler a sistemas de part´ıculas: ∆E=C
Z
N BX
A
i=1
m~vi · d~ri = 0
(9.50)
Lagrange mostr´o adem´as que (9.50) se cumple si y s´olo si vale la segunda ley de Newton, mi~¨r i = −∂V /∂~ri , i = 1, 2, ...N . Adem´as, Lagrange fue el primero que introdujo las coordenadas generalizadas, con las cuales (9.50) es: ∆E=C
Z
N BX
A
pν dqν = 0
(9.51)
i=1
Cuando en (9.51) se asume que T es funci´ on cuadr´atica de las velocidades generalizadas se tiene: Z B ∆E=C 2T dt = 0 (9.52) A
Lagrange llam´ o a (9.52) el principio de la m´as peque˜ na o m´as grande fuerza viva.
Las transformaciones can´onicas / 331 Hamilton, escoc´es que vivi´o entre 1805 y 1865, aport´ o en 1835 la formulaci´ on general del principio de m´ınima acci´on y las ecuaciones de Hamilton. Extiende la formulaci´ on al considerar trayectorias circuitosas en que la energ´ıa no se conserva: Z B Z B ∆ L dt = ∆ (2T − H)dt = 0 (9.53) A
A
El conjunto de trayectorias es tal que pasa simult´ aneamente por los mismos puntos inicial y final. Es claro ya por qu´e a Σ se llama la acci´on de Lagrange y a S la acci´on de Hamilton. Los principios de Hamilton y de m´ınima acci´on son aplicables equivalentemente para sistemas conservativos, sin embargo, el primero es m´as general pues se aplica adem´as a sistemas hol´ onomos generales, con una generalizaci´ on a sistemas hol´ onomos con fuerzas no derivables de un potencial, ecuaci´ on (3.12). Las ecuaciones de Jacobi. Para el caso de un sistema conservativo ordinario T puede escribirse como: T = T2 =
l X
aµν q˙µ q˙ν = q12 G(q1 , q2 , ...ql , q2′ , q3′ , ...ql )
(9.54)
µ,ν=1
donde: G=
l X
aµν qµ′ qν′
(q1′ = 1)
(9.55)
µ,ν=1
Como H = h = T + V , (9.54) conduce a: r h−V q˙1 = G
(9.56)
Para M , (9.56) nos da: M=
p 2T = 2 G(h − V ) q˙1
(9.57)
Las ecuaciones diferenciales lagrangianas de Whittaker, (9.36) con M dado por (9.57), que son aplicables a sistemas conservativos ordinarios, se llaman las ecuaciones de Jacobi (1886). Otras formas del principio de acci´ on estacionaria de Maupertuis-EulerLagrange. Definimos en el espacio de configuraci´on los vectores l-dimensionales ρ~ = {q1, q2, ...ql }. Entonces el vector ρ ~ determina la posici´on del sistema en el espacio de configuraci´on. La energ´ıa cin´etica est´ a relacionada con la velocidad del punto representativo del sistema en el espacio de configuraci´on, ρ ~˙ . Para un sistema escler´onomo la energ´ıa cin´etica es funci´ on cuadr´atica de las velocidades generalizadas, de acuerdo con (9.54): T =
l l 1 X 1 X 2aµν q˙µ q˙ν = mµν dqµ dqν 2 µ,ν=1 2dt2 µ,ν=1
(9.58)
332 / Mec´ anica cl´ asica avanzada Si definimos en el espacio de configuraci´on la m´etrica no cartesiana mµν = 2aµν , donde aµν est´ a dada por (3.105), el producto escalar de dos vectores, ρ ~ y ~n, estar´ a dado por: (~ ρ, ~η ) =
l X
mµν ρµ ην
(9.59)
µ,ν=1
O sea que es posible asociar al espacio de configuraci´on de un sistema mec´anico un espacio riemanniano, dado por la m´etrica (tensor m´etrico) mµν (v´ease el texto de Lichnerowicz, C´ alculo tensorial, cap´ıtulo VI). De las expresiones (9.58) y (9.59), tenemos que: T =
1 ˙2 dρ ρ ~ ⇒ dt = √ 2 2T
(9.60)
Se sigue que la energ´ıa cin´etica de un sistema din´amico siempre coincide con la energ´ıa cin´etica del punto representativo en el espacio de configuraci´on, si a ese punto se le asigna una masa m = 1. El principio de acci´on estacionaria tomar´a la forma: Z (q2 ) √ Z t2 2T dρ = 0 (9.61) 2T dt = ∆ ∆Σ = ∆ t1
(q1 )
Para sistemas conservativos, tales que h = T + V : Z (q2 ) √ ∆ h − V dρ = 0
(9.62)
(q1 )
La ecuaci´ on (9.62) se llama la forma de Jacobi del principio de acci´on estacionaria. Para un movimiento libre, V = 0: Z (q2 ) dρ = 0 (9.63) ∆ (q1 )
La ecuaci´ on (9.63) indica √ que la trayectoria es la √ m´as corta, la l´ınea recta; donde la longitud recorrida es ρ = 2h, donde ρ = (t1 − t2 ) 2h. Para V = 0, el punto representativo del sistema en el espacio de configuraci´on se √ mueve uniformemente con velocidad 2h sobre una trayectoria recta. En general, para V 6= 0, de la forma de Jacobi del principio de acci´on estacionaria se deduce que la trayectoria del sistema en el espacio de configuraci´on (trayectoria real) es la geod´esica. Esta trayectoria tambi´en es la “m´ as recta” o sea la de m´ınima curvatura (principio variacional de Hertz de la m´ınima curvatura).
9.4.
El teorema de Li Hua Chung
Sea la integral invariante de Poincar´e-Cart´ an, I, definida en (9.25). Seg´ un (9.24), I tiene el mismo valor sobre cualquier contorno cerrado que envuelva el mismo haz de trayectorias reales en el espacio de fases. Particularicemos para el caso en que los puntos
Las transformaciones can´onicas / 333 sobre C1 y C2 tienen los mismos tiempos. Es decir, sea C1 un conjunto de puntos del espacio de fases que forma una l´ınea cerrada y que corresponde a estados simult´ aneos de un sistema de acuerdo con (9.17), las ecuaciones param´etricas de C1 son: qν1 = qν1 (α) ;
t1 (α) = constante ;
p1ν = p1ν (α) ;
ν = 1, 2, ...l
(9.64)
C2 est´ a definida similarmente. A lo largo de estos contornos se cumple que ∆t = 0, reduci´endose la ecuaci´ on (9.24) a: I
l X
pν ∆qν =
C2 ν=1
I
l X
pν ∆qν = I1
(9.65)
C1 ν=1
La integral I1 fue introducida por Poincar´e pero fue Cart´ an quien la extendi´o a contornos formados por estados no simult´ aneos con la introducci´on del t´ermino adicional −Ht.5 Sea C un contorno arbitrario en el espacio de fases (v´ease figura 9.6). Es claro que las proyecciones de C sobre cada uno de los planos de fase (qν , pν ), ν = 1, 2, ...l, constituye una curva cerrada bidimensional, que llamaremos Cν , ν = 1, 2, ...l. Pν
Cν
Aν
qν
Figura 9.6 C es un contorno arbitrario en el espacio de fases con proyecciones Cν Se sigue entonces que: I (p1 ∆q1 + p2 ∆q2 + ...pl ∆ql ) = C I I I p2 ∆q2 + ... p1 ∆q1 +
pl ∆ql
(9.66)
El a ´rea encerrada por el contorno Cν es Aν , donde: I pν ∆qν = ±Aν
(9.67)
C1
C2
Cl
Cν
5 La
mec´ anica de Hamilton puede desarrollarse postulando un espacio de dimensi´ on par dotado de una estructura definida por la invariancia de I1 .
334 / Mec´ anica cl´ asica avanzada Se toma el signo m´as si se eval´ uHa la integral Hen el sentido de las agujas del reloj y menos en el sentido contrario. Como C pν ∆qν = cν pν ∆qν , el sentido del contorno Cν depender´a del sentido de C. Entonces: I X l l X ±Aν (9.68) pν ∆qν = I1 = C ν=1
ν=1
donde C consta de estados simult´ aneos. Los contornos C y Cν var´ıan durante el movimiento del sistema y las ´areas Aν tambi´en var´ıan, pero la suma algebraica de esas areas, (9.68), permanece constante. La anterior es pues la interpretaci´ ´ on geom´etrica de la invariancia de la integral de Poincar´e I1 . Como H no aparece en I1 , hallamos que la invariancia de I1 no depende del sistema mec´anico particular, es decir, I1 es invariante para cualquier sistema hamiltoniano. Por esto se llama a I1 la integral universal invariante. Es v´alido entonces enunciar el siguiente teorema: si q˙ν = ∂H/∂pν ; p˙ ν = −∂H/∂qν , ν = 1, 2, ...l, entonces I1 es invariante. Si I1 es invariante para alg´ un sistema de ecuaciones diferenciales q˙ν = Qν = Qν (q, p, t), p˙ν = Pν (q, p, t), ν = 1, 2, ...l, entonces ese sistema debe ser hamiltoniano. Para demostrar la segunda parte, sea: I X l dpν dI1 d∆qν = ∆qν + pν dt dt dt ν=1 =
I X l
(p˙ ν ∆qν + pν ∆q˙ν )
I X l
(p˙ ν ∆qν + ∆(pν q˙ν ) − ∆pν q˙ν )
I X l
(p˙ ν ∆qν − q˙ν ∆pν )
I X l
(Pν ∆qν − Qν ∆pν )
ν=1
=
ν=1
=
ν=1
=
ν=1
(9.69)
Como I1 = 0, se sigue que (9.69) debe ser igual a la integral de una diferencial ∆ exacta de alguna funci´ on de (q, p, t) que llamaremos −H: I X l (Pν ∆qν − Qν ∆pν ) = ν=1
I
−∆H = −
Z X l ∂H ν=1
∂H ∆qν + ∆pν ∂qν ∂pν
(9.70)
entonces, Pν = −∂H/∂qν ; Qν = ∂H/∂pν ; ν = 1, 2, ...l, con lo cual se concluye la prueba.
Las transformaciones can´onicas / 335 Teoremas de Stockes. En la teor´ıa de campos vectoriales se muestra que la integral de l´ınea a lo largo de una curva rectificable es igual a la integral de superficie sobre la regi´ on encerrada por esa l´ınea del rotacional del vector: I Z Z ~ · dS ~ V~ · d~r = rotV (9.71) C
S
En t´erminos de las componentes: Z Z X I X 3 3 ∂Vj Vi dxi = dSk ǫijk ∂xi C i=1
(9.72)
S i,j,k=1
~ que determina un donde ǫijk es el tensor de Levi-Civita. dSk es la componente de dS plano perpendicular a la direcci´ on ~ek ; por tanto dSk = dxi dxj con i 6= j 6= k, o sea que: Z Z X I X 3 3 ∂Vj ∂Vi Vi dxi = dxi dxj (9.73) − ∂xi ∂xj C i=1 i
En geometr´ıa diferencial se llama a una integral sobre un contorno cerrado “integral relativa” y a una integral sobre una regi´on que no es cerrada “integral absoluta”; una integral de l´ınea se llama de “primer orden” y una de superficie se llama “de segundo orden” porque aparecen uno y dos diferenciales respectivamente. En el espacio de fases, el teorema de Stockes toma la forma: Z Z X I X 2l 2l ∂Vj ∂Vi Vi ∆xi = ∆xi ∆xj (9.74) − ∂xi ∂xj C i=1 i
donde x1 = q1 , ...xl = ql ; xl+1 = p1 , ...x2l = pl . As´ı, para l = 1, (9.74) es: Z Z I ∂A ∂B ∆q ∆p − (A∆q + B∆p) = ∂q ∂p C
(9.75)
S
En particular, para A = p y B = 0, como es de esperarse: Z Z Z p ∆q = ∆p ∆q C
(9.76)
S
La ecuaci´ on (9.74) puede escribirse como: I X l (Aν ∆qν + Bν ∆pν ) = C ν=1
Z Z " X l ∂Aν ∂Aµ ∆qµ ∆qν + − ∂qµ ∂qν µ<ν=1 S
l X ∂Aµ ∂Bν ∆qµ ∆pν + − ∂qµ ∂qν µ,ν=1 # l X ∂Bν ∂Aµ ∆pµ ∆pν − ∂pµ ∂pν µ<ν=1
(9.77)
336 / Mec´ anica cl´ asica avanzada Para Aν = pν y Bν = 0, se cumple: I X Z Z X l l pν ∆qν = ∆pν ∆qν C ν=1
(9.78)
S ν=1
En general, una integral relativa de orden 2ν − 1, de orden impar, puede escribirse como una integral absoluta de orden par 2ν, para ν = 1, 2, ...l. As´ı por ejemplo, se cumple que: Z Z X I X l l pν ∆qν = J2 = ∆qν ∆pν (9.79) I1 = S ν=1
ν=1
I3
=
=
Z Z Z
l X
pν ∆qν ∆pµ ∆qµ = J4
µ,ν=1
Z Z Z Z X l
∆qν ∆pν ∆qµ ∆pµ
(9.80)
µ,ν=1
I2l−1 =
=
Z Z
Z Z Z
...
Z ···
Z
l X
pν1 ∆qν1 ∆pν2 ∆qν2 ... ∆pνl ∆qνl = J2l
ν1 , ν2 , ...νl =1 l X
(9.81) ∆q1 ∆p1 ... ∆ql ∆pl
ν1 , ν2 , ...νl =1
Se puede mostrar que I1 , I3 , ...I2l−1 son integrales universales invariantes. O sea que una integral universal invariante relativa de orden impar I2ν−1 puede representarse como una integral invariante absoluta de orden par J2ν . En 1947 Li Hua Chung prob´ o que cualquier integral universal invariante difiere por un factor constante de una de las integrales (9.79), (9.80) o (9.81). Gantmacher presenta la demostraci´on de que cualquier integral universal invariante relativa de primer orden es un m´ ultiplo de I1 , para l = 1. Teorema de Li Hua Chung. Este teorema dice que si: ZZ Z h l X ··· Aµ1 ∆qµ1 ∆pµ2 ∆qµ2 ... I (ν) = Vν
µ1 , µ2 , ...µl =1
∆pµν ∆qµν + Bµ1 ∆pµ1 ∆pµ2 ∆qµ2 ... ∆pµν ∆qµν es una integral universal invariante relativa, entonces: I (ν) = CIν
(9.82)
i
(9.83)
donde C es una constante, e Iν es una de las l integrales universales invariantes de Poincar´e. Vν es una variedad cerrada de ν dimensiones en el espacio de fases, donde
Las transformaciones can´onicas / 337 ν = 1, 3, ..,2l − 1. Notaci´ on vectorial en el espacio de fases. V~ denotar´a una matriz columna ˜ es una matriz cuadrada, l × l, de l dimensiones con componentes Vν , ν = 1, 2, ...l. M con componentes Mµν . El gradiente de una funci´ on F respecto a las coordenadas y a los momentos, se denota respectivamente por: ∂F ∂F , ∂~q ∂~ p
(9.84)
y es un vector, o sea una matriz columna con componentes ∂F/∂qν y ∂F/∂pν respectivamente; ν = 1, 2, ...l. El gradiente de un vector es una matriz l × l, as´ı: ! ! ~ ~ ∂Vµ ∂Vµ ∂V ∂V = = ; ; µ, ν = 1, 2, ...l (9.85) ∂~q ∂qν ∂~ p ∂pν µν
µν
El producto escalar de dos vectores es: ~ ·V ~ = U
l X
Uν Vν
(9.86)
ν=1
˜V ~ , es un vector. y el producto de una matriz por un vector, M Prueba del teorema de Li Hua Chung para ν = 1. Usando la notaci´ on vectorial, se cumple que: I X l h i I ~ · ∆~q + B ~ · ∆~ p) Aν (~ q , p~, t)∆qν + Bν (~q, ~p, t)∆pν = (A I = ′
(9.87)
C ν=1
Las ecuaciones de movimiento en el espacio de fases son: ∂H ∂H ˙ ; p~ = − q~˙ = ∂~ p ∂~q
(9.88)
La soluci´on de las ecuaciones (9.88) es de la forma: q=~ ~ q (~ q0 , ~ p0 , t); p~ = p~(~ q0 , p~0 , t)
(9.89)
donde ~q0 y p~0 son los valores de ~ q y ~q para t = t0 . En el tiempo t = t0 definimos la curva cerrada C0 , constituida por un conjunto de estados simult´ aneos, caracterizada por un conjunto de par´ ametros (α): q0 = ~ ~ q (α); p~0 = ~ p0 (α); (αi ) ≤ (α) ≤ (αf )
(9.90)
Los puntos que en t = t0 estaban sobre el contorno C0 , formar´an un contorno C en alg´ un otro instante de tiempo t. Los puntos del contorno C se obtienen reemplazando (9.90) en (9.89): q=~ ~ q (α, t); ~ p = p~(α, t); (αi ) ≤ (α) ≤ (αf )
(9.91)
338 / Mec´ anica cl´ asica avanzada Poniendo (9.91) en (9.87) se obtiene a I ′ en funci´ on de t. De la invariancia de I ′ ′ se sigue que dI /dt = 0. Derivando a (9.87): I ′ ~˙ · ∆~q + A ~ · ∆~q˙ + B ~˙ · ∆~ ~ · ∆p~˙ = 0 ˙ A p+B (9.92) I =
donde se us´o la propiedad d(∆~q)/dt = ∆~q˙ . La ecuaci´ on (9.92) tambi´en se puede escribir como: I h i ~˙ · ∆~q + ∆(A ~ · ~q˙ ) − ∆A ~ · ~q˙ + B ~˙ · ∆~ ~ · p~˙ ) − ∆B ~ · p~˙ A p + ∆(B (9.93) I˙′ = Se cumple que: I
C
(αi ) ˙ ˙ ~ ~ ∆(A · ~ q ) = A · ~q =0
(9.94)
(αf )
debido a que ~ q (αi , t) = ~q(αf , t); ~p(αi , t) = p~(αf , t), por ser C un contorno cerrado. Por otra parte: ~ ~ ~ ~˙ = ∂ A · ~q˙ + ∂ A · p˙ + ∂ A A ∂~q ∂~p ∂t
(9.95)
~ ~ ∂A ∂A · ∆~q + · ∆~ p ∂~q ∂~p
(9.96)
~= ∆A
Usando (9.95) y (9.96), obtenemos: ! I " ~ ~ ~ ∂A ∂A ∂A ′ ˙ ˙ I = · ∆~q − · ~q + · p˙ + ∂~q ∂~p ∂t +
~ ~ ~ ∂B ∂B ∂B · ~q˙ + · p˙ + ∂~q ∂~p ∂t
!
· ∆~ p−
! ~ ~ ∂A ∂A · ∆~q + · ∆~ p · ~q˙ ∂~q ∂~p ! # ~ ~ ∂B ∂B · ∆~q + · ∆~ p · ~p˙ ∂~q ∂~p
(9.97)
Reagrupando t´erminos y expresando a ~q˙ y ~p˙ por medio de (9.88) obtenemos: ! ! # I " ~ ~ ∂H ∂H ∂A ∂B ′ ˜ ˜ ˙ −Z · ∆~q + −Z · ∆~ p (9.98) I = + + ∂~q ∂t ∂~p ∂t donde la matriz Z˜ se define como: ~ ~ ∂A ∂B Z˜ = − ∂~ p ∂~q
(9.99)
Como I˙′ = 0, el integrando en (9.98) debe ser el diferencial de alguna funci´on F : ∆F =
∂F ∂F · ∆~q + · ∆~ p ∂~q ∂~p
(9.100)
Las transformaciones can´onicas / 339 comparando (9.98) y (9.100) vemos que: ~ ∂F ∂H ∂A = −Z˜ + ; ∂~q ∂~q ∂t
~ ∂F ∂H ∂B = −Z˜ + ∂~p ∂~p ∂t
(9.101)
En t´erminos de componentes (9.101) toma la forma: l
l
λ=1
λ=1
X X ∂F ∂H ∂H ∂Aν ∂Bν ∂F =− Zνλ + =− Zνλ + ; ∂qν ∂qλ ∂t ∂pν ∂pλ ∂t
(9.102)
Como F ha de ser una funci´ on continua de ~q y p~ se debe cumplir: ∂2F ∂2F ∂2F ∂2F ∂2F ∂2F = ; = ; = ∂qµ ∂qν ∂qν ∂qµ ∂pµ ∂pν ∂pν ∂pµ ∂pµ ∂qν ∂qν ∂pµ
(9.103)
De (9.102) y (9.103) se sigue que: −
X ∂Zνλ ∂H X ∂ 2 Aν ∂2H − + = Zνλ ∂qµ ∂qλ ∂qµ ∂qλ ∂qµ ∂t
−
X ∂Zµλ ∂H X ∂ 2 Aµ ∂2H − + Zµλ ∂qν ∂qλ ∂qν ∂qλ ∂qν ∂t
−
X ∂Zνλ ∂H X ∂ 2 Bν ∂2H − + = Zνλ ∂pµ ∂pλ ∂pµ ∂pλ ∂pµ ∂t
λ
λ
λ
λ
λ
λ
X ∂Zµλ ∂H X ∂ 2 Bµ ∂2H − − + Zµλ ∂pν ∂pλ ∂pν ∂pλ ∂pν ∂t λ
λ
−
X ∂Zνλ ∂H X ∂ 2 Aν ∂2H − + = Zνλ ∂pµ ∂qλ ∂pµ ∂qλ ∂pµ ∂t
−
X ∂Zµλ ∂H X ∂2H ∂ 2 Bµ − + Zµλ ∂qν ∂pλ ∂qν ∂pλ ∂qν ∂t
λ
λ
(9.104)
λ
λ
En (9.104) consideremos los casos µ = ν y µ 6= ν. Para µ = ν se tiene s´olo una relaci´ on no trivial, la tercera: X ∂Zνλ ∂H ∂2H ∂2H Zνλ ∂H − − + Zνλ − Zνλ ∂pν ∂qλ ∂qν ∂pλ ∂pν ∂qλ ∂qν ∂pλ λ 2 2 ∂ ∂ Aν ∂ Bν + =0 (9.105) − ∂t ∂pν ∂qν Como H es arbitrario, (9.105) se cumple s´olo si: Zνλ = Zνν δνλ ;
∂Zνν ∂Zνν ∂Zνν = 0; = 0; =0 ∂pν ∂qν ∂t
(9.106)
340 / Mec´ anica cl´ asica avanzada Para µ 6= ν y usando (9.106), las relaciones (9.104) quedan:
−
∂Zνν ∂H ∂2H ∂ 2 Aν − Zνν + = ∂qµ ∂qν ∂qµ ∂qν ∂qµ ∂t
−
∂2H ∂ 2 Aµ ∂Zµµ ∂H − Zµµ + ∂qν ∂qµ ∂qν ∂qµ ∂qν ∂t
−
∂2H ∂ 2 Bν ∂Zνν ∂H − Zνν + = ∂pµ ∂pν ∂pµ ∂pν ∂pµ ∂t (9.107)
∂2H ∂ 2 Bµ ∂Zµµ ∂H − Zµµ + − ∂pν ∂pµ ∂pν ∂pν ∂pν ∂t −
∂2H ∂ 2 Aν ∂Zνν ∂H − Zνν + = ∂pµ ∂qν ∂pµ ∂qν ∂pµ ∂t
−
∂2H ∂ 2 Bµ ∂Zµµ ∂H − Zµµ + ∂qν ∂pµ ∂qν ∂pµ ∂qν ∂t
Las ecuaciones (9.107) pueden escribirse as´ı:
−
∂Zνν ∂H ∂Zµµ ∂H ∂2H + + (Zµµ − Zνν ) ∂qµ ∂qν ∂qν ∂qµ ∂qµ ∂qν
+
∂ ∂t
−
∂Zµµ ∂H ∂2H ∂Zνν ∂H + + (Zµµ − Zνν ) ∂pµ ∂pν ∂pν ∂pµ ∂pµ ∂pν
∂ + ∂t
∂Aν ∂Aµ − ∂qµ ∂qν
∂Bν ∂Bµ − ∂pµ ∂pν
=0
(9.108) =0
−
∂Zµµ ∂H ∂ 2H ∂Zνν ∂H + + (Zµµ − Zνν ) ∂pµ ∂qν ∂qν ∂pµ ∂pµ ∂qν
+
∂ ∂t
∂Aν ∂Bµ − ∂pµ ∂qν
=0
Las transformaciones can´onicas / 341 Como H es arbitrario, de (9.108) se sigue que: ∂Zνν ∂Zµµ = 0; = 0 ; Zµµ = Zνν ∂qµ ∂pµ ∂ ∂t ∂ ∂t
∂Aν ∂Aµ − ∂qµ ∂qν ∂Aν ∂Bµ − ∂pµ ∂qν
= 0;
∂ ∂t
∂Bν ∂Bµ − ∂pµ ∂pν
=0
(9.109)
=0
Las relaciones (9.106) y (9.109) nos dan que para todos µ, ν, se cumple: Zνλ = Z δνλ ;
∂Z ∂Z = 0; =0 ∂qν ∂pν
∂Z = 0 ⇒ Z = constante ∂t ∂ ∂Bν ∂Aµ ∂Bµ ∂ ∂Aν = 0; =0 − − ∂t ∂qµ ∂qν ∂t ∂pµ ∂pν ∂ ∂t
∂Aν ∂Bµ − ∂pµ ∂qν
(9.110)
=0
donde Z = Zνν . Para µ = ν cumple Zµν = 0, o sea: ∂Bµ ∂Aµ = ; ∂pν ∂qν
µ=ν
reemplazando (9.111) en la u ´ltima igualdad (9.110) se obtiene: ∂ ∂Aν ∂Aµ =0 − ∂t ∂pµ ∂pν
(9.111)
(9.112)
La ecuaci´ on (9.112) y la primera igualdad (9.110) nos dan: ∂ ∂Aν ∂ ∂Aµ ∂ ∂Aν ∂ ∂Aµ = ; = ∂pµ ∂t ∂pν ∂t ∂qµ ∂t ∂qν ∂t
(9.113)
Las expresiones (9.113) se cumplen si Aν (q, p, t) son de la forma: Aν =
∂f (q, t) ∂g(p, t) + ∂qν ∂pν
(9.114)
donde f y q son funciones continuas. Bν satisfacen, por los mismos argumentos, relaciones similares a (9.113), por tanto: Bν =
∂f ′ (q, t) ∂g ′ (p, t) + ∂qν ∂pν
(9.115)
342 / Mec´ anica cl´ asica avanzada ~ y B ~ para Las ecuaciones (9.114) y (9.115) son las condiciones que deben satisfacer A que (9.87) sea una integral universal invariante. Se cumple entonces que, para µ 6= ν: ∂Aν ∂Aµ ∂2f ∂2f − = − =0 ∂qµ ∂qν ∂qµ ∂qν ∂qν ∂qµ
∂Bµ ∂ 2g′ ∂ 2g′ ∂Bν − = − =0 ∂pµ ∂pν ∂pµ ∂pν ∂pν ∂pµ
(9.116)
∂Bµ ∂Aν ∂Aµ ∂2g ∂2g ∂Aν − = − = − =0 ∂pµ ∂qν ∂pµ ∂pν ∂pµ ∂pν ∂pν ∂pµ Para µ = ν las dos primeras igualdades en (9.116) siguen siendo v´alidas, en tanto que la tercera se reemplaza por: ∂Aν ∂Bν − = Zνν = C ∂pν ∂qν
(9.117)
Por tanto, (9.116) y (9.117) nos dan para todos µ, ν: ∂Aν ∂Aµ = ; ∂qµ ∂qν
∂Bν ∂Bµ = ; ∂pµ ∂pν
∂Aν ∂Bµ − = Cδµν ∂pµ ∂qν
(9.118)
Tambi´en podemos escribir a (9.118) as´ı: ∂Aν ∂Aµ = ; ∂qµ ∂qν
∂Bν ∂Bµ = ; ∂pµ ∂pν
∂ ∂Bµ (Aν − Cpν ) = ∂pµ ∂qν
(9.119)
Las expresiones (9.119) nos dicen que debe existir cierta funci´ on Φ(~q, ~p, t) tal que: ∆Φ =
∂Φ ∂Φ ~ − C~ ~ · ∆~ · ∆~q + · ∆~ p = (A p) · ∆~q + B p ∂~q ∂~p
(9.120)
puesto que: ∂Φ ∂Φ = Aν − C pν ; = Bν ∂qν ∂pν
(9.121)
Lo anterior implica que se cumplan las relaciones (9.119) a fin de que Φ sea continua. Se tiene entonces que: I I I ~ ~ (A · ∆~ q + B · ∆~ p) = C~ p · ∆~q + ∆Φ (9.122) La integral universal invariante (9.87) es entonces igual a: I I ′ ~ ~ I = (A · ∆~ q + B · ∆~ p) = C p~ · ·∆~q = CI1
(9.123)
lo cual constituye la prueba del teorema de Li Hua Chung para I ′ . De paso hemos hallado ~ yB ~ deben tener la forma (9.114) y (9.115) respectivamente a fin de que I ′ sea que A una integral universal invariante. Esta prueba es una generalizaci´ on para l grados de libertad de la presentada en Gantmacher para l = 1.
Las transformaciones can´onicas / 343
9.5.
Las transformaciones can´ onicas
En la secci´ on 4.5 se dio la definici´on de una transformaci´ on can´onica como una transformaci´ on de coordenadas en el espacio de fases 2l-dimensional, que en general puede depender del tiempo y que no cambia la forma de las ecuaciones de Hamilton. All´ı derivamos las f´ ormulas de la transformaci´ on a partir de la segunda forma del principio de Hamilton. Aqu´ı usaremos la invariancia de la integral de Poincar´e-Cart´ an y el teorema de Li Hua Chung. La funci´ on generatriz de una transformaci´ on can´ onica. Sean dos espacios de fase 2l dimensionales (q, p), (q, p). La transformaci´ on can´onica establece una correspondencia biun´ıvoca entre los puntos de estos dos espacios en cada instante t: q ν = q ν (q, p, t) ; J
pν = pν (q, p, t) ;
q 1 , q 2 , ...q l , p1 , p2 , ... pl q1 , q2 , ...ql , p1 , p2 , ... pl
ν = 1, 2, ...l
6= 0
(9.124) (9.125)
Un conjunto de trayectorias rectas en el espacio (q, p) est´ a definido por el sistema de ecuaciones diferenciales: ∂H(q, p, t) dpν ∂H(q, p, t) dqν ; ; = =− dt ∂pν dt ∂qν
ν = 1, 2, ...l
(9.126)
A cada una de las trayectorias definidas por (9.126) la transformaci´ on can´onica le hace corresponder una trayectoria recta en el espacio (q, p), definida por el sistema de ecuaciones diferenciales: dq ν ∂H(q, p, t) dpν ∂H(q, p, t) = ; =− ; ν = 1, 2, ...l dt ∂pν dt ∂q ν
(9.127)
Sea un “tubo” de trayectorias en el espacio de fases y sea C un contorno arbitrario que rodea ese tubo de trayectorias en el espacio (q, p). En el espacio (q, p) en virtud de la transformaci´ on habr´ a otro tubo de trayectorias rectas y C es un contorno que corresponde a C. C0 y C 0 son los contornos definidos por un conjunto de estados simult´ aneos, t = constante, y que se corresponden mediante la transformaci´ on. C0 y C 0 est´ an dadas por ecuaciones param´etricas del tipo de (9.64), y C y C por ecuaciones como (9.17). Es decir, C 0 y C0 obedecen a: C : t=
t(α) ; qν = qν (α) ; pν = pν (α) (9.128)
C0 : t =
t(α) = constante ; qν = qν (α) ; pν = pν (α) ; ν = 1, 2, ...l
y an´alogamente para C 0 y C. Como las trayectorias son hamiltonianas en (q, p) y en an, (9.25), que: (q, p), se sigue de la invariancia de la integral de Poincar´e-Cart´ ! I X I l l X pν ∆qν (9.129) pν ∆qν − H ∆t = C
ν=1
C0 ν=1
344 / Mec´ anica cl´ asica avanzada I
C
l X
ν=1
pν ∆q ν − H ∆t
!
=
I
l X
C 0 ν=1
pν ∆q ν
(9.130)
Como t es invariante bajo una transformaci´ on can´onica, se sigue que el lado derecho de (9.129) est´ a evaluado en el mismo tiempo que el lado derecho de (9.130). Si en la H Pl integral universal invariante ν=1 pν ∆q ν pasamos a las variables (q, p) por medio de la transformaci´ on can´ onica (9.124), obtenemos: I
l X
C 0 ν=1
pν ∆q ν =
I
l X
C0 ν=1
"
l X
µ=1
∂qµ pµ ∂qν
!
l X
∆qν +
µ=1
∂q µ pµ ∂pν
!
∆pν
#
(9.131)
La ecuaci´ on (9.131) es de la forma de (9.87): es una cierta integral universal invariante de primer orden en el espacio (p, q). Por el teorema de Li Hua Chung, el invariante obtenido puede diferir de I1 s´olo por un factor constante C, ecuaci´ on (9.123): I
l X
C 0 ν=1
pν ∆q ν = C
I X l
pν ∆qν
(9.132)
C ν=1
de las ecuaciones (9.129), (9.130) y (9.132) se sigue entonces que: ! ! I I l l X X pν ∆qν − H ∆t pν ∆q ν − H ∆t = C C
C
ν=1
(9.133)
ν=1
on de las (q, p), la trayectoria Si en la primera integral expresamos a (q, p) en funci´ de integraci´ on C ser´a reemplazada por C, por lo cual podemos escribir a (9.133) como: ! !# I " X l l X pν ∆q ν − H ∆t − C pν ∆qν − H ∆t =0 (9.134) C
ν=1
ν=1
C es un contorno arbitrario en el espacio (q, p), o sea que el integrando en (9.134) debe ser la diferencial exacta ∆ de alguna funci´ on de (q, p, t), que llamaremos −F (q, p, t). Por tanto podemos escribir: ! ! l l X X pν ∆q ν − H ∆t (9.135) ∆F = C pν ∆qν − H ∆t − ν=1
ν=1
donde adem´as se tiene que: ∆F =
l X ∂F ν=1
∂F ∆qν + ∆pν ∂qν ∂pν
+
∂F ∆t ∂t
(9.136)
Pl Como ν=1 pν ∆q ν − H ∆t no es un diferencial exacto, o sea no es igual a −∆F , se sigue que C nunca es cero. La funci´ on F se llama la funci´ on generatriz y la constante C
Las transformaciones can´onicas / 345 la valencia de la transformaci´ on can´onica (9.124). La transformaci´ on can´onica se llama univalente, o simplemente transformaci´ on can´onica cuando C = 1. Algunos autores llaman las transformaciones can´ onicas con C 6= 1 transformaciones can´onicas extendidas. En conclusi´ on, una condici´on necesaria y suficiente para que la transformaci´ on (9.124) sea can´ onica es la existencia de una funci´ on generatriz F y alguna constante C para las cuales la ecuaci´ on (9.135) se satisfaga id´enticamente en virtud de la transformaci´ on (9.124). Es de notarse que la ecuaci´ on (9.135) vale para toda transformaci´ on can´onica independientemente de cu´al sea la funci´ on H: vale para todo sistema hamiltoniano, o sea F no depende de H. Esto se prueba f´acilmente para un hamiltoniano arbitrario H1 definiendo a H 1 de modo que H 1 − H = C(H1 − H), con lo cual se llega a que (9.135) vale tambi´en para H 1 y H1 . Formas alternas de definir la funci´ on generatriz de una transformaci´ on can´ onica. El principio de Hamilton modificado tambi´en puede expresarse como: ! Z t2 l X − qν p˙ ν − H dt = 0 (9.137) δ t1
ν=1
puesto que las ecuaciones de Euler-Lagrange correspondientes al principio variacional (9.137) son las ecuaciones de Hamilton o ecuaciones de movimiento en el espacio de fases. En lugar de (9.22) podemos escribir: ∆S˜ =
−
l X
ν=1
! t2 qν ∆pν − H∆t
(9.138)
t1
Consecuentemente se obtiene la siguiente forma para la integral invariante de Poincar´e-Cart´ an, (9.25): I=
I
−
l X
ν=1
qν ∆pν − H∆t
!
(9.139)
Es f´ acil ver que (9.139) se puede derivar directamente de (9.25) mediante la transformaci´ on can´ onica ~ q → −~ p, p~ → q~. Se sigue entonces que adem´as de (9.129) son posibles las siguientes relaciones: ! I I l l X X − qν ∆pν − qν ∆pν − H∆t = C
I
C
C0
ν=1
−
l X
q ν ∆pν − H∆t
ν=1
!
=
I
ν=1
(9.140)
C0
−
l X
q ν ∆pν
ν=1
P Por el teorema de Li Hua Chung se sigue que lν=1 qν ∆pν , que es una integral universal invariante, es proporcional a I1 . Usando (9.129) y (9.140) conjuntamente con el teorema de Li Hua Chung, podemos obtener adem´as de (9.132) las siguientes tres
346 / Mec´ anica cl´ asica avanzada relaciones, que nos dar´ an otras tres expresiones para la funci´ on generatriz completamente equivalentes (9.135): I I I
C0
C0
l X
pν ∆q ν = C
l X
q ν ∆pν = C
C 0 ν=1
−
−
ν=1 l X
q ν ∆pν = C
ν=1
I I I
C0
−
l X
qν ∆pν
ν=1
l X
(9.141)
pν ∆qν
C0 ν=1
C0
−
l X
qν ∆pν
ν=1
Es claro que las “C” que aparecen en (9.132) y en (9.141) no tienen por qu´e ser la misma. De cada una de las expresiones (9.141) se obtiene una forma diferente para la funci´ on generatriz de la transformaci´ on can´onica por un procedimiento igual al que conduce a la forma (9.135). En primer lugar, y en virtud de (9.129) y (9.140), las ecuaciones (9.141) son equivalentes a: ! ! I I l l X X qν ∆pν − H∆t (9.142) − pν ∆q ν − H∆t = C C
I
C
I
C
C
ν=1
−
l X
−
l X
ν=1
ν=1
q ν ∆pν − H∆t
!
q ν ∆pν − H∆t
!
=C
ν=1
I
l X
C
=C
ν=1
I
−
C
pν ∆qν − H∆t
l X
ν=1
!
qν ∆pν − H∆t
(9.143) !
(9.144)
de (9.144) se sigue que: ∆F = C
∆F = C
−
l X
ν=1
l X
ν=1
∆F = C
−
qν ∆pν − H∆t !
−
qν ∆pν − H∆t
!
pν ∆qν − H∆t
l X
ν=1
!
−
l X
ν=1
− −
l X
ν=1
−
pν ∆q ν − H∆t
!
(9.145)
q ν ∆pν − H∆t
!
(9.146)
l X
ν=1
q ν ∆pν − H∆t
!
(9.147)
Las transformaciones can´ onicas libres. En el conjunto de todas las transformaciones can´ onicas hay una clase que se puede caracterizar por la siguiente propiedad: su funci´ on generatriz puede expresarse como una funci´ on de un conjunto de (2l) variables independientes que pueden ser (q q), (q p), (p q) o (p p). A estas transformaciones las llamaremos transformaciones can´onicas libres de la primera, segunda, tercera y cuarta
Las transformaciones can´onicas / 347 clase respectivamente. Es posible que una transformaci´ on can´onica dada sea a la vez can´onica libre de m´as de una clase. En (3.20) encontramos transformaciones can´onicas libres de la primera clase. Ejemplo 9.5.1 Demostrar que la transformaci´ on can´onica (4.134), para l = 1, es libre de primera clase: 1 p p2 2 p = mω q + ; q = −tan−1 (9.148) 2 mω 2 mωq Las f´ ormulas de transformaci´ on pueden escribirse en la forma: p = mωq tan q ;
p=
1 mωq 2 sec2 q 2
o sea que es libre de la primera clase. Tambi´en se puede escribir como: s r mωq 2 2p −1 q = cos ; p = −mω − q2 2p mω
(9.149)
(9.150)
o sea que tambi´en es libre de la segunda clase. Es f´acil ver que tambi´en es libre de tercera y cuarta clase. Ejemplo 9.5.2 Demostrar que la transformaci´ on identidad es can´onica de segunda y tercera clase pero no es de primera ni de cuarta clase. La transformaci´ on identidad es: q ν = qν ;
pν = pν ;
ν = 1, 2, ...l
(9.151)
Esta transformaci´ on puede escribirse en cualquiera de las formas siguientes: qν =
qν ; pν = pν
qν =
q ν ; pν = pν ;
(9.152) ν = 1, 2, ...l
on es o sea que s´olo es posible tomar independientes a (q, p) o a (q, p). Esta transformaci´ can´onica de segunda y tercera clase pero no es de primera ni de cuarta clase. Ejemplo 9.5.3 Mostrar que la transformaci´ on que intercambia coordenadas y momentos y cambia de escala, es libre de primera y cuarta clase pero no de segunda ni de tercera clase: qν = pν =
1 p β ν
αpν ;
qν =
βqν ;
1 pν = q ν ; α
(9.153) ν = 1, 2, ...l
Ejemplo 9.5.4 Mostrar que la transformaci´ on can´onica q = −αp/q, p = q 2 /2α, con l = 1, es una transformaci´ on can´ onica libre de primera y de cuarta clase pero no de segunda ni de tercera clase:
348 / Mec´ anica cl´ asica avanzada q=
αp ; −√ 2αp
p=
q2 ; 2α
q=
p 2αp
(9.154)
qq p=− α
Las transformaciones can´onicas libres de primera clase se caracterizan porque (p, p) se pueden expresar en funci´ on de (q, q). Esto dice que las (p) dependen de (q), o sea que: q 1 , q 2 , ...q l 6= 0 (9.155) J p1 , p2 , ...pl En este caso la funci´ on generatriz F (q, p, t) puede representarse mediante una funci´ on de (q, q) que llamaremos F1 : F (q, p, t) = F1 (q, q, t)
(9.156)
De (9.135) y (9.156) se sigue que: ∆F1 (q, q, t) = C
l X
ν=1
pν ∆qν − H∆t
!
−
l X
ν=1
pν ∆q ν − H∆t
!
(9.157)
Como para estas transformaciones ∆qν y ∆q ν son todos independientes se sigue entonces que: ∂F1 = Cpν ; ∂qν
∂F1 = −pν ; ∂qν
ν = 1, 2, ...l
∂F1 = H − CH ∂t
(9.158) (9.159)
Las ecuaciones (9.158) definen la transformaci´ on can´onica bajo consideraci´on, esto es, ellas pueden reducirse a la forma (9.124). Con ello probaremos que toda transformaon ci´ on can´ onica libre de primera clase define una funci´ on F1 (q, q, t) y que a cada funci´ F1 (q, q, t) le corresponde una transformaci´ on can´onica libre de primera clase. Debemos mostrar que es posible resolver las ecuaciones (9.158) para expresar a (q, p) en funci´ on de (q, p). Empecemos por mostrar que todas las derivadas parciales ∂F1 /∂qν son independientes. Supongamos que no lo fueran, es decir, que pudi´eramos encontrar una expresi´on para una de ellas en funci´ on de las dem´ as. Ello requerir´ıa que exista una funci´ on Ω diferente de cero tal que: ∂F1 ∂F1 ∂F1 (9.160) , , ... , q1 , q2 , ...ql = 0 Ω ∂q1 ∂q2 ∂ql donde en (9.160) los (q) son tomados como par´ ametros. De (9.158) se sigue: Ω(Cp1 , Cp2 , ...Cpl , q1 , q2 , ...ql ) = 0
(9.161)
como (q, p) son cantidades independientes, se sigue de (9.161) que Ω ≡ 0 y en consecuencia las ∂F1 /∂qν son independientes, consideradas como funciones de las variables
Las transformaciones can´onicas / 349 q 1 , q 2 , ...q l . Que las l cantidades independientes ∂F1 /∂qν sean funciones de las l cantidades independientes q ν se expresa diciendo que el jacobiano de esas funciones no es id´enticamente cero: 2 ∂ F1 ∂F1 /∂~q 6= 0 (9.162) = det J q ~ ∂~q ∂~q De la desigualdad (9.162) se sigue que las primeras l ecuaciones (9.158) pueden resolverse para las q ν , con lo cual todas las nuevas variables de fases q ν , pν (ν = 1, 2, ...l) pueden expresarse en funci´ on de las viejas variables qν , pν (ν = 1, 2, ...l). La ecuaci´ on (9.162) tambi´en permite que en (9.158) las l u ´ltimas ecuaciones sean resueltas para qν en on, las ecuaciones (9.158) definen una transformaci´on funci´ on de las q ν , pν . En conclusi´ can´onica libre de primera clase con funci´ on generatriz y valencia dadas, F1 y C 6= 0, en tanto que la f´ ormula (9.159) permite relacionar las funciones hamiltonianas H y H, que ser´an proporcionales s´olo en el caso en que la transformaci´on can´onica no dependa expl´ıcitamente del tiempo. Podemos decir que la clase de las transformaciones can´onicas libres de primera clase se puede obtener hallando todas las funciones generatrices F1 que satisfacen la condici´on (9.162) y las diferentes valencias C 6= 0, y usando las f´ormulas (9.158). Para las transformaciones can´onicas libres de primera clase univalentes (C = 1), (9.158) y (9.159) toman la forma m´as simple: ∂F1 ∂F1 ∂F1 = pν ; = −pν ; ν = 1, 2, ...l ; H = H + ∂qν ∂qν ∂t
(9.163)
La u ´ltima ecuaci´ on (9.163), dice que H − H no depende del sistema hamiltoniano espec´ıfico que se tenga sino simplemente de cu´al es la transformaci´ on can´onica, que puede ser definida sin hacer referencia a la forma del hamiltoniano. La discusi´ on de los otros tipos de transformaciones can´onicas libres es completamente an´aloga a la de las transformaciones can´onicas libres de primera clase. Las f´ormulas son las siguientes, que se obtienen usando las formas (9.145), (9.146) y (9.147) para la funci´ on generatriz. En las Transformaciones Can´onicas (T.C.) libres de segunda clase (q, p) son independientes, luego: ! ~p J 6= 0 (9.164) p~ Como (q, p) son independientes, (9.146) permite escribir: ∂F2 ∂F2 = Cpν ; = q ν ; ν = 1, 2, ...l ∂qν ∂pν
(9.165)
∂F2 = H − CH ∂t
(9.166)
donde F2 es funci´ on de (q, p, t) y satisface la condici´on: 2 ∂ F2 6= 0 det ∂~q ∂~p
(9.167)
350 / Mec´ anica cl´ asica avanzada En las T.C. libres de tercera clase (p, q) son independientes, luego: ! ~q 6= 0 J q ~
(9.168)
como (p, q) son independientes, (9.145) permite escribir: ∂F3 ∂F3 = −Cqν ; = −pν ; ν = 1, 2, ...l ∂pν ∂qν
(9.169)
∂F3 = H − CH ∂t
(9.170)
donde F3 es funci´ on de (p, q, t) y satisface la condici´on: 2 ∂ F3 6= 0 det ∂~ p ∂~q En las T.C. libres de cuarta clase (p, p) son independientes, luego: ! ~p J 6= 0 q ~
(9.171)
(9.172)
Como (p, p) son independientes, (9.147) permite escribir: ∂F4 = −Cqν ; ∂pν
∂F4 = qν ; ∂pν
ν = 1, 2, ...l
∂F4 = H − CH ∂t donde F4 es funci´ on de (p, p, t) y satisface la condici´on: 2 ∂ F4 6= 0 det ∂~ p ∂~p
(9.173)
(9.174)
(9.175)
Se tienen, pues, 4l cantidades no independientes (q, p, q, p) de las cuales, adem´as de (q, p) y (q, p), se pueden extraer conjuntos de variables independientes (q, q), (q, p), (p, q), (p, p). En cada uno de estos cuatro casos decimos que la transformaci´on can´onica es libre. Una transformaci´ on can´onica arbitraria es no libre y obedece f´ormulas de transformaci´ on en t´erminos de una funci´ on generatriz que veremos m´as adelante y de las cuales (9.158) y (9.164) a (9.175) no son m´as que casos particulares. Ejemplo 9.5.5 Hallar la funci´ on generatriz del tipo F2 para la transformaci´ on can´onica (9.148). Usando (9.146) y (9.150) obtenemos: ∆F2 = C(p ∆q − H ∆t) − (−q ∆p − H ∆t) = Cp ∆q + q ∆p
(9.176)
Las transformaciones can´onicas / 351 La u ´ltima igualdad en (9.176) se sigue de que la transformaci´ on no depende del tiempo. Tambi´en: s r 2p mωq 2 −1 ∆F2 = C(−mω)∆q − q 2 + ∆p cos (9.177) mω 2p Como ∆F2 es exacto se sigue que ∂ 2 F2 /∂p ∂q = ∂ 2 F2 /∂q ∂p lo cual implica que la transformaci´ on es univalente, o sea C = 1. La funci´ on generatriz es: s r mωq 2 2p 1 F2 (q, p) = p cos−1 − mωq − q2 (9.178) 2p 2 mω Para esta misma transformaci´ on se cumple que: q=−
p p2 cot q ; p = csc2 q mω 2mω
(9.179)
Entonces para una funci´ on generatriz del tipo F3 se cumple: p p2 ∂F3 ∂F3 = cot q ; =− csc2 q ∂p mω ∂q 2mω
(9.180)
donde hemos usado (9.169) con C = 1. Es claro que: ∆F3
= =
1 (2p cot q ∆p − p2 csc2 q ∆q) 2mω 1 2 ∆ p cotq 2mω
(9.181)
con lo cual: F3 =
p2 cot q 2mω
(9.182)
similarmente hallamos para F4 : F4 =
p2 p p 2mωp − p2 + p sen−1 √ 2mω 2mωp
(9.183)
En s´ıntesis, las funciones generatrices de la transformaci´ on can´onica (3.107) son: 1 F1 = − mωq 2 tan q 2 s r mωq 2 2p 1 2 −1 − mωq −1 F2 = p cos 2p 2 mωq 2 p2 cot q F3 = 2mω r s p2 2mωp p2 −1 − 1 + F4 = p sen 2mω p2 2mωp
(9.184)
352 / Mec´ anica cl´ asica avanzada Ejemplo 9.5.6 Hallar las funciones generatrices del tipo F2 y F3 para la transformaci´ on can´ onica identidad. Sabemos que no existen funciones del tipo F1 o F4 . La transformaci´ on no depende del tiempo, luego, de (9.146) y (9.152): ∆F2 = C
l X
pν ∆qν +
ν=1
l X
q ν ∆pν = C
ν=1
l X
pν ∆qν +
ν=1
l X
qν ∆pν
(9.185)
ν=1
de la condici´on ∂ 2 F2 /∂qν ∂pµ = ∂ 2 F2 /∂pµ ∂qν se sigue que la transformaci´ on debe ser univalente, en consecuencia: ∆F2 =
l X
(pν ∆qν + qν ∆pν ) = ∆
ν=1
l X
q ν qν
(9.186)
ν=1
Por tanto: F2 =
l X
pν qν
(9.187)
ν=1
Similarmente: F3 = −
l X
q ν pν
(9.188)
ν=1
Ejemplo 9.5.7 Hallar las funciones generatrices del tipo F1 y F4 para la transformaci´ on can´ onica de cambio de escala e intercambio de coordenadas y momentos (9.153). Sabemos que F2 y F3 no existen para esa transformaci´ on. El resultado es: C = −α β ;
C = −α β ;
F1 = −β
F4 = α
l X
q ν qν
(9.189)
ν=1
l X
pν pν
(9.190)
ν=1
Ejemplo 9.5.8 Hallar las funciones generatrices de la transformaci´ on de cambio de escala: q ν = αqν ; pν = βpν C = α β ; F2 = α
l X
pν qν
(9.191)
ν=1
C = α β ; F3 = −β
l X
ν=1
q ν pν
(9.192)
Las transformaciones can´onicas / 353 Ejemplo 9.5.9 Sea una transformaci´ on can´onica libre de primera clase (q, p) → (q, p) on inversa (q, p) → (q, p) tambi´en con generatriz F1 (q, q, t). Mostrar que la transformaci´ es can´ onica, y hallar la correspondiente funci´ on generatriz. La transformaci´ on original satisface: ! l X ∆F1 = C pν ∆qν − H ∆t − ν=1
l X
ν=1
pν ∆q ν − H ∆t
!
∂F1 ∂F1 ∂F1 = Cpν ; = −pν ; ν = 1, 2, ...l ; = H − CH ∂qν ∂qν ∂t
(9.193)
(9.194)
La desigualdad (9.162) garantiza que las dos u ´ltimas ecuaciones (9.194) se pueden resolver para (q) en funci´ on de (p), tomando (q) como par´ ametros, con lo cual se pueden expresar (p, q) en funci´ on de (q, p), o sea que las ecuaciones (9.124) se pueden invertir. Esto prueba que la transformaci´ on inversa existe, la cual adem´as es can´onica. Para la transformaci´ on inversa: ! ! l l X X i i pν ∆q ν − H ∆t − pν ∆qν − H ∆t (9.195) ∆F1 = C ν=1
ν=1
∂F1i ∂F1i = C i pν ; = −pν ; ∂q ν ∂qν
ν = 1, 2, ...l ;
∂F1i = H − CiH ∂t
(9.196)
comparando (9.194) y (9.196) vemos que: −
∂F1i 1 ∂F1 = ; ∂qν C ∂qν
−
∂F1 1 ∂F1i = i ∂qν C ∂qν
Ci
∂F1 ∂F1i + ∂t ∂t
= (−CC i + 1)H
C
∂F1i ∂F1 + ∂t ∂t
= (−CC i + 1)H
(9.197)
De (9.197) se sigue que: F1 = −CF1i ;
F1i = −C i F1 ;
Ci =
1 C
(9.198)
1 F1 (q, q, t) ; C
Ci =
1 C
(9.199)
o m´as expl´ıcitamente: F1i (q, q, t) = −
Para una transformaci´ on can´onica libre univalente de primera clase se cumple simplemente: F1i (q, q, t) = −F1 (q, q, t)
(9.200)
354 / Mec´ anica cl´ asica avanzada o sea que la funci´ on generatriz de la transformaci´ on can´onica inversa es el negativo de la funci´ on generatriz de la T.C. original. Para una transformaci´ on can´onica arbitraria, se cumplen las expresiones siguientes para las funciones generatrices F y F i , aunque no se cumplen las f´ ormulas (9.194) y (9.196): ! ! l l X X ∆F (q, p, t) = C pν ∆q ν − H ∆t (9.201) pν ∆qν − H ∆t − ν=1
i
∆F (q, p, t) =
C
i
l X
ν=1
ν=1
pν ∆q ν − H ∆t
!
l X
−
ν=1
pν ∆qν − H ∆t
La ecuaci´ on (9.202) tambi´en se puede escribir como: ! l 1 X 1 i − i ∆F (q, p, t) = pν ∆qν − H ∆t − C C i ν=1
l X
ν=1
!
(9.202)
!
pν ∆q ν − H ∆t(9.203)
de donde se llega al resultado general: F i (q, p, t) = −
1 1 F (q, p, t) ; C i = C C
(9.204)
Ejemplo 9.5.10 Mostrar que el resultado de dos transformaciones can´onicas sucesivas es una transformaci´ on can´onica. El generador de la transformaci´ on resultante es la suma de los generadores de las transformaciones separadas. Si las transformaciones son libres de primera clase: (a+b)
F1
(a)
(b)
(q, q, t) = F1 (q, q, t) + F1 (q, p, t)
(9.205)
donde a es la transformaci´ on (q, p) → (q, p) y b es la transformaci´ on (q, p) → (q, p); a + b representa la transformaci´ on combinada (q, p) → (q, p). Ejemplo 9.5.11 Mostrar que la realizaci´ on de tres transformaciones can´onicas sucesivas es asociativa. Para transformaciones libres de primera clase esto se expresa as´ı: (a+b)+c a+(b+c) q, q, t q, q, t = F1 F1
lo que se sigue de la propiedad (9.205): a+(b+c) (a) (b+c) q, q, t = F1 (q, q, t) + F1 F1 q, q, t = (a) F1 (q,
q, t) +
donde c es la transformaci´ on (q, p) → (q, p).
(b) F1
q, q, t +
(c) F1
q, q, t
(9.206)
(9.207)
Las transformaciones can´onicas / 355 Las ecuaciones (9.205), (9.206) y (9.207) valen tambi´en para transformaciones can´onicas arbitrarias. Significado de la valencia de una transformaci´ on can´ onica. Sea la transformaci´ on de cambio de escala (9.191) y una transformaci´ on can´onica univalente arbitraria. Si esas dos transformaciones se realizan en sucesi´on, las respectivas funciones generatrices se pueden escribir como: ∆Fc.e. = αβ
l X
ν=1
∆Fµ.v. =
l X
ν=1
pν ∆qν − H ∆t
pν ∆q ν − H ∆t
!
!
−
−
l X
ν=1
l X
ν=1
pν ∆q ν − H ∆t
pν ∆q ν − H ∆t
!
!
(9.208)
(9.209)
Entonces la propiedad (9.205), permite escribir para la funci´ on generatriz de la transformaci´ on completa: ∆Fµ.v. = αβ
l X
ν=1
pν ∆qν − H ∆t
!
−
l X
ν=1
pν ∆q ν − H ∆t
!
(9.210)
O sea que cualquier transformaci´ on can´onica no univalente puede suponerse compuesta de una transformaci´ on de cambio de escala donde c = αβ seguida de una transformaci´ on univalente. Lo anterior permite que en la pr´actica se usen s´olo las transformaciones can´ onicas univalentes. El grupo de las transformaciones can´ onicas. El conjunto de todas las transformaciones can´ onicas de un sistema de l grados de libertad es un conjunto infinito no contable. Este conjunto posee la estructura algebraica de grupo: (i) Hay una ley de composici´on interna, mediante la cual a dos transformaciones can´ onicas se les puede asociar una tercera; es decir, est´ a definida la suma de dos transformaciones can´ onicas para dar una transformaci´ on can´onica, ecuaci´ on (9.205). (ii) Existe la transformaci´ on can´onica identidad, ecuaci´ on (9.189). (iii) La transformaci´ on inversa de una transformaci´ on can´onica dada existe y es can´onica, (9.204). (iv) La realizaci´ on de transformaciones can´onicas sucesivas es asociativa, (9.206). Por todo lo anterior podemos decir que la forma de las ecuaciones can´ onicas es invariante con respecto al grupo de las transformaciones can´ onicas. La integral de Poincar´e-Cart´ an, las integrales invariantes de Poincar´e, los corchetes de Poisson y otras cantidades tambi´en poseen esta propiedad de invariancia bajo el grupo de las transformaciones can´ onicas. Relaci´ on entre las diferentes funciones generatrices de transformaciones can´ onicas libres. Interpretaci´ on en t´ erminos de transformaciones de Legendre. En la secci´ on (4.1) se defini´o la transformaci´ on de Legendre. Sea una transformaci´ on
356 / Mec´ anica cl´ asica avanzada can´ onica libre de primera clase, univalente, las f´ormulas de transformaci´ on se obtienen de: pν =
∂F1 ∂F1 ; −pν = ; ν = 1, 2, ...l ∂qν ∂qν
(9.211)
Usando la notaci´ on de la secci´ on 4.1, sea (x) = (q); (α) = (q, t); (y) = (p) y X = F1 . Entonces (9.211) se pueden escribir como: yν =
∂X ∂X ∂X(x, α) ; −pν = ; H −H = ∂xν ∂q ν ∂t
(9.212)
Podemos interpretar, pues, a F1 , como el generador de la transformaci´ on de Legendre (q) → (p). El generador de la transformaci´ on de Legendre inversa, (y) → (x) es Y (y, α), tal que: Yν =
l X
ν=1
xν yν − X ; xν =
∂Y ∂yν
(9.213)
donde adem´as se satisface: ∂Y ∂X ∂Y ∂X =− → =− ; ∂αi ∂αi ∂q ν ∂qν
∂X ∂Y =− ∂t ∂t
(9.214)
∂Y ∂t
(9.215)
se cumple, pues, que: qν =
∂Y ; ∂pν
−pν = −
∂Y ; ∂qν
H −H =−
Si llamamos Y = −F 3(p, q, t), las ecuaciones (9.215) quedan as´ı: qν = −
∂F3 ; ∂pν
pν = −
∂F3 ; ∂qν
H −H =−
∂F3 ∂t
(9.216)
que coinciden con las f´ormulas (9.168) a (9.171). En conclusi´ on, F1 y F3 est´ an relacionadas mediante una transformaci´ on de Legendre: F3 = F1 −
l X
pν qν
(9.217)
ν=1
Con argumentos completamente an´alogos llegamos a: F2 = F1 +
l X
q ν pν
l X
q ν pν −
(9.218)
ν=1
F4 = F1 +
ν=1
l X
qν pν
(9.219)
ν=1
Ejercicio 9.5.1 Usar las relaciones (9.217), (9.218) y (9.219) para obtener a F2 , F3 y F4 a partir de F1 para un oscilador arm´onico lineal. Comparar con las f´ormulas (9.184).
Las transformaciones can´onicas / 357 Ejemplo 9.5.12 Verificar las expresiones (9.187) y (9.188) usando la transformaci´on de legendre: F3 = F2 −
l X
ν=1
q ν pν −
l X
pν qν
(9.220)
ν=1
Usando (9.187) obtenemos: F3
l X
=
ν=1 l X
=
ν=1
(pν qν − q ν pν − pν qν ) (pν q ν − q ν pν − pν q ν ) =
l X
ν=1
−q ν pν
(9.221)
en efecto, (9.221) coincide con (9.188). Notaci´ on de las funciones generatrices. Corben-Stehle usan la siguiente notaci´on para las funciones generatrices de las T.C. libres F1, 2, 3, 4 de Goldstein: F1 = φ(q, q, t) F2 = ψ ′ (q, p, t) (9.222) F3 = ψ(q, p, t) F4 = φ′ (q, p, t) Landau usa F1 = F y F2 = Φ. Las transformaciones puntuales. Una transformaci´ on de coordenadas llamada transformaci´ on puntual, puede escribirse como una transformaci´ on can´onica. Las nuevas coordenadas son funciones de las viejas coordenadas pero no de los viejos momentos. Entonces en una transformaci´ on puntual pueden tomarse como independientes (p, q) o (p, q), o sea que una transformaci´ on puntual es libre de segunda y de tercera clase. Puede expresarse en las siguientes formas: q ν = fν (q, t) ; pν =
∂F2 ; ∂qν
qν = −
∂F3 ; ∂pν
pν = gν (q, p, t) qν =
∂F2 ∂pν
pν = −
∂F3 ∂q ν
(9.223) (9.224) (9.225)
Se requiere entonces que F2 y F3 sean de la forma: F2 =
l X
ν=1
fν (q, t)pν
(9.226)
358 / Mec´ anica cl´ asica avanzada
F3 = −
l X
fν−1 (q, t)pν
(9.227)
ν=1
donde fν−1 son las funciones inversas a fν , o sea, qν = fν−1 (q, t). Entonces se tiene para pν y pν : pν =
l X ∂fµ (q, t) pν ∂qν µ=1
pν =
l X ∂fµ−1 (q, t) pµ ∂q ν µ=1
(9.228)
(9.229)
Seg´ un lo anterior es claro que (p) y (p) estar´ an conectados por una transformaci´ on lineal que depende de las coordenadas que llamaremos T˜ de modo que en forma de matrices y vectores l-dimensionales (9.228) y (9.229) toman la forma: p = T˜(q, t)~p ; ~p = T˜−1 (q, t)~ ~ p Tµν =
−1 ∂fµν ∂fν −1 ; Tµν = ∂qµ ∂qµ
(9.230) (9.231)
Por poderse expresar en t´erminos de funciones generatrices, la transformaci´ on puntual es can´ onica. Entonces, tanto las ecuaciones de Hamilton como las de Lagrange son covariantes bajo transformaciones puntuales. Las ecuaciones (9.223) y (9.228) pueden tomarse como las f´ ormulas de una transformaci´ on can´onica puntual. Ejemplo 9.5.13 Sea un sistema de tres grados de libertad y la transformaci´ on de coordenadas cartesianas a coordenadas esf´ericas. Expresar esta transformaci´ on como transformaci´ on can´ onica. La transformaci´ on es: p r = x2 + y 2 + z 2 = fr (q)
z θ = cos−1 p = fθ (q) 2 x + y2 + z 2
φ = tan−1
(9.232)
y = fθ (q) x
x = r senθ cos φ = fx (q) y = r senθ senφ = fy (q) z = r cos θ = fz (q)
(9.233)
Las transformaciones can´onicas / 359 donde tomamos a (q) = (x, y, z) y (q) = (r, θ, φ). Adem´as usamos la notaci´ on (fν−1 ) = (fx , fy , fz ). La funci´ on generatriz F2 , de acuerdo con (9.226) y (9.232) es: F2 (q, p) = =
pr f r + pθ f θ + pφ f φ p z x2 + y 2 + z 2 + p2θ cos−1 p 2 x + y2 + z 2 −1 y +pφ tan x pr
(9.234)
Similarmente para F3 (q, p) tenemos: F3 (q, p) = =
−px fx − py fy − pz fz
(9.235)
−px r senθ cos φ − py rsenθ senφ − pz r cos θ
Usando (9.228) junto con (9.234) y (9.235) obtenemos las siguientes f´ormulas para la transformaci´ on de los momentos: y xz x pr − 2 pθ p +p px = p 2 φ 2 2 2 2 2 x + y x +y +z x + y (x2 + y 2 + z 2 ) x y yz pr + 2 pθ py = p pφ + p 2 x +y x2 + y 2 + z 2 x2 + y 2 (x2 + y 2 + z 2 )
(9.236)
p x2 + y 2 pr − 2 px = p pθ 2 2 2 x + y2 + z 2 x +y +z z
y similarmente: pr =
px senθ cos φ + py senθ senφ + pz cos θ
pθ =
px r cos θ cos φ + py r cos θ senφ − pz r senθ
pr =
−px r senθ senφ + py rsenθ cos φ
(9.237)
Notemos que: p~2 = p2x + p2y + p2z = p2r +
p2φ p2θ + r2 sen2 θ r2
Expresadas en t´erminos de r, θ, φ, las matrices T˜ y T˜ −1 son: senφ 1 cos θ cos φ − senθ cos φ r r senθ cos φ 1 senθ senφ cos θ senφ T˜(q) = r r senθ 1 0 cos θ − senθ r
(9.238)
(9.239)
360 / Mec´ anica cl´ asica avanzada
senθ cos φ
−1 ˜ T (q) = r cos θ cos φ −r senθ senφ
cos θ senφ r cos θ senφ r senθ cos φ
cos θ
−r senθ 0
(9.240)
˜ Sin embargo T˜ −1 6= T˜ T , o sea que Se ve, como debe ser, que T˜T˜−1 = T˜ −1 T˜ = I. la transformaci´ on de los momentos no es ortogonal. Transformaci´ on puntual lineal. En este caso se tiene: qν =
l X
Sνµ qµ + bν = fν (q, t)
(9.241)
ν=1
donde asumimos que Sνµ y bν pueden depender expl´ıcitamente del tiempo, aunque obviamente no dependen de (q) ni de (p). La transformaci´ on inversa es: qν =
l X
ν=1
−1 Sνµ q µ − bµ = fν−1 (q, t)
(9.242)
−1 donde Sνµ es la matriz inversa de Sνµ . Las funciones generatrices F2 (q, p, t) de la transformaci´ on, y −F2 (q, p, t) = F3 (q, p, t) de la transformaci´ on inversa son:
F2 (q, p, t) =
l X
Sµν pµ qν +
µ,ν=1
F2 (q, p, t) = −
l X
l X
b ν pν
(9.243)
ν=1
µ,ν=1
−1 Sµν q µ − b µ pν
(9.244)
La relaci´ on entre los momentos tambi´en ser´a lineal: pν =
l X
Sµν pµ ;
pν =
l X
−1 Sµν pµ
(9.245)
µ=1
µ=1
La “representaci´ on” de las coordenadas y la “representaci´ on” de los momentos. La transformaci´ on (q, p) → (p, −q) es can´onica. De acuerdo con (9.189) puede ser generada por las funciones generatrices. F1 (q, q) =
l X
ν=1
q µ qν ; F4 (p, p) =
l X
pµ pν
(9.246)
ν=1
Como la transformaci´ on no depende del tiempo, H = H: H(q, p, t) = H(q, p, t) = H(−p, q, t)
(9.247)
Las transformaciones can´onicas / 361 As´ı por ejemplo, para un oscilador arm´onico lineal: H(q, p, t) =
1 2 k 2 q + p 2m 2
(9.248)
Ciertamente en el formalismo hamiltoniano las ecuaciones de movimiento son covariantes. El contenido de esta transformaci´ on es el siguiente: en el espacio de configuraci´on el estado del sistema se puede representar mediante dos puntos, o equivalentemente, mediante las coordenadas y velocidades generalizadas; la transformaci´ on nos dice que en el espacio de momentos tambi´en est´ a toda la informaci´on requerida para describir el estado; en el espacio de momentos el estado se puede representar entonces mediante los momentos generalizados y sus derivadas temporales. Hallemos las ecuaciones de lagrange en el espacio de los momentos. Partimos de P l on can´onica generada por (9.246): L = ν=1 pν q˙ν − H y usamos la transformaci´ ! l l l l X X X X pν q˙ν + pν q˙ ν − H − pν q˙ ν (9.249) L= pν q˙ν − H = ν=1
ν=1
ν=1
ν=1
El nuevo lagrangiano L estar´ a entonces relacionado con L por: L=
l X
ν=1
pν q˙ ν − H = L −
l X
ν=1
l d X pν qν pν q˙ν − pν q˙ν = L − dt ν=1
(9.250)
Como L y L difieren por una derivada total respecto al tiempo, el principio de Hamilton nos dice que las ecuaciones de movimiento son: d ∂L(p, p, ∂L(p, p, ˙ t) ˙ t) − = 0 ; ν = 1, 2, ...l ∂pν dt ∂ p˙ ν
(9.251)
lo cual coincide con el resultado (4.48) que se obtuvo con base en consideraciones sobre las transformaciones de Legendre. El paso del formalismo lagrangiano al hamiltoniano, secci´ on 3.1, se realiza mediante la transformaci´ on pν = ∂L(q, q, ˙ t)/∂ q˙ν , que se expresa en t´erminos de transformaciones de Legendre. Esta transformaci´ on tiene la forma de cierta transformaci´ on (p, q) → (p = q, ˙ q) en el espacio de fases. Podr´ıamos investigar si es una transformaci´ on can´onica donde los nuevos momentos sean las (q). ˙ Tambi´en la transformaci´ on puede escribirse en una forma tal que q ν = q˙ν ; que es m´as u ´til en el contexto de las transformaciones can´onicas pues permite interpretar on generatriz del tipo F1 de cierta transformaci´ on a L(q, q, ˙ t) = L(q, q, t) como la funci´ can´onica. Es decir, L genera la transformaci´ on: pν =
∂L(q, q, t) ∂L(q, q, t) ∂L(q, q, t) ; pν = − ; H −H = ∂qν ∂q ν ∂t
(9.252)
que equivale a la transformaci´ on (q, p) ˙ ↔ (−p, q). ˙ H es el hamiltoniano en las variables ˙ Si quisi´eramos expresar esta transformaci´ on can´onicas (q, p) ˙ y H en las variables (−p, q). mediante una funci´ on generatriz del tipo F4 (p, p, t), dada de acuerdo con (9.219) por Pl Pl L(q, q, t)+ ν=1 (q ν pν −qν pν ) = L(q, q)− ˙ ν=1 (pν q˙ν +qν p˙ ν ), notamos que ese generador, de acuerdo con (9.250), ser´ıa precisamente la funci´ on que llamamos L(p, p, ˙ t).
362 / Mec´ anica cl´ asica avanzada Ejercicio 9.5.2 Hallar los hamiltonianos y las ecuaciones de movimiento que corresponden a los conjuntos de variables can´onicas (q, p) ˙ y (−p, q). ˙ Ejercicio 9.5.3 Analizar la transformaci´ on (q, p) ↔ (q, q) ˙ como una transformaci´ on en el espacio de fases, e investigar si es can´onica. De serlo hallar la correspondiente funci´ on generatriz. La funci´ on generatriz de una transformaci´ on can´ onica arbitraria. En general, una transformaci´ on can´onica es no libre, o sea que no se puede describir mediante funciones generatrices del tipo F1, 2, 3, 4 . As´ı por ejemplo para un sistema de dos grados de libertad la transformaci´ on: q 1 = q1 , p1 = p1 , q 2 = p2 , p2 = −q2
(9.253)
es can´ onica pero no se puede describir mediante una funci´ on generatriz de una transformaci´ on can´ onica libre, pues involucra una mezcla de los cuatro tipos. El tratamiento de estas transformaciones se basa en el lema de Carath´eodory, cuya demostraci´on est´ a dada en el texto de Gantmacher, Lectures in analytical mechanics, secci´ on 29. El enunciado del lema es el siguiente. Lema. Si hay 2l funciones independientes q 1 , q 2 , ...q l , p1 , p2 , ...pl de las 2l cantidades independientes q1 , q2 , ...ql , p1 , p2 , ...pl , entonces del conjunto de 4l cantidades qν , pν , q ν , pν (ν = 1, 2, ...l) siempre es posible escoger 2l cantidades independientes de tal manera que no hay ni un s´olo par de cantidades conjugadas (qν , pν ) o (q ν , pν ) entre an ellas. Tenemos entonces que de las 4l cantidades qν , pν , q ν , pν (ν = 1, 2, ...l) que est´ conectadas mediante la transformaci´ on can´onica: ~q , ~p ) 6= 0 (9.254) q ν = q ν (q, p, t) ; pν = pν (q, p, t) ; ν = 1, 2, ...l ; J( q, p es posible tomar las siguientes 2l cantidades independientes: q1 , q2 , ...qr , pr+1 , pr+2 , ...pl , q 1 , q 2 , ...q s , ps+1 , ps+2 , ...pl (9.255) 0 ≤ r ≤ l, 0 ≤ s ≤ l donde, de acuerdo con el lema de Carath´eodory no hay ni un par de variables can´onicamente conjugadas. Como la transformaci´ on es can´onica existe cierta funci´ on F (q, p, t) tal que: ! ! l l X X ∆F = C pν ∆q ν − H ∆t (9.256) pν ∆qν − H ∆t − ν=1
ν=1
de acuerdo con (9.136). Es claro que igualmente podr´ıamos haber usado cualquiera de las expresiones (9.145), (9.146) o (9.147), obteni´endose cuatro expresiones para F que s´olo difieren por una transformaci´ on de Legendre. La expresi´on (9.256) usando (9.255) se puede separar as´ı: ∆F = C
r X
ν=1
pν ∆qν +C
l X
ν=r+1
pν ∆qν −
s X
ν=1
pν ∆q ν −
s X
ν=s+1
pν ∆q ν + H − H ∆t
(9.257)
Las transformaciones can´onicas / 363 Usando las siguientes expresiones: l X
l X
pν ∆qν = ∆
pν qν
ν=r+1
ν=r+1
l X
l X
pν ∆q ν = ∆
ν=s+1
!
pν q ν
ν=s+1
!
−
∆
F+
ν=s+1
C
r X
q ν pν − C
pν ∆qν −
ν=1
l X
−
qν pν
ν=r+1
l X
qν ∆pν
ν=r+1
ν=s+1
l X
q ν ∆pν
(9.258)
ν=s+1
!
=
!
l l X X + − pν ∆q ν + q ν ∆pν ν=1
qν ∆pν
ν=r+1
podemos escribir a (9.257) como: l X
l X
!
+ H − CH ∆t
(9.259)
seg´ un (9.255), ∆qν (ν = 1, 2, ...r), ∆pν (ν = r + 1, r + 2, ...r), ∆q ν (ν = 1, 2, ...s), ∆pν (ν = s + 1, s + 2, ...l) son independientes y por tanto: C pν
=
−C qν
=
qν
=
−pν
=
H − CH =
∂U ; ∂qν ∂U ; ∂pν ∂U ; ∂pν ∂U ; ∂qν
ν = 1, 2, ...r ν = r + 1, r + 2, ...l ν = s + 1, s + 2, ...l ν = 1, 2, ...s
∂U ∂t
(9.260)
donde U es funci´ on de las cantidades (9.255) y est´ a definida por: U =F+
l X
ν=s+1
q ν pν − C
l X
pν qν
(9.261)
ν=r+1
Las f´ ormulas (9.260) son equivalentes a las f´ormulas (9.254) y determinan la transformaci´ on can´ onica por medio de la valencia C y la funci´ on generatriz U de las variables independientes (9.255). Las f´ ormulas (9.260) relacionan el conjunto de variables independientes (9.255) con el siguiente conjunto de variables independientes complementarias: p1 , p2 , ...pr , qr+1 , qr+2 , ...ql , p1 , p2 , ...ps , q s+1 ; q s+2 , ...q l (9.262) 0 ≤ r ≤ l, 0 ≤ s ≤ l
364 / Mec´ anica cl´ asica avanzada El jacobiano de las variables p1 , p2 , ...ps , q s+1 , q s+2 , ...q l respecto a las variables q1 , q2 , ...qr , pr+1 , pr+2 , ...pl es diferente de cero. Ese jacobiano puede escribirse como: ∂~ps ∂~ps ! ∂~qr ∂~pl−r ~ps , ~q l−s = det J qr , p~l−r ~ ∂~q l−s ∂~q l−s ∂~qr ∂~pl−r 2 ∂2U ∂ U − − ∂~qr ∂~q ∂~pl−r ∂~q s s (9.263) = det ∂2U ∂2U ∂~qr ∂~pl−s ∂~pl−r ∂~pl−s
donde ~ps es el vector p1 , p2 , ...ps . p~l−r es el vector pr+1 , pr+2 , ...pl , con significado an´alogo para los otros vectores que aparecen en (9.263). En vista de (9.263), las ecuaciones (9.260) de la primera l´ınea pueden resolverse para expresar a q 1 , q 2 , ...q s , ps+1 , ps+2 , ...pl en funci´ on de p1 , p2 , ...pr , qr+1 , qr+2 , ...ql . Despu´es se reemplazan las expresiones obtenidas en las l ecuaciones de la segunda l´ınea de (9.260) para obtener las ecuaciones de la transformaci´ on can´ onica (9.254). Las f´ormulas de la transformaci´ on can´onica inversa pueden obtenerse de manera an´aloga mediante una funci´ on generatriz que depende de las variables (9.262) en vez de las variables complementarias igual a (9.255), −C −1 U y una valencia igual a C −1 . Queda claro que las transformaciones can´onicas libres resultan como casos particulares de la transformaci´ on can´onica arbitraria, al definir apropiadamente los valores de r y s.
9.6.
La ecuaci´ on de Hamilton-Jacobi
En la secci´ on 3.4 hemos discutido la especificaci´ on del estado del sistema mediante las constantes de movimiento. Por simplicidad estamos considerando que el sistema es integrable y posse por lo tanto un conjunto de 2l constantes de movimiento uniformes. El objetivo de la descripci´on cl´asica es encontrar a las variables de estado en funci´ on del tiempo para cada valor de las constantes de movimiento, considerados como un conjunto completo de variables din´amicas independientes. Si se quiere pueden tomarse como constantes de movimiento los 2l valores iniciales de las variables de estado. La soluci´on estar´ a dada por: q = ~q(~ ~ q0 , p~0 , t) ; p~ = ~p(~q0 , p~0 , t)
(9.264)
La ecuaci´ on (9.264) puede interpretarse como una transformaci´ on can´onica de las variables ~ q0 , p~0 a las variables ~q, p~. En la secci´ on 4.7 vimos que para un sistema conservativo la acci´on coincide con el negativo de la funci´ on generatriz de la transformaci´ on can´onica de evoluci´ on temporal (9.264). Veamos que este resultado vale en general. En la secci´ on 9.1 vimos que la diferencia de acci´on entre dos trayectorias rectas infinitesimalmente
Las transformaciones can´onicas / 365 pr´oximas, ∆S, cuyos puntos iniciales y finales est´ an sobre ciertas curvas C1 y C2 respectivamente, del espacio de configuraci´on, est´ a dada por la ecuaci´ on (9.11), ! ! l l X X ∆S = pν ∆qν − H ∆t − pν ∆qν − H ∆t (9.265) ν=1
C2
ν=1
C1
Describiendo la transformaci´ on can´onica (9.264) mediante la funci´ on generatriz (9.135) con C = 1 y tomando a (q, p) como las nuevas variables y a q0 , p0 , como las viejas variables, obtenemos: ! ! l l X X −∆F = pν ∆qν − H ∆t − (9.266) pν0 ∆qν0 − H0 ∆t ν=1
ν=1
Si en (9.265) definimos la curva C1 como el conjunto de puntos iniciales simult´ aneos, t1 (α) = constante = t0 y dejamos a C2 arbitraria, entonces (9.265) tomar´a la forma: ∆S =
l X
ν=1
pν ∆qν − H ∆t −
l X
pν0 ∆qν0
(9.267)
ν=1
Las expresiones (9.266) y (9.267) coincidir´an si la transformaci´ on can´onica generada por F , (9.264), satisface: −∆F − H0 ∆t = ∆S
(9.268)
Tomando H0 = 0 obtenemos F = −S. Adem´as como ∂F/∂t = H − H0 se sigue que: F = −S ; →
∂S +H =0 ∂t
(9.269)
El resultado (9.269) fue obtenido por Hamilton (1805-1865) en 1835, quien adem´as supuso que la transformaci´ on can´onica (9.264), es libre de primera clase, con lo cual (9.267) conduce a: pν =
∂S ∂S ; pν0 = ; ∂qν ∂qν0
ν = 1, 2, ...l
(9.270)
Las f´ ormulas (9.270) conducen a la transformaci´ on can´onica (9.264). 6 S se llama la funci´ on principal de Hamilton (o simplemente acci´on de Hamilton). Que F = −S, sin emRt bargo, no da un m´etodo para encontrar a F , puesto que para evaluar a S = t0 L(q, q, ˙ t) dt se requiere conocer a q(t), q(t), ˙ o sea haber resuelto el problema, es decir conocer la “transformaci´on” (9.264). El resultado de Hamilton fue un c´ırculo vicioso: para escribir a partir de (9.270) las ecuaciones (9.264) se requiere conocer la funci´ on principal de Hamilton, y para evaluar esta funci´ on se requiere conocer la soluci´on (9.264). La contribuci´ on de Jacobi (1804-1851), en 1837, fue romper este c´ırculo vicioso; mostr´o que al resolver la ecuaci´ on diferencial que resulta de (9.269), llamada la ecuaci´ on de HamiltonJacobi, para obtener una funci´ on S mediante las f´ormulas (9.270), se obtiene la soluci´on 6 Es
una transformaci´ on can´ onica a unas variables donde el sistema est´ a completamente en equilibrio; su trayectoria de fases se reduce a un punto.
366 / Mec´ anica cl´ asica avanzada buscada (9.264). La ecuaci´ on de Hamilton-Jacobi para la funci´ on principal de Hamilton. Tratemos de hallar la transformaci´ on can´onica libre univalente de primera clase que transforma las ecuaciones de Hamilton: q˙ν =
∂H ; ∂pν
p˙ν = −
∂H ; ∂qν
ν = 1, 2, ...l
(9.271)
ν = 1, 2, ...l
(9.272)
en las ecuaciones de Hamilton: ∂H ; q˙ ν = ∂pν
∂H ; p˙ ν = − ∂qν
donde H sea id´enticamente cero: H ≡0
(9.273)
Las ecuaciones (9.272) y (9.273) conducen a la soluci´on inmediata: q ν = βν ;
pν = αν ;
ν = 1, 2, ...l
(9.274)
donde αν y βν son 2l constantes arbitrarias. En virtud de (9.158), las f´ormulas de transformaci´ on estar´ an dadas por: ∂S(q, β, t) ∂S(q, β, t) = pν ; = −αν ; ν = 1, 2, ...l ∂qν ∂βν
(9.275)
En tanto que por (9.159) y (9.273) S necesariamente satisface: ∂S +H =0 ∂t
(9.276)
La ecuaci´ on (9.276) junto con (9.275) nos da la siguiente ecuaci´ on diferencial en derivadas parciales para S: ! ~ t) ~ t) ∂S(~q, β, ∂S(~ q, β, (9.277) + H ~q, ∂t ∂~q ~ t) La ecuaci´ on (9.277) se llama la ecuaci´ on de Hamilton-Jacobi.7 La soluci´on S(~q, β, de la ecuaci´ on de Hamilton-Jacobi con l constantes arbitrarias β1 , β2 , ...βl se llama la integral completa de la ecuaci´ on de Hamilton-Jacobi si se cumple la condici´on: det
∂2S 6= 0 ~ ∂~q ∂ β
(9.278)
La expresi´on (9.278) es equivalente a la (9.162) que es la condici´on necesaria para que las ecuaciones (9.275) puedan resolverse para expresar a ~q, p~, en la forma ~ t); ~ ~ t). Lo anterior constituye el teorema de Jacobi cuyo enunciado q = ~q(~ ~ α, β, p = p~(~ α, β, 7 Ya
optica. ´
en 1824 el mismo Hamilton hall´ o una ecuaci´ on diferencial de esta forma en conexi´ on con la
Las transformaciones can´onicas / 367 ~ t) es alguna integral completa de la ecuaci´ es el siguiente: “si S(~ α, β, on de HamiltonJacobi (9.277), entonces la soluci´on para las variables de estado ~q y p~ del sistema puede escribirse en la forma (9.275) para cualquier hamiltoniano H”.8 Seg´ un esto, en vez de integrar directamente las ecuaciones de movimiento (9.271), que nos dar´ an a ~q, p~, con 2l constantes de integraci´ on arbitrarias, el teorema de Jacobi nos permite hacerlo encontrando la integral completa de la ecuaci´ on de Hamilton-Jacobi. Una integral completa de la ecuaci´ on de Hamilton-Jacobi no es una soluci´on m´as general de esta ecuaci´ on. Pero en este contexto s´olo es importante saber que existe una soluci´on completa. Hasta aqu´ı no hemos impuesto ninguna restricci´on sobre las constantes αν , βν . Si las escogemos de tal manera que coincidan con los valores iniciales de pν y qν obtendremos una soluci´on completa que coincide con la acci´ on principal de Hamilton –es la funci´ on generatriz de la transformaci´ on inversa de (9.264)–. En este caso S coincide con el generador de la transformaci´ on can´onica de evoluci´ on hacia atr´ as en el tiempo, pero para otra elecci´on de las constantes αν , βν , la soluci´on completa S de la ecuaci´on de Hamilton-Jacobi no admite esta interpretaci´ on. En esto se basa el aporte de Jacobi, quien no s´olo rompi´o el c´ırculo vicioso que mencionamos antes sino que adem´as ~ t) mostr´o que cualquier soluci´on completa de la ecuaci´ on (9.277) permite escribir a ~q(~ α, β, ~ t) en la forma (9.275) donde las βν son las constantes de integraci´ y ~q(~ α, β, on de la ecuaci´on de Hamilton-Jacobi. Hay en efecto, un n´ umero infinito de integrales completas de la ecuaci´ on de Hamilton-Jacobi. Ejemplo 9.6.1 Formar la funci´ on principal de Hamilton para el movimiento de una part´ıcula en ca´ıda libre en presencia de la gravedad. En este caso (tomando t0 = 0): x = 0,
S=
y = 0,
Z t 0
1 z = z0 + z˙0 t − gt2 2
1 mz˙ 2 − mgz 2
dt
=
1 1 m z˙02 t − z˙0 gt2 + g 2 t3 2 3 1 2 1 3 −mg z0 t + z˙0 t − gt 2 6
(9.279)
(9.280)
teniendo en cuenta que E = 1/2 mz˙ 02 + mgz0 : 1 S = −Et + mz˙02 t − mz˙0 gt2 + mgt3 2 y como: z˙0 t= g
1−
s
2g 1 + 2 (z0 − z) z˙0
!
podemos escribir a S en la forma: 3/2 mz˙03 2g S = −Et − 1 + 2 (z0 − z) 3g z˙ 8 Este
(9.281)
(9.282)
(9.283)
enunciado constituye la contribuci´ on de Jacobi a este problema y fue publicado en el a˜ no 1837.
368 / Mec´ anica cl´ asica avanzada donde omitimos una constante. La expresi´on (9.283) tambi´en se puede escribir en t´erminos de E como: 3/2 m 2 S(z, E, t) = −Et − (E − mgz)3/2 (9.284) 3g m que coincide con la ecuaci´ on (4.190), que fue obtenida integrando la ecuaci´ on de HamiltonJacobi. Otras formas de la ecuaci´ on de Hamilton-Jacobi. Si queremos hallar una transformaci´ on can´ onica libre univalente de segunda, tercera o cuarta clase que haga a H id´enticamente igual a cero, podemos emplear un procedimiento an´alogo al que nos condujo a la ecuaci´ on (9.277) y tambi´en buscar una integral completa de la misma. Una forma equivalente de hallar esas transformaciones es por medio de las f´ormulas (9.217), (9.218) y (9.219). Adem´as son u ´tiles: F2 =
F1 +
l X
q ν pν
l X
q ν pν
ν=1
F4 =
F3 +
(9.285)
ν=1
La ecuaci´ on de Hamilton-Jacobi para las diferentes funciones generatrices de las transformaciones can´ onicas libres que hacen a H id´enticamente cero son: ! ~ t) ~ t) ∂F1 (~q, β, ∂F1 (~ q , β, + H ~q, ,t = 0 ∂t ∂~q ∂F2 (~q, α ~ , t) ∂F2 (~ q, α ~ , t) + H ~q, ,t = 0 ∂t ∂~q ~ t) ∂F3 (~ q , β, +H ∂t
~ t) ∂F3 (~ p, β, − , p~, t ∂~p
!
(9.286)
=0
∂F4 (~ q, α ~ , t) ∂F4 (~q, α ~ , t) +H − , p~, t = 0 ∂t ∂~p Vemos que F1 y F2 satisfacen la misma ecuaci´ on diferencial, lo cual es consistente con (9.285), esto es, F1 y F2 difieren por una constante aditiva. Similarmente F3 y F4 satisfacen la misma ecuaci´ on. F3 y F4 en la pr´actica son de poco inter´es en el m´etodo de Hamilton-Jacobi puesto que las qν entran en la energ´ıa potencial que es una funci´ on complicada y se hace por ello m´as dif´ıcil la separaci´on de variables. Es posible hallar la ecuaci´ on de Hamilton-Jacobi asociado a la transformaci´ on can´ onica (9.260), lo cual se deja como ejercicio. Ejemplo 9.6.2 El oscilador arm´ onico lineal. Resolver la ecuaci´ on de Hamilton-Jacobi y con ella hallar la soluci´on a las ecuaciones de movimiento.
Las transformaciones can´onicas / 369 El hamiltoniano es: H=
p2 kq 2 + 2m 2
La ecuaci´ on de Hamilton-Jacobi (9.277) es: 2 ∂S(q, β, t) kq 2 ∂S(q, β, t) + + =0 ∂t ∂q 2
(9.287)
(9.288)
Aqu´ı podemos buscar una soluci´on separando las variables q y t en la forma:9 S(q, β, t) = −ht + Σ(q, β)
(9.289)
donde h es la constante de Jacobi que en este caso coincide con la energ´ıa total E. Como el sistema tiene s´olo un grado de libertad hay s´olo una constante de integraci´ on, por tanto, podemos hacer h = E = β. Σ(q, E) ser´a soluci´on a la ecuaci´ on: 2 kq 2 1 d Σ(q, E) + =E (9.290) 2m dq 2 La ecuaci´ on (9.290) puede resolverse directamente: r √ Z q 2E Σ(q, E) = mk − q 2 dq k q0
(9.291)
No evaluaremos a (9.291) por cuanto el objetivo no es hallar a S sino, mediante las f´ormulas (9.275) encontrar a q y p en funci´ on del tiempo: Z qr √ 2E S(q, E, t) = Σ(q, E, t) = −Et + mk − q 2 dq (9.292) k q0 reemplazando a (9.292) en (9.275) obtenemos: r √ 2E ∂S p= = mk − q2 ∂q k Z q √ 2/k ∂S r = −t + mk −α = ∂E 2E q0 2 − q2 k
(9.293)
(9.294)
La ecuaci´ on (9.294) se puede integrar directamente, incorporando la constante que depende de q0 en α para obtener: ! √ q −1 (9.295) −α = −t + mk sen p 2E/k 9 En
la secci´ on 4.4 encontramos una segunda soluci´ on de esta ecuaci´ on en la cual las variables no est´ an separadas. Tal soluci´ on est´ a dada por la ecuaci´ on (4.143).
370 / Mec´ anica cl´ asica avanzada La ecuaci´ on (9.295) nos da a q en funci´ on del tiempo y reemplaz´andolo en (9.293) obtenemos a p en funci´ on del tiempo: r 2E sen ω(t − α) q(E, α, t) = k (9.296) √ p(E, α, t) = 2mE cos ω(t − α) Vemos que, como β y α son cantidades can´onicamente conjugadas, la energ´ıa E y el tiempo α son un par de cantidades can´onicamente conjugadas. E y α no coinciden con las condiciones iniciales, aunque est´ an relacionadas con ellas: r r √ 2E k q0 = − sen ωα ; p0 = 2mE cos ωα ; ω = (9.297) k m Ejemplo 9.6.3 Comparar a S con la acci´on para el oscilador arm´onico: Z
t
L dt = t0
E
Z
t
t0
Z
t t0
kq 2 p2 − 2m 2
dt =
[cos2 ω(t − α) − sen2 ω(t − α)] dt =
E E sen 2ω(t − α) − sen 2ω(t0 − α) 2ω 2ω Omitiendo la constante aditiva podemos escribir: Z t E 1 L dt → sen ω(t − α) cos ω(t − α) = mω 2 q 2 cot ω(t − α) ω 2 t0 Evaluando a S en (9.292): √ S = −Et + mk× # " r 2E q 2E 1 −1 2 q −q + sen p + constante 2 k k 2E/k
(9.298) (9.299)
(9.300)
(9.301)
reemplazando a (9.296) en (9.301) y omitiendo una constante aditiva: S = −Et +
1√ 2mEq cos ω(t − α) + E(t − α) 2
1 ⇒ S → mωq 2 cot ω(t − α) 2
(9.302)
Comparamos (9.300) y la parte final de (9.302) para encontrar el resultado que se espera: la soluci´on a la ecuaci´ on de Hamilton-Jacobi coincide con la integral de acci´on. La ecuaci´ on de Hamilton-Jacobi independiente del tiempo. Si el sistema es conservativo generalizado (puede ser escler´onomo, aunque no hay fuerzas disipativas
Las transformaciones can´onicas / 371 y H no depende del tiempo expl´ıcitamente) posee una constante de movimiento que es la constante de Jacobi h, que coincide con la energ´ıa total cuando adem´as el sistema es escler´ onomo –v´ease la ecuaci´ on (3.99)–. Entonces la ecuaci´ on de Hamilton-Jacobi (9.277) tiene la forma: ! ~ t) ~ t) ∂S(~ q , β, ∂S(~ q , β, =0 (9.303) +H ~ q, ∂t ∂~q Una soluci´on completa puede escribirse en la forma:10 S(~ q , β1 , β2 , ...βl−1 , h, t) = −ht + Σ(~q, β1 , β2 , ...βl−1 , h)
(9.304)
donde β1 , β2 , ...βl−1 son constantes con valores arbitrarios. Reemplazando a (9.304) en (9.303) y llamando β~l−1 a β1 , β2 , ...βl−1 obtenemos: ! ~l−1 , h) ∂Σ(~ q, β H ~ q, =h (9.305) ∂~q La integral completa de (9.305) satisface (9.278) es decir: 2 ∂ Σ det 6= 0 (βl = h) ~ ∂~q ∂ β
(9.306)
Conocida la soluci´on de la ecuaci´ on de Hamilton-Jacobi independiente del tiempo (9.305), la condici´on (9.306) permite obtener a qν y pν en funci´ on del tiempo (ν = 1, 2, ...l) a partir de las ecuaciones que corresponden a (9.275): ~l−1 , h ∂Σ ~ q, β = pν ; ν = 1, 2, ...l ∂qν (9.307) ~ ∂Σ ~ q , βl−1 , h = −αν ; ν = 1, 2, ...l − 1 ∂βν ∂Σ(~ q , β~l−1 , h) = t − αl ∂h
(9.308)
donde αν , βν , h, son constantes arbitrarias. Usando las segundas l − 1 ecuaciones (9.307) podemos expresar a l − 1 coordenadas en t´erminos de la restante l-´esima coordenada y de las 2l − 1 constantes arbitrarias ~l−1 , h, α1 , α2 , ...αl−1 , como en la ecuaci´ ´ β on (9.38). Estas son las ecuaciones de las trayectorias en el espacio de configuraci´on. La ecuaci´ on (9.308) conecta las coordenadas con la variable temporal t, y equivale a la ecuaci´ on (9.40). As´ı como la acci´on principal de Hamilton coincide con una de las integrales completas de la ecuaci´ on de Hamilton-Jacobi dependiente del tiempo, la acci´on de Lagrange 10 El
ejemplo 4.4.2, secci´ on 4.4, ilustra la propiedad general de la ecuaci´ on de Hamilton-Jacobi de poseer soluciones en las cuales las variables t y ~ q no est´ an separadas.
372 / Mec´ anica cl´ asica avanzada Σ coincide con una de las integrales completas de la ecuaci´ on de Hamilton-Jacobi independiente del tiempo (V´ease secci´ on 9.3). La conexi´on entre la acci´on principal de Hamilton S, y la acci´on reducida, Σ, est´ a dada por la ecuaci´ on (9.46). Si tomamos all´ı a t2 = t y a t1 arbitrario, y omitimos una constante aditiva, vemos que la ecuaci´ on (9.46) coincide con la ecuaci´ on (9.304). Como se se˜ nalaba en la secci´ on 9.3, la acci´on reducida Σ permite determinar las trayectorias en el espacio de configuraci´on, consistentemente con el principio de m´ınima acci´on. S es la funci´ on generatriz de la transformaci´ on can´onica que lleva a unas cantidades can´ onicas que son constantes. Σ es la funci´ on generatriz de cierta transformaci´ on can´ onica que no depende del tiempo, que no coincide con la transformaci´ on generada por S pero que tiene alguna relaci´on con ella, seg´ un veremos. Σ considerada como la funci´ on generatriz de una transformaci´ on can´ onica. Sea una transformaci´ on can´onica independiente del tiempo que al ser aplicada a un sistema conservativo generalizado (∂H/∂t = 0) nos lleva a unas nuevas variables can´onicas q ν , pν , donde todas las pν sean c´ıclicas. Por tanto todos los q ν ser´an constantes de movimiento. Llamemos βν a esas constantes. Esta transformaci´ on satisface: ∂F1 =0⇒H =H; ∂t ∂F1 = pν ; ∂qν
H = H(q) = constante = h
∂F1 = pν ; ∂qν
ν = 1, 2, ...l
(9.309)
(9.310)
F1 , seg´ un (9.309) y (9.310), debe ser soluci´on a la ecuaci´ on diferencial:
H
∂F1 (~ q , ~q) q, ~ ∂~q
!
=h
(9.311)
Si llamamos βl = h, (9.309) y (9.310) se pueden escribir como:
H
∂F1 (~ q , β~l−1 , h) q, ~ ∂~q
!
=h
(9.312)
~l−1 , h) ∂F1 (~ q, β = p~ ∂~q ~l−1 , h) ∂F1 (~ q, β = −~pl−1 ~l−1 ∂β ~l−1 , h) ∂F1 (~ q, β = −~ pl ∂h
(9.313)
Las transformaciones can´onicas / 373 Las ecuaciones de Hamilton y sus soluciones para las variables pν y qν son: ~ ~ ~q˙ = ∂H(q) = 0 ⇒ ~q = constante = β ∂~p ~ ~p˙ = − ∂H(q ) = − ∂βl ~ ~ ∂p ∂β ⇒ ~pl−1 = constante = α ~ l−1 ;
(9.314)
pl = −t + αl
Las ecuaciones (9.312) y (9.313) junto con las (9.314) quedan as´ı: ~l−1 , h) ∂F1 (~ q, β = pν ; ν = 1, 2, ...l ∂~qν ~l−1 , h) ∂F1 (~ q, β = −αν ; α = 1, 2, ...l − 1 ∂βν
(9.315)
~l−1 , h) ∂F1 (~ q, β = t − αl ∂h Comparando (9.312) con (9.305) y a (9.315) con (9.307), vemos que la funci´ on generatriz de la transformaci´ on buscada, F1 (q, q), coincide con la funci´ on Σ. Σ puede considerarse como la funci´ on generatriz de una transformaci´ on can´onica libre univalente de primera clase que al ser aplicada a un sistema conservativo generalizado nos conduce a unas variables can´onicas (q, p) donde todas las q ν son constantes, lo mismo que l − 1 pν . Una de las constantes q ν coincide con h y el l-´esimo pν es una on se aplica a un sistema funci´ on lineal del tiempo, pl = −t + αl . Si esta transformaci´ para el cual ∂H/∂t 6= 0, es claro que las nuevas variables can´onicas ya no tendr´an las caracter´ısticas se˜ naladas. ~ lo cual No es dr´astica la exigencia βl = h. Podr´ıamos haber dejado a h = H(β), nos conducir´ıa a que todos los q ν son constantes y todos los pν son funciones lineales del tiempo. Tratamiento cuando H(q, p) tiene coordenadas c´ıclicas. Si el sistema es conservativo generalizado y adem´as hay l − r coordenadas c´ıclicas, entonces H = H(q1 , q2 , ...qr , p1 , p2 , ...pl ). Los momentos pr+1 , pr+2 , ...pl , conjugados a las coordenadas c´ıclicas ser´an constantes de movimiento. La soluci´on completa de la ecuaci´ on de Hamilton-Jacobi puede escribirse como: S = −ht +
l X
βν qν + Σ0 (q1 , q2 , ...qr , β1 , β2 , ...βl , h)
(9.316)
ν=r+1
donde la funci´ on Σ0 es soluci´on a la ecuaci´ on diferencial: ∂Σ0 ∂Σ0 ∂Σ0 , , ... , βr+1 , βr+2 , ...βl = h H q1 , q2 , ...qr , ∂q1 ∂q2 ∂qr
(9.317)
en la cual hemos tomado los momentos constantes coincidiendo con l − r constantes βν .
374 / Mec´ anica cl´ asica avanzada
9.7.
Las transformaciones can´ onicas infinitesimales
Ecuaciones de transformaci´ on. Las transformaciones can´onicas infinitesimales (T.C.I.) son las transformaciones can´onicas en las que (p, q) difieren infinitesimalmente de (p, q): q ν = qν + δqν ;
pν = pν + δpν ;
ν = 1, 2, ...l
(9.318)
aqu´ı δ no denota desplazamientos virtuales sino simplemente los cambios infinitesimales en las coordenadas y momentos en la T.C.I. La T.C.I. (9.318) difiere infinitesimalmente de la transformaci´ on identidad. Si la transformaci´ on infinitesimal s´olo depende de un par´ ametro ε, podemos decir que la funci´ on generatriz de la T.C.I. ser´ıa igual a la funci´ on generatriz de la transformaci´ on identidad m´as un t´ermino del orden de ε. La transformaci´ on identidad es univalente libre de tercera y de segunda clase, seg´ un las ecuaciones (9.184) a (9.188). La funci´ on generatriz de la T.C.I. (9.318) ser´a pues: F2 (q, pν , t) =
l X
pν qν + ε G(q, p, t)
(9.319)
ν=1
Si la T.C.I. posee m par´ ametros infinitesimales, F2 ser´a: F2 =
l X
pν qν +
ν=1
m X
εj Gj
(9.320)
j=1
Es decir, las T.C.I. son las que se obtienen a partir de la identidad variando de manera continua uno o varios par´ ametros. Los Gj se llaman los generadores infinitesimales de la T.C.I., en t´erminos de los cuales se pueden expresar las f´ormulas (9.135). Una transformaci´ on can´onica del tipo F2 satisface: pν =
∂F2 ∂F2 ∂F2 ; qν = ; ν = 1, 2, ...l ; H − H = ∂qν ∂pν ∂t
(9.321)
Entonces para la T.C.I. con funci´ on generatriz (9.319) tenemos: δpν = −ε
∂G ∂G ; δqν = ε ; ν = 1, 2, ...l ∂qν ∂pν
(9.322)
∂G H =H +ε ∂t donde en (9.322) hemos notado que ε f (q, p, t) = εf (q, p, t) al primer orden en ε. La T.C.I. de evoluci´ on temporal. Sabemos que la evoluci´ on temporal puede considerarse como una transformaci´ on can´onica. Queremos hallar el generador de la T.C.I. de evoluci´ on temporal. La transformaci´ on es: qν (t); pν (t) → q ν (t) = qν (t + τ )pν (t) = pν (t + τ ) ; ν = 1, 2, ...l
(9.323)
Las transformaciones can´onicas / 375 donde tomamos a τ infinitesimal. De acuerdo con (9.269), la funci´ on generatriz de la transformaci´ on can´ onica de evoluci´ on temporal entre t0 y t es −S, Z t e.t. L dt (9.324) F1 = − t0
O sea que para la transformaci´ on (9.323) con τ infinitesimal, la funci´ on generatriz es: F1e.t.
=
=
− −
Z
l X
t+τ
L dt ≈ −Lτ = −
t
l X
ν=1
pν q˙ν − H
!
τ
pν q˙ν τ + Hτ
(9.325)
ν=1
Por otra parte, q˙ν = (q ν − qν )/τ → q˙ν τ = q ν − qν , o sea que: F1e.t. ≈ −
l X
(pν qν − pν q ν ) + Hτ
(9.326)
ν=1
De acuerdo con (9.217), (9.218), (9.187) y (9.188) vemos que: F1id. = F2id. +
l X
(pν qν + pν q ν ) =
l X
(−q ν pν + pν qν + pν q ν )
(9.327)
ν=1
ν=1
donde F2id. es la funci´ on generatriz de la T.C. identidad y F1e.t. se refiere a la evoluci´ on temporal. Comparando (9.326) y (9.327) obtenemos: F1e.t. = F2id. −
l X
pν q ν + Hτ
(9.328)
ν=1
Comparando (9.328) con (9.218) obtenemos: F1e.t. = F2id. + Hτ =
l X
pν qν + Hτ
(9.329)
ν=1
Si comparamos a (9.329) con (9.319) vemos que en este caso τ hace el papel del par´ ametro infinitesimal ε y H es el generador infinitesimal de la T.C.I. de evoluci´ on temporal. Al mismo resultado llegamos de la siguiente manera, notemos que: q ν = qν + τ q˙ν ⇒ δqν = τ q˙ν = dqν
(9.330)
pν = pν + τ p˙ν ⇒ δpν = τ p˙ ν = dpν ; H = H +
∂H τ ∂t
(9.331)
Comparando a (9.322) con (9.330) obtenemos: ε
∂G = τ q˙ν ; ∂pν
−ε
∂G = τ p˙ν ; ∂qν
ε
∂G ∂H =τ ∂t ∂t
(9.332)
376 / Mec´ anica cl´ asica avanzada De las ecuaciones de Hamilton obtenemos para (9.332): ε
∂G ∂H =τ ; ∂pν ∂pν
−ε
∂ (εG − τ H) = 0 ; ∂qν
∂G ∂H ∂ = −τ ⇒ (εG − τ H) = 0 ∂qν ∂qν ∂pν ν = 1, 2, ...l ;
(9.333)
∂ (εG − τ H) = 0 ∂t
Las ecuaciones (9.333) nos dicen que εG = τ H. En efecto, podemos tomar τ como ε y a H como el generador de la T.C.I. El movimiento finito del sistema puede considerarse como una sucesi´on de T.C.I. Si H es constante, el generador de la T.C.I. de evoluci´ on temporal es el mismo para cada una de las transformaciones en tal sucesi´on. Si H depende de t, H es G para la evoluci´ on de t a t + τ y H + (∂H/∂t)τ es G para la evoluci´ on de t + τ a t + 2τ , etc. En el l´ımite τ → 0, la evoluci´ on finita es el desarrollo continuo de una T.C. En este caso el generador de la T.C.I. es H. En general, el generador de cualquier T.C.I. es una variable din´ amica del sistema. La T.C.I. de translaci´ on espacial. Esta transformaci´ on involucra tres par´ ametros infinitesimales. Supongamos que el sistema es libre, de modo que las coordenadas cartesianas son a la vez coordenadas generalizadas independientes. La transformaci´ on es: xi = xi + εx ; y i = yi + εy ; z i = zi + εz ; i = 1, 2, ...N
(9.334)
Adem´as, como para este sistema p~i = mi~r˙ i , se tiene que: ~pi = p~i ; i = 1, 2, ...N
(9.335)
En este caso δxi = εx , δyi = εy , δzi = εz , δ~ pi = 0; i = 1, 2, ...N . Entonces las ecuaciones (9.322) toman la forma: ∂ ~ = ~ε ; (~ε · G) ∂~ pi
∂ ~ = 0; (~ε · G) ∂~ri
i = 1, 2, ...N
(9.336)
donde nos basamos en (9.320) con m = 3 y formamos los εj con el vector ~ε y con los Gj ~ De (9.336) se sigue que G ~ tiene la expresi´on: el vector G. ~ = G
n X
pi = P~ ~
(9.337)
i=1
Vemos que el momento total del sistema P~ es el generador infinitesimal de la transformaci´ on can´ onica de translaci´ on espacial. M´ as exactamente, en la translaci´ on por una cantidad ε a lo largo del vector unitario ~n, entonces ~ε = ε~n y el generador infinitesimal ~ = Pn . El generador infinitesimal de translaciones a lo largo de la direcci´ ser´a ~n · G on ~n es la componente del momento total en esa direcci´ on, Pn . El hecho de que se emplee (9.335) no implica que P~ o Pn sea constante en el tiempo. Veremos que P~ es constante s´olo si H no depende de la coordenada de posici´on del centro de masa.
Las transformaciones can´onicas / 377 y
ri
ε
r
θi
x
Figura 9.7 Rotaci´on de las part´ıculas alrededor del eje z
La T.C.I. de rotaci´ on espacial. Suponemos tambi´en qu´e sistema es libre. Por simplicidad consideremos una rotaci´on de todas las part´ıculas alrededor del eje z (v´ease figura 9.7). La transformaci´ on es: xi =
ri cos(θi + ε)
yi =
ri sen(θi + ε)
zi =
zi ; i = 1, 2, ...N
(9.338)
y similarmente para las componentes de P~i . Al primer orden en ε, las ecuaciones (9.338) y sus similares para p~i nos dan: xi = xi − εyi ; yi = yi + εxi ; z i = zi pxi = pxi − εpyi ; pyi = pyi + εpxi ; pzi = pzi ;
(9.339) i = 1, 2, ...N
Comparando (9.339) con (9.322) hallamos: −εyi = δxi = ε
∂G ∂G ; εxi = δyi = ε ; ∂pxi ∂pyi
−εpyi = δpxi = −ε εpxi = δpyi = −ε
0 = δzi = ε
∂G ∂pxi
∂G ∂pzi (9.340)
∂G ∂G ; 0 = δpzi = −ε ∂yi ∂zi
vemos que G no depende de zi ni de pzi . (9.340) se satisfacen si: G=
N X i=1
(xi pyi − yi pxi ) = Lz
(9.341)
378 / Mec´ anica cl´ asica avanzada O sea que Lz es el generador infinitesimal de una rotaci´on del sistema alrededor del eje z, donde Lz es la componente z del momento angular total del sistema. Vemos que: Lz =
N X i=1
(xi pyi − y i pxi ) =
N X (xi pyi − yi pxi ) + 0 (ε2 )
(9.342)
i=1
O sea que, como debe ser, Lz = Lz . Veremos que Lz ser´a constante en el tiempo s´olo si H no depende de la coordenada φ del vector de posici´on del centro de masa.
9.8.
Los corchetes de Poisson
En el numeral anterior vimos que los generadores infinitesimales H, Pn y Lz corresponden a cantidades con claro significado f´ısico. Aqu´ı consideraremos algunas propiedades de las funciones del estado del sistema que hemos definido como variables din´amicas (v´ease secci´ on 3.4). Las variables din´ amicas. Definimos una variable din´amica como una funci´ on del estado del sistema y del tiempo que no cambia su valor en una transformaci´ on can´onica. As´ı que bajo una transformaci´ on can´onica (q, p) → (q, p), f ser´a una variable din´amica si se cumple: f (q, p, t) = f [q(q, p, t), p(q, p, t)] = f (q, p, t)
(9.343)
De acuerdo con esta definici´on, como en una transformaci´ on can´onica: H(q, p, t) = H(q, p, t) +
∂F ∂t
(9.344)
se sigue que el hamiltoniano no es una variable din´amica cuando se consideran transformaciones can´ onicas que dependen del tiempo. As´ı por ejemplo, para un sistema conservativo H = E, igual a la energ´ıa total, en tanto que por medio de una transformaci´ on can´ onica dependiente del tiempo podemos hacer H = 0. Tenemos en general que el ~ o p~. As´ı tambi´en, la energ´ıa generador de una T.C.I. es una variable din´amica, como L cin´etica es una variable din´amica. En esta definici´on de variables din´amicas est´ a impl´ıcita la idea de las transformaciones can´onicas desde un punto de vista pasivo. Formas “activa” y “pasiva” de una transformaci´ on can´ onica. En la secci´ on 7.7 vimos que las rotaciones de un cuerpo r´ıgido admiten las interpretaciones “activa” y “pasiva”. An´alogamente esas consideraciones se pueden hacer a las transformaciones en el espacio de fases. En la interpretaci´ on “pasiva”, una transformaci´ on can´onica es una regla de correspondencia que asocia a cada punto del espacio de fases (q, p) un punto del espacio de fases (q, p), tal que las ecuaciones de movimiento toman la misma forma en los dos espacios. Es una aplicaci´on de un espacio en otro espacio. Una variable din´amica es una funci´ on del estado del sistema, considerado como algo intr´ınseco o sea independiente del espacio de fases que se use para describirlo. As´ı, si el estado del sistema en un tiempo
Las transformaciones can´onicas / 379 dado se describe por el punto A(q, p) en un espacio de fases y por el punto A(q, p) en otro espacio de fases, una variable din´amica tiene el mismo valor en A que en A. Por otra parte, hay transformaciones can´onicas que admiten una interpretaci´ on activa. Son aquellas transformaciones can´onicas del espacio de fases en s´ı mismo; o sea aquellas en que se tiene una aplicaci´on del espacio de fases sobre s´ı mismo. As´ı, la transformaci´ on can´ onica de evoluci´ on temporal asocia al estado del sistema en el tiempo t0 , (q0 , p0 ) el estado en el tiempo t, (q, p); la transformaci´ on can´onica de translaci´ on espacial asocia a la posici´on del sistema (~r1 , ~r2 , ...~rN ) una posici´on en la cual todas las part´ıculas se han desplazado una distancia ~ ε: (~r1 + ~ε, ~r2 + ~ε, ...~rN + ~ε); la transformaci´ on can´onica de rotaci´on espacial es la misma estudiada en el cap´ıtulo 7. Son susceptibles de una interpretaci´ on “activa” todas aquellas transformaciones can´onicas que se pueden obtener a partir de la transformaci´ on identidad por medio de la variaci´on continua de uno o varios par´ ametros. As´ı por ejemplo, la inversi´ on de las coordenadas, o la transformaci´ on can´onica que intercambia coordenadas y momentos, no son susceptibles de una interpretaci´on activa. Tampoco mediante una variaci´on continua de par´ ametros podemos llegar de las coordenadas cartesianas a las coordenadas esf´ericas, por ejemplo. Toda T.C.I. es pues susceptible de ser tratada en las formas pasiva (el sistema descrito desde diferentes espacios de fases) o activa (el sistema es cambiado de un estado a otro). En (9.318) es entonces v´alido tomar desplazamientos del tipo ∆. Cambio de una variable din´ amica en una T.C.I. En la interpretaci´ on “pasiva” no tiene sentido preguntarse por el “cambio de una variable din´amica f bajo una transformaci´ on can´ onica”, pues de acuerdo con (9.343) no hay tal cambio. En la interpretaci´ on “activa”, si tiene sentido preguntarse c´ omo cambia el valor de f al pasar el sistema de un estado A(q, p) a un estado B(q, p). Usaremos el s´ımbolo ∂ para denotar tal cambio: ∂f (q, p, t) = f (q, p, t) − f (q, p, t)
(9.345)
Para ser m´as precisos, en la interpretaci´ on “pasiva” podemos preguntarnos por el cambio en la forma funcional de la variable din´amica al ser descrita desde dos espacios de fases diferentes, lo cual es mucho m´as dif´ıcil de visualizar. Este cambio de forma funcional est´ a definido por: f (q, p, t) − f (q, p, t)
(9.346)
de acuerdo con la notaci´ on (9.343). Usando (9.343) podemos escribir a (9.346) como: f (q, p, t) − f (q, p, t) = −∂f
(9.347)
comparando (9.345) y (9.347) vemos que: ∂f = −∂f
(9.348)
Los dos cambios (9.345) y (9.346) son iguales, o sea que ∂f puede significar el cambio del valor de f al pasar el sistema del estado (q, p, t) al estado (q, p, t) o el cambio funcional de la funci´ on f en el mismo estado, en la interpretaci´ on “pasiva”. La T.C.I. es
380 / Mec´ anica cl´ asica avanzada (9.318) y expresada en t´erminos de generadores es (9.322). Con la interpretaci´ on “activa” ∂f es: ∂f
= =
=
f (q + δq, p + δp, t) − f (q, p, t) l X ∂f (q, p, t) ∂f (q, p, t) δqν + δpν ∂qν ∂pν ν=1 l m X X ∂f (q, p, t) ∂Gj (q, p, t) ∂f (q, p, t) ∂Gj (q, p, t) εj − εj ∂qν ∂pν ∂pν ∂qν j=1 ν=1 =
m X
εj [f (q, p, t), Gj (q, p, t)]
(9.349)
j=1
donde hemos definido el corchete de Poisson de dos variables din´amicas g(q, p, t) y h(q, p, t) como: l X ∂g ∂h ∂g ∂h − [g, h] = ∂qν ∂pν ∂pν ∂qν ν=1
(9.350)
Vemos que el corchete de Poisson de dos variables din´amicas a su vez es una variable din´ amica. En s´ıntesis: f (q, p, t) − f (q, p, t) = f (q, p, t) − f (q, p, t) m X εj Gj (q, p, t) = f (q, p, t),
(9.351)
j=1
Si la T.C.I. es la evoluci´ on temporal, tenemos que ε = τ y G = H. En este caso: l
∂f X f˙ = + ∂t ν=1 l
=
∂f X + ∂t ν=1
∂f ∂f q˙ν + p˙ ν ∂qν ∂pν
∂f ∂H ∂f ∂H − ∂qν ∂pν ∂pν ∂qν
(9.352)
∂f + [f, H] ⇒ f˙ = ∂t Si la variable din´amica f no depende expl´ıcitamente del tiempo, su rata de cambio es igual a su corchete de Poisson con H. Si f es una constante de movimiento, el corchete de Poisson de f con H es igual al negativo de su derivada parcial respecto al tiempo; si f no depende expl´ıcitamente del tiempo ser´a una constante de movimiento si su corchete de Poisson con H es cero. Simetr´ıa y leyes de conservaci´ on. Sabemos que la simetr´ıa din´amica de un sistema se expresa mediante las simetr´ıas de las funciones L o H.
Las transformaciones can´onicas / 381 Sea una T.C.I. y sea G el generador de la misma; G es una variable din´amica. Entonces es correcto expresar el siguiente teorema: G es una constante de movimiento si H es invariante bajo la transformaci´ on generada por G. Recordemos que H no es en general una variable din´amica. Por esta raz´ on al realizar la T.C.I. generada por G el cambio en H no est´ a dado por (9.349). H es simplemente una funci´ on que en un espacio de fases dado define las ecuaciones can´onicas de movimiento. Por esta raz´ on, cuando la transformaci´ on can´onica depende del tiempo, no se cumple on que H(q, p, t) = H(q, p, t). Denotemos por ∂H a la siguiente diferencia. Ver ecuaci´ (9.346): ∂H = H(q, p, t) − H(q, p, t)
(9.353)
H(q, p, t) y H(q, p, t), de acuerdo con (9.344) y (9.319) est´ an relacionadas por: H(q, p, t) − H(q, p, t) = ε
∂G ∂t
(9.354)
reemplazando a (9.354) en (9.353) tenemos: ∂H = H(q, p, t) − H(q, p, t) + ε
∂G ∂t
(9.355)
Ahora s´ı podemos usar la ecuaci´ on (9.351) para H: H(q, p, t) − H(q, p, t) = ε [H(q, p, t), G(q, p, t)]
(9.356)
La diferencia entre H y H es del orden de ε, luego, al primer orden en ε (9.356) toma la forma: H(q, p, t) − H(q, p, t) = ε [H(q, p, t), G(q, p, t)] Ahora, reemplazamos a (9.357) en (9.355) para obtener: ∂G ∂G ∂H = −ε [H, G] + ε =ε + [G, H] ∂t ∂t
(9.357)
(9.358)
De (9.352) vemos entonces que: ∂H = ε G˙
(9.359)
La ecuaci´ on (9.359) nos permite inmediatamente obtener el enunciado del teorema: G es una constante de movimiento si y s´ olo si es el generador de una transformaci´ on can´ onica infinitesimal que no cambia la forma funcional del hamiltoniano. As´ı pues, si H no cambia al desplazar el sistema a lo largo de una direcci´ on ~n, P~ .~n es una constante de movimiento y si H no cambia al rotar el sistema alrededor del eje ~ n es una constante de movimiento. P~ es el momento lineal total y L ~ es el ~n entonces L.~ momento angular. Este resultado ya lo hab´ıamos obtenido en unos casos particulares en la secci´ on 3.4. Como seg´ un este teorema las constantes de movimiento han de ser los generadores de T.C.I. que dejan invariante a H, se sigue que hallando todas las transformaciones de simetr´ıa de H podemos encontrar todas las constantes de movimiento.
382 / Mec´ anica cl´ asica avanzada Por otra parte si se conocen 2l constantes de movimiento del sistema se tendr´a resuelto el problema mec´anico, si esas 2l constantes son independientes. En efecto, el m´etodo de Hamilton-Jacobi permite mediante una transformaci´ on can´onica expresar las coordenadas y momentos del sistema en t´erminos de las constantes de movimiento y del tiempo. En el cap´ıtulo 11 se muestra que el resultado falla si el sistema es no integrable. La conservaci´ on del momento que vimos en el cap´ıtulo 3 se sigue de este teorema. Si qν0 es c´ıclica, H no depende de ella y por tanto es invariante en una T.C.I. que implique on habr´ a de ser una el cambio de qν0 , y el generador infinitesimal de esta transformaci´ constante de movimiento. Las ecuaciones de tal transformaci´ on can´onica ser´an: δqν = ε δνν0 ;
δpν = 0 ;
ν = 1, 2, ...l
(9.360)
por otra parte se tiene que: δqν = ε
∂G ; ∂pν
δpν = −ε
∂G ; ∂qν
ν = 1, 2, ...l
(9.361)
Se sigue de (9.360) y (9.361) que: (9.362)
G = pν0
O sea que el generador es precisamente el momento can´onico conjugado de la coordenada c´ıclica qν0 . En general, un cambio en cualquier variable can´onica del sistema, qν o pν , es generado por su variable can´onicamente conjugada, pν o −qν , respectivamente. Las ecuaciones de movimiento en t´ erminos de los corchetes de Poisson. Si en la ecuaci´ on (9.352) reemplazamos a f por qν y por pν obtenemos: q˙ν = [qν , H] ;
p˙ ν = [qν , H] ;
ν = 1, 2, ...l
(9.363)
o tambi´en, usando las ecuaciones de Hamilton: ∂H ∂H = [qν , H] ; = −[pν , H] ; ν = 1, 2, ...l ∂pν ∂pν
(9.364)
Las expresiones (9.363) son las ecuaciones de movimiento de Poisson, totalmente equivalentes a las ecuaciones de movimiento de Hamilton. Las ecuaciones (9.364) no son m´as que el resultado de aplicar el p´ arrafo que sigue a la ecuaci´ on (9.362), conjuntamente con (9.351). Ejemplo 9.8.1 Hallar las ecuaciones de movimiento de Poisson para una part´ıcula cargada en presencia de un campo electromagn´etico externo. Usamos la ecuaci´ on (3.117) para h conjuntamente con la ecuaci´ on (4.1) para ~r˙ en funci´ on del momento can´onico p~: H=
e ~ 2 1 p~ − A + eφ 2m c
(9.365)
Las transformaciones can´onicas / 383 ~ y φ son los potenciales vectorial y escalar del campo externo. Evaluemos los donde A corchetes de Poisson de ~r con H y de p~ con H para mostrar la consistencia con las f´ormulas (9.363): ∂rn ∂H ∂rn ∂H · − · ∂~r ∂~ p ∂~p ∂~r e~ p~ − A ∂H c ; ~n = ~i, ~j, ~k = ~n · = ~n · ∂~ p m
[rn , H] =
(9.366)
Por otra parte: [pn , H] = =
∂pn ∂H ∂pn ∂H ∂H ∂H · − · = −~n · =− ∂~r ∂~ p ∂~p ∂~r ∂~r ∂rn ~ e ~ ∂A ∂φ e p~ − A · −e mc c ∂rn ∂rn
(9.367)
La ecuaci´ on (9.367) tambi´en puede escribirse as´ı: [pn , H] =
~ ∂φ e ∂ ˙ ~ ∂An e ˙ ∂A + −e = (~r · A) − A˙ n + ~r · c ∂rn ∂rn c ∂rn ∂t e ˙ e ∂An ∂φ An − −e c c ∂t ∂rn
(9.368)
~ y E se pueden expresar en t´erminos de A ~ y φ as´ı: Notamos que B ~ ~ = − ∂φ − 1 ∂ A ; E ∂~r c ∂t
~ = ∂ ×A ~ B ∂~r
(9.369)
Notemos que: ∂ ∂Aµ ~ ~r˙ × ×A = ǫnms ǫstµ r˙m ∂~r ∂rt n = (δnt δmµ − δnµ δmt ) r˙m
∂Aµ ∂rt
(9.370)
~ ∂A ∂Aµ = ~r˙ · − ~r˙ · ∂rn ∂~r y, ∂An ˙ ∂An A˙ n = + ~r · ∂t ∂~r
(9.371)
con lo cual: ~ ∂ ~ + ∂An − A˙ n ~ = ~r˙ · ∂ A + ∂An − A˙ n = ∂ (~r˙ · A) ×A ~r˙ × ∂~r ∂rn ∂t ∂rn ∂t
(9.372)
384 / Mec´ anica cl´ asica avanzada remplazando (9.372) en (9.369) obtenemos: e ˙ 1 ∂An ∂ ∂φ e ˙ ~ [pn , H] = + ~r × ×A + An − e c ∂~r c ∂rn c ∂t n e ˙ ~ e = (~r × B)n + eEn A˙ n + A˙ n c c pero, seg´ un la expresi´on para la fuerza de Lorentz: e ~ n + eEn m¨ rn = (~r˙ × B) c Usando (9.374), (9.373) queda como: e e d [pn , H] = m¨ rn + A˙ n = mr˙n + An = p˙ n c dt c en concordancia con (9.363). Tambi´en de (9.366) se sigue que: [rn , H] = r˙n
de donde:
(9.374)
(9.375)
(9.376)
El corchete de Poisson de dos componentes del momento cinem´ atico es: ∂pci ∂pcj ∂pci ∂pcj · − · [pci , pcj ] = ∂~r ∂~p ∂~p ∂~r ~ pero p~c = p~ − (e/c) A, por tanto: e ∂Aj e ∂Ai · ~nj − ~ni · [pci , pcj ] = − c ∂~r c ∂~r =
(9.373)
e c
∂Aj ∂Ai − ∂ri ∂rj
e = ǫijk c
∂ ~ ×A ∂~r k
e [pci , pcj ] = ǫijk Bk c Esto u ´ltimo tambi´en puede escribirse como: e [r˙i , r˙j ] = 2 ǫijk Bk m c O sea que el corchete de Poisson de x˙ con y˙ es cero s´olo si Bz se anula.
(9.377)
(9.378)
(9.379)
(9.380)
Algunas propiedades de los corchetes de Poisson. Para cualesquiera tres funciones f (q, p, t), g(q, p, t) y h(q, p, t), se cumple: (i) [f, g] = −[g, f ] (ii) [cf, g] = [f, cg] = c[f, g] ; c : constante (iii) [f + g, h] = [f, h] + [g, h] (iv) [f g, h] = f [g, f ] + g[f, h] (v)
∂g ∂f ∂ [f, h] = , g + f, ∂t ∂t ∂t
(9.381)
Las transformaciones can´onicas / 385 Estas propiedades se siguen directamente de la definici´on de los corchetes de Poisson, ecuaci´ on (9.350). La identidad de Jacobi. Para cualesquiera tres funciones f , g y h se cumple: [f, [g, h]] + [g, [h, f ]] + [h, [f, g]] = 0
(9.382)
esta relaci´ on se llama la identidad de Jacobi. Para demostrarla es u ´til la siguiente interpretaci´ on del corchete de Poisson: l X ∂g ∂ ∂g ∂ ˆg φ [g, φ] = − φ=D (9.383) ∂qν ∂pν ∂pν ∂qν ν=1 ˆ g es un operador diferencial lineal en el espacio de fases. donde D Con esta notaci´ on podemos escribir el siguiente conmutador: ˆ g f = [g, [h, f ]] − [h, [g, f ]] ˆh − D ˆ hD ˆ gD D =
(9.384)
[g, [h, f ]] + [h, [f, g]]
La expresi´on (9.384) s´olo contiene derivadas primeras respecto a pν y qν de la funci´ on f . En efecto: ˆg = D
2l X i=1
gi
∂ ; xν = qν ; xν+l = pν ; ν = 1, 2, ...l ∂xi
(9.385)
por tanto, tenemos que: ˆg f ˆh − D ˆ hD ˆ gD D 2l 2l X X ∂ ∂ ∂ ∂ = gi hj − hi gj f ∂xi ∂xj ∂xi ∂xj i=1 j=1 " 2l X 2l X ∂2 ∂hj ∂ ∂2 g i hj = + gi − hi g j ∂xi ∂xj ∂xi ∂xj ∂xi ∂xj i=1 j=1
# ∂gj ∂ f − hi ∂xi ∂xj
=
2l X 2l X ∂hj ∂gj ∂f gi − hi ∂xi ∂xi ∂xj i=1 j=1
(9.386)
Por otra parte tenemos que: [f, [g, h]] =
ˆ h g, f ] = [[h, g], f ] = [D
2l X i=1
=
∂g ,f hi ∂xi
2l X l X ∂ ∂g ∂g ∂ ∂f ∂f hi hi − ∂qν ∂xi ∂pν ∂pν ∂xi ∂qν i=1 ν=1
(9.387)
386 / Mec´ anica cl´ asica avanzada La ecuaci´ on (9.386) se puede escribir como:
ˆg ˆh − D ˆ hD ˆ gD D
" 2l X l X ∂hν ∂gν ∂f gi f= − hi ∂xi ∂xi ∂qν i=1 ν=1 # ∂hl+ν ∂gl+ν ∂f + gi − hi ∂xi ∂xi ∂pν
(9.388)
Sumando (9.387) y (9.388) obtenemos:
[f, [g, h]] + [g, [h, f ]] + [h, [f, g]] = 2l X l X ∂g ∂gν ∂ ∂f ∂hν hi − hi − gi ∂x ∂x ∂p ∂x ∂q i i ν i ν i=1 ν=1 +
(9.389)
2l X l X ∂g ∂gl+ν ∂ ∂f ∂hl+ν hi − hi + gi ∂xi ∂xi ∂qν ∂xi ∂pν i=1 ν=1
De (9.383) y (9.385) se sigue que:
gν = −
∂g ; ∂pν
gl+ν =
∂g ; ∂qν
ν = 1, 2, ...l
(9.390)
Por tanto:
∂gν ∂ ∂hν − hµ − gµ ∂qµ ∂qµ ∂pν =
∂g hµ ∂qµ
∂h ∂ 2 g ∂g ∂ 2 h − ∂pµ ∂qµ ∂pν ∂pµ ∂qµ ∂pν (9.391)
∂ 2 h ∂g ∂h ∂ 2 g + + ∂pν ∂pµ ∂qµ ∂pµ ∂pν ∂qµ =
∂g ∂ 2 h ∂g ∂ 2 h + ∂pµ ∂qµ ∂pν ∂qµ ∂pµ ∂qν
Las transformaciones can´onicas / 387 Similarmente hallamos que: gl+µ
∂gν ∂ ∂hν − hl+µ − ∂qµ ∂pµ ∂pν −
∂g hl+µ = ∂pµ
∂g ∂ 2 h ∂g ∂ 2 h − ∂qµ ∂pµ ∂pν ∂pµ ∂pν ∂qµ
∂hl+ν ∂gl+ν ∂ gµ − hµ + ∂qµ ∂qµ ∂qν
∂g hµ = ∂qµ
(9.392)
∂g ∂ 2 h ∂g ∂ 2 h − − ∂pµ ∂qµ ∂qν ∂qµ ∂qν ∂pµ ∂hl+ν ∂gl+ν ∂ gl+µ − hl+µ + ∂pµ ∂pµ ∂qν
∂g hl+µ = ∂pµ
∂g ∂ 2 h ∂g ∂ 2 h + ∂qµ ∂pµ ∂qν ∂pµ ∂qν ∂qµ Reemplazando (9.391)y (9.392) en (9.389) obtenemos: [f, [g, h]] + [g, [h, f ]] + [h, [f, g]] = l X
µ,ν=1
∂g ∂ 2 h ∂g ∂ 2 h + ∂pν ∂qµ ∂pν ∂qµ ∂pµ ∂pν ∂g ∂ 2 h ∂g ∂ 2 h − − ∂qµ ∂pµ ∂pν ∂pµ ∂pµ ∂qν
+
l X
µ,ν=1
−
∂g ∂ 2 h ∂g ∂ 2 h − ∂pµ ∂qµ ∂qν ∂qµ ∂qν ∂pµ ∂g ∂ 2 h ∂g ∂ 2 h + + ∂qµ ∂pµ ∂qν ∂pν ∂qν ∂qµ
!
!
∂f ∂qν
(9.393)
∂f ∂pν
La ecuaci´ on (9.393) es id´enticamente cero, lo cual prueba la identidad de Jacobi. Invariancia de los corchetes de Poisson bajo T.C.I. Se trata de mostrar que: [f (q, p, t), g(q, p, t)] = [f (q, p, t), g(q, p, t)]
(9.394)
De la definici´on (9.343) se sigue que: l X ∂f ∂qµ ∂f ∂f ∂pµ ∂f = = + ∂q ∂q ν ∂qµ ∂qν ∂pµ ∂q ν µ=1
(9.395)
388 / Mec´ anica cl´ asica avanzada De (9.318) y (9.322) se sigue:
∂qµ ∂2G ; = δµν − ǫ ∂q ν ∂qν ∂pµ
∂pµ ∂2G =ǫ ∂q ν ∂qν ∂qµ
(9.396)
Por tanto, se cumple: ∂f ∂f ∂ ∂f ∂f ∂G +ǫ ,f = +ǫ [G, f ] − ǫ G, = ∂qν ∂qν ∂qν ∂qν ∂qν ∂qν
(9.397)
donde la u ´ltima igualdad se sigue de (9.381-v). De (9.318) y (9.322) se sigue:
∂2G ∂pµ ; = δµν + ǫ ∂pν ∂pν ∂qµ
∂qµ ∂2G = −ǫ ∂pν ∂pν ∂pµ
(9.398)
y an´alogamente se llega a: ∂f ∂ ∂f ∂f +ǫ [G, f ] − ǫ G, = ∂pν ∂pν ∂pν ∂pν
(9.399)
Reemplazando (9.397) y (9.399) y expresiones an´alogas para g, en (9.394):
f, g
(q,p)
=
" l X ∂[G, f ] ∂f ∂f +ǫ − ǫ G, · ∂qν ∂pν ∂qν ν=1
∂[G, g] ∂g ∂g + +ǫ − ǫ G, ∂pν ∂pν ∂pν
∂[G, f ] ∂f ∂f · +ǫ − ǫ G, ∂pν ∂pν ∂pν # ∂[G, g] ∂g ∂g +ǫ − ǫ G, ∂qν ∂qν ∂qν
(9.400)
Las transformaciones can´onicas / 389 Al primer orden en ε podemos escribir:
f, g
(q,p)
l X ∂[G, f ] ∂g = [f, g](q,p) + ε ∂qν ∂pν ν=1
∂f − G, ∂qν
∂f ∂[G, g] ∂g + ∂pν ∂qν ∂pν
∂g ∂[G, g] ∂f ∂g ∂f ∂f G, − + G, − ∂qν ∂pν ∂qν ∂pν ∂qν ∂pν −
∂f ∂g ∂g ∂[G, f ] G, + ∂qν ∂pν ∂qν ∂pν
(9.401)
=
[f, g](q,p) + ǫ ([[G, f ], g] + [f, [G, g]]) +ǫ
l X ∂g ∂f ∂g ∂f ,G − ,G ∂pν ∂qν ∂qν ∂pν ν=1
En la u ´ltima igualdad se ha hecho uso de la propiedad (9.381-iv). Ahora los u ´ ltimos t´erminos en (9.401) dan [[f, g], G], con lo cual el t´ermino del orden de ε es cero con base en la identidad de Jacobi, por tanto: [f , g](q,p) = [f, g]q,p
(9.402)
Llegamos a la conclusi´ on de que el corchete de Poisson de dos variables din´amicas es una variable din´ amica que es invariante bajo transformaciones can´onicas infinitesimales. En otras palabras, el corchete de Poisson de dos variables din´amicas es una variable din´amica con un valor independiente de las variables usadas para describir el estado del sistema: los corchetes de Poisson son invariantes can´ onicos. Veremos que esta invariancia se cumple aun bajo transformaciones can´onicas que no se pueden obtener de manera continua a partir de la transformaci´ on identidad, o sea como sucesi´on de T.C.I. El teorema de Jacobi-Poisson. Si f y g son dos constantes de movimiento, entonces [f, g] tambi´en es una constante de movimiento.11 De (9.352) se sigue que si f y g son constantes de movimiento se cumple: ∂g ∂f + [f, H] = 0 y + [g, H] = 0 ∂t ∂t
(9.403)
Debemos probar que esto implica que: ∂[f, g] + [[f, g], H] = 0 ∂t 11 Este
teorema fue enunciado por Poisson en 1809.
(9.404)
390 / Mec´ anica cl´ asica avanzada En efecto:
∂ ∂g ∂f = − [[f, H] , g] − [f, [g, h]] [f, g] = , g + f, ∂t ∂t ∂t
(9.405)
[[H, f ] , g] + [g, [H, f ]] = − [[f, g] , H] La u ´ltima igualdad en (9.405) se sigue de la identidad de Jacobi, lo cual demuestra el teorema. El corchete de Poisson de dos variables din´amicas que se conservan es una variable din´ amica que se conserva. Esto permite, por ejemplo, construir a partir de un conjunto de s constantes de movimiento independientes C1 , C2 , ...Cs (s < 2l) las 2l − s constantes independientes restantes Cs+1 , Cs+2 , ...C2l por formar los corchetes de Poisson entre todos los posibles pares de estas S variables din´amicas. En total hay s(s − 1)/2 corchetes de Poisson, de los cuales algunos pueden ser cero o funciones de constantes de movimiento conocidas antes, pero es de esperarse que haya 2l − s que sean independientes. Es claro que puede haber un n´ umero m´ınimo s de constantes de movimiento independiente tal que a partir de ellas se pueda obtener el conjunto completo de 2l constantes de movimiento independientes. Ejemplo 9.8.2 Sea una part´ıcula en una dimensi´ on, sometida a una fuerza constante. Hallar dos constantes de movimiento independientes y mostrar que el corchete de Poisson de ellas no da lugar a una tercera constante de movimiento. La soluci´on al problema es: 1 x = v(t + t0 ) + g(t + t0 )2 ; p = mv + mg(t + t0 ) 2
(9.406)
donde t0 y v son constantes. Dos constantes de movimiento son t0 y la energ´ıa total E. x puede escribirse en la forma: x=
1 p (t + t0 ) − g(t + t0 )2 m 2
Entonces las expresiones para t0 y E en funci´ on de p y x son: s 2x p p2 p2 − t0 = −t + − ; E = − mgx mg m2 g 2 g 2m
(9.407)
(9.408)
El corchete de Poisson de t0 y E es: [t0 (p, x, t), E(p, x, t)] =
∂t0 ∂E ∂t0 ∂E − ∂x ∂p ∂p ∂x
(9.409)
Haciendo el c´ alculo indicado en (9.408), usando (9.409), obtenemos: [t0 , E] = 1
(9.410)
La ecuaci´ on (9.408) puede interpretarse como una transformaci´ on can´onica que permite expresar las nuevas variables can´onicas t0 y E en funci´ on de las viejas x y p. Tal transformaci´ on depende del tiempo. Esto ilustra un resultado m´as general: [qν , pν ] = [q ν , q ν ] = 1, para todo ν, que veremos m´as adelante.
Las transformaciones can´onicas / 391 Ejemplo 9.8.3 Sea una part´ıcula para la cual lz y py son constantes de movimiento. Hallar una tercera constante de movimiento. Por el teorema de Poisson, [lz , py ] es constante. [lz , py ] = [xpy , py ] − [ypx , py ]
(9.411)
= x[py , py ] + py [x, py ] − y[px , py ] − px [y, py ] Es f´ acil, de la definici´on, verificar que: [x, py ] = 0 ; [px , py ] = 0 ; [y, py ] = 1 son.
(9.412)
Por tanto, [lz , py ] = −px . O sea que px es constante de movimiento si lz y py lo
Ejemplo 9.8.4 Demostrar que si dos componentes del momento angular son constantes de movimiento, la tercera tambi´en lo es. Si li y lj son dos componentes de ~l constantes, por el teorema de Poisson [li , lj ] tambi´en es una constante. Recordando que: li = ǫikl xk pl
(9.413)
Vemos que: [li , lj ] = ǫikl ǫjmn [xk pl , xm pn ]
(9.414)
Usando la propiedad (9.381-iv) vemos que: [xk pl , xm pn ] =
xk [pl , xm pn ] + pl [xk , xm pn ]
=
−xk [xm pm , pl ] − pl [xm pn , xk ]
=
−xk (xm [pn , pl ] + pn [xm , pl ])
(9.415)
−pl (xm [pn , xk ] + pn [xm , xk ]) Es f´ acil ver que: [pn , pl ] = 0 ; [xm , pl ] = δml ; [xm , xk ] = 0
(9.416)
con lo cual (9.415) queda: [xk pl , xm pn ] = −xk pn δml + pl xm δnk
(9.417)
reemplazando (9.417) en (9.414) obtenemos: [li , lj ] = −ǫikl ǫjln xk pn + ǫikl ǫjnk pl xn
(9.418)
Usando la propiedad: ǫikl ǫjnl = δij δkn − δin δjk
(9.419)
392 / Mec´ anica cl´ asica avanzada obtenemos: [li , lj ] = (δij δkn − δin δkj )xk pn − (δij δkn − δin δkj )pk xn
(9.420)
Finalmente encontramos que: [li , lj ] = δij ~r · ~p − rj pi − δij ~r · ~p + pj ri = ri pj − pi rj
(9.421)
no es otra cosa que: [li , lj ] = ǫijk lk
(9.422)
As´ı, vemos que [lx , ly ] = xpy − ypx = lz , o sea que si lx y ly son constantes de movimiento, lz tambi´en lo es. Los corchetes de Poisson fundamentales. Son los corchetes de Poisson para las coordenadas y los momentos del sistema. Se sigue de la definici´on de corchete de Poisson que: [qν , qµ ] = 0 ; [pν , pµ ] = 0 ; [qν , pµ ] = δµν ; µ, ν = 1, 2, ...l
(9.423)
De acuerdo con la invariancia de los corchetes de Poisson bajo transformaciones can´ onicas se tiene que las relaciones (9.423) se cumplen independientemente de las variables can´ onicas usadas para describir el estado del sistema; veremos que esta propiedad proporciona un criterio para saber si una transformaci´ on en el espacio de fases es o no can´ onica. Algunos corchetes de Poisson de inter´ es. En principio el corchete de Poisson de un par de variables din´amicas se obtiene a partir de los corchetes de Poisson fundamentales. Algunos corchetes de Poisson que se calculan directamente son: [qν , f ] =
∂f ; ∂pν
[pν , f ] = −
∂f ; ∂qν
µ, ν = 1, 2, ...l
(9.424)
siempre t0 es una de las constantes de movimiento y tiene una forma similar a (9.408), ver tambi´en la ecuaci´ on (3.91): t0 (q, p, t) = −t + θ(q, p)
(9.425)
de acuerdo con (9.411) se cumple que: [t0 , H] = −
∂t0 = 1 ⇒ [t0 , H] = 1 ∂t
(9.426)
La ecuaci´ on (9.423) nos dice que el corchete de Poisson de un par de variables can´onicamente conjugadas es igual a +1; [qν , pν ] = 1 ; ν = 1, 2, ...l (9.426) nos dice entonces que t0 y H son un par de variables din´amicas can´onicamente conjugadas. Muchos autores se˜ nalan que t y H son can´onicamente conjugadas, pero esto es err´oneo, pues realmente t no es una variable din´ amica, como s´ı lo es t0 . Enfaticemos que f es una variable din´amica si satisface f (q, p, t) = f (q, p, t).
Las transformaciones can´onicas / 393 Vimos que el m´etodo de Hamilton-Jacobi permite mediante una transformaci´ on can´onica describir el estado por medio de constantes de movimiento. Los corchetes fundamentales de Poisson, (9.423), permiten a priori saber si dos constantes de movimiento dadas pueden tomarse como dos “coordenadas” o dos “momentos” o una “coordenada” y su “momento” can´ onicamente conjugado. La ecuaci´ on (9.426) nos dice categ´oricamente que t0 y H pueden tomarse como un par de variables can´onicamente conjugadas pero no es posible que ambos sean “coordenadas” o “momentos”. Algo an´alogo se concluye de las siguientes relaciones entre componentes de los momentos angular y lineal: [li , lj ] = ǫijk lk ; [pi , lj ] = ǫijk pk ; [xi , lj ] = ǫijk xk [ li , ~l2 ] = 0 ; [~ p, ~l2 ] = 2~l × ~p ; i, j, k = 1, 2, 3
(9.427)
Se sigue que dos componentes de ~l no pueden tomarse como variables can´onicas de estado, como tampoco una componente de p~ y ~l2 . Sin embargo, por ejemplo, [px , lx ] = 0 y [lz , lx ] = 0, permiten que px y lx sean momentos can´onicos respectivamente, lo mismo que la componente de p~ paralela a ~l y ~l2 . Como ejemplo, para una part´ıcula en un campo de fuerzas centrales se cumple que [ ~l2 , H] = 0 y [lz , H] = 0. Para este sistema se cumple: [~l, H] = 0 ; [lz , H] = 0 ; [~l2 , lz ] = 0
(9.428)
O sea que H, ~l2 y lz pueden tomarse como tres “momentos” constantes, que junto con sus tres “coordenadas” can´onicamente conjugadas, que son funciones lineales del tiempo seg´ un se vio al final del cap´ıtulo 2, constituyen un conjunto de seis variables can´ onicas que describen exhaustivamente el sistema. Por ser independientes, li y lj podr´ıan servir de variables de estado pero en un formalismo no can´onico (no hamiltoniano). Funciones escalares y vectoriales del estado de una part´ıcula. Una funci´ on escalar por definici´on, es aquella que no cambia al efectuar una rotaci´on del sistema de coordenadas (punto de vista “pasivo”). Al efectuar la rotaci´on los vectores de estado ~r on 7.7: y p~ cambian en ~r y ~p, ver secci´ ˜r ; ~p = A~ ˜p ~r = A~
(9.429)
donde A˜ es la matriz de rotaci´on. Entonces φ(~r, p~) es escalar si: φ(~r, p~) = φ(~r , ~p)
(9.430)
Una funci´ on vectorial del estado de la part´ıcula es una funci´ on F que se transforma de acuerdo con (9.428), es decir, F~ tiene tres componentes que se transforman por rotaciones como las componentes de ~r: ~ (~r, ~p) F~ (~r, ~p) = A˜F~ (~r, p~) = F
(9.431)
Para rotaciones infinitesimales A˜ est´ a dada por: ˜ i δφ A˜ = I˜ + Ci G
(9.432)
394 / Mec´ anica cl´ asica avanzada ˜ i est´ donde los G an dados en la ecuaci´ on (7.221), los Ci son los cosenos directores del eje de rotaci´on y δφ es el ´angulo de rotaci´on. De acuerdo con (9.318) y (9.432): ˜ i ~r δφ ; ~p = p~ + Ci G ˜ i p~ δφ ~r = ~r + Ci G
(9.433)
De acuerdo con (9.318), (9.322) y (9.433) tenemos que: δ~r =
˜ i~r δφ = ∂ ǫ G(~r, ~p) Ci G ∂~p
δ~ p=
∂ ˜ip ~ δφ = Ci G ǫ G(~r, ~p) ∂~r
(9.434)
donde G es el generador infinitesimal de la rotaci´on, que de acuerdo con (9.340) es la componente de ~l a lo largo del eje de rotaci´on: G(~r, p~) = ~n · ~r × ~p = Ci li
(9.435)
Vemos entonces que δφ = ǫ y que: ˜ i ~r = Ci G
∂ ∂ Ci li = (~n · ~r × ~p) = ~n × ~r ∂~ p ∂~p
˜ i p~ = Ci G
∂ ∂ − Ci li = − (~n · ~r × p~) = ~n × p~ ∂~p ∂~r
(9.436)
Tomando componentes en (9.432) a (9.436): ˜i ˜i = ǫkil xl = ǫkil Ci xl ⇒ G Ci G kl
kl
(9.437)
El lector puede verificar f´acilmente que este resultado es consistente con las ecuaciones (7.222), teniendo en cuenta que all´ı se ten´ıan rotaciones “activas”. De (9.436) vemos que se puede escribir: ˜ i~r = −Ci~r · G ˜ i p~ G(~r, ~ p) = ~l · ~n = Ci p~ · G
(9.438)
˜ i~r = −~r · G ˜ i ~p ; i = 1, 2, 3 ⇒ li = p~ · G ˜ i , (9.437). consistente con la antisimetr´ıa de G Evaluemos el corchete de Poisson de dos componentes de ~l: [li , lj ] = =
∂li ∂li ∂li ∂lj ˜ i p~) · (G ˜ j ~r) − (G ˜ i ~r) · (−G ˜ j p~) · − · = (−G ∂~r ∂~ p ∂~p ∂~r ˜ i~r · G ˜j p ˜ j ~r · G ˜ i ~p G ~−G
(9.439)
˜ i )~ ˜j − G ˜T G ˜ i p~ = ~rT (G ˜T G ˜ j ~p − ~rT G ˜T G ˜T G p = ~rT G j i j i ˜ i son antisim´etricos, G ˜ T = −G ˜i, Como los G i ˜ j )~ ˜i − G ˜iG ˜j G p [li , lj ] = ~rT (G
(9.440)
Las transformaciones can´onicas / 395 De acuerdo con la ecuaci´ on (7.224) que define el ´algebra de Lie de las rotaciones: ˜j ˜i − G ˜iG ˜j G G [li , lj ] =
˜k = ǫjik G ˜ k p~ ǫjik ~rT G (9.441)
=
˜ k p~ −ǫijk ~r · G
=
ǫijk lk
lo cual concuerda con el resultado obtenido en (9.422). ˜ i tienen la misma ´algebra de Lie, definida por corchetes de Decimos que li y G Poisson de variables din´ amicas y de conmutadores de matrices respectivamente. Volvamos al problema de las funciones escalares y vectoriales. Para rotaciones infinitesimales una funci´ on escalar cumple: φ(~r, p~) = φ(~r + δ~r, p~ + δ~ p) = φ(~r, ~p) + δ~r ·
∂φ ∂φ + δ~ p· ∂~r ∂~p
(9.442)
o sea que se cumple: ∂φ ∂φ + δ~ p· =ǫ δ~r · ∂~r ∂~ p
∂G ∂φ ∂G ∂φ · − · ∂~ p ∂~r ∂~r ∂~p
= −ǫ [G, φ] = 0
lo cual es consistente con (9.351). La ecuaci´ on (9.443) tambi´en implica que: ∂φ ∂φ ∂φ ∂φ ~n × ~r · =0 + ~n × p~ · = 0 ⇒ ~n · ~r × + p~ × ∂~r ∂~ p ∂~r ∂~p
(9.443)
(9.444)
Como ~n es arbitrario, a fin de que φ sea escalar debe cumplirse: ~r ×
∂φ ∂φ + p~ × =0 ∂~r ∂~ p
(9.445)
se cumple si ∂φ/∂~r = a~r + b~ p y ∂φ/∂~p = c~r + d~ p puesto que: ~r ×
∂φ ∂φ + p~ × = b~r × p~ + c~ p × ~r = 0 si b = c ∂~r ∂~ p
(9.446)
es decir, φ es de la forma: φ=
1 2 1 2 a~r + c~r · p~ + d ~ p = A~r2 + B~ p2 + c~r · ~p 2 2
(9.447)
donde A, B y C no dependen de ~r ni de ~p. As´ı pues: [~r2 , li ] = 0 ; [~ p2 , li ] = 0 ; [~r · p~, li ] = 0 implican : [φ, li ] = 0
(9.448)
Una funci´ on vectorial F~ (~r, p~) puede escribirse en la forma: F~ = f1 ~r + f2 ~ p + f3 ~l donde f1 , f2 y f3 son funciones escalares, o sea de la forma (9.447).
(9.449)
396 / Mec´ anica cl´ asica avanzada Usando las f´ ormulas (9.427) vemos que: [Fi , lj ] = ǫijk Fk → [F~ , li ] = ~ei × F~
(9.450)
De (9.428) se sigue que F~ se transforma bajo rotaci´on como (9.431). Los vectores de la forma (9.449) dependen del estado del sistema, en tanto que los vectores unitarios de base ~ei son independientes de ´el como tambi´en los vectores ~n, que definen las rotaciones. Si ~n mismo estuviera determinado por los vectores ~r y p~, entonces una rotaci´on cambiar´ıa no s´olo los componentes de la funci´ on F~ sino la naturaleza misma de la funci´ on (algo an´alogo a lo que sucede con el hamiltoniano cuando las transformaciones can´onicas dependen del tiempo). En una rotaci´on el cambio en F~ es: ∂ F~ = δφ [F~ , ~l.~n]
(9.451)
´ donde los vectores unitarios no son rotados por ~l · ~n. Este no ser´ıa el caso si F~ fuera un vector externo como un campo magn´etico, que no depende del estado de la part´ıcula. La expresi´on (9.451) vale pues s´olo para funciones vectoriales de la forma (9.449). La ecuaci´ on (9.450) tambi´en puede escribirse usando la notaci´ on di´adica en t´erminos del ~ ~ di´adico unidad 1 = ~e1~e1 + ~e2~e2 + ~e3~e3 : ~ [F~ , ~l] = −~1 × F~
(9.452)
~ Es f´acil mostrar que: Sean dos vectores de estado del sistema, F~ , G. ~ ~l · ~n] = 0 [F~ · G,
(9.453)
~ es una funci´ En efecto, F~ · G on escalar, que no cambia por rotaciones. Por contraste, F~ · ~n′ donde ~n′ es un vector independiente del estado, no es una funci´ on escalar y satisface que: [F~ · ~n′ , ~l · ~n] = (~n′ × ~n) · F~
(9.454)
que en general no es cero. Ejemplo 9.8.5 Mostrar que (9.450) no se cumple cuando F~ no depende exclusivamente ~ = (~r × B)/2 ~ del estado de la part´ıcula, por ejemplo cuando es el potencial vectorial A ~ es un vector fijo y constante en el espacio; digamos B ~ = B~l3 , o sea un campo donde B magn´etico homog´eneo en la direcci´ on z. [Ai , li ] =
1 1 B[(~r × ~e3 )i , lj ] = Bǫik3 [xk , li ] 2 2
(9.455)
usando (9.427) obtenemos: [Ai , lj ] = =
1 1 Bǫik3 ǫkjl xl = − B(δij δ3l − δil δ3j ) xl 2 2 1 − B(δij x3 − δ3j xi ) 2
(9.456)
Las transformaciones can´onicas / 397 Por otra parte, el lado derecho en (9.450) es: 1 ǫijk Ak = Bǫijk ǫkl3 xl 2
(9.457) 1 1 = B(δil δj3 − δi3 δjl ) xl = B(δj3 xi − δi3 xj ) 2 2 Comparando (9.456) con (9.457) vemos que no son iguales. En conclusi´ on, no hay una f´ ormula general para evaluar el corchete de Poisson de un vector que depende del estado solamente y un vector espacial. Correspondencia del formalismo de Poisson con el cuadro de Heisenberg de la mec´ anica cu´ antica.12 Hay una correspondencia entre el conjunto de las variables din´amicas en la descripci´ on cl´ asica y el conjunto de los operadores herm´ıticos en la descripci´ on cu´antica de un sistema de l grados de libertad. En esos dos conjuntos se puede definir un ´ algebra de Lie, de la siguiente manera: (i) En esos conjuntos se puede definir una ley de composici´on interna mediante la cual se hace corresponder a cada par de elementos del conjunto un tercer elemento del mismo conjunto: C = [a, b]. Tal ley de composici´on satisface: (ii) La propiedad reflexiva: [a, a] = 0, para todo elemento del conjunto, siendo 0 elemento del mismo. (iii) La propiedad antisim´etrica: [a, b] = −[b, a]. (iv) La propiedad de linealidad: [αa + βb, c] = α[a, c] + β[b, c] siendo α y β n´ umeros cualesquiera. (v) La identidad de Jacobi: para cualesquiera tres elementos a, b, c, del conjunto se cumple [a, [b, c]] + [b, [c, a]] + [c, [a, b]] = 0. Esta ´ algebra es en general no conmutativativa, adem´as de ser no asociativa: [a, [b, c]] 6= [[a, b], c]. En el conjunto de las variables din´amicas cl´asicas el ´algebra de Lie est´ a dada por los corchetes de Poisson, que satisfacen todas las propiedades (i) a (v). En el conjunto de los operadores hem´ıticos cu´anticos se satisfacen las propiedades (i) a (v) definiendo la ley de composici´on interna por medio de conmutadores: [ˆ a, ˆb] = a ˆˆb − ˆbˆ a. La correspondencia entre el formalismo de Poisson y el de Heisenberg se establece de la siguiente manera: a cada variable can´onica de estado pν o qν , ν = 1, 2, 3, ...l, le corresponde un operador herm´ıtico, pˆν o qˆν , ν = 1, 2, ...l. En consecuencia a cada variable din´ amica f (q, p, t) le corresponde un operador herm´ıtico construido a partir de los operadores pˆν o qˆν : fˆ(ˆ q , pˆ, t). A cada corchete de Poisson fundamental le corresponde un conmutador fundamental. La correspondencia entre el corchete de Poisson y conmutadores es: 1 1 (9.458) [f, g] → [fˆ, gˆ] = (fˆgˆ − gˆfˆ) i¯ h i¯ h En particular a los corchetes fundamentales de Poisson, (9.423), les corresponde: qˆµ qˆν − qˆν qˆµ = 0 ;
pˆµ pˆν − pˆν pˆµ = 0
qˆµ pˆν − pˆν qˆµ = i¯ hδµν ; µ, ν = 1, 2, ...l 12 V´ ease
el cap´ıtulo 12.
(9.459)
398 / Mec´ anica cl´ asica avanzada A la relaci´ on (9.426) le corresponde: ˆ −H ˆ tˆ0 = i¯h tˆ0 H
(9.460)
similarmente, ˆli ˆ li = i¯hǫijk ˆlk lj − ˆ lj ˆ Las ecuaciones de movimiento de Heisenberg son: ˆ −H ˆ qˆν ; ˆp˙ ν = 1 pˆν H ˆ −H ˆ pˆν ; ν = 1, 2, ...l ˆq˙ν = 1 qˆν H i¯ h i¯h
(9.461)
(9.462)
˜ i (q, p, t) son los generadores infinitesimales de un grupo de simetr´ıas, que Si G satisface las relaciones de ´algebra de Lie cl´asicas, i h ˜k ˜i, G ˜ j = Cijk G (9.463) G
˜ i (q, p, t) son llamadas las constantes estructurales, las correspondientes relaciodonde G nes de ´ algebra de Lie cu´anticas son: ˆ i = iCijk ¯hG ˆk ˆj − G ˆj G ˆiG G
(9.464)
en particular para el grupo de rotaciones tridimensional, Cijk = ǫijk , que caracterizan al grupo SO(3). Toda la mec´anica cu´antica puede hacerse corresponder con la mec´anica cl´asica a partir de las relaciones que hemos mencionado; con la mec´anica cu´antica en el formalismo de Heisenberg y con la mec´anica cl´asica en el formalismo de Poisson. La analog´ıa llega hasta el punto de formularse un principio de Hamilton cu´antico (principio de acci´on de Schwinger) y construirse una integral de Poincar´e-Cart´ an. Ejemplo 9.8.6 Sea una variable din´amica B independiente del tiempo, la cual satisface la u ´ltima igualdad de la ecuaci´ on (9.352). Mostrar que la soluci´on de dicha ecuaci´ on coincide formalmente con la f´ormula de Hausdorff-Baker-Campbell (H.B.C.) de la mec´anica cu´antica. En mec´anica cu´antica se obtiene un operador en el tiempo t a partir del operador en el tiempo cero por la relaci´on: ˆ h ˆ ˆ ˆ = eiHt/¯ B(t) B(0)e−iHt/¯h
(9.465)
ˆ es el operador hamiltoniano. Se puede mostrar que esta ecuaci´ donde H on equivale a la f´ ormula de H.B.C: 2 1 it it ˆ ˆ ˆ [H, ˆ B ˆo ]] ˆ ˆ [H, B(t) = B0 + [H, B0 ] + ¯h 2! ¯h n (9.466) 1 it ˆ [H, ˆ ...[H, ˆ B ˆ0 ]...]] + ... +... [H, {z } | n! ¯h n corchetes
Las transformaciones can´onicas / 399 (v´ease el texto de Messiah, M´ecanique quantique, tomo 1, cap´ıtulo 8). Cl´asicamente la ecuaci´ on de movimiento para la variable din´amica B es (9.352): B˙ = [B, H] (9.467) Formalmente B puede expandirse en serie de Tayor alrededor de t = 0: t2 ¨ tn (n) ˙ B = B0 + tB + B + ... B + ... 2! n! 0
0
Notando que: ¨ = [B, ˙ H] = [[B, H], H], ... B
obtenemos: B = B0 − t[H, B]|0 +
(9.468)
0
(9.469)
t2 [H, [H, B]] 2! 0
(9.470) 1 + ... (−t)n [H, [H ...[H, B] ...]] + ... {z } | n! n corchetes 0 Es clara la correspondencia entre (9.466) y (9.470) con s´olo reemplazar el corchete de Poisson por i/¯ h veces el conmutador. La expresi´on (9.466) puede tambi´en obtenerse a partir de las f´ormulas cu´anticas que corresponden a (9.467) y (9.468): ˆ˙ = i [H, ˆ B] ˆ (9.471) B h ¯ Como ilustraci´ on, sea una part´ıcula en un campo homog´eneo gravitacional −mg. El hamiltoniano cu´antico ser´a: 2 ˆ = pˆ − mg x ˆ (9.472) H 2m ˆ = H ˆ y B ˆ0 = x Sea B ˆ0 . Hallemos a xˆ usando la f´ormula (9.466). Es necesario evaluar los siguientes conmutadores: 1 2 −1 ˆ x [H, ˆ0 ] = pˆ0 , x ˆ0 = x ˆ0 , pˆ20 2m 2m (9.473) −1 i¯h = ([ˆ x0 , pˆ0 ] pˆ0 + pˆ0 [ˆ x0 , pˆ0 ]) = − pˆ0 2m m i¯ h ˆ [H, ˆ x0 ]] = −mg x [H, ˆ0 , − pˆ0 = −g¯h2 (9.474) m Como el conmutador (9.474) es constante, todos los conmutadores de orden superior se anulan. Reemplazando (9.473) y (9.474) en (9.466): 1 pˆ0 t + gt2 (9.475) m 2 La ecuaci´ on (9.475) es formalmente igual a la expresi´on cl´asica que se obtendr´ıa a partir de (9.470). xˆ = x ˆ0 +
400 / Mec´ anica cl´ asica avanzada
9.9.
Pruebas del car´ acter can´ onico de una transformaci´ on
La prueba m´as directa consiste en usar la transformaci´ on junto con las ecuaciones de Hamilton en las variables originales para obtener las ecuaciones de movimiento en las nuevas variables; la transformaci´ on ser´a can´onica si las nuevas ecuaciones de movimiento lo son para un hamiltoniano cualquiera; esto se us´o en los ejemplos de las ecuaciones (3.92) y (3.93). Otra prueba consiste en mostrar que existe una funci´ on generatriz U para la transformaci´ on, tal que las f´ormulas de la transformaci´on se puedan llevar a la forma (9.260). A continuaci´on veremos otros m´etodos de prueba como son los corchetes de Lagrange y Poisson y la llamada condici´on simplicial. Veamos que en la prueba del car´ acter can´onico de una transformaci´ on es suficiente demostrar que la transformaci´ on para un tiempo dado es can´onica. Sea la transformaci´ on: q ν = q ν (q, p, t) ; pν = pν (q, p, t) ; ν = 1, 2, ...l
(9.476)
Si la transformaci´ on es can´onica se debe cumplir: l X
ν=1
pν ∆q ν − H ∆t = C
l X
ν=1
pν ∆qν − H ∆t
!
− ∆F (q, p, t)
(9.477)
Si en (9.477) tomamos un tiempo fijo y arbitrario t = t′ obtenemos: l X
ν=1
pν δq ν = C
l X
ν=1
pν δqν − δF (q, p, t)
(9.478)
Ahora (9.478) es la identidad que define una transformaci´ on can´onica que no depende del tiempo, q ν = q ν (q, p, t′ ) ; pν = pν (q, p, t′ ) ; ν = 1, 2, ...l
(9.479)
Entonces, las ecuaciones (9.479) definen una transformaci´ on can´onica con valencia C y funci´ on generatriz F (q, p, t′ ) que no depende del valor escogido para t = t′ . Veamos ahora c´ omo la identidad que define el car´ acter can´onico de la transformaci´ on dependiente del tiempo, ecuaci´ on (9.477), puede obtenerse de la identidad correspondiente para la transformaci´ on independiente del tiempo, ecuaci´ on (9.478). La ecuaci´ on (9.4) relaciona las variaciones δ con las variaciones ∆: ∆q ν = δq ν + q˙ ν ∆t ;
ν = 1, 2, ...l
(9.480)
Con expresiones an´alogas para ∆pν , ∆qν , ∆pν . Entonces la relaci´on entre ∆F y δF ser´a: # " l X ∂F ∂F ∂F ∆t (9.481) q˙ν + p˙ ν + ∆F = δF + ∂qν ∂pν ∂t ν=1
Las transformaciones can´onicas / 401 Usando las f´ ormulas (9.480) y (9.481), la ecuaci´ on (9.478) se transforma en: l X
ν=1
p ∆q ν − q˙ ν ∆t
= C
l X
ν=1
+
"
pν (∆qν − q˙ν ∆t) − ∆F
l X ∂F
ν=1
∂F q˙ν + p˙ ν ∂qν ∂pν
∂F + ∂t
#
∆t
(9.482)
La ecuaci´ on (9.482) coincidir´ a con (9.477) si se define la funci´ on H por la ecuaci´ on: l X ∂F ∂F ∂F H = CH + pν q˙ ν − Cpν q˙ν + q˙ν + p˙ ν + (9.483) ∂qν ∂pν ∂t ν=1
El par´ent´esis en (9.483) se puede escribir tambi´en en la forma siguiente si asumimos que la transformaci´ on es libre de primera clase, de modo que F es funci´ on de (q, q, t): l X ∂F1 ∂F1 pν q˙ ν − Cpν q˙ν + (9.484) q˙ν + p˙ ν ∂qν ∂pν ν=1
Esta expresi´on es cero, de acuerdo con las f´ormulas de la transformaci´ on (9.158). Se sigue entonces que:
∂F1 (9.485) ∂t Se llega al resultado correspondiente a (9.485) si la transformaci´on tiene una estrutura arbitraria, es decir, regida por las f´ormulas (9.260). Concluimos que a fin de que la transformaci´ on (9.476) sea can´ onica es necesario y suficiente que todas las transformaciones independientes del tiempo obtenidas de la transformaci´ on (9.476) por reemplazar a t por un valor ´ arbitrario t′ , sean can´onicas, es decir, que satisfagan la ecuaci´ on (9.478), con una y la misma valencia C y una y la misma funci´ on generatriz F . Por esta raz´ on, al formular las pruebas para el car´ acter can´onico de una transformaci´ on, basta restringirse a la consideraci´on de las transformaciones que no contienen la variable temporal t expl´ıcitamente: ! ~q, ~p q ν = q ν (q, p) ; pν = pν (q, p) ; ν = 1, 2, ...l ; J 6= 0 (9.486) ~q, p~ H = CH +
Los corchetes de Lagrange. Para la transformaci´ on can´onica (9.486), la identidad (9.477) toma la forma: l X
ν=1
pν ∆ q ν = C
l X
ν=1
pν ∆qν − ∆K(q, p)
(9.487)
on de ∆qν y ∆pν usando las f´ormulas Si en (9.487) expresamos a ∆q ν en funci´ (9.486) obtenemos: # " ! ! l l l X X X ∂q ν ∂qν (9.488) Cpν − ∆qν − ∆pν ∆K = pν pµ ∂qν ∂pν ν=1 µ=1 ν=1
402 / Mec´ anica cl´ asica avanzada ∆K ser´a un diferencial exacto si se cumplen las condiciones: ! ! l l X X ∂q µ ∂q µ ∂ ∂ Cpλ − = Cpν − pµ pµ ∂qν ∂qλ ∂qλ ∂qν µ=1 µ=1 ∂ ∂pν ∂ ∂pν
l X
∂q µ − pµ ∂pλ µ=1 l X
∂q µ Cpλ − pµ ∂qλ µ=1
!
!
=
∂ ∂pλ
=
∂ ∂qλ
l X
∂qµ − pµ ∂pν µ=1 l X
∂q µ − pµ ∂pν µ=1
!
(9.489)
!
Si efectuamos las operaciones, las ecuaciones (9.489) se transforman en: l X ∂pµ ∂q µ ∂pµ ∂q µ = 0 − ∂qν ∂qλ ∂qλ ∂qν µ=1 l X ∂pµ ∂q µ ∂pµ ∂qµ = 0 − ∂pν ∂pλ ∂pλ ∂pν µ=1
(9.490)
l X ∂pµ ∂q µ ∂pµ ∂q µ = Cδνλ − − ∂pν ∂qλ ∂qλ ∂pν µ=1 Se define el corchete de Lagrange de dos variables din´amicas f y g como: l X ∂qν ∂pν ∂qν ∂pν {f (q, p, t), g(q, p, t)} ≡ − ∂f ∂g ∂g ∂f ν=1
(9.491)
Con esta notaci´ on, las f´ormulas (9.490) toman la forma: {qν (q, p, t), qλ (q, p, t)} = 0 ; {qν (q, p, t), pλ (q, p, t)} =
{pν (q, p, t), pλ (q, p, t)} = 0
Cδνλ ;
(9.492)
ν, λ = 1, 2, ...l
En las f´ ormulas (9.492) hemos colocado la variable t, teniendo en cuenta el resultado anterior, seg´ un el cual el car´ acter de la transformaci´ on dependiente del tiempo es el mismo que el de la transformaci´ on realizada en un tiempo fijo t = t′ . Las ecuaciones (9.492) expresan las condiciones suficientes y necesarias para que la transformaci´ on (9.476) sea can´ onica. Esta es una de las mencionadas pruebas del car´ acter can´onico de una transformaci´ on. Las f´ ormulas (9.492) se llaman los corchetes de Lagrange fundamentales: con las ecuaciones (9.492) se pueden formar las siguientes igualdades entre matrices l × l: {~ q, ~ q )} = ˜ 0l ; {~ p, p~)} = ˜0l ; {~q, ~p)} = C I˜l
(9.493)
Las transformaciones can´onicas / 403 donde el elemento ν, λ, de la matriz {~q, ~q}, es {qν , qλ }, ..., y 0˜l y I˜ son las matrices cero e identidad de orden l × l respectivamente. A su vez las f´ormulas (9.493) se pueden condensar en la siguiente expresi´on con matrices 2l × 2l:
{~ q, ~ q )} {~ q, p~)}
−{~ q, ~ p)} {~ p, p~)}
=
˜0l
−I˜l
I˜l
˜0l
˜ ≡E
(9.494)
˜ es una matriz 2l × 2l antisim´etrica, ortogonal, de cuadrado igual al negativo de E la matriz identidad, y de determinante +1: ˜T = E
˜ −E
˜T = E
˜ −1 E
˜2 = E
−I˜
˜= det E
+1
(9.495)
Vectores y matrices simpliciales. Se trata de una notaci´ on vectorial en el espacio de fases con vectores de 2l elementos y matrices de dimensi´ on 2l × 2l. Con esta notaci´ on se “entremezclan” las coordenadas y momentos generalizados, y de ah´ı el nombre de “simplicial” que recibe esta notaci´ on. El t´ermino matriz simplicial se reserva ˜ que satisfacen la relaci´on: para una cierta clase de matrices 2l × 2l, las matrices M ˜ T E˜ M ˜ =E ˜ M
(9.496)
el conjunto de todas las matrices simpliciales de dimensi´ on 2l × 2l forma un grupo, llamado el grupo simplicial. En efecto: (i) El producto de dos matrices simpliciales es una matriz simplicial. (ii) Las matrices simpliciales son no singulares, o sea que para toda matriz simplicial existe la matriz inversa. La matriz inversa de una matriz simplicial es simplicial. (iii) La matriz identidad 2l × 2l es simplicial. (iv) El producto de matrices simpliciales es asociativo. Los vectores de 2l elementos en el espacio de fases se pueden escribir en la forma [~u, ~v ], donde ~u y ~v son vectores columna de l elementos. Una forma bilineal de dimensi´ on 2l es: f=
l X
(−uν vν′ + vν u′ν ) = ~v · ~u ′ − ~u · ~v ′
(9.497)
ν=1
que puede escribirse en la forma: ′ ~u ˜ f = (~u, ~v ) E ′ ~v
(9.498)
404 / Mec´ anica cl´ asica avanzada Si ahora se someten los vectores [~u, ~v ] y [~u ′ , ~v ′ ] a una transformaci´ on mediante una ˜: matriz simplicial M ′ ′ ~u ~u ~u ~u ˜ ˜ =M =M ; (9.499) ′ ′ ~v ~v ~v ~v Entonces se cumple que: ′ ′ ~u ~u ˜ TE ˜M ˜ = (~u, ~v ) M f = ~u, ~v E˜ ′ ~v ′ ~v ′ ~u ˜ =f = (~u, ~v ) E ′ ~v
(9.500)
Es decir, la forma bilineal f es invariante bajo transformaciones de los vectores [~u, ~v ] realizados por matrices simpliciales; en otras palabras, f es invariante bajo las transformaciones del grupo simplicial. La matriz jacobiana de una transformaci´ on biana de una transformaci´ on can´onica: ∂q 1 ∂q1 ∂q 1 ∂q1 ∂q1 ∂q 1 ... ... ∂q1 ∂q2 ∂ql ∂p1 ∂p2 ∂pl ∂q ∂q 2 ∂q 2 ∂q2 ∂q 2 ∂q2 2 ... ... ∂q ∂q ∂q ∂p ∂p ∂pl 1 2 l 1 2 ... ... ... ... ... ... ... ... ∂ql ∂q l ∂ql ∂q l ∂q l ∂ql ... ... ∂q ∂q2 ∂ql ∂p1 ∂p2 ∂pl 1 J˜ = ∂p1 ∂p1 ∂p1 ∂p1 ∂p1 ∂p1 ∂q1 ∂q2 . . . ∂ql ∂p1 ∂p2 . . . ∂pl ∂p2 ∂p2 ∂p2 ∂p2 ∂p2 ∂p2 ... ... ∂q1 ∂q2 ∂q ∂p ∂p ∂pl l 1 2 ... ... ... ... ... ... ... ... ∂p ∂pl ∂pl ∂pl ∂pl ∂pl l ... ... ∂q1 ∂q2 ∂ql ∂p1 ∂p2 ∂pl
can´ onica. Sea la matriz jaco
=
∂~q ∂~q ∂~p ∂~q
∂~q ∂~p ~ ∂p ∂~p
(9.501)
donde ∂~p/∂~q, etc., son matrices jacobianas de orden l. Mostremos que J˜ satisface la relaci´ on: ˜ J˜ = C E ˜ J˜T E
(9.502)
Las transformaciones can´onicas / 405 donde C es la valencia de T ∂~q ∂~q ˜ J˜ = J˜T E ∂~q T ∂~ p
la transformaci´ on can´onica. En T ∂~p ∂~q ˜ ˜ 0l −Il ∂~q ∂~q T ∂~p I˜l ˜0l ∂~p ∂~q ∂~ p
efecto: ∂~q ∂~p ~ ∂p ∂~p
(9.503)
efectuando el producto de matrices indicado en (9.503), teniendo en cuenta que cuando las matrices constan de bloques se siguen las mismas reglas de la multiplicaci´on ordinaria de matrices, obtenemos: T T T T ∂~q ∂~p ∂~p ∂~q ∂~q ∂~p ∂~p ∂~q − − ∂~q ∂~q ∂~q ∂~q ∂~q ∂~p ∂~q ∂~p T ˜ J˜ = (9.504) J˜ E T T T T ∂~p ∂~q ∂~q ∂~p ∂~p ∂~q ∂~q ∂~p − − ∂~ p ∂~q ∂~ p ∂~q ∂~p ∂~p ∂~p ∂~p
∂~p/∂~qT indica la matriz traspuesta de ∂~p/∂~q. Notemos que los corchetes de Langrange fundamentales, (9.490) y (9.492), se pueden escribir en forma de matrices. En efecto, las ecuaciones (9.490) son los siguientes elementos de matriz: ! ! ! ! l X ~p T ~q ~q T ~p ∂ ∂ ∂ ∂ =0 − ∂~ q ∂~ q ∂~ q ∂~ q µ=1 νµ
!
!
~T ∂p ∂~ p µ=1 l X
~T ∂q ∂~ p µ=1 l X
νµ
νµ
µλ
∂~q ∂~ p
!
∂~p ∂~q
!
µλ
µλ
νµ
−
T ∂~q ∂~p
!
−
T ∂~q ∂~p
!
νµ
νµ
µλ
∂~p ∂~p
!
∂~q ∂~q
!
µλ
µλ
Comparando a (9.504) con (9.505) obtenemos que: ˜ 0l −C I˜l ˜ J˜ = ˜ = CE J˜T E ˜ C I˜l 0
=0
(9.505)
= Cδνλ
(9.506)
Con lo cual queda demostrada la relaci´on (9.502). Si la transformaci´ on can´onica es univalente, C = 1, entonces J˜ es una matriz simplicial. En general, para C 6= 1, se dice que J˜ es una matriz simplicial generalizada, con valencia C. El conjunto de todas ˜ las matrices simpliciales generalizadas (todas con la misma C) forma un grupo. Si M l ˜ es una matriz simplicial generalizada, se cumple que det M = ±C . En efecto, tomando el determinante de (9.506) y teniendo en cuenta que el determinante de un producto de ˜ = +1, matrices es igual al producto de los determinantes y que det E ˜ detJ˜ = C 2l det E ˜ det J˜T detE
(9.507)
406 / Mec´ anica cl´ asica avanzada Como det J˜T = det J˜ se sigue que: ˜ 2 = C 2l ⇒ detJ˜ = ±C l (det J)
(9.508)
˜ = ±1, o sea que las O sea que para una matriz simplicial se cumple que det M matrices simpliciales son no singulares. Sabemos que las igualdades (9.492), o sea (9.505), son las condiciones suficientes y necesarias para que la transformaci´ on sea can´onica. Por tanto la igualdad (9.506) se cumple solamente si la transformaci´ on es can´onica. Llegamos pues, a otra prueba del car´ acter can´ onico de una transformaci´ on: Para que la transformaci´ on q ν = q ν (q, p, t), pν = pν (q, p, t), ν = 1, 2, ...l sea can´ onica, es necesario y suficiente que la matriz jacobiana J˜ correspondiente a esta transformaci´ on sea una matriz simplicial generalizada con valencia constante C. Si la transformaci´ on es univalente, entonces J˜ es una matriz simplicial ordinaria. Entonces, ˜ ecuaci´ la condici´ on de la naturaleza simplicial de J, on (9.502), debe cumplirse id´enticamente para todos las variables (q, p, t). El teorema de Liouville. En la secci´ on 9.6, ecuaci´ on (9.269), se hall´o que el movimiento de un sistema hamiltoniano puede considerarse como una transformaci´ on can´ onica libre de primera clase univalente. En consecuencia, su matriz jacobiana es simplicial y su determinante vale ±1. Se sigue entonces que el volumen de una regi´on arbitraria del espacio de fases es constante en el tiempo. Tal volumen es: Z Z Z Γ= ... dq 1 dq 2 ...dq l dp1 dp2 ...dpl (9.509) que puede expresarse tambi´en en la forma: ! Z Z Z ~q, ~p Γ= ... J dq1 dq2 ...dql dp1 dp2 ...dpl ~q, p~
(9.510)
˜ Si la transformaci´ donde J es el determinante de la matriz jacobiana J. on es can´onica, l ˜ J = det J = ±C , o se a que: Γ = Γ|C|l
(9.511)
En particular, Γ es invariante bajo la transformaci´ on can´onica de evoluci´ on temporal, o sea que: dΓ =0 dt
(9.512)
La ecuaci´ on (9.512) puede considerarse como una prueba del teorema de Liouville, v´ease ecuaci´ on (3.137). Γ es una de las integrales invariantes de Poincar´e, ecuaci´ on (9.81). Invariancia de los corchetes de Poisson bajo transformaciones can´ onicas. Hemos ya mostrado esta invariancia bajo transformaciones can´onicas infinitesimales, ecuaci´ on (9.394) y siguientes. Veremos ahora que esta invariancia vale para cualquier tipo de tranformaci´on can´ onica univalente; no solamente para aquellas que pueden obtenerse a partir de la transformaci´ on continua de par´ ametros.
Las transformaciones can´onicas / 407 Empecemos por mostrar que la condici´on de canonicidad (9.502) puede expresarse en la forma: ˜ J˜E˜ J˜T = C E
(9.513) ˜T −1
˜−1
en efecto, multiplicando por (J ) a (9.502) por la izquierda y por J por la derecha, obtenemos: 1 ˜ (J˜T )−1 E˜ J˜−1 = E (9.514) C En (9.514) ahora tomamos las matrices inversas de ambos lados y usamos las propiedades de las ecuaciones (9.495): −1 i−1 h 1 ˜ ˜ J˜−1 ˜ −1 J˜T = −J˜E ˜ J˜T ; ˜ E = J˜E (J˜T )−1 E = −C E (9.515) C O sea que la siguiente es otra expresi´on de la condici´on de canonicidad: ˜ J˜E˜ J˜T = C E
(9.516)
La ecuaci´ on (9.516) puede obtenerse a partir de (9.502) intercambiando los papeles ˜ J˜T se puede obtener de (9.504) de J˜ y J˜T . Comparando con (9.503) vemos que J˜E intercambiando a ∂~q/∂~q y ∂~p/∂~ p por sus respectivas traspuestas y a ∂~p/∂~q por (∂~q/∂~p)T . Es decir: T T T T ∂~q ∂~q ∂~q ∂~q ∂~q ∂~p ∂~q ∂~p − − ∂~ ∂~q ∂~p ∂~p ∂~q ∂~q ∂~p p ∂~q T ˜ ˜ ˜ J EJ = (9.517) T T T T ∂~p ∂~q ~ ~ ~ ~ ~ ~ ∂p ∂q ∂p ∂p ∂p ∂p − − , ∂~ p ∂~q ∂~q ∂~p ∂~p ∂~q ∂~q ∂~p Los corchetes de Poisson fundamentales pueden escribirse en forma de matriz. En efecto: ! ! ! ! l X ~q ~q ~p T ~p T ∂ ∂ ∂ ∂ [q ν , pλ ] = − ∂~q ∂~p ∂~p ∂~q µ=1 µλ µλ νµ νµ (9.518) ! T T ∂~q ∂~p ∂~q ∂~p = − ∂~q ∂~ p ∂~p ∂~q νλ
y similarmente: [q ν , q λ ] =
T T ∂~q ∂~q ∂~q ∂~q − ∂~q ∂~ p ∂~ p ∂~q
!
µλ
;
[pν , pλ ] =
T T ∂~p ∂~p ∂~p ∂~p − ∂~q ∂~p ∂~p ∂~q
Se sigue entonces que (9.516) se puede escribir como: ~ ~ ˜0l −I˜l C − q, q − ~q, ~p = C E˜ = J˜E˜ J˜T = T ˜ ˜ ~ ~ ~q , ~p Il C 0l − p, p
!
(9.519) µλ
(9.520)
408 / Mec´ anica cl´ asica avanzada O sea que las condiciones de canonicidad de la transformaci´ on tambi´en se pueden expresar por medio de los corchetes de Poisson, seg´ un (9.520): [~q , ~q ] = ˜0l ; [~p, ~p] = ˜0l ; [~q, ~p] = C I˜l , o en t´erminos de los elementos de matriz. [q ν , q λ ] = 0 ;
[pν , pλ ] = 0 ;
[q ν , pλ ] = Cδνλ ;
ν, λ = 1, 2, ...l
(9.521)
Las ecuaciones (9.521) coinciden con (9.423) cuando la transformaci´ on can´onica es univalente. Sean ahora dos variables din´amicas f (q, p, t) y g(q, p, t). Al expresar a las qν , pν ; ν = 1, 2, ...l, en t´erminos de las variables (q, p, t) por medio de la transformaci´ on can´onica, obtenemos las variables din´amicas f (q, p, t) y g(q, p, t). O sea que los corchetes de Poisson de f con g pueden evaluarse bien respecto a las variables (q, p) o respecto a las variables (q, p). Mostremos qu´e vale la identidad: [f, g](q,p) = C[f, g](q,p)
(9.522)
notemos que: [f, g](q,p) =
=
[f, g](q,p) =
=
l X ∂f ∂g ∂f ∂g − ∂qν ∂pν ∂pν ∂qν ν=1 ∂f ∂g ∂f ∂g − ∂~q ∂~p ∂~p ∂~q (9.523)
l X ∂f ∂g ∂f ∂g − ∂q ν ∂pν ∂pν ∂q ν ν=1 ∂f ∂g ∂f ∂g − ∂~q ∂~p ∂~p ∂~q
Las ecuaciones (9.523) se pueden expresar de la siguiente manera con la notaci´ on de (9.498):
[f, g](q,p) =
∂g ∂g , ∂~q ∂~p
∂f ∂~q E˜ ∂f ∂~p
(9.524)
y similarmente [f, g](q,p) . Veamos c´ omo se transforman las derivadas respecto a qν y respecto a pν en funci´ on de las derivadas respecto a q ν y respecto a pν : l X ∂f ∂qµ ∂f ∂pµ ∂f = = + ∂qν ∂q ν ∂qν ∂pµ ∂qν µ=1
T T ∂~q ∂f ∂~p ∂f − ∂~q ∂~q ∂~q ∂~p
!
(9.525) ν
Las transformaciones can´onicas / 409 y similarmente para ∂f /∂pν . Vemos entonces que: T T ∂~p ∂f ∂~q ∂f ∂f + ∂~q ∂~p ∂~q ∂~q ∂~q = = ∂f T T ∂~q ∂f ~ ∂ p ∂f + ∂~ p ∂~ p ∂~q ∂~p ∂~p T T ∂f ∂~p ∂~q ∂~q ∂~q ∂~q T T ∂f ∂~q ∂~p ∂~p ∂~ p ∂~p
(9.526)
Comparando a (9.526) con (9.501) vemos que: [∂f /∂~q, ∂f /∂~p] = J˜T ∂f /∂~q, ∂f /∂~p Es decir: ∂f ∂~q ∂g ∂g ˜ ˜ ˜T (9.527) J EJ [f, g](q,p) = , ~ ∂~ q ∂p ∂f ∂~p De acuerdo con (9.516) obtenemos entonces: ∂f ∂~q ∂g ∂g ˜ = C [f, g] CE [f, g](q,p) = , (q,p) ∂~ q ∂~p ∂f ∂~p
(9.528)
Hemos mostrado que si la transformaci´ on (q, p) → (q, p) es can´onica entonces se cumple la igualdad (9.522). El inverso tambi´en vale: si para cualquier par de variables din´ amicas f y g vale la identidad (9.522) para una y la misma constante C 6= 0, entonces la transformaci´ on de las 2l variables qν y pν a las 2l variables q ν y pν es can´ onica con valencia C. Este es pues otro test del car´ acter can´onico de una transformaci´ on. Para una transformaci´ on can´ onica univalente, C = 1, se cumple: [f, g](q,p) = [f, g](q,p)
(9.529)
En otras palabras, los corchetes de Poisson son invariantes bajo transformaciones can´onicas univalentes, lo cual es el mismo resultado (9.402). En resumen, para estas transformaciones es innecesario especificar respecto a cuales variables se eval´ uan los corchetes de Poisson. Otras propiedades de los corchetes de Lagrange. Sea el siguiente conjunto de 2l variables din´ amicas: u1 , u2 , ...ul , v1 , v2 , ...vl . Usando notaci´ on vectorial, dicho
410 / Mec´ anica cl´ asica avanzada conjunto se puede escribir como (~u, ~v ). Podemos formar con estas variables los siguientes corchetes de Lagrange y Poisson: [~u, ~u]; [~u, ~v ]; [~v , ~v ]; {~u, ~u}; {~u, ~v }; {~v , ~v } A su vez con estos corchetes podemos formar las siguientes matrices de orden 2l: [~u, ~u] [~u, ~v ] {~u, ~u} {~u, ~v } ˜= ; L P˜ = (9.530) [~v , ~u] [~v , ~v ] {~v , ~u} {~v , ~v }
˜ P˜ = I, donde I˜ es la identidad de orden Mostremos que se cumple lo siguiente: L 2l. Los corchetes de Langrange se pueden expresar en forma similar a (9.524): ∂~q ∂~q ∂~p ˜ ∂f {f, g} = E , ∂~p ∂g ∂g ∂f
(9.531)
˜ P˜ es de la forma siguiente: Un elemento t´ıpico de la matriz L 2l X i=1
{xn , xi } [xi , xm ] =
2l X i=1
∂~z T ˜ ∂~z E ∂xi ∂xn
!
∂xm T ˜ ∂xi E ∂~z ∂~z
!
(9.532)
donde xi es una componente del vector [~u, ~v ] y zi representa una componente del vector [~ q , p~].13 Notando que: 2l X ∂zr ∂xi ∂zr = = δrs ; ∂x ∂z ∂zs i s i=1
˜ 2 = −I˜ E
(9.533)
y que: Eµr Ert
∂zt ∂xm = −δnm ∂xn ∂zµ
(9.534)
obtenemos entonces que: 2l X i=1
˜ P˜ = −I˜ {xn , xi } [xi , xm ] = −δnm ⇒ L
(9.535)
O sea que el corchete de Lagrange es, excepto por el signo, el rec´ıproco del corchete de Poisson. La invariancia del uno implica la invariancia del otro. Vimos que los corchetes de Poisson son invariantes bajo transformaciones can´onicas univalentes, por tanto se 13 V´ ease
las f´ omulas (9.385).
Las transformaciones can´onicas / 411 sigue la invariancia de los corchetes de Lagrange bajo estas fransformaciones.14 Otras propiedades de los corchetes de Lagrange son las siguientes: q ~q ~ ˜ , = E p~ p ~ {~ q, f } =
∂~p ∂~q ; {~ p, f } = − ∂f ∂f
(9.536)
{g, f } = −{f, g} {cf, g} = {f, cg} =
1 {f, g} c
No se cumplen las propiedades de linealidad ni la identidad de Jacobi, o sea que los corchetes de Lagrange no permiten definir un ´algebra. Ejemplo 9.9.1 Analizar la siguiente transformaci´ on compleja, y si es can´onica, hallar la funci´ on generatriz y la valencia. 1 1 q = √ (q + ip) ; p = √ (q − ip) 2 2 La transformaci´ on puede escribirse en la forma: √ √ p = i(q − 2q) ; p = 2q − q
(9.537)
(9.538)
La transformaci´ on ser´a can´ onica libre de primera clase con valencia C, si, de acuerdo con (9.158), puede generarse por una funci´ on tal que: Cp =
∂F ∂F ; p=− ∂q ∂q
(9.539)
Es simple mostrar que la transformaci´ on (9.537) ser´a can´onica si F y C est´ an dadas por: F =
1 2 1 2 √ q + q − 2qq ; C = −i 2 2
(9.540)
De acuerdo con (9.159), el nuevo hamiltoniano ser´a: H = iH
(9.541)
Es simple mostrar de (9.492) que {q, p} = −i. Ejemplo 9.9.2 En la transformaci´ on can´onica del ejemplo 9.9.1 hallar el corchete de Poisson de q, y de p. Resolver el problema del oscilador arm´onico lineal usando dicha transformaci´ on can´ onica. 14 El corchete de Lagrange de dos constantes de movimiento es una constante de movimiento. Sin embargo, a diferencia de los de Poisson, los corchetes de Lagrange no sirven para hallar nuevas constantes de movimiento porque para evaluarlos hay que conocer todas esas constantes.
412 / Mec´ anica cl´ asica avanzada Como la transformaci´ on (9.537) es can´onica con valencia C = −i, se sigue de la f´ ormula general para los corchetes de Poisson que: [q, p] = −i
(9.542)
resultado que tambi´en puede obtenerse directamente de las f´ormulas de la transformaci´ on. N´ otese que toda transformaci´ on lineal con coeficientes constantes en el espacio de fases bidimensional ser´a can´onica con valencia igual al determinante de la matriz de la transformaci´ on: q = aq + bp ;
p = eq + f p ⇒ c = af − be
(9.543)
El hamiltoniano del oscilador arm´onico lineal es: H=
1 p2x + kx2 2m 2
(9.544)
y puede escribirse en la forma siguiente: H=
1 I(q 2 + p2 ) 2
mediante la transformaci´ on: r √ I q ; px = Imω p x= mω
(9.545)
(9.546)
donde k = mω 2 e I es una constante que puede tomar cualquier valor. En la transformaci´ on (9.546) procedemos por analog´ıa con una correspondiente transformaci´ on cu´antica. Si ahora realizamos la transformaci´ on can´onica: 1 i q = √ (q + p) ; q = √ (p − q) 2 2
(9.547)
obtenemos para H: H = Iωqp
(9.548)
entonces el hamiltoniano CH ser´a: −iH = −iIωN
(9.549)
donde llamamos N a: N = qp podemos ver que E = IN y que: N , q = −q ; N , p = p
(9.550)
(9.551)
Vemos que q, p y N son an´alogos a los operadores de destrucci´on, de creaci´on y de ˆ , de la mec´anica cu´antica. n´ umero, a ˆ, a ˆ+ , N
Las transformaciones can´onicas / 413 La transformaci´ on (9.543) es de cambio de escala, o sea que seg´ un las f´ormulas (9.191) y (9.192) es libre de segunda clase, con valencia igual al producto de los factores de escala: r mω 1 1 C= ·√ (9.552) = I I Imω de modo que el hamiltoniano correspondiente a las variables can´onicas q y p ser´a ωqp. Entonces, el hamiltoniano correspondiente a q y p es: H = −iωq p
(9.553)
Las f´ ormulas (9.551) nos permiten escribir directamente las ecuaciones de movimiento de Poisson, ecuaciones (9.363): q˙ = q, H ; p˙ = p, H (9.554)
con lo cual de (9.553) y (9.551) obtenemos: q˙ = −iωq ; p˙ = iωp
(9.555)
Que podemos integrar f´ acilmente: q = q 0 e−iωt ; p = q ⋆0 eiωt
(9.556)
donde hemos notado que q y p son complejo conjugadas entre s´ı. Utilizando las f´ormulas (9.547) obtenemos a q y p en funci´ on del tiempo: √ √ q = 2Re (q 0 e−iωt ) ; p = 2Im(q 0 e−iωt ) (9.557) Es claro que q 0 puede determinarse de las condiciones iniciales sobre q y p: √ √ (9.558) q0 = 2Re q 0 ; p0 = 2Imq0 Entonces obtenemos para q(t) y p(t) en t´erminos de sus valores iniciales: q = q0 cos ωt + p0 sen ωt (9.559) p = p0 cos ωt + q0 sen ωt y para las variables originales x y px , obtenemos: x = x0 cos ωt +
px0 sen ωt mω
(9.560)
px = px0 cos ωt − mωx0 sen ωt Ejemplo 9.9.3 Analizar las dispersiones de x y de px para un ensamble de osciladores arm´onicos lineales que tengan la misma energ´ıa. El ensamble est´ a ilustrado en el ejemplo 4.8.1, secci´ on 4.8.
414 / Mec´ anica cl´ asica avanzada Los distintos sistemas del ensamble difieren s´olo por la fase. La dispersi´ on en x se caracteriza por su varianza (∆x)2 , definida por: (∆x)2 = h(x − hxi)2 i = hx2 i − hxi2
(9.561)
x = Ax sen(ωt + δ)
(9.562)
donde h...i denota el promedio sobre el ensamble. Como x(t) puede escribirse en la forma: Si promediamos sobre todos los posibles valores de δ, 0 ≤ δ ≤ 2π, obtenemos los promedios de ensamble microcan´onicos:
A2x ; hxi = 0 (9.563) 2 px se comporta an´alogamente. Obtenemos entonces que: 1 1 (∆x)2 = A2x ; (∆p)2 = A2p (9.564) 2 2 El producto ∆x ∆px ser´a entonces: 1 (9.565) (∆x) (∆px ) = Ax Ap 2 Notamos seg´ un el ejemplo 9.9.2 que los m´aximos valores de x y px , que se obtienen de las f´ ormulas (9.560), son: px A2x = x20 + 2 0 2 ; A2p = p2x0 + m2 ω 2 x20 (9.566) m ω que pueden expresarse en funci´ on de q0 y p0 mediante (9.546): I A2x = (q 2 + p20 ) ; A2p = Iωm(q02 + p20 ) (9.567) mω 0 Reemplazando (9.548) en (9.546) obtenemos: hx2 i =
(∆x) (∆px ) = I(q02 + p20 )
(9.568)
Notando que seg´ un (9.550): N = (Re q 0 )2 + (Im q 0 )2
(9.569)
Entonces obtenemos al usar (9.549): E (9.570) ω Este valor no depende del tiempo, en concordancia con el teorema de Liouville, ejemplo 4.8.4, secci´ on 4.8. El resultado (9.569) es una propiedad del ensamble o sea que para un valor dado de E, queda determinado de manera u ´ nica el valor del producto ∆x ∆px . Solamente disminuyendo el valor de E es posible disminuir el valor de este producto; o sea que una disminuci´ on de ∆x implica un aumento en ∆px y viceversa. Seg´ un la desigualdad de Heisenberg para osciladores mec´anico-cu´ anticos: h ¯ ∆x ∆px ≥ (9.571) 2 se sigue entonces de (9.551) que E ≥ ¯hω/2. Si tomamos I igual a la constante de Planck, se sigue tambi´en de (9.551) que E = n¯hω. Estos resultados recuerdan a an´alogos resultados mec´anico-cu´ anticos. ∆x ∆px = IN =
10 La ecuaci´ on de Hamilton-Jacobi con variables de acci´ on-´ angulo Aqu´ı estudiaremos m´as en detalle el significado f´ısico de las soluciones de la ecuaci´on de Hamilton-Jacobi con ´enfasis en los sistemas que presentan movimientos multiperi´odicos. Se desarrollar´ a la teor´ıa hasta el punto en el cual se perciban claramente las diferencias y similitudes con la mec´anica c´ uantica, cuando se trate con sistemas at´omicos. Las soluciones y los m´etodos de soluci´on de la ecuaci´ on de Hamilton-Jacobi han merecido numerosos estudios. El m´etodo de separaci´on de variables permite en principio resolver cualquier problema integrable introduciendo las coordenadas adecuadas. Los modelos no integrables, como el famoso problema de los tres cuerpos, son objeto de muchas investigaciones en la actualidad. Un estudio matem´atico de los principales casos en que se resuelve la ecuaci´ on de Hamilton-Jacobi est´ a en la secci´on 27 del texto de (Gantmacher Op. cit.).
10.1.
Los invariantes adiab´ aticos
Desde cuando el f´ısico aleman Max Planck en 1899 descubri´ o que la absorci´ on y la emisi´ on de energ´ıa radiante por la materia no se producen en cantidades arbitrarias sino de una manera cuantizada, los f´ısicos han tratado de introducir las ideas c´ uanticas en la mec´anica cl´ asica. En 1913 Niels Bohr explic´o el espectro del hidr´ogeno con la mec´anica cl´ asica m´as dos suposiciones de tipo c´ uantico: que los electrones s´olo tienen ciertos movimientos peri´odicos (´ orbitas) estables y no un continuo de tales movimientos, y que pueden pasar entre dos ´ orbitas adyacentes por emitir o absorber un cuanto de luz. Los movimientos ligados de los sistemas cu´anticos aislados que son estables o estacionarios forman un conjunto discreto. Los dem´ as estados son inestables, aunque ligados, y forman un conjunto continuo; son estados no estacionarios. Desde entonces hasta la actualidad (y pasar´ a alg´ un tiempo hasta que la cuesti´on sea definitivamente resuelta), los f´ısicos t´eoricos investigan los movimientos estables que presentan los sistemas at´omicos; con ello se busca determinar la causa de que ciertos estados sean estables y los dem´ as sean inestables. A comienzos del siglo la cuesti´on de inter´es no era tanto las causas de 415
416 / Mec´ anica cl´ asica avanzada la cuantizaci´on de los sistemas at´omicos (lo cual se tom´o como un dato experimental) sino determinar cuales son las cantidades susceptibles de ser cuantizadas. Se hall´o que las cantidades a ser cuantizadas deben satisfacer los siguientes dos requisitos: pueden cambiar s´olo por m´ ultiplos enteros de la constante de Planck ¯h y deben permanecer absolutamente inalteradas cuando se someta el sistema a una influencia externa que no sea capaz de causar una alteraci´on de magnitud ¯h en esa cantidad. Tales cantidades se llaman invariantes adiab´ aticos y fueron extensivamente estudiados por P. Ehrenfest en los a˜ nos 1914-1923.1 Los invariantes adiab´aticos de la vieja teor´ıa c´ uantica coinciden con las llamadas variables de acci´on. Un invariante adiab´ atico para un sistema de un grado de libertad. Sea un sistema de un grado de libertad en un estado arbitrario de movimiento acotado con lo cual el movimiento adem´as ser´a peri´odico. Sea λ un par´ ametro caracter´ıstico de los efectos externos sobre el sistema; si λ cambia, cambian los efectos externos sobre el sistema con lo cual se realizar´a un trabajo y posiblemente cambie tambi´en la frecuencia de la oscilaci´ on adem´as de la energ´ıa total. Ciertamente la energ´ıa total depender´a del valor de λ siendo constante para cada valor que tenga λ: E = E(q, p, λ). Las expresiones para la energ´ıa total y el per´ıodo del movimiento son de la forma: 1 (10.1) E = a(q, λ) q˙2 + U (q, λ) 2 Z q2 √ 2a dq √ T = (10.2) E −U q1 donde q1 y q2 son las ra´ıces de la ecuaci´ on E = U (q, λ) para valores dados de E y λ. Puesto que E depende de λ, T depende de E y de λ. Si λ cambia con el tiempo, E depender´a del tiempo a trav´es de λ: ∂E ˙ λ E˙ = ∂λ
(10.3)
Se dice que el par´ ametro λ var´ıa adiab´aticamente si: λ λ˙ ≪ T
(10.4)
es decir, si λ var´ıa muy poco en el curso de un per´ıodo del movimiento del sistema. Un invariante adiab´atico es una cantidad que no cambia cuando el sistema se somete a una variaci´ on adiab´atica de λ. Sabemos que, en virtud de las ecuaciones de Hamilton: ∂H H˙ = ∂t
(10.5)
O sea que para un sistema conservativo como el que consideramos aqu´ı: ∂H ˙ ∂H λ = E˙ = ∂t ∂λ 1 El
(10.6)
tema contin´ ua estudi´ andose en la actualidad. V´ ease por ejemplo: K.P. Marzlin, B.C. Sanders, Physics review letters 93, 160408(2004). Tambi´ en http://xxx.lanl.gov/abs/quant-ph/0405059.
La ecuaci´ on de Hamilton-Jacobi con variables acci´on-´ angulo / 417 Como λ var´ıa muy poco en un per´ıodo del movimiento, podemos considerar que λ˙ tambi´en es constante. Entonces al promediar la ecuaci´ on (10.6) sobre un per´ıodo obtenemos: Z 1 T ∂H E˙ = λ˙ dt (10.7) T 0 ∂λ De acuerdo con una de las ecuaciones de Hamilton se cumple: dt =
dq ∂H/∂p
(10.8)
La ecuaci´ on (10.7) se puede entonces escribir como: I ∂H/∂λ dq ∂H/∂p (10.9) E˙ = λ˙ I 1 dq ∂H/∂p H donde denota la integral de l´ınea sobre la trayectoria de fases del sistema en un per´ıodo de movimiento. En un per´ıodo, por hip´otesis, λ cambia muy poco, por tanto E es constante, seg´ un (10.6). Como una trayectoria de fases se caracteriza por la relaci´on: p = p(q; E, λ)
(10.10)
donde E y λ son fijos, entonces p (o q) solo, es suficiente para especificar el estado. Sobre una trayectoria de fases dada C se cumple entonces que H(q, p, λ) = HC (p, λ), luego: dHc ∂Hc ∂Hc ∂p = + dλ ∂λ ∂p ∂λ
(10.11)
Como durante un per´ıodo E no cambia apreciablemente y HC = E se cumple aproximadamente que: ∂Hc ∂Hc /∂λ =− ∂p ∂p/∂λ
(10.12)
como por otra parte ∂HC /∂E = (∂HC /∂p)(∂p/∂E) = 1, cumple: 1 ∂Hc = ∂p ∂p/∂E Reemplazando a (10.12) y (10.13) en (10.9) obtenemos: I ∂p dq − ∂λ E˙ = λ˙ I ∂p dq ∂E La ecuaci´ on (10.14) se puede escribir en la forma: I ∂p ˙ ∂p ˙ E+ λ dq = 0 ∂E ∂λ
(10.13)
(10.14)
(10.15)
418 / Mec´ anica cl´ asica avanzada Dado que durante un per´ıodo E y λ permanecen pr´acticamente constantes, de (10.10) se sigue que: ∂p ∂p ˙ ∂p ˙ E+ λ = ∂t ∂E ∂λ
(10.16)
˙ con lo cual en vez de (10.15) podemos y podemos sin mayor error reemplazar a E˙ por E, escribir: I I d ∂p dq = 0 (λ˙ 2 ) ⇒ p dq = 0 + 0(λ˙ 2 ) (10.17) ∂t dt Se define la variable de acci´ on J como: I J = p dq
(10.18)
Entonces (10.17) nos dice que J˙ = 0, o sea que J es un invariante adiab´atico (una cantidad que no cambia cuando λ var´ıa adiab´aticamente). Concluimos que J depende de la energ´ıa del sistema pero var´ıa muy poco con λ. Esto permite calcular a partir de J la frecuencia del movimiento: I I I ∂p 1 ∂J = dq = dq = dt = T (10.19) ∂E ∂E ∂HC /∂p o sea que:
ν=
1 ∂J/∂E
(10.20)
La ecuaci´ on (10.18) tiene la siguiente interpretaci´ on geom´etrica: J es el valor del ´rea encerrada por la curva de fases que describe el sistema en un per´ıodo. La invariancia a adiab´atica de J permite concluir que una perturbaci´on al sistema que var´ıa lentamente con el tiempo puede producir una deformaci´on de la trayectoria de fases pero de tal manera que no se cambia el valor del ´area encerrada por esa curva. J tambi´en se puede escribir como una integral de superficie: Z J = dq dp (10.21) Ejemplo 10.1.1 Evaluar la variable de acci´on J para un oscilador arm´onico unidimensional. En este caso el hamiltoniano constante es: H=
p2 1 + mω 2 q 2 = E 2m 2
(10.22)
que puede escribirse en la forma: q2 p2 + =1 2mE 2E/(mω 2 )
(10.23)
La ecuaci´ on de Hamilton-Jacobi con variables acci´on-´ angulo / 419 on (10.23) define una elipse en el plano de fases cuyos semiejes son p La ecuaci´ y 2E/(mω 2 ). El valor de J es igual al ´area encerrada por la elipse, esto es: p √ E J = π ( 2mE) ( 2E/(mω 2 )) = 2π ω
√ 2mE
(10.24)
La invariancia adiab´atica de J significa en este caso que al variar lentamente los par´ ametros del oscilador (m y ω), la energ´ıa var´ıa de manera proporcional a la frecuencia ω. Ejemplo 10.1.2 Mostrar expl´ıcitamente la invariancia adiab´atica de J para un p´endulo simple sometido a un acortamiento o alargamiento adiab´atico de la cuerda, para peque˜ nas oscilaciones. En este caso el hamiltoniano, constante, es: H=
1 2 2 ml ϕ˙ + mgl(1 − cos ϕ) = E 2
(10.25)
para peque˜ nas oscilaciones: ϕ˙ 2 ϕ2 1 2 2 1 ml ϕ˙ + mgl ϕ2 = E ⇒ + =1 2 2 2 2E/(ml ) 2E/(mgl)
(10.26)
que es la ecuaci´ on de una elipse en el plano ϕ − ϕ, ˙ el ´area encerrada es:
p 2πE E 1 √ = 2π 2E/(mgl) = ω ml2 ml gl H Es claro que J = p dq est´ a dada tambi´en por la expresi´on (10.24): π
p
2E/(ml2 )
(10.27)
E ω
(10.28)
J = 2π
para probar la invariancia adiab´atica de J, calculemos el trabajo realizado al variar la longitud del hilo del p´endulo en una cantidad dl. Este trabajo es: dA = −mlϕ˙ 2 − mg cos ϕ dl (10.29)
en (10.29) el primer t´ermino representa el trabajo de la fuerza de la ligadura y el segundo el trabajo de la fuerza de gravedad. Para peque˜ nas oscilaciones (10.29) se puede escribir como: 1 (10.30) dA = −mg dl + mg ϕ2 − mlϕ˙ 2 dl 2 El primer t´ermino en (10.30), −mg dl, representa el trabajo hecho para subir la posici´on de equilibrio de la masa del p´endulo; y el otro t´ermino representa la energ´ıa comunicada a la oscilaci´ on, que llamaremos dE: 1 (10.31) mg ϕ2 − mlϕ˙ 2 dl dE = 2
420 / Mec´ anica cl´ asica avanzada Sabemos que para un valor dado de l los valores medios de las energ´ıas cin´etica y potencial son iguales, e iguales a la mitad de la energ´ıa total E (teorema del virial): 1 2 2 1 1 ml ϕ˙ = mgl ϕ2 = E 2 2 2
(10.32)
Comparando (10.32) y (10.31), al tomar el promedio temporal de dE, obtenemos que: E dl 2l
(10.33)
dω 1 dl =− ω 2 l
(10.34)
dE = −
p Como la frecuencia angular es ω = g/l, vemos que el cambio fraccional de ω es proporcional al cambio fraccional de l cuando la longitud del p´endulo se altera en dl:
Comparando a (10.33) y (10.34) obtenemos que: dω dE = E ω
(10.35)
Se sigue por integraci´ on de (10.35) que: J E = = Constante 2π ω
(10.36)
Argumentos similares se pueden usar cuando ω se var´ıa lentamente a causa de alguna otra influencia externa. Se us´o el car´ acter adiab´atico de la variaci´on en l, dl, al tomar en (10.31) el promedio temporal: se asumi´o que dl es pr´acticamente constante durante un per´ıodo de la oscilaci´on. Como el oscilador arm´onico del ejemplo de (10.22) equivale matem´aticamente a un p´endulo con una amplitud de oscilaci´on peque˜ na, se sigue que E/ω es constante en tal caso. Sin embargo, se puede mostrar que para otros sistemas de un grado de libertad, E/ω no es un invariante adiab´atico, aunque para tales sistemas habr´ a otros invariantes adiab´aticos.
10.2.
Los toroides invariantes
En la secci´ on 9.6 analizamos en detalle la soluci´on de las ecuaciones de movimiento de un sistema conservativo generalizado por el m´etodo de Hamilton-Jacobi. Esto nos condujo a la ecuaci´ on de Hamilton-Jacobi independiente del tiempo, ecuaciones (9.305) y siguientes del cap´ıtulo anterior. El resultado es que para tales sistemas es posible hallar una transformaci´ on can´onica generada por Σ, que permite expresar a (~q, p~) en funci´ on de (~q, ~p), dados por pν = αν (ν = 1, 2, ...l − 1), pl = −t + αl , q ν = βν (ν = 1, 2, ...l) donde αν y βν son 2l constantes y se exige que Bl = h. Si no se toma a h coincidiendo con una ~ se obtendr´ a la soluci´on en t´erminos de de las βν sino que se deja en general h = H(β) ~ ~q = ~γ t + α ~ ~ ~p = β, ~ donde α ~ y β son las constantes de integraci´ on y ~γ son funciones de β. El formalismo de las variables acci´on-´ angulo se caracteriza por:
La ecuaci´ on de Hamilton-Jacobi con variables acci´on-´ angulo / 421 (a) Es aplicable a sistemas conservativos generalizados. (b) Se define para sistemas ligados. (c) Se identifican las l constantes pν con l invariantes adiab´aticos del sistema. (d) Si existen las l constantes de movimiento se dice que el sistema es integrable. Los sistemas integrables se caracterizan por poseer un n´ umero de constantes de movimiento uniformes igual al n´ umero de grados de libertad:2 en un sistema no integrable el n´ umero de constantes de movimiento uniformes es menor que l, y la trayectoria f´asica cubrir´a (total o parcialmente) regiones de m´as de l dimensiones en el espacio f´asico. Veremos que si el sistema posee m´as constantes de movimiento uniformes que el n´ umero de grados de libertad, entonces la trayectoria f´asica cubre regiones de dimensi´ on menor que l y adem´as la separaci´on de variables es posible en m´as de un sistema de coordenadas. Las ecuaciones de movimiento de un sistema hamiltoniano de l grados de libertad son de la forma: x˙ i = fi (x1 , x2 , ...x2l , t) ;
i = 1, 2, ..,2l
(10.37)
Una integral primera del sistema (10.37) es una funci´ on constante que se obtiene a partir del mismo: d Φ(x1 , x2 , ...x2l , t) = 0 (10.38) dt La integral primera Φ = C es una superficie 2l dimensional en el espacio de 2l + 1 dimensiones, de coordenadas x1 , x2 , ...x2l , t, que posee la propiedad de que cada curva integral que tiene un punto com´ un con esta superficie est´ a enteramente contenida en ella. Si se han hallado k integrales primeras: Φi (x1 , x2 , ...x2l , t) = Ci ;
i = 1, 2, ...k
(10.39)
Y si todas estas integrales son independientes, o sea, si al menos un determinante: Φ1 , Φ2 , ...Φk 6= 0 (10.40) J xj1 , xj2 , ...xjk donde xj1 , xj2 , ...xjk son k funciones cualesquiera de las x1 , x2 , ...x2l , entonces a partir de las ecuaciones (10.39) se pueden expresar k funciones de t desconocidas xj1 , xj2 , ...xjk en funci´ on de las dem´ as y sustituy´endolas en (10.37), reducir el problema a la integraci´ on de un sistema de ecuaciones con menos inc´ ognitas que 2l. Si k = 2l y todas las integrales son independientes, entonces (10.39) es un sistema de 2l ecuaciones algebraicas con las 2l inc´ ognitas xi , que puede resolverse en el caso en que todas las funciones Φi sean uniformes. Sucede a veces que entre las Φi hay algunas que son funciones multiformes del estado del sistema y entonces las funciones Φ1 , Φ2 , ...Φ2l no determinan un´ıvocamente el estado cuando toman los valores constantes C1 , C2 , ...C2l . Para que un sistema de ecuaciones diferenciales (10.37) sea integrable es suficiente, pues, que existan l integrales primeras uniformes. Cuando el sistema permite la separaci´on de variables en la forma: Z Fi (xi ) dxi = t; i = 1, 2, ..,2l (10.41) 2 Es
posible que un sistema sea integrable mas no separable, es decir, que no se puede desacoplar las ecuaciones de movimiento.
422 / Mec´ anica cl´ asica avanzada se dice que el sistema se integra por cuadraturas. Teorema de Liouville sobre los sistemas integrables. Recordemos que una funci´ on Φ es una integral primera de un sistema de hamiltoniano H si su corchete de Poisson con H es nulo: [H, Φ] = 0
(10.42)
Estamos excluyendo la constante t0 , conjugada can´onica de H, y funciones de t0 . Dos funciones F1 y F2 del estado de un sistema hamiltoniano est´ an en involuci´ on si su corchete de Poisson es nulo. Liouville demostr´ o que si en un sistema de l grados de libertad se conocen l integrales primeras independientes y uniformes en involuci´ on entonces ese sistema se integra por cuadraturas. El enunciado exacto del teorema es: sean l funciones en involuci´ on: Φ1 , Φ2 , ...Φl ;
[Φµ , Φν ] = 0 ;
µ, ν = 1, 2, ...l
(10.43)
en un espacio f´ asico de dimensi´ on 2l. Consideremos los subespacios (hipersuperficies 2l − 1 dimensionales): Sν = {(q, p) : Φν (q, p) = Cν } ;
ν = 1, 2, ...l
(10.44)
y el producto directo de los mismos: Mc = {(q, p) : Φν = Cν ; ν = 1, 2, ...l}
(10.45)
Suponemos que sobre Mc las l funciones Φν son independientes (esto es, que los l gradientes de las hipersuperficies Sν son linealmente independientes en cada punto de Mc ). Entonces, recordando el teorema sobre simetr´ıas y leyes de conservaci´ on de la secci´ on 9.8, como los Φν son generadores infinitesimales de las transformaciones can´onicas que dejan invariante a H, se cumple que: (i) Mc es un subespacio invariante bajo cada una de las transformaciones can´onicas infinitesimales generadas por Φ1 = H, Φ2 , ...Φl . (ii) Si las funciones Φν son continuas y uniformes y tales que (q) y (p) siempre toman valores finitos, entonces el subespacio Mc corresponde con un toroide de dimensi´ on l: T l = {ϕ1 , ϕ2 , ...ϕl } mod 2π
(10.46)
donde ϕ1 , ϕ2 , ...ϕl son coordenadas angulares sobre el toroide invariante T l . (iii) El hamiltoniano H genera sobre Mc un movimiento que se denomina cuasiperi´ odico, definido en t´erminos de las coordenadas angulares ϕ ~ = (ϕ1 , ϕ2 , ...ϕl ) sobre el toroide invariante T l : d ϕ ~=~ ω; dt
~ ω ~ =ω ~ (C)
(10.47)
(iv) Las ecuaciones can´onicas de Hamilton se integran por cuadraturas.3 3 Una
demostraci´ on rigurosa del teorema puede verse en el libro de V. Arnold, Les m´ ethodes mat´ ematiques de la mec´ anique classique, Mir, Mosc´ u, 1976.
La ecuaci´ on de Hamilton-Jacobi con variables acci´on-´ angulo / 423 Ejemplo 10.2.1 Aplicar el teorema de Liouville al estudio del oscilador bidimansional. Seg´ un el teorema de Liouville sobre sistemas integrables, si en un sistema can´onico de dos grados de libertad se conoce una integral primera F que no depende de H, entonces el sistema se integra por cuadraturas; el subespacio definido por H = h y F = f siendo f y h dos constantes, es un toro invariante sobre el cual el movimiento es cuasiperi´odico. Para precisar, consideremos un oscilador bidimensional descrito por el hamiltoniano: H=
p2y 1 p2x + + m(ωx2 x2 + ωy2 y 2 ) 2m 2m 2
(10.48)
El sistema de ecuaciones diferenciales (10.37) para este caso es: x˙ =
px ; m
y˙ =
p˙ x = −mωx2 x ;
py m
(10.49)
p˙ y = −mωy2 y
Es f´ acil ver que: px py p˙x + mωx2 x x˙ = p˙ y + mωy2 y y˙ = 0 m m
(10.50)
Con lo cual se obtiene que las siguientes son integrales primeras: 1 p2x + mωx2 x = E1 ; 2m 2
p2y 1 + mωy2 y 2 = E2 2m 2
(10.51)
La hipersuperficie bidimensional ME1 E2 tiene intersecciones con los planos de fase (x, px ) y (y, py ) dadas por las elipses (10.51). Si se quiere, pueden tomarse como integrales primeras a H y una de las dos (10.51); dado que H = E1 + E2 . La hipersuperficie H = h es una esfera (o mejor elipsoide) en el espacio f´asico; tal hipersuperficie es de dimensi´ on 3, en tanto que H1 = E1 es unidimensional siendo la hipersuperficie MEE1 bidimensional. El producto directo de las elipses definidas por (10.51) es un toroide de dimensi´ on 2, en tanto que los puntos del producto directo de las regiones H = h y H1 = E1 constituyen una superficie bidimensional, que se puede hacer corresponder topol´ogicamente con un toroide bidimensional (v´ease figura 10.1). El movimiento cuasiperi´odico generado por H sobre ME1 E2 se define en t´erminos de las coordenadas angulares ϕ ~ = (ϕ1 , ϕ2 ) de los puntos de la superficie de un toro que se mueven uniformemente sobre las circunferencias ϕ1 = Constante y ϕ2 = Constante, con frecuencias angulares constantes que dependen de los valores de E1 y E2 : d~ ϕ =~ ω(E1 , E2 ) dt
(10.52)
Si ω1 y ω2 son inconmensurables, entonces la trayectoria de fases llena totalmente el toro cuando t → ∞, en tanto que cuando ω1 y ω2 son conmensurables la trayectoria de fases es cerrada y por lo tanto ocupa una regi´on de dimensi´ on menor a la del toro, es
424 / Mec´ anica cl´ asica avanzada
ϕ2 ϕ1
Figura 10.1 Toroide generado por H.
decir, unidimensional. Para que esto ocurra es necesario que exista una nueva constante de movimiento adem´as de E1 y E2 . Por ejemplo, cuando ωx = ωy , existe otra constante de movimiento relacionada con la degeneraci´ on, que es el momento angular: A = xpy − ypx
(10.53)
Cuando ωy = 2ωx la constante es: A = (m2 ωx2 x2 − p2x ) y + xpx py
(10.54)
y cuando ωx = 2ωy , es constante: A = (m2 ωy2 y 2 − p2y ) x + ypx py
(10.55)
Para el caso ωx = ωy es f´acil ver que hay otra constante dada por: B = px py + m2 ω 2 xy
(10.56)
y que se cumple: [E2 , B] = −mω 2 A ;
[E2 , A] =
B m
(10.57)
o sea que E2 con B1 y E2 con A no est´ an en involuci´ on. Tampoco A y B est´ an en involuci´ on puesto que su corchete de Poisson vale E2 − E1 . Pero a´ un es posible formar una combinaci´ on lineal de A y B que est´e en involuci´ on con E1 y con E2 : C = B + mω tan(ϕ10 − ϕ20 ) A
(10.58)
donde ϕ10 − ϕ20 es la diferencia de fase de los dos movimientos oscilatorios. Resultados an´alogos se esperan cuando las frecuencias satisfacen la relaci´on nωx = mωy donde n y m son n´ umeros enteros.
La ecuaci´ on de Hamilton-Jacobi con variables acci´on-´ angulo / 425 Vectores tangentes a Mc . Como las l funciones Φν son independientes, tambi´en ser´an linealmente independientes los l vectores gradientes 2l-dimensionales, perpendicu~ν . lares a las superficies Φν = Cν , que llamaremos V ∂Φν ∂Φν ∂Φν V~ν = (10.59) , , ... ∂q1 ∂q2 ∂pl ~ν no tiene componentes a lo largo de un vector E ˜V ~µ , donde la matriz Un vector V ˜ simplicial E fue definida en la secci´ on 9.9. En efecto: ∂Φµ ∂~q ˜ V~µ = ∂Φν , ∂Φν E˜ (10.60) V~ν · E = [Φµ , Φν ] = 0 ∂~q ∂~ p ∂Φµ ∂~p
Entonces concluimos que sobre el subespacio l-dimensional Mc existen l vectores linealmente independientes, tangentes a Mc en cada punto. En efecto, los V~ν son lineal˜ son todos diferentes se concluye que mente independientes, y como los autovalores de E ˜ ~ los E Vν son linealmente independientes. Se sigue entonces que en cada punto de Mc un vector tangente (por ejemplo la direcci´ on de la trayectoria de fases en ese punto) puede expresarse como combinaci´ on ˜V ~ν (ν = 1, 2, ...l). lineal de los l vectores E Si se realiza en un punto de Mc la transformaci´ on can´onica infinitesimal generada por Φν , de acuerdo con la f´ ormula (9.349), el cambio experimentado por una variable din´amica f est´ a dado por: ∂f ∂f ˜V ~ν ∂ν f = ǫ [f, Φν ] = −ǫ ·E (10.61) , ∂~q ∂~p Se sigue entonces que el cambio 1 0 0 0 1 0 ~q ∂ν = −ǫ . . . .. .. .. p ~ 0 0 0
experimentado por el vector de estado (~q, ~p) es: . . . 0 . . . 0 ˜~ ˜ V~ν Vν = −ǫE (10.62) .. .. .. .. E . . . . . . . 1
O sea que los desplazamientos producidos por cada una de las transformaciones can´onicas infinitesimales generadas por Φ1 , Φ2 , ...Φl est´ an contenidos totalmente dentro del subespacio Mc . Con esto queda demostrada la proposici´on (i) del teorema de Liouville. En particular, para cuando Φ1 = H se tiene que: q ~ −∂H/∂~p ∂H ⇒ ~q˙ = ∂H ; ∂ = −ǫ ~p˙ = − (10.63) ∂~p ∂~q p~ ∂H/∂~q
426 / Mec´ anica cl´ asica avanzada como debe ser. Hemos mostrado que cualquier desplazamiento sobre Mc se puede obtener por medio de las l transformaciones can´onicas asociadas a las integrales primeras Φν en involuci´ on. Como en cada punto de Mc cada uno de los vectores tiene una direcci´ on bien definida, concluimos que a cada integral primera Φν se le puede asociar una familia de trayectorias “paralelas” sobre la superficie de Mc y que en consecuencia a las l integrales primeras en involuci´ on Φν se les puede asociar un sistema de coordenadas curvil´ıneas sobre Mc . En efecto, los l desplazamientos finitos asociados a los l grupos de transformaciones correspondientes a las Φν se pueden describir mediante l par´ ametros reales. Si fijamos sobre Mc un punto (~q, p~) ≡ x0 , entonces cualquier punto de Mc se puede obtener de ´este por acci´on de los l grupos de transformaciones asociados a Φ1 , Φ2 , ...Φl : g(~r)x0 ≡ g1 (r1 ) g2 (r2 ) ...gl (rl )x0 = xr1 , r2 , ...rl ∈ Mc
(10.64)
donde gν (rν ) es la transformaci´ on finita asociada a Φν siendo rν el par´ ametro. Entonces los vectores ~r ≡ (r1 , r2 , ...rl ) definen un´ıvocamente los puntos de Mc . Correspondencia entre Mc y un toroide de dimensi´ on l. Por hip´otesis la regi´ on Mc es acotada, ya que estamos tratando con sistemas ligados. Como consecuencia de esto, los vectores ~r = (r1 , r2 , ...rl ) que sirven para caracterizar los puntos de Mc tienen componentes acotadas. Para precisar, llamemos Rl al espacio eucl´ıdeo l-dimensional en el cual est´ an definidos los vectores ~r; en consecuencia, la regi´on del espacio f´asico Mc est´ a asociada a un subespacio l-dimensional acotado de Rl mediante la f´ormula (10.64). Como la regi´ on Mc es acotada, ciertamente existen transformaciones g(~r) que retornan un punto arbitrario x0 de Mc en s´ı mismo: g(~r)x0 = x0
(10.65)
Podemos, por ejemplo, definir l transformaciones independientes que retornen a x0 en s´ı mismo de la siguiente manera: g1 (1)x0 = x0 ;
g2 (1)x0 = x0 ;
...gl (1)x0 = x0
(10.66)
Es decir, asociar el intervalo (0, 1) a cada una de las l´ıneas cerradas que se obtienen por desplazar el punto x0 mediante las transformaciones gν (rν ). Es claro entonces que gν (mν )x0 = x0 donde mν es un n´ umero entero. Por tanto podemos caracterizar el conjunto de todas las transformaciones de la forma (10.65) mediante los vectores enteros: ~r = (m1 , m2 , ...ml ) ;
mν = ... − 2, −1, 0, 1, ...
(10.67)
A su vez el intervalo (0, 1) corresponde con el intervalo (0, 2π), de modo que podemos hacer corresponder a la regi´on Mc un toroide de dimensi´ on l, T l , definido como el producto cartesiano de l c´ırculos, siendo definidos los puntos de los l c´ırculos mediante coordenadas angulares ϕν mod 2π: T l = {(ϕ1 , ϕ2 , ...ϕl )} ;
ϕ ~ mod 2π
(10.68)
La ecuaci´ on de Hamilton-Jacobi con variables acci´on-´ angulo / 427 Existe una completa correspondencia entre T l y la regi´on de Rl que representa los puntos de Mc . Por tanto es posible asociar a los puntos de Mc un toroide de dimensi´ on l. Toda la argumentaci´on depende de la existencia de transformaciones sobre Mc de la forma (10.65) para cualquier punto de Mc . Existencia en Mc de movimientos cuasiperi´ odicos. La transformaci´ on can´onica generada por H tiene por par´ ametro a t. Entonces la correspondencia entre Mc y T l permite asociar a cada valor de t un punto (ϕ1 , ϕ2 , ...ϕl ) mod 2π sobre T l . El movimiento generado por H en Mc se presenta uniforme sobre T l debido a que una variaci´on ∆t en el par´ ametro t se traduce en variaciones ∆ϕ1 , ∆ϕ2 , ...∆ϕl en las coordenadas sobre T l . Como ciertamente la variaci´ on del par´ ametro t es uniforme, de igual manera ser´an uniformes las variaciones en las coordenadas angulares sobre T l . En consecuencia: ϕ˙ ν = ων ;
ων = ων (~c) ;
ϕ ~ (t) = ϕ ~ (0) + ~ω t
(10.69)
Hemos justificado las tres primeras proposiciones del teorema de Liouville. Las superficies de secci´ on de Poincar´ e. Asumamos que el espacio de fases es 4-dimensional (sistema aut´ onomo de dos grados de libertad). Escojamos una superficie bidimensional, que puede o no coincidir con uno de los planos de fase; para precisar tomemos el plano x − px en un valor de y determinado. Cada vez que la trayectoria de fases cruza el plano x − px en una direcci´ on dada, un punto en el valor de x y px es marcado sobre la superficie. Despu´es de muchos ciclos de la trayectoria, en el plano quedar´a formada una figura de puntos. Si tomamos como referencia el oscilador arm´onico bidimensional (ejemplo 10.2.1), la figura tendr´a forma el´ıptica (v´ease figuras 10.2 y 10.3). Cada elipse corresponde a una trayectoria. Un comportamiento similar ocurre en las intersecciones con el plano x = 0. Los planos x − px y y − py son ejemplos de superficies de secci´ on y las figuras de puntos formados permiten obtener conclusiones acerca de las frecuencias del movimiento. Si las frecuencias son conmensurables, las intersecciones de la trayectoria con las superficies de secci´ on se repiten debido a que la trayectoria es cerrada, en caso contrario, las intersecciones cuando t → ∞ forman una curva continua sobre la superficie de secci´ on, que no es otra cosa que la intersecci´on del toroide invariante con la superficie de secci´ on. Que las intersecciones de la trayectoria con una superficie de secci´on est´ an localizadas sobre una curva u ´nica es una consecuencia de la existencia de una constante de movimiento adem´as de la energ´ıa. En efecto la conservaci´ on de la energ´ıa, H(x, y, px , py ) = E
(10.70)
permite expresar una variable en t´erminos de las otras tres, py = py (x, y, px ). Entonces es suficiente considerar la proyecci´on de la trayectoria sobre el volumen tridimensional (x, y, px ). Si hay una constante de movimiento adem´as de H, I(x, y, px , py ) = C
(10.71)
entonces (10.70) y (10.71) se pueden combinar para darnos: px = px (x, y)
(10.72)
428 / Mec´ anica cl´ asica avanzada px
0
0
x
Figura 10.2 Superficies de secci´on de Poincar´e en el plano x − px py
0
0
y
Figura 10.3 Superficies de secci´on de Poincar´e en el plano y − py O sea que las intersecciones sucesivas de la trayectoria con la superficie de secci´ on y = 0 deben estar sobre la curva u ´nica px = px (x, 0). Consideremos ahora el toroide asociado a las constantes de movimiento E y C, MEC . Las coordenadas angulares sobre MEC son ϕ1 y ϕ2 siendo ω1 y ω2 las frecuencias correspondientes. Ciertamente la relaci´on de frecuencias es funci´ on de E y C: α(E, C) =
ω1 (E, C) ω2 (E, C)
(10.73)
Para α = r/S, con r y S enteros, la trayectoria sobre el toro es peri´odica, cerr´andose al completarse r revoluciones en ϕ1 y S revoluciones en ϕ2 . En la superficie de secci´ on ϕ2 = Constante habr´ an S puntos fijos sobre una circunferencia de radio R que depende solamente de E y C. Las sucesivas intersecciones est´ an separadas por un tiempo
La ecuaci´ on de Hamilton-Jacobi con variables acci´on-´ angulo / 429 ∆t = 2π/ω2 . Durante este intervalo, ϕ1 avanza por ω1 ∆t = 2πα. La aplicaci´ on “twist” de Moser. Las ecuaciones que describen el movimiento de la N -´esima a la (N +1)-´esima intersecci´on de la trayectoria con la superficie de secci´ on son: RN +1 = RN ;
ϕN +1 = ϕN + 2πα
(10.74)
La ecuaci´ on (10.74) constituye una aplicaci´on (o mapeo discreto) de los puntos de la superficie de secci´ on en ella misma.
10.3.
Las variables acci´ on-´ angulo
~ ϕ Mostremos que es posible definir una transformaci´ on can´onica (~q, p~) → (I, ~ ) de ~ que son los manera tal que hay l integrales primeras Φν dependientes u ´nicamente de I, momentos can´ onicamente conjugados de las coordenadas angulares sobre el toroide T l correspondiente a Mc . ~ son coordenadas de los puntos de Mc en el espacio f´asico 2lCiertamente (~ ϕ, Φ) dimensional y satisfacen las ecuaciones direrenciales ordinarias siguientes: ~ dΦ d~ ϕ ~ = 0; =ω ~ (Φ) dt dt que se integran inmediatamente para darnos: ~ ~ ~ t Φ(t) = Φ(0) ; ϕ ~ (t) = ϕ ~ (0) + ~ω Φ(0)
(10.75)
(10.76)
~ no son necesariamente can´onicas, es posible construir l Aunque las variables (~ ϕ, Φ) ~ tales que (I, ~ ϕ funciones de las Φν , que llamaremos Iν = Iν (Φ), ~ ) sean variables can´onicas. Las Iν , son llamadas las variables de acci´ on y junto con las variables angulares ϕν forman en la vecindad de Mc un sistema de variables can´onicas acci´ on-´ angulo. Las cantidades Iν son integrales primeras del sistema de hamiltoniano H = Φ1 puesto que son funciones de integrales primeras. A su vez, las Φν pueden expresarse en funci´ on de las Iν . Entonces en las variables acci´on-´ angulo las ecuaciones can´onicas con hamiltoniano que s´olo depende de los “momentos” can´ onicos, son: ∂H dI~ =− = 0; dt ∂ϕ ~
d~ ϕ ∂H ~ = ~ω (I) (10.77) = dt ∂ I~ Las funciones ων est´ an restringidas por la condici´on que resulta de la continuidad ~ de la funci´ on H(I): ∂2H ∂2H ∂ων ∂ωµ = ⇒ = ∂Iν ∂Iµ ∂Iµ ∂Iν ∂Iµ ∂Iν
(10.78)
Variables acci´ on ´ angulo para l = 1. Debemos encontrar una transformaci´ on can´onica (q, p) → (I, ϕ) que satisfaga las dos condiciones siguientes: I dϕ = 2π (10.79) I = I(h) y Mh
430 / Mec´ anica cl´ asica avanzada En este caso el “toro” es una l´ınea cerrada. Es claro que la funci´on generatriz del tipo F2 para esta transformaci´ on es Σ(I, q), que satisface: p= H
∂Σ ; ∂q ∂Σ ,q ∂q
ϕ=
∂Σ ∂I
= h(I)
(10.80) (10.81)
siendo H(p, q) = h(I) el hamiltoniano del sistema. Como la relaci´on h(I) es biun´ıvoca se sigue que cada curva Mh est´ a definida por un valor de I. Sobre una curva definida h por un valor de I, se sigue de (10.80) que: dΣ|I=Constante = p dq En la vecindad de un punto q0 la acci´on vale:4 Z q p dq = Area Σ(I, q) =
(10.82)
(10.83)
q0
La segunda condici´on en (10.79) depende del comportamiento global de Σ(I, q). La funci´ on Σ no es uniforme pues al dar un ciclo completo sobre la curva Mh cambia su valor por una constante igual al ´area encerrada por la curva. Esto no afecta el valor de ∂Σ/∂q pero s´ı el de ϕ = ∂Σ/∂I puesto que el ´area depende de I. Si llamamos ∆Σ(I) al ´ area, I p dq (10.84) ∆Σ(I) = Mh
Entonces (10.80) define a ϕ con la indeterminaci´on de un m´ ultiplo entero de d∆Σ/dI. Para que se satisfaga la segunda condici´on de (10.79) es necesario entonces que: d∆Σ(I) ∆Σ A = 2π ⇒ I = = dI 2π 2π o sea que I debe valer: I 1 I= p dq 2π Mh
(10.85)
(10.86)
Si el ´ area A depende de h, entonces existe la funci´ on h(I) inversa de I(h). El per´ıodo del movimiento sobre la curva cerrada Mh en el plano de fases (q, p) est´ a dado por: T =
dA(h) dh
(10.87)
Hemos demostrado adem´as que la variable de acci´on es un invariante adiab´ atico, de acuerdo con la definici´on dada por (10.18). 4 Esta
integral de l´ınea ciertamente est´ a sobre la trayectoria del sistema, pero no est´ a evaluada siguiendo el movimiento del sistema: es una propiedad intr´ınseca de los puntos q y q0 del “toro”.
La ecuaci´ on de Hamilton-Jacobi con variables acci´on-´ angulo / 431 Ejemplo 10.3.1 Resolver las ecuaciones de movimiento para el oscilador arm´onico unidimensional del ejemplo 10.1.1 usando las variables acci´on-´ angulo. ω0 ≡
De acuerdo con el ejemplo 10.1.1, para un oscilador arm´onico de constante k, con p k/m el ´ area encerrada por la elipse definida por H = E es: A=
E 2πE ⇒ I= ω0 ω0
(10.88)
La frecuencia del movimiento es entonces: ω=
∂E = ω0 ∂I
(10.89)
que en este caso particular resulta independiente del valor de I. Las f´ ormulas (10.80) permiten resolver las ecuaciones de movimiento usando el formalismo de las variables acci´on-´ angulo. En efecto: Z qq Z q 2mE − m2 ω02 q 2 dq p dq = Σ(I, q) = (10.90) q0
q0
entonces: ϕ=
∂Σ = ∂I
Z
q
q0
r
dq = sen−1 2I − q2 mω0
r
mω0 q 2I
lo cual nos dice que: r r 2I 2I q= sen ϕ = sen (ϕ0 + ω0 t) mω0 mω0
(10.91)
(10.92)
donde hemos absorbido en ϕ la constante de integraci´ on de (10.91). Resulta que la variable angular ϕ es la fase de las oscilaciones. Ejemplo 10.3.2 Aplicar el formalismo de las variables acci´on-´ angulo para hallar la soluci´on a las ecuaciones de movimiento del p´endulo plano y realizar un estudio del espacio f´asico correspondiente. Las ecuaciones de movimiento son: p˙ = −F sen θ ;
θ˙ = Gp
(10.93)
donde F = mgL, G = 1/(mL2 ) siendo mg la fuerza gravitacional, L la longitud del p´endulo, θ el ´ angulo respecto a la vertical y p el momento angular conjugado a θ. El hamiltoniano es: H=
1 2 Gp − F cos θ = E 2
(10.94)
El problema es completamente separable, como ocurre siempre cuando hay un grado de libertad. Una descripci´ on cualitativa del movimiento se obtiene a partir de un diagrama de energ´ıa y otro de las trayectorias de fase (v´ease figura 10.4). F es el mayor
432 / Mec´ anica cl´ asica avanzada valor de la energ´ıa potencial. Si E > F , entonces p es siempre diferente de cero y el movimiento es no acotado en θ (rotaci´ on). Para E < F , el movimiento es acotado (libraci´on). Para E = F , tenemos el movimiento separatriz, en el cual el per´ıodo de oscilaci´on se hace infinito. Hay dos puntos singulares en p = 0: el origen en θ = 0, que es estable o punto singular el´ıptico; y la intersecci´on de las dos ramas de la separatriz en θ = ±π, que es inestable o punto singular hiperb´ olico. Una trayectoria de fases cerca a un punto singular el´ıptico permanece en su vencindad, en tanto que una trayectoria cerca a un punto hiperb´ olico diverge de ´el. El per´ıodo est´ a dado por: r I dθ 1 √ T = (10.95) 2G E + F cos θ Sobre la separatriz vemos de (10.93) que la fuerza restauradora y la velocidad son cero en θ = π, de modo que T es infinito.
p Punto elíptico
Rot. Sep. Lib.
E>F E=F E
–2π
–π
0
π
2π
θ
Punto hiperbólico
Figura 10.4 Curvas de fase para el p´endulo Transformemos ahora el hamiltoniano a variables acci´on ´angulo, usando la definici´ on (10.86): r Z 2 θmax 2 (E + F cos θ) dθ (10.96) I(E) = π 0 G y las expresiones (10.80) y (10.83): Z 1 dE θ ∂Σ dα r = φ(θ, E) = ∂I G dI 0 2 (E + F cos α) G
(10.97)
La ecuaci´ on de Hamilton-Jacobi con variables acci´on-´ angulo / 433 donde θmax = π/2 para rotaci´on (E > F ) y cos θm´ax = −H/F para libraci´ on (E < F ). El nuevo hamiltoniano se obtiene notando que H = H = E, con lo cual (10.96) permite en principio expresar a E en funci´ on de I. En (10.79) se supone que Mc representa una l´ınea cerrada. Sin embargo la definici´on es posible ampliarla para incluir no s´olo libraci´ on sino rotaci´on. Si en (10.96) y (10.97) efectuamos el cambio de variable siguiente: s 1 E θ 1+ sen η = sen (10.98) 2 F 2 obtenemos: I= y,
8 π
r
E(k) − (1 − k 2 )K(k) , k < 1 F G 1 kE(k −1 ) , k>1 2
F (η, k) /K(k) , k<1 π ϕ= 2 2F (η/2, k −1) /K(k −1 ) , k > 1
(10.99)
(10.100)
siendo F (η, k) y E(η, k) las integrales el´ıpticas incompletas de primera y segunda especie respectivamente, en tanto que K(k) = F (π/2, k) y E(k) = E(π/2, k) son las integrales el´ıpticas completas de primera y segunda especie (v´ease secci´ on 8.4). Z η dξ p = sen−1 (sen η) F (η, k) = 2 2 1 − k sen ξ 0 (10.101) Z ηp E(η, k) = 1 − k 2 sen2 ξ dξ 0
k est´ a dada por:
E (10.102) F y es una medida de la energ´ıa normalizada del oscilador. k = 1 cuando E = 1 (la energ´ıa de la separatriz) y k < 1 para libraci´ on y k > 1 para rotaci´on. De (10.95) obtenemos para la frecuencia normalizada: 1/K(k) , k<1 ω(k) π = (10.103) ω0 2 2k/K(k −1 ) , k > 1 √ donde ω0 = F G es la frecuencia angular para el movimiento linealizado alrededor del punto singular el´ıptico. El valor asint´ otico de K cerca a k = 1 nos da una frecuencia normalizada cerca a la separatriz: (π/2)/ln 4(1 − k 2 )−1/2 , k < 1 ω = (10.104) l´ım k→1 ω0 π/2 ln 4(k 2 − 1)−1/2 , k>1 2k 2 = 1 +
que tiende a cero cuando k tiende a 1.
434 / Mec´ anica cl´ asica avanzada Ejercicio 10.3.1 Mostrar que para la trayectoria separatriz se cumple: p=±
2ω0 θ cos ; G 2
θ = 4tan−1 (eω0 t ) − π
(10.105)
Variables acci´ on ´ angulo para l grados de libertad. En el caso unidimensional, donde el toroide invariante se reduce a una l´ınea, la integral de l´ınea en (10.86) coincide con la trayectoria. En el caso l-dimensional esta coincidencia no es necesaria. Sean γ1 , γ2 , ...γl , l l´ıneas cerradas sobre el toroide Mc , topol´ogicamente equivalentes a circunferencias. Sobre cada l´ınea especificamos un punto mediante una coordenada ϕν que en un circuito cerrado se aumenta por el valor 2π. Los γν no coinciden necesariamente con trayectorias, que seg´ un veremos en general no son cerradas; es decir, en el caso general ninguna de las l´ıneas γν coincide con la proyecci´on de la trayectoria de fases del sistema sobre el plano qν − pν . Entonces definimos la Iν por: 1 Iν = 2π
Z
l Z 1 X p~ · d~q = pν dqµ 2π µ=1 γµ γν
(10.106)
Consideramos sobre Mc un “tubo de caracter´ısticas” que pasan por los puntos de γν en un tiempo dado (v´ease figura 10.5). En un tiempo posterior t′ los puntos del tubo de caracter´ısticas que en t estaban sobre γν pasar´ an a formar un contorno cerrado diferente γν′ . En la secci´ on 9.4 se demostr´ o que la integral de Poincar´e I1 no cambia de valor al ser evaluada sobre contornos que envuelven el mismo tubo de caracter´ısticas y tales que los puntos de dichos contornos representen estados simult´ aneos.
γν
γ′ν
Figura 10.5 Tubo de caracter´ısticas sobre el toroide Se sigue entonces en virtud de la invariancia de la integral de Poincar´e que: Z Z p~ · d~q = ~p · d~q (10.107) γν
γν′
Se sigue de (10.106) que el valor de la variable de acci´on Iν no var´ıa al deformar la curva cerrada γν . De la topolog´ıa de un toroide se sigue que no es posible por deformaci´on hacer coincidir una curva γµ con otra γν independiente, o sea que la topolog´ıa del toroide determina de manera u ´nica los l n´ umeros I1 , I2 , ...Il definidos por (10.106).
La ecuaci´ on de Hamilton-Jacobi con variables acci´on-´ angulo / 435 ~ ϕ Como (Φ, ~ ) son las coordenadas de los puntos de la vecindad de Mc , entonces si las Iν son independientes, o sea si I1 , I2 , ...Il J 6= 0 (10.108) C1 , C2 , ...Cl entonces en la vecindad del toroide se pueden tomar como coordenadas las variables ~ ϕ). (I, De acuerdo con el m´etodo de Hamilton-Jacobi, la siguiente es la funci´ on generatriz ~ ϕ de la transformaci´ on can´ onica (~ q, p ~) → (I, ~) 5 ~ ~ Σ(I, q) =
Z
q ~
q ~0
~ ~ p~(I, q ) · d~q
(10.109)
de acuerdo con las f´ ormulas: p~ =
∂Σ ; ∂~q
ϕ ~=
∂Σ ∂ I~
(10.110)
~ ~q), la cual en principio Como sabemos, (10.109) no permite evaluar la funci´ on Σ(I, se obtiene resolviendo la ecuaci´ on de Hamilton-Jacobi independiente del tiempo: ∂Σ ~ ,~ q = h(I) (10.111) H ∂~q Queda claro que el sistema es integrable si es posible encontrar l contornos cerrados independientes tales que existen las l cantidades I1 , I2 , ...Il , lo cual es posible independientemente de poder resolver la ecuaci´ on (10.111) por separaci´ on de variables. La funci´ on Σ es multivaluada sobre Mc . El cambio experimentado al realizarse un circuito sobre una l´ınea γν es igual a: I dΣ = 2πIν (10.112) ∆ν Σ = γν
Sin embargo en la vecindad de un punto ~q0 siempre es posible definir una funci´ on un´ıvoca que especifica la transformaci´ on can´onica. Como en el caso unidimensional, la no uniformidad de Σ se traduce en la no uniformidad de las variables angulares. En efecto el cambio en la variable angular ϕν al realizarse un circuito sobre la l´ınea γµ est´ a dado por: ∆µ ϕν = ∆µ
∂Σ ∂ = ∆µ Σ = 2πδµν ∂Iν ∂Iν
(10.113)
Por otra parte, las variables de acci´on est´ an indeterminadas por una constante que no depende de las Iν , como se puede ver en (10.85), pero es una constante que no trae problemas como los provenientes de la no uniformidad de Σ. 5 La
integral (10.109) es una integral de l´ınea que no depende de la trayectoria seguida para llegar de ~ q0 a q~.
436 / Mec´ anica cl´ asica avanzada Sistemas separables. Hay casos en los cuales mediante una adecuada elecci´on de las coordenadas resulta que la funci´ on Σ puede escribirse en la forma: ~ ~ Σ(I, q) =
l X
~ qν ) Σν (I,
(10.114)
ν=1
se dice entonces que el sistema es completamente separable. Para un sistema de este tipo las ecuaciones (10.110) toman la forma: pν =
∂ ~ qν ) ; Σν (I, ∂qν
ϕν =
l X ∂ ~ qµ ) Σµ (I, ∂I ν µ=1
(10.115)
ν = 1, 2, ...l En este sistema es posible escoger los ciclos de base γ1 , γ2 , ...γl en los planos de fase (q1 , p1 ), (q2 , p2 ), ...(ql , pl ) de modo que las variables de acci´on pueden definirse por las integrales: I 1 1 Iν = ∆ν Σν = pν dqν (10.116) 2π 2π donde cada integral es tomada sobre un ciclo de la coordenada qν . Ver la secci´ on 9.4. Sistemas multiplemente peri´ odicos degenerados. Cuando el sistema es separable, las variables angulares describen la proyecci´on del punto representativo del sistema sobre el plano de fases correspondiente (pν , qν ) y ων es la frecuencia angular correspondiente al movimiento de tal proyecci´on sobre la trayectoria cerrada. Entonces tanto qν como pν son funciones peri´odicas del tiempo. Puede ocurrir que todas las frecuencias sean conmensurables entre s´ı; entonces existen numeros ´ enteros m1 , m2 , ...ml tales que, si T1 , T2 , ...Tl son los per´ıodos sobre las proyecciones en los planos de fases se cumple: m1 T1 = m2 T2 = ... ml Tl = T
(10.117)
en este caso la trayectoria de fases es cerrada y el sistema como un todo es peri´odico. Se dice entonces que el sistema es completamente degenerado. Si el sistema es no degenerado o parcialmente degenerado, entonces (10.117) no se cumple y nunca retorna a su estado inicial, pero cuando T es suficientemente grande entonces pasa arbitrariamente cerca al estado inicial y se dice que el movimiento es cuasiperi´ odico sobre el toroide invariante. En este caso la trayectoria, independientemente de las condiciones iniciales, es uniformemente distribuida sobre el toroide. Este enunciado constituye el teorema erg´ odico. Podemos decir que si el sistema es no degenerado es erg´ odico. Si hay degeneraci´on esto no se cumple. En las coordenadas en que el sistema es separable, qν y pν son funciones peri´odicas del tiempo con frecuencia angular ων . Entonces cualquier funci´ on uniforme F (~q, p~ ) del
La ecuaci´ on de Hamilton-Jacobi con variables acci´on-´ angulo / 437 estado del sistema es peri´odica respecto a las variables angulares y su per´ıodo respecto a cada una de ellas es 2π. Su expansi´ on de Fourier es de la forma: F (~ q , p~) =
∞ X
∞ X
...
n1 =−∞ n2 =−∞
∂E ∂E ∂E n1 + n2 + ... nl t An1 , n2 , ...nl exp i ∂I1 ∂I2 ∂Il n =−∞ ∞ X
(10.118)
l
Cada t´ermino de esta suma es peri´odico respecto al tiempo con frecuencia angular: ∂E ∂E ∂E n1 + n2 + ... nl ∂I1 ∂I2 ∂Il
(10.119)
pero como estas frecuencias no son conmensurables en general, la suma no es peri´odica. En particular, no ser´an peri´odicas las coordenadas y momentos (~q, p~) en las cuales el sistema no sea separable. En algunos casos particulares, dos o m´as de las frecuencias ων = ∂E/∂Iν son conmensurables para todos los valores de las Iµ . La existencia de degeneraci´on conlleva una reducci´on del numero ´ de variables de acci´on independientes de las cuales depende de la energ´ıa. En efecto si ω1 y ω2 son tales que: n1
∂E ∂E = n2 ∂I1 ∂I2
(10.120)
donde n1 y n2 son enteros, se deduce entonces que E depende de I1 y I2 s´olo en la combinaci´ on n2 I1 + n1 I2 : E(I~ ) = E(n2 I1 + n1 I2 , I3 , ...Il )
(10.121)
Cuando hay degeneraci´ on, el n´ umero de integrales de movimiento uniformes es mayor que l. En efecto, la siguiente cantidad es constante de movimiento: A = n1 ϕ1 − n2 ϕ2
(10.122)
la constancia de la cual es evidente de (10.120). Adem´as est´ a constante de movimiento no depende de las Iν , que son las variables can´onicamente conjugadas de las ϕν . Al realizarse un circuito sobre la l´ınea γν , el cambio en A est´ a dado, en virtud de (10.113), por: ∆ν A = (n1 δ1ν − n2 δ2ν ) 2π
(10.123)
o sea que A no es uniforme, pero su no uniformidad consiste en la adici´ on de un m´ ultiplo entero de 2π. Por tanto, tomando una funci´ on trigonom´etrica arbitraria de A se obtiene una nueva integral de movimiento uniforme. Ejemplo 10.3.3 Mostrar que las constantes (10.53) y (10.54) en el caso del oscilador arm´onico bidimensiohal son funciones respectivamente de ϕ1 − ϕ2 y de 2ϕ1 − ϕ2 .
438 / Mec´ anica cl´ asica avanzada Es simple mostrar que A(I1 , I2 , ϕ1 , ϕ2 ) en (10.53) vale: 2p A= I1 I2 sen(ϕ1 − ϕ2 ) m
y en (10.54) vale: p A = 2I1 mI2 ω1 sen(2ϕ1 − ϕ2 )
(10.124)
(10.125)
De (10.123) se sigue que estas constantes de movimiento son uniformes. En el c´ alculo hemos usado la f´ ormula (10.92) para cada uno de los grados libertad, en coordenadas cartesianas. Ejemplo 10.3.4 En la secci´ on 5.2 mostramos que el oscilador arm´onico bidimensional cuando ω1 = ω2 es separable en coordenadas cartesianas y en coordenadas polares. Resolver este problema en coordenadas polares usando las variables acci´on ´angulo. La ecuaci´ on de Hamilton-Jacobi para el problema es: " 2 2 # 1 ∂Σ 1 ∂Σ 1 + mω02 r2 = E + 2 2m ∂r r ∂ϕ 2
(10.126)
Resolviendo a (10.126) por separaci´on de variables obtendremos las dos ecuaciones diferenciales ordinarias siguientes: 2 l2 dΣr dΣϕ + 2 + m2 ω02 r2 = 2mE (10.127) = l; dϕ dr r donde l2 es la constante de separaci´on. Salvo constantes de integraci´ on, las soluciones son: Z r l2 Σϕ = lϕ ; Σr = (10.128) 2mE − 2 − m2 ω02 r2 dr r Entonces las cuatro ecuaciones (10.115) toman la forma: r l2 pϕ = l ; pr = 2mE − 2 − m2 ω02 r2 r ϕr = ϕ
ϕϕ = ϕ
∂l + ∂Ir
Z
∂l + ∂Iϕ
Z
1 ∂l2 ∂E − 2 ∂Ir r ∂Ir r dr 2 l 2 2 2 2 2mE − 2 − m ω0 r r
(10.129)
2m
2m r
1 ∂l2 ∂E − 2 ∂Iϕ r ∂Iϕ
l2 2 2mE − 2 − m2 ω02 r2 r
dr
(10.130)
(10.131)
La variable de acci´on Iϕ vale: Iϕ = l
(10.132)
La ecuaci´ on de Hamilton-Jacobi con variables acci´on-´ angulo / 439 y la variable de acci´on Ir vale: Z rmax r 1 l2 Ir = ·2 2mE − 2 − m2 ω02 r2 dr 2π r rm´ın
(10.133)
donde rm´ın y rmax est´ an dados por la f´ormula (5.76). Mediante la sustituci´on x = r2 , (10.133) toma la forma: I q 1 1 Ir = −m2 ω02 x2 + 2mEx − l2 dx (10.134) 2π x La integral se hace f´ acilmente usando la t´ecnica de los residuos teniendo en cuenta que en el plano complejo el integrando es una funci´ on biforme (positivo en el intervalo (xm´ın , xmax ) y negativo entre (xmax , xm´ın )), present´ andose entonces una l´ınea de ramificaci´ on entre xm´ın y xmax . Por otra parte el integrando tiene singularidades en x = 0 y x = ∞, present´ andose polos en dichos puntos. El residuo en x = 0 vale −l/(2π) y el residuo en x = ∞ (que se obtiene con la sustituci´on y = 1/x) vale E/(2πω0 ). En consecuencia, usando (10.132): E = ω0 (Ir + Iϕ )
(10.135)
La t´ecnica para evaluar este tipo de integrales puede verse en el ap´endice II del libro de Born, The mechanics of the atom o en la secci´ on 9-7 del libro de Goldstein. Esto nos permite escribir entonces (10.130) y (10.131) como: Z dr r (10.136) ϕr = mω0 l2 2 2 2 2mE − 2 − m ω0 r r Z mω0 − l/r2 r ϕϕ = ϕ + dr (10.137) l2 2 2 2 2mE − 2 − m ω0 r r Estas integrales coinciden con las evaluadas en el cap´ıtulo 5, que aparecieron en las f´ormulas (5.67) y (5.75): El resultado para r en funci´ on de ϕr se obtiene directamente de (5.81): ! r ω02 l2 E 2 (10.138) 1 + 1 − 2 sen 2ϕr = r02 (1 + e sen 2ϕr ) r = mω02 E La ecuaci´ on de la ´ orbita r(ϕ) depende de la diferencia ϕϕ − ϕr y de una constante de integraci´ on que se puede absorber por ϕϕ . Como seg´ un (10.135) el movimiento es degenerado (ωr = ωϕ = ω0 ), resulta que ϕϕ − ϕr es una constante. La integral en (10.131) es id´entica a (5.67). El resultado para ϕ en t´erminos de las variables acci´on ´ angulo es: e + sen 2ϕr 1 (10.139) ϕ = ϕϕ − ϕr + sen−1 2 e sen 2ϕr + 1
440 / Mec´ anica cl´ asica avanzada La constante (10.122) que aparece cuando hay frecuencias degeneradas es: A = ϕr − ϕϕ
(10.140)
Los cambios en A al realizarse circuitos sobre las l´ıneas γr y γϕ respectivamente son ∆r A = 2π y ∆ϕ A = −2π. O sea que ϕ no es una funci´ on uniforme, lo cual introduce dificultades para tomar a (r, ϕ, pr , pϕ ) como variables de estado. Cuando Iϕ = 0, ϕ = π/4 − A y cuando Iϕ = Ir + Iϕ , ϕ = ϕϕ = ϕr − A. S´ olo una funci´ on que contenga funciones trigonom´etricas de A es uniforme. El toroide invariante en coordenadas polares est´ a definido por las ecuaciones H = E y pϕ = l. En este caso degenerado queda reducido a una curva cerrada: p2r +
l2 + m2 ω02 r2 = 2mE ; r2
pϕ = l
(10.141)
El potencial efectivo presenta dos puntos de retorno en r, en tanto que en ϕ no hay puntos de retorno. Las figuras 10.6 y 10.7 muestran las envolventes de las trayectorias en el plano de la ´ orbita y algunas ´orbitas, para l = 0 y para l 6= 0. Las ecuaciones param´etricas de la curva en el plano r − Pr son: r2 = r02 (1 + e sen 2ϕr ) ;
p2r = m2 ω02 r02 e2
cos2 2ϕr 1 + esen 2ϕr
(10.142)
l≠0 Figura 10.6 Envolventes de las trayectorias en el plano de la ´orbita para l 6= 0 La figura 10.8 muestra las curvas de fases representadas por (10.142) para diferentes valores de e. Cuando e → 1, las trayectorias cerca a rm´ın son muy “planas”, de modo que cuando e = 1, los puntos con pmax y pm´ın est´ an unidos por una l´ınea recta vertical levantada en rm´ın = 0.
La ecuaci´ on de Hamilton-Jacobi con variables acci´on-´ angulo / 441
l=0
Figura 10.7 Envolventes de las trayectorias en el plano de la ´orbita para l = 0
1
pr (mω0r0)
e=1
e = 0,8 e = 0,6
0,5
e = 0,4 e = 0,2 e=0
0
0,5
1
r/r 0 1,5
–0,5
–1
Figura 10.8 Curvas de fases para diferentes valores de e
Como r es positivo, la trayectoria para e = 1 es un arco de elipse con los extremos unidos por una l´ınea recta vertical, o sea que en r = 0, pr cambia abruptamente de signo. e = 1 corresponde a un movimiento pendular. En este caso el “toroide” se convierte
442 / Mec´ anica cl´ asica avanzada en un segmento de l´ınea, pues en cualquier movimiento real los puntos de la l´ınea recta vertical son recorridos a velocidad infinita. En coordenadas polares son constantes de movimiento E y l. Como consecuencia de la degeneraci´ on hay otra constante que es una funci´ on trigonom´etrica de A. Tal constante coincide con E1 o con E2 . En efecto, podemos tomarla como E1 . px puede expresarse en funci´ on de pr y pϕ mediante la f´ormula: 1 px = pr cos ϕ − pϕ sen ϕ r
(10.143)
pϕ es una constante igual a l, cuyo valor tiene la siguiente expresi´on en funci´ on de e: p l = mω0 r02 1 − e2 (10.144)
remplazando pr de (10.142) en (10.143) obtenemos: p mω0 r0 e cos ϕ cos 2ϕr − 1 − e2 sen ϕ px = √ 1 + e sen 2ϕr
(10.145)
con lo cual E1 puede llevarse a la forma: E1 =
mω02 r02 1 [e (1 + cos 2ϕ)(e + sen 2ϕr ) 2 1 + e sen 2ϕr √ +1 − e2 − e 1 − e2 sen 2ϕ sen 2ϕr ]
De (10.139) obtenemos las siguientes expresiones para cos 2ϕ y sen 2ϕ: √ (e + sen 2ϕr ) sen 2A + 1 − e2 cos 2ϕr cos 2A cos 2ϕ = 1 + e sen 2ϕr √ (e + sen 2ϕr ) cos 2A − 1 − e2 cos 2ϕr sen 2A sen 2ϕ = 1 + e sen 2ϕr
(10.146)
(10.147)
La sustituci´ on de (10.147) en (10.146) nos conduce finalmente a: E1 =
1 mω02 r02 (1 + e sen 2A) 2
(10.148)
y en consecuencia: E2 =
1 mω02 r02 (1 − e sen 2A) 2
(10.149)
Sistemas no separables. Como una consecuencia del teorema de Liouville sobre los sistemas integrables, todo sistema de l grados de libertad que posea l constantes de movimiento uniformes admite un sistema de variables acci´on ´angulo, siendo las variables de acci´on l constantes de movimiento uniformes y las variables agulares l funciones lineales del tiempo de la forma ϕν = ων t+ϕν0 siendo las ϕν0 l constantes de movimiento no uniformes. En un sistema no integrable, el n´ umero de constantes de movimiento uniformes es menor que l y por tanto la trayectoria de fases cubrir´a regiones de m´as de l dimensiones.
La ecuaci´ on de Hamilton-Jacobi con variables acci´on-´ angulo / 443 Cuando hay un n´ umero de constantes de movimiento uniformes superior a l, se tiene un sistema integrable degenerado. Sistemas separables degenerados. En este caso es posible construir m´as de l constantes de movimiento uniformes en involuci´ on. Entonces hay diferentes maneras de escoger el conjunto de l variables de acci´on y por tanto hay diferentes transformaciones can´onicas a variables acci´on ´ angulo. Sean (q, p) → (I, ϕ) y (q, p), (I ′ , ϕ′ ) dos de tales transformaciones, entonces las variables (q, p) en los dos casos deben ser diferentes. Llegamos a otra propiedad fundamental de los sistemas degenerados consistente en que las ecuaciones de movimiento son separables en diferentes sistemas de coordenadas. Ejemplo 10.3.5 Mostrar que en un oscilador arm´onico bidimensional cuando ωx = 2ωy (o ωy = 2ωx ) es posible la separaci´on de variables en coordenadas parab´olicas. En el ejemplo 10.2.1 hallamos que cuando ωy = 2ωx existen tres constantes de movimiento uniformes independientes, E1 , E2 y A (10.54), cuando la separaci´on de variables se hace en coordenadas cartesianas. En t´erminos de las coordenadas parab´olicas ξ y η las coordenadas cartesianas x, y est´ an dadas por: p (10.150) x = ξ−η; y = ±2 ξη ; 0 ≤ (ξ, η) < ∞
En este sistema de coordenadas curvil´ıneas, las curvas de ξ constante son par´ abolas confocales con ejes a lo largo de x y abiertas hacia la izquierda. Las curvas de η constante son par´ abolas confocales con ejes a lo largo del eje x pero abiertas hacia la derecha y ortogonales a la familia ξ = constante. En ambos casos el foco est´ a en el origen. Las ecuaciones cartesianas de esas familias de curvas son: y 2 − 4ηx = 4η 2 (η = Constante)
y
y 2 + 4ξx = 4ξ 2
(ξ = Constante) (10.151)
La sustituci´ on de (10.150) en (10.151) hace triviales a estas u ´ltimas identidades, como debe ser. El lagrangiano en coordenadas cartesianas es: m m 2 L= x˙ + y˙ 2 − ωy2 (4x2 + y 2 ) (10.152) 2 2 cuando ωx = 2ωy . En coordenadas parab´olicas es: ! 1 η˙ 2 ξ˙2 L = m(ξ + η) − 2mωy2 (ξ 2 + η 2 − ξη) (10.153) + 2 ξ η Por tanto el hamiltoniano en coordenadas parab´olicas es: H=
1 ξp2ξ + ηp2η + 2mωy2 (ξ 2 + η 2 − ξη) 2m ξ + η
La ecuaci´ on de Hamilton-Jacobi es: " 2 2 # 1 1 ∂Σ ∂Σ ξ + 2mωy2 (ξ 2 + η 2 − ξη) = E +η 2m ξ + η ∂ξ ∂η
(10.154)
(10.155)
444 / Mec´ anica cl´ asica avanzada Haciendo Σ = Σξ (ξ) + Ση (η)
(10.156)
obtenemos las ecuaciones: 2 dΣξ 2ξ + 8mωy2 ξ 3 − 4mEξ = β dξ 2η
dΣη dη
2
(10.157)
+ 2mωy2 η 3 − 4mEη = −β
(10.158)
donde β es la constante de separaci´on. Integrando estas ecuaciones hallamos: Z s Z s β β 2 2 2 Σ= − 4m ωy ξ dξ + − 4m2 ωy2 η 2 dη (10.159) 2mE + 2mE − 2ξ 2η La constante β tiene la siguiente expresi´on en t´erminos de las variables de estado: β = 2ξη
p2ξ − p2η + 8m2 ωy2 ξη(ξ − η) ξ+η
(10.160)
y cumple un papel an´alogo al de la constante l cuando ωx = ωy . En efecto, cuando β 6= 0 los potenciales efectivos en los movimientos unidimensionales equivalentes tienen las siguientes expresiones: ξ Vef (ξ) =
β 1 4mωy2 ξ 2 − ; 2 4mξ
η Vef (η) =
1 β 4mωy2 η 2 + 2 4mη
(10.161)
De las gr´ aficas de energ´ıa potencial efectiva se deducen los valores de retorno en ξ y η y por tanto las par´ abolas que envuelven las trayectorias en el plano x − y. Tales curvas envolventes se denominan “c´austicas”. La figura 10.9 muestra las c´ austicas para diferentes signos de β y algunas de las trayectorias. La soluci´on anal´ıtica en variables acci´on ´angulo requiere evaluar las variables de acci´on y por medio de las ecuaciones (10.115) hallar las ecuaciones de la trayectoria. Al conocer la funci´ on E(Iξ , Iη ) se hallan las frecuencias ωξ , ωη que contendr´an alguna relaci´ on racional de la forma (10.120) y luego se puede obtener una constante de movimiento adicional, de la forma (10.122). Es interesante notar que al separar el movimiento en coordenadas cartesianas hay una constante ligada a la degeneraci´on que es (10.55). Tal constante es precisamente β. Para mostrar esto, notemos que las f´ormulas de la transformaci´ on inversa a (10.150) son: p p x + x2 + y 2 −x + x2 + y 2 ξ= ; η= (10.162) 2 2 dado que los momentos est´ an conectados por las f´ormulas: pξ ∂x/∂ξ ∂y/∂ξ px = pη py ∂x/∂η ∂y/∂η
(10.163)
La ecuaci´ on de Hamilton-Jacobi con variables acci´on-´ angulo / 445 y
y
η2 η1
ξ1
ξ2
ξ2
y
η2
x
x
x
ξ2
η2
β>0
β=0
β<0
Figura 10.9 Curvas envolventes o “c´austicas” para distintos valores de β
se sigue que: pξ =
pη =
px +
s
−px +
p −x + x2 + y 2 p py x + x2 + y 2
s
p x + x2 + y 2 p py −x + x2 + y 2
(10.164)
Reemplazando a (10.164) y (10.162) en (10.160) se sigue que: β = 2[ypx py + x(m2 ωy2 y 2 − p2y )]
(10.165)
Similarmente, la constante ligada a la degeneraci´on en coordenadas parab´olicas puede tomarse como E1 : ! ξp2ξ − ηp2η 1 E1 = + 2mωy2 (ξ − η)2 (10.166) 2m ξ+η
10.4.
Problema de Kepler (coordenadas esf´ ericas)
El hamiltoniano para una part´ıcula de masa m sometida al efecto de un centro de fuerzas inm´ovil que crea un potencial −k/r es: ! p2ϕ 1 p2θ k 2 H(r, θ, pr , pθ , pϕ ) = pr + 2 + 2 − (10.167) 2m r r sen2 θ r Este problema admite la separaci´on completa de variables en la ecuaci´ on de HamiltonJacobi, en la forma: Σ(r, θ, ϕ) = Σϕ (ϕ) + Σθ (θ) + Σr (r)
(10.168)
446 / Mec´ anica cl´ asica avanzada obteni´endose las siguientes ecuaciones diferenciales: 2 dΣϕ = lz2 dϕ r
2
dΣr dr
dΣθ dθ
2
2
+
(10.169)
− 2mkr − 2mEr2 = −l2
(10.170)
lz2 = l2 sen2 θ
(10.171)
donde l y lz son las constantes de separaci´on. Los puntos de retorno en θ y r, donde pθ = 0 y pr = 0, est´ an dados por: ! r k 2El2 rmax, min = − 1± 1+ ; 2E mk 2 sen θmax, min = ±
(10.172)
lz l
La variable de acci´on Iθ est´ a dada por: r Z θmax I r lz2 l2 2 2πIθ = 2 dθ = l − l2 − z2 dθ 2 sen θ sen θ θm´ın
(10.173)
donde se ha notado que pθ es positivo cuando θ se incrementa de θm´ın = sen−1 (lz /l) a θmax = π − θm´ın y es negativo cuando θ decrece de θmax a θm´ın , y que el integrando es una funci´ on par de θ. Con la sustituci´ on η = sen2 θ, Iθ toma la forma: s Z l 1 l2 η − lz2 2πIθ = 2 dη (10.174) 1−η lz /l2 η y con la sustituci´ on r −lz2 + l2 u x= 1−u
(10.175)
llegamos a:
2πIθ = 4 l2 − lz2
Z
∞ 0
(x2
x2 dx + lz2 )(x2 + l2 )
Descomponemos el integrando en fracciones parciales: Z ∞ Z ∞ dx dx 2 2 − lz 2πIθ = 4 l x2 + l2 x2 + lz2 0 0
(10.176)
(10.177)
para llegar finalmente a: Iθ = l − lz
(10.178)
La ecuaci´ on de Hamilton-Jacobi con variables acci´on-´ angulo / 447 Por otra parte, de (10.169) se sigue directamente: Iϕ = lz
(10.179)
Obteniendo las siguientes expresiones para las constantes l y lz en t´erminos de las variables de acci´on: l = Iθ + Iϕ ; Ir est´ a dado por: Z 2πIr =
lz = lϕ
rmax
rm´ın
pr dr −
(10.180)
Z
rm´ın
pr dr = 2
Z
rmax
pr dr
(10.181)
rm´ın
rmax
Llamando a y b a: a=−
k ; 2E
l b= √ −2mE
(10.182)
Podemos escribir a p2r como: " 2 2 # b a a 2 pr = −2mE −1 + 2 − r a r
(10.183)
De tablas de integrales est´ andar como la de Schaum’s hallamos: √ Z √ Ar2 + Br + C Ar2 + Br + C dr = r B −2Ar − B + √ sen−1 √ 2 −A B 2 − 4AC
(10.184)
√ Br + 2C − −Csen−1 √ r B 2 − 4AC Por tanto: Z
√ √ r−a pr dr = −2mE −r2 + 2ar − b2 + a sen−1 √ a2 − b 2 ar − b2 −1 √ −b sen r a2 − b 2
y teniendo en cuenta que: p rmin, max = a ± a2 − b2
llegamos a: Z rmax rm´ın
pr dr =
√ −2mE (a − b)π
(10.185)
(10.186)
(10.187)
448 / Mec´ anica cl´ asica avanzada De donde se tiene la siguiente expresi´on para E en funci´ on de Ir , Iθ , Iϕ : E=−
mk 2 2(Ir + Iθ + Iϕ )2
(10.188)
Entonces a y b en t´erminos de las variables de acci´on toman la forma: a=
(Ir + Iθ + Iϕ )2 ; mk
b=
(Iθ + Iϕ )(Iθ + Iϕ + Ir ) mk
Σr y Σθ pueden escribirse como: Z p 1 1 Σr = (Ir + Iθ + Iϕ ) −r2 + 2ar − b2 dr a r Z s Iϕ2 1 1− dθ Σθ = (Iθ + Iϕ ) 2 (Iθ + Iϕ ) sen2 θ
(10.189)
(10.190)
(10.191)
Soluci´ on para el movimiento radial. Seg´ un la ecuaci´ on (10.115), la variable angular ϕr es: ϕr =
∂Σr ∂Σ = ∂Ir ∂Ir
(10.192)
Al derivar la integral (10.190) usamos las expresiones auxiliares: 2a ∂a = ; I = Ir + Iθ + Iϕ ∂I I " 2 # 2(1 − ǫ2 )a2 Iθ + Iϕ ∂ a2 = ∂I I I ǫ2 = 1 − ∂ ∂I
Iθ + Iϕ I
1 I =− a a
Por tanto: ϕr =
2
(10.193)
(10.194)
(10.195)
Z p 1 1 −r2 + 2ar − (1 − ǫ2 )a2 dr a r Z dr +2 p 2 −r + 2ar − (1 − ǫ2 )a2 −
2
−(1 − ǫ )a
Z
r
p
−r2
(10.196)
dr + 2ar − (1 − ǫ2 ) a2
Cada una de estas integrales es elemental y puede hallarse en el manual citado.
La ecuaci´ on de Hamilton-Jacobi con variables acci´on-´ angulo / 449 El resultado, luego de simplificaciones, es: ϕr = −
1p 2 r−a −r + 2ar − (1 − ǫ2 )a2 + sen−1 a ǫa
(10.197)
A este resultado se puede llegar derivando respecto a I la expresi´on integrada Σr que se obtiene de (10.185). Definamos ahora una cantidad auxiliar y as´ı: y=
1 − r/a ⇒ r = a(1 − ǫy) ǫ
Con lo cual: p ϕr = −ǫ 1 − y 2 − sen−1 y
(10.198)
(10.199)
Como Σ es indeterminada bajo la adici´ on de una constante arbitraria, ϕr estar´ a igualmente indeterminada bajo la adici´ on de una constante, que llamaremos a. Introduciendo una nueva variable ψ, definida como: y = cos ψ y usando la circunstancia mencionada, obtenemos: π ϕr = −ǫ sen ψ − −ψ +α 2
(10.200)
(10.201)
Podemos escoger a α igual a π/2 con lo cual: ϕr = ψ − ǫ sen ψ
(10.202)
r = a(1 − ǫ cos ψ)
(10.203)
La ecuaci´ on (10.202) es la ecuaci´ on de Kepler, hallada en el cap´ıtulo 5. Vemos adem´as que la variable angular ϕr coincide con la anomal´ıa media M , en tanto que ψ es la anomal´ıa exc´entrica que, como sabemos, sirve para especificar la posici´on de la part´ıcula en el plano de la ´ orbita. En el ejemplo 5.3.1 se hall´o la soluci´on anal´ıtica de la ecuaci´ on de Kepler en serie de Fourier. ϕr puede escribirse, de acuerdo con (10.77) en la forma: ϕr = ωr (t − t0 )
(10.204)
Vemos que cuando ϕr = 0, ψ = 0 y r = rm´ın ; cuando ϕr = π, ψ = π y r = rmax ; cuando ϕr = 2π, ψ = 2π y r = rm´ın y as´ı sucesivamente. ωr es la frecuencia angular del movimiento radial que es peri´odico. Ejemplo 10.4.1 Expresar a r, x, y en t´erminos de ϕr por medio de series de Fourier, donde x, y son unos ejes cartesianos en el plano de la ´orbita, con x a lo largo del eje mayor de la ´ orbita y el origen es el centro de fuerzas. De la figura 5.14 se sigue que: x = r cos ϕv y y = r sen ϕv donde ϕv es la anomal´ıa verdadera (´ angulo entre r y x).
450 / Mec´ anica cl´ asica avanzada Por otra parte, la ecuaci´ on de la ´orbita en el plano de la misma cuando se toma a x en la direcci´ on del perihelio es: r=
a(1 − ǫ2 ) 1 + ǫ cos ϕv
(10.205)
Por tanto, combinando (10.205) y (10.203): a(1 − ǫ2 ) − r = a(cos ψ − ǫ) ǫ p p y = r2 − x2 = a 1 − ǫ2 sen ψ x=
(10.206) (10.207)
Vemos que x y r son funciones pares de ψ en tanto que y es una funci´ on impar. Entonces podemos escribir: ∞ X 1 r = B0 + Bn cos(nϕr ) a 2 n=1 ∞ X 1 x Cn cos(nϕr ) = C0 + a 2 n=1 ∞ X y p = 1 − ǫ2 Dn sen (nϕr ) a n=1
Los coeficientes de Fourier son: Z Z r −2 π 2 πr cos(nϕr ) dϕr = sen (nϕr ) d Bn = π 0 a nπ 0 a Z Z −2 π x 2 πx cos(nϕr ) dϕr = sen (nϕr ) d Cn = π 0 a nπ 0 a Z π 2 y √ Dn = sen (nϕr ) dϕr π 0 a 1 − ǫ2 Z π 2 y √ = cos nϕr d nπ 0 a 1 − ǫ2
(10.208)
(10.209)
(10.210)
(10.211)
(10.212)
(10.213)
donde se han realizado integraciones por partes. Usando (10.206), (10.207) y (10.203) llegamos a las siguientes expresiones con integrales sobre ψ. Z 2ǫ π sen [n(ψ − ǫ sen ψ)] sen ψ dψ (10.214) Bn = − nπ 0 Z π 2 Cn = sen [n(ψ − ǫ sen ψ)] sen ψ dψ (10.215) nπ 0
La ecuaci´ on de Hamilton-Jacobi con variables acci´on-´ angulo / 451 Dn =
2 nπ
Z
π
0
cos[n(ψ − ǫ sen ψ)] cos ψ dψ
(10.216)
Procediendo como en el ejemplo 5.3.1, usando la definici´on integral de las funciones de Bessel enteras, llegamos a: Bn =
ǫ 2ǫ [Jn+1 (ǫn) − Jn−1 (ǫn)] = − Jn′ (ǫn) n n
(10.217)
Cn =
1 2 [Jn−1 (ǫn) − Jn+1 (ǫn)] = Jn′ (ǫn) n n
(10.218)
Dn =
2 Jn (ǫn) ǫn
(10.219)
B0 y C0 deben calcularse por separado. El resultado es: B0 = 2 + ǫ 2 ;
C0 = −3ǫ
(10.220)
Entonces, finalmente: ∞ X 1 ǫ2 r =1+ +ǫ [Jn+1 (ǫn) − Jn−1 (ǫn)] cos(nϕr ) a 2 n n=1 ∞ X 1 3 x =− ǫ+ [Jn−1 (ǫn) − Jn+1 (ǫn)] cos(nϕr ) a 2 n n=1 ∞ X 2p y 1 1 − ǫ2 = Jn (ǫn) sen (nϕr ) a ǫ n n=1
(10.221)
(10.222)
(10.223)
Es interesante notar que el sistema formado por dos part´ıculas cargadas, ligado, emite radiaci´ on electromagn´etica. El momento de dipolo del sistema, d~ = Z1 e~r1 + Z2 e~r2 , donde Z1 y Z2 tienen signos opuestos, se puede escribir, usando las f´ormulas (5.1), como: Z1 Z2 ~ d = µe ~r (10.224) − m1 m2 donde µ es la masa reducida. Las ecuaciones (10.221) a (10.223) muestran que el momento de dipolo se puede expandir en serie de Fourier y la intensidad radiada de frecuencia nω0 , donde ω0 = ϕ˙ r est´ a dada por la f´ormula: In =
ω04 n4 ~ 2 dn 3c3
(10.225)
Como d~n es un vector en el plano de la ´orbita, se han de considerar las contribuciones de x y y a la radiacion de frecuencia nω0 . El resultado es: 2 1 − ǫ2 2 Z2 Z1 64n2 E 4 Jn′2 (ǫn) + − J (ǫn) (10.226) In = 3 2 2 n 3c Z1 Z2 m1 m2 ǫ2
452 / Mec´ anica cl´ asica avanzada ver Landau, Teor´ıa de campos, secci´ on 70. Soluci´ on para el movimiento en θ. La variable angular ϕθ es: ϕθ =
∂Σ ∂Σr ∂Σθ = + ∂Iθ ∂Iθ ∂Iθ
(10.227)
Notando que: p 2a2 p ∂ 1 − ǫ2 1 + 1 − ǫ2 [(1 − ǫ2 ) a2 ] = ∂Iθ I
(10.228)
r − (1 − ǫ2 )a ∂Σr = ϕr − sen−1 ∂Iθ ǫr
(10.229)
y mediante un c´ alculo similar al que conduce a (10.196) obtenemos:
Por otra parte, de (10.191) se sigue: Z ∂Σθ sen θ dθ s = 2 ∂Iθ Iϕ 2 sen θ − Iθ + Iϕ
(10.230)
y con el cambio de variable u = sen2 θ: Z ∂Σθ 1 du q = ∂Iθ 2 2 [u − Iϕ /(Iθ + Iϕ )2 ] (1 − u)
(10.231)
La f´ ormula (14.120) del manual citado nos conduce finalmente a: ∂Σθ cos θ = sen−1 q ∂Iθ 1 − Iϕ2 /(Iθ + Iϕ )2
si llamamos γ a: s γ=
1−
(10.232)
Iϕ2 (Iθ + Iϕ )2
(10.233)
obtenemos de (10.231), (10.229) y (10.227): " r [r − (1 − ǫ2 ) a ]2 cos θ 1− ϕθ − ϕr = sen−1 γ ǫ2 r 2 2
−
r − (1 − ǫ ) a ǫr
s
1−
2
(10.234)
cos θ γ2
Donde hemos usado la f´ormula: p p sen−1 A − sen−1 B = sen−1 A 1 − B 2 − B 1 − A2
(10.235)
La ecuaci´ on de Hamilton-Jacobi con variables acci´on-´ angulo / 453 Definamos las cantidades auxiliares siguientes: L=
r − (1 − ǫ2 ) a ; ǫr
M=
L ; γ
S = sen (ϕθ − ϕr )
(10.236)
Entonces (10.234) toma la forma: r p 1 S = cos θ − M 2 − M γ 2 − cos2 θ 2 γ
(10.237)
y despejando a cos θ obtenemos: p p cos θ = γS 1 − M 2 γ 2 ± γ 2 M 1 − S 2
(10.238)
Para hallar la dependencia de cos θ, notamos que L tiene la siguiente expresi´on en t´erminos de ψ: L=
ǫ − cos ψ 1 − ǫ cos ψ
(10.239)
Entonces: √ sen (ϕθ − ϕr ) 1 − ǫ2 sen ψ − cos(ϕθ − ϕr )(ǫ − cos ψ) cos θ = γ (1 − ǫ cos ψ)
(10.240)
donde hemos tomado el signo negativo en (10.238) para hacer la expresi´on compatible con el caso en que la ´ orbita est´ a colocada completamente en el plano x − z. Despejando a M en t´erminos de cos θ obtenemos: M =−
p Sp 2 1 cos θ γ − cos θ ± 1 − S2 γ2 γ2
(10.241)
y usando las definiciones (10.236), llegamos a la siguiente expresi´on para la ecuaci´ on de la ´orbita en t´erminos de las variables acci´on-´ angulo: r (Iθ + Iϕ )2 ( 1− 1 1 I2 I2 1+ s = 2 r (Iθ + Iϕ ) a Iϕ2 1− (Iθ + Iϕ )2 (10.242) "
× sen (ϕθ − ϕr )
s
sen2 θ
Iϕ2 − ± cos(ϕθ − ϕr ) cos θ (Iθ + Iϕ )2
#)
Si la part´ıcula se mueve sobre un plano que contiene al eje z, no tendr´a componente del momento angular en ese eje, o sea Iϕ = 0. En ese caso, seg´ un (10.172), θm´ın = 0 y θmax = π, y seg´ un (10.233), γ = 1. Entonces (10.242) toma la forma: ( ) r Iθ2 I2 1 1 1 ± 1 − 2 cos[θ ∓ (ϕθ − ϕr )] (10.243) = 2 r Iθ a I
454 / Mec´ anica cl´ asica avanzada Si tomamos el signo positivo y definimos a θ0 como: θ0 = ϕθ − ϕr
(10.244)
llegamos a la f´ ormula conocida: 1 1 + ǫ cos(θ − θ0 ) = r a(1 − ǫ2 )
(10.245)
Entonces θ0 es la direcci´ on del vector absidal del perihelio respecto al eje z, o sea la orientaci´on de la elipse. Las frecuencias asociadas a los movimientos en r, ϕ y θ son iguales, pues (10.188) conduce a: mK 2 ∂E (10.246) = ∂I I3 Seg´ un (10.120) y (10.122), habr´ an dos constantes de movimiento asociadas a la degeneraci´ on: ωr = ωθ = ωϕ =
ϕr − ϕθ
y
ϕϕ − ϕθ
(10.247)
Cuando Iϕ = 0, la ´orbita est´ a colocada en el plano z − x′ , donde x′ hace un ´angulo cualquiera con el eje x. θ0 es el ´ angulo entre los ejes x y z, como se muestra en la figura 10.10. x-
z y-
θ0 x′ θ
´ Figura 10.10 Orbita en el plano z − x′ Cuando Iϕ = 0 y θ0 = 0, la ecuaci´ on (10.240) da la siguiente relaci´on entre θ y ψ: r 1−ǫ ψ θ cot (10.248) cot = 2 1+ǫ 2 En general, para una ´orbita con orientaci´on arbitraria y con el plano de la ´orbita fuera del plano zx′ tenemos: θ0 = ϕθ − ϕr ;
cos θmin = γ ;
cos θmax = π − θmin
(10.249)
La ecuaci´ on de Hamilton-Jacobi con variables acci´on-´ angulo / 455 En t´erminos de estos ´ angulos la ecuaci´ on general de la ´orbita es: 1 ǫ 1 1+ = r (1 − ǫ2 ) a cos θm´ın
√ cos θ0 cos θ + sen θ0 sen2 θ − sen2 θm´ın
(10.250)
Soluci´ on para el movimiento en ϕ. ϕϕ est´ a dada por: ϕϕ =
∂Σ ∂Σr ∂Σθ ∂Σϕ = + + ∂Iϕ ∂Iϕ ∂Iϕ ∂Iϕ
(10.251)
De (10.229) vemos que: r − (1 − ǫ2 ) a ∂Σr = ϕr − sen−1 ∂Iϕ ǫr
(10.252)
De (10.191) se sigue: ∂Σθ = ∂Iϕ
Z
s
1−
Iϕ 1 Iθ + Iϕ sen2 θ
Iϕ2 1 1− (Iθ + Iϕ )2 sen2 θ
dθ
(10.253)
El cambio de variable: s cos2 θ v= 2 sen θ − (1 − γ 2 ) nos lleva a: Z
dθ p sen4 θ − (1 − γ 2 ) sen2 θ
(10.254)
=−
Z
dv 1 + v 2 (1 − γ 2 )
p 1 −1 1 − γ2] tan [v =− 1 − γ2
(10.255)
Entonces (10.252), (10.253), (10.255) junto con (10.230) nos conducen a: p (10.256) ϕϕ = ϕθ + tan−1 [v 1 − γ 2 ] + ϕ Resolviendo para v hallamos:
1 v=p tan(ϕϕ − ϕθ − ϕ) 1 − γ2
(10.257)
que equivale a la siguiente ecuaci´ on cuadr´atica en cos θ: (1 − γ 2 ) cos2 θ + tan2 (ϕϕ − ϕθ − ϕ) cos2 θ −γ 2 tan2 (ϕϕ − ϕθ − ϕ) = 0
(10.258)
456 / Mec´ anica cl´ asica avanzada por tanto: cos θm´ın tan(ϕϕ − ϕθ − ϕ) cos θ = p sen2 θm´ın + tan2 (ϕϕ − ϕθ − ϕ)
(10.259)
o si se quiere:
sen θm´ın cos θ tan(ϕϕ − ϕθ − ϕ) = √ 2 cos θm´ın − cos2 θ
(10.260)
Usando (10.238) obtenemos esta expresi´on para la dependencia temporal de ϕ: tan(ϕϕ − ϕθ − ϕ) = sen θm´ın
√ − cos θ0 (ǫ − cos ψ) + sen θ0 1 − ǫ2 sen ψ √ sen θ0 (ǫ − cos ψ) + cos θ0 1 − ǫ2 sen ψ
(10.261)
Cuando la ´ orbita est´ a en el plano x − y, Iθ = 0, o sea γ = 0. Entonces θm´ın = θmax = π/2 = θ. En consecuencia, si tomamos θ0 = 0, −ǫ + cos ψ tan(ϕϕ − ϕθ − ϕ) = √ 1 − ǫ2 sen ψ
(10.262)
de donde: √
1 − ǫ2 sen ψ cos(ϕϕ − ϕθ − ϕ) = = 1 − ǫ cos ψ
r
1 − ǫ2 p 2 2 a ǫ − (a − r)2 ǫr
(10.263)
que nos conduce a una ecuaci´ on similar a la (10.245), pero esta vez para la ´orbita en el plano x − y. Entonces el ´angulo que hace el vector absidal del perihelio respecto al eje x, cuando θ0 = 0, es: ϕ0 +
π 2
donde
ϕ0 = ϕϕ − ϕθ
(10.264)
Cuando la ´ orbita est´ a en el plano z − x′ , Iϕ = 0 y sen θm´ın = 0 entonces tan(ϕϕ − ϕθ − ϕ) = 0. Por tanto en este caso el ´angulo ϕ es constante y vale ϕ0 , que es el ´angulo que hace la l´ınea de intersecci´on entre el plano vertical de la ´orbita y el plano x − y. En general, para Iϕ y Iθ arbitrarios, el plano de la ´orbita y el plano x − y se cortan en la l´ınea Ox′ , llamada l´ınea de nodos. La curva cruza el plano xy cuando θ = π/2 y cuando θ = 3π/2. En esos puntos, seg´ un (10.260), ϕ vale ϕ0 . En conclusi´ on, ϕ0 es el angulo de la l´ınea de nodos respecto al eje x. ϕ0 es el acimut de la part´ıcula cuando ´ θ = π/2 y π + ϕ0 es el acimut cuando θ = 3π/2. Como ϕ es una variable c´ıclica, pϕ es constante de movimiento, cuyo valor es igual al de Iϕ cuya variable can´onica conjugada es ϕϕ . Por medio de una transformaci´ on can´onica es posible hacer que las variables acci´on-´ angulo sean (Ir + Iθ + Iϕ , ϕr ), (Iθ + Iϕ , ϕθ − ϕr ) y (Iϕ , ϕϕ − ϕθ ), con lo cual vemos que l y θ0 son variables can´onicas conjugadas, lo mismo que lz y ϕ0 . Como sabemos, θ0 y ϕ0 en tanto que variables angulares son no uniformes pues al completar un ciclo sobre las l´ıneas γθ0 y γϕ0 del toroide no regresan a su valor original
La ecuaci´ on de Hamilton-Jacobi con variables acci´on-´ angulo / 457 sino que aumentan en 2π, pero esto no tiene efecto sobre las f´ormulas ya que aparecen en funciones trigonom´etricas. Los ejes x, y, z fijos a la ´ orbita, se pueden ubicar respecto a los ejes x, y, z mediante los ´angulos de Euler que denotaremos ϕ′ , θ′ , ψ ′ definidos en la secci´ on 7.6. ϕ′ es el ´angulo ′ ′ ′ ′ entre x y x, θ el ´ angulo entre z y z y el ψ ´angulo entre x y x , donde el eje x′ coincide con la l´ınea de nodos. (V´ease figura 10.11). ϕ′ , θ′ , ψ ′ est´ an relacionados con θ0 , ϕ0 mediante: ϕ′ = ϕ0 ;
θ′ =
π − θm´ın ; 2
ψ′ =
π − θ0 2
(10.265)
z
z θ′
θmin
y′ y
α θ0
x ψ′ y
ϕ′ x′
Figura 10.11 Los ejes x, y y z est´an fijos a la ´orbita y ubicados respecto a x, y y z mediante los ´angulos de Euler. x, y est´an sobre el plano de la ´orbita. El ´ angulo entre el vector absidal del perihelio, eje x, y el eje z, es α, cuyo coseno es el elemento 1 − 3 de la matriz que conecta los ejes x, y, z con los ejes x, y, z: cos α = sen ψ ′ sen θ′ = cos θmin cos θ0
(10.266)
~ = ǫ~ex , por tanto Puede mostrarse que el vector de Runge-Lenz tiene la expresi´on A Az = ǫ cos α. I determina la longitud del semieje mayor de la ´orbita a, en tanto que I y Iθ + Iϕ determinan la excentricidad. Concluimos que las variables acci´on-´ angulo determinan la forma y tama˜ no de la ´orbita, lo mismo que su orientaci´on en el espacio. I adem´as determina la frecuencia y ϕr determina la posici´on de la part´ıcula sobre la ´orbita. ϕ0 , θ0 , ϕr , Iϕ , Iθ + Iϕ , I son conocidas como los elementos de Delaunay de la ´orbita en astronom´ıa. Ejemplo 10.4.2 Hallar las expansiones de Fourier para z y x ± iy.
458 / Mec´ anica cl´ asica avanzada De la matriz de rotaci´on en t´erminos de los ´angulos de Euler se sigue: z = sen θ′ sen ψ ′ x + sen θ′ cos ψ ′ y
(10.267)
Entonces, usando (10.265): z = cos θm´ın (cos θ0 x + sen θ0 y)
(10.268)
x y y est´ an dados por (10.222) y (10.223). En consecuencia: ( ∞ −iϕr X e 3 Jn′ (nǫ) cos nϕr z = aγ − ǫ−iϕr + 4 n n=1 √ ) 1 − ǫ2 eiϕθ −i Jn (nǫ) sen nϕr ǫ
+aγ
(
∞ iϕr X e
3 − ǫeiϕr + 4 n n=1
(10.269)
Jn′ (nǫ) cos nϕr
√ ) 1 − ǫ2 e−iϕθ +i Jn (nǫ) sen nϕr ǫ Igualmente de la matriz de rotaci´on obtenemos: x + iy = [(cos ψ ′ cos ϕ′ − cos θ′ sen ϕ′ sen ψ ′ ) +i(cos ψ ′ sen ϕ′ + cos θ′ cos ϕ ′ sen ψ ′ )] x (10.270) + [(−sen ψ ′ cos ϕ′ − cos θ′ sen ϕ′ cos ψ ′ ) +i(−sen ψ ′ sen ϕ′ + cos θ′ cos ϕ ′ cos ψ ′ )] y Usando nuevamente (10.265), (10.206) y (10.209) llegamos a: h p x + iy = a sen θ0 + i 1 − γ 2 cos θ0 (cos ψ − ǫ)
√ i p 1 − ǫ2 sen ψ ǫiϕ0 + − cos θ0 + i 1 − γ 2 sen θ0
Finalmente, usando (10.222) y (10.223) llegamos a: ! " ∞ −iϕr X p e 3ǫ Jn′ (nǫ) cos nϕr − e−iϕr + x + iy = i −1 + 1 − γ 2 4 n n=1 # ∞ −iϕr √1 − ǫ2 X p e 2 Jn (nǫ) sen nϕr eiϕϕ − −1 − i 1 − γ ǫ n n=1 " ! ∞ −iϕr X p 3ǫ e + i 1 + 1 − γ2 − e−iϕr + Jn′ (nǫ) cos nϕr 4 n n=1
(10.271)
La ecuaci´ on de Hamilton-Jacobi con variables acci´on-´ angulo / 459 p − 1 + i 1 − γ2
! ∞ # √ 1 − ǫ2 X e−iϕr Jn (nǫ) sen nϕr ei(ϕϕ −2ϕθ ) ǫ n n=1
(10.272)
Vemos que se anulan todos los coeficientes de Fourier para los cuales nϕ y nθ son diferentes de: nϕ = 0, 1, −1 ;
nθ = 0, ±2
En cuanto a n no hay ninguna restricci´on. Seg´ un la f´ ormula (10.225), para este caso se tiene: h i ω4 4 An, n , nϕ 2 + Bn, n , nϕ 2 In, nθ , nϕ = 03 τn, nθ , nϕ θ θ 3c
(10.273)
(10.274)
umero que describe el orden del arm´onico de ω0 radiado, y A y donde τn, nθ , nϕ es un n´ B son los coeficientes de Fourier de z y de x + iy respectivamente. Vemos que solamente es posible la radiaci´ on asociada a los nθ y nϕ dados por (10.273). Las f´ ormulas (10.269) y (10.272) pudieron tambi´en obtenerse directamente de (10.240) y de (10.256). Ejemplo 10.4.3 Mostrar que el vector de Runge-Lenz (o de Laplace) es una constante de movimiento asociada a la degeneraci´on del movimiento en el problema de Kepler. ~ es constante: Es simple mostrar que el vector A ~ = p~ × ~l − mk ~r A r
(10.275)
~ · ~l = 0, se sigue que A ~ es un vector fijo en el plano de la ´orbita. Tomando Como A ~ con ~r obtenemos: el producto escalar de A Ar cos ϕv = l2 − mkr
(10.276)
Comparando con la ecuaci´ on de la ´orbita vemos que la magnitud de A es esencialmente ǫ: A = mkǫ
(10.277)
~ es independiente de las Se sigue entonces que s´olo una de las componentes de A ~ ~ est´ constantes de movimiento E y l. De (10.276) se sigue tambi´en que A a en la direcci´ on del perihelio, de donde se concluye que salvo el factor mk: ~ = ǫ~ex ; A
Az = ǫ cos α
(10.278)
Como cos α tiene la expresi´on (10.266), se sigue que Az depende esencialmente de la constante θ0 = ϕθ − ϕr , que sabemos es constante debido a la degeneraci´on del movimiento y adem´as es independiente de ~l y E. Tambi´en sabemos que la existencia de este tipo de constantes est´ a asociada a la posibilidad de separar las variables en otro sistema de coordenadas. En efecto, seg´ un veremos, A es precisamente la constante que aparece al separar variables en coordenadas parab´olicas.
460 / Mec´ anica cl´ asica avanzada Ejemplo 10.4.4 Mostrar que las constantes de movimiento lx , ly est´ an asociadas a la degeneraci´ on del movimiento angular en un problema de fuerzas centrales. De las f´ ormulas (5.23) en la secci´ on 5.1 sabemos que: lx = −pθ sen ϕ − pϕ cot θ cos ϕ ;
(10.279)
ly = pθ cos ϕ − pϕ cot θ sen ϕ Que pθ y pϕ tienen las siguientes expresiones es v´alido en cualquier problema de fuerzas centrales: r l2 pθ = l2 − z2 ; pϕ = lz (10.280) sen θ donde l y lz son las constantes de separaci´on en coordenadas esf´ericas. Para precisar, adoptemos los resultados en el movimiento kepleriano. Seg´ un (10.258) se cumple: p 1 − γ2 sen θ = p 2 1 − γ cos2 (ϕ − ϕ0 ) (10.281) −r sen (ϕ − ϕ0 ) cos θ = p 1 − γ 2 cos2 (ϕ − ϕ0 ) lx puede escribirse en la forma siguiente usando (10.260): p sen ϕ − lz cot θ cos ϕ lx = −l γ 2 − cos2 θ sen θ ! p l 1 − γ 2 sen ϕ = − lz cos ϕ cot θ tan (ϕ − ϕ0 )
(10.282)
Entonces, usando (10.281) llegamos a: lx = l cos θm´ın sen ϕ0
(10.283)
similarmente, ly = −l cos θm´ın cos ϕ0
(10.284)
Estos resultados son v´alidos para fuerzas centrales en general y no s´olo en el caso kepleriano, ya que independientemente de la forma del potencial la energ´ıa depende de Iθ y Iϕ en la combinaci´ on Iθ + Iϕ , lo cual da lugar a que: ωθ = ωϕ
(10.285)
en cualquier problema de fuerzas centrales y por tanto ϕ0 = ϕϕ − ϕθ es una constante de movimiento, lo que a su vez implica que lx y ly sean constantes. l, lz y lx2 + ly2 = l2 cos2 θmin = l2 −lz2 son constantes de movimiento especiales de las coordenadas esf´ericas y por lo tanto s´olo dependen de las variables de acci´on. lx y ly son constantes que
La ecuaci´ on de Hamilton-Jacobi con variables acci´on-´ angulo / 461 dependen de las variables angulares 6 ϕθ y ϕϕ a trav´es de ϕ0 y est´ an asociadas a la posibilidad de separar el movimiento angular del radial en coordenadas esf´ericas donde el eje polar es reemplazado por x o por y. Que lx y ly dependan de las variables angulares es resultado de la propiedad general del vector momento angular consistente en que no existe una transformaci´ on can´onica en que lx , ly , lz sean simult´ aneamente momentos generalizados. En efecto, en el ejemplo 9.8.4 se muestra que las componentes de ~l no est´ an en involuci´ on entre s´ı: [li , lj ] = ǫijk lk ;
i, j, k = x, y, z
(10.286)
Notemos que (10.286) es una propiedad de los li que sabemos son los generadores infinitesimales del grupo de rotaciones. Se dice que ~l tiene un ´ algebra de Lie cuyas constantes de estructura son ǫijk . Ejemplo 10.4.5 Mostrar la invariancia bajo el grupo O(4). ~ y ~l podemos formar los vectores J~ y K ~ definidos como: Con los vectores A 1 1 ~ ~ ; ~ = 1 ~l − √ 1 l+ √ J~ = A K (10.287) ~ 2 2 −2mE −2mE A Estos vectores est´ an en involuci´ on entre s´ı, mas no sus componentes: [Ji , Jj ] = ǫijk Jk ,
[Ki , Kj ] = ǫijk Kk ,
[Ji , Kj ] = 0
(10.288)
~ tienen cada uno un ´algebra de Lie como la del grupo de rotaPor tanto J~ y K ciones. Concluimos que el hamiltoniano de una part´ıcula ligada en un potencial −k/r es invariante bajo dos grupos de rotaciones independientes. Estos grupos son subgrupos de un grupo m´as general, el de las rotaciones ortogonales O(6). La representaci´on O(6) es reducible siendo una de sus representaciones irreducibles O(4). Como, seg´ un vimos en la secci´ on 7.8, existe un homomorfismo entre O(3) y SU (2), entonces podemos ver que hay un homomorfismo entre las representaciones O(4) y SU (2) ⊗ SU (2). Vemos que la degeneraci´ on del sistema que consideramos resulta del hecho de ser invariante el hamiltoniano bajo un grupo de simetr´ıa m´as amplio que el grupo de rotaciones. ~ K ~ y H s´olo existen 5 constantes inEntre las siete constantes de movimiento J, 2 2 dependientes, que podemos tomar como J , K , Jz , Kz , H pues existen dos relaciones entre ellas, provenientes de:
~ · ~l = 0 ; J~ − K
2 ~ J~ − K = mkaǫ2
(10.289)
De (10.288) puede verse que estas cinco constantes no est´ an en involuci´ on. Por tanto si se halla un sistema de coordenadas en que J 2 y K 2 sean constantes de separaci´on, necesariamente Jz y Kz depender´an de variables angulares. 6 Puede
verse que los “buenos n´ umeros cu´ anticos” est´ an asociados precisamente con las variables din´ amicas que no dependen de variables angulares.
462 / Mec´ anica cl´ asica avanzada
10.5.
Problema de Kepler (coordenadas parab´ olicas)
Las coordenadas parab´olicas en tres dimensiones son una generalizaci´ on de las definidas en el ejemplo 10.3.5. p p x = 2 ξn cos ϕ ; y = 2 ξn sen ϕ ; z =ξ−n (10.290) donde ϕ es el ´ angulo acimutal. Las f´ormuIas inversas son: ξ=
1 θ (z + r) = r cos2 2 2
η=
θ 1 (−z + r) = r sen2 2 2
(10.291)
y x Con un procedimiento an´alogo al del ejemplo 10.3.5 llegamos a: s Z p2ϕ 2mK1 2mE + − 2 dξ Σ(ξ, η, ϕ; E, K, pϕ ) = ξ 4ξ ϕ = tan−1
+
Z
s
2mE +
2mK2 − η
p2ϕ 4η 2
dη + ϕpϕ
(10.292) (10.293)
Las constantes de separaci´on K1 y K2 satisfacen: K1 + K2 = K ;
0 ≤ K1 ≤ K
Las variables de acci´on son definidas por: s I p2ϕ 2mK1 dξ 2πIξ = 2mE − 2 + 4ξ ξ s I p2ϕ 2mK2 2πIη = 2mE − 2 + dη 4η η 2πIϕ = 2πpϕ
(10.294)
(10.295)
(10.296) (10.297)
De la siguiente ecuaci´ on, dada en Goldstein, que se deduce similarmente a la integral de (10.134) en el ejemplo 10.3.4, I r √ C 2B B (10.298) − 2 dr = 2πi A+ −C + √ r r A obtenemos: Iξ , η = i
pϕ mK1,2 i +√ 2 2mE
(10.299)
La ecuaci´ on de Hamilton-Jacobi con variables acci´on-´ angulo / 463 que junto con (10.297) nos conduce a la siguiente expresi´on para la energ´ıa en t´erminos de las variables de acci´on parab´olicas: E=−
mk 2 2(Iξ + Iη + Iϕ )2
(10.300)
Si definimos a I como: I = Iξ + Iη + Iϕ
(10.301)
llegamos a la siguiente expresi´on para las constantes K1 y K2 en t´erminos de las variables de acci´on: K1,2 = K
2Iξ,η + Iϕ 2I
(10.302)
Es conveniente definir una sola constante, pues K1 y K2 est´ an relacionadas por (10.294): β=
K1 − K2 Iξ − Iη = ; K I
−1 ≤ β ≤ 1
(10.303)
Veremos que β coincide con la componente z del vector de Runge-Lenz (v´ease en Mec´ anica cu´ antica de Laudau, secci´ on 37). Entonces K1 y K2 tienen la siguiente expresi´on en t´erminos de β: K1 =
1+β K; 2
K2 =
1−β K 2
(10.304)
Ejercicio 10.5.1 Expresar a K1 y K2 en coordenadas parab´olicas. Luego, usando las f´ormulas de transformaci´ on expresar a β en coordenadas cartesianas y mostrar que coincide con la componente z del vector de Laplace. Variables angulares ϕξ y ϕη . De (10.293) se sigue que:
ϕξ
=
Z
m s
∂E m ∂K1 + ∂Iξ ξ ∂Iξ
p2ϕ 2mK1 − 2 2mE + ξ 4ξ
dξ
(10.305) +
Z
s
∂E m ∂K2 m + ∂Iξ η ∂Iξ
p2ϕ 2mK2 − 2 2mE + η 4η
dη
De (10.300) y (10.302) se siguen: ωξ = ωη = ωϕ =
2E mk 2 ∂E = 3 =− ∂I I I
(10.306)
464 / Mec´ anica cl´ asica avanzada y, ∂K1,2 K2 =± ; ∂Iξ I
K1 ∂K1,2 =∓ ; ∂Iη I
K1 − K2 ∂K1,2 =∓ ∂Iϕ I
(10.307)
Por tanto:
ϕξ
=
+
Z
Z
−
s
2mE mK1 + I ξI
p2ϕ 2mK1 2mE + − 2 ξ 4ξ
s
dξ
(10.308)
2mE mK 2 − − I ηI
p2ϕ 2mK2 2mE + − 2 η 4η
dη
ϕη tiene una expresi´on an´aloga, colocando η, en lugar de ξ y K1 en lugar de K2 . Definimos a y γ as´ı: a=
I2 ; mk
γ=
Iϕ I
(10.309)
los puntos de retorno en ξ y ϕ est´ an dados por: s ! 1+β γ2 1± 1− ; ξmax,min = a 2 (1 + β)2 ηmax,min = a
1−β 2
1±
s
1−
2
γ (1 − β)2
!
(10.310)
Las f´ ormulas 14.281 y 14.280 del Manual de f´ ormulas y tablas matem´ aticas de Spiegel nos dan para ϕξ : s 2 ξ ξ γ2 ϕξ = − − + (1 + β) − a a 4 r η 2 η γ2 − − + (1 − β) − + a a 4 −sen−1
2 ξ 1− 1+β a s γ2 1− (1 + β)2
ϕη tiene una expresi´on an´aloga intercambiando ξ con η y 1 + β con 1 − β.
(10.311)
La ecuaci´ on de Hamilton-Jacobi con variables acci´on-´ angulo / 465 Si definimos a θ1 , Lξ y Lη as´ı:
7
2ξ 1− (1 + β) a θ1 = ϕξ − ϕn ; Lξ = s ; γ2 1− (1 + β)2 2η 1− (1 − β) a Lη = s γ2 1− (1 + β)2
(10.312)
obtenemos: 2ξ 2η , = a a
1−
s
γ2 1− Lξ , η (1 ± β)2
!
(1 ± β)
(10.313)
y, θ1 = −sen−1 Lξ + sen−1 Lη
(10.314)
Adem´as, q 1p (1 + β)2 − γ 2 1 − L2ξ 2 q 1p − (1 − β)2 − γ 2 1 − L2η − sen2 Lξ,η 2
ϕξ,η = −
(10.315)
Ahora definamos dos nuevas variables (anomal´ıas exc´entricas): Lη = sen αη ;
Lξ = sen αξ
(10.316)
Entonces (10.314) y (10.315) se convierten en: θ1 = −αξ + αη ϕξ = −
1p (1 + β)2 − γ 2 cos αξ 2
(10.318)
1p (1 + β)2 − γ 2 cos(αη − θ1 ) 2
(10.319)
1p − (1 + β)2 − γ 2 cos(θ1 + αξ ) − αξ 2 ϕη = −
7 Como
(10.317)
1p − (1 + β)2 − γ 2 cos αη − αη 2
se cumple (10.306), se sigue que θ1 es una constante de movimiento asociada a la degeneraci´ on.
466 / Mec´ anica cl´ asica avanzada Las f´ ormulas (10.318) y (10.319) son ecuaciones trascendentales que permiten en principio expresar a αξ y αη en funci´ on de las variables angulares y en consecuencia de (10.313) expresar a ξ y η en funci´ on del tiempo, en efecto: ξ= η=
p 1 a 1 + β − (1 + β)2 − γ 2 sen αξ 2
(10.320)
p 1 a 1 − β − (1 − β)2 − γ 2 sen αη 2
(10.321)
De (10.314) se obtiene una ecuaci´ on que relaciona a ξ con η y que constituye la ecuaci´ on de la ´ orbita en coordenadas parab´olicas. El resultado es: s ( 2η a (1 + β)2 − γ 2 1+β− cos θ1 1 − β − ξ= 2 (1 − β)2 − γ 2 a (10.322) #) r 2 4η 4η + −γ 2 + (1 − β) − 2 sen θ1 a a Relaci´ on con la soluci´ on en coordenadas esf´ ericas. Empecemos por expresar a ǫ en t´erminos de γ, β y θ1 . Para ello basta hallar una expresi´on para r = ξ + η usando (10.320) y (10.321): r 1 + β2 − γ2 1p r (1 − β 2 )2 − 2γ 2 (1 + β 2 ) + γ 4 cos θ1 =1− + a 2 2 (10.323) (1)
× cos(αξ − αξ ) Donde: (1) tan αξ
p p (1 + β)2 + γ 2 + (1 − β)2 + γ 2 cos θ1 p = (1 − β)2 − γ 2 sen θ1
Comparando (10.323) con (10.203) cuando r = rmax , obtenemos: r 1 + β2 − γ2 1p (1 − β 2 )2 − 2γ 2 (1 + β 2 ) + γ 4 cos θ1 ǫ= + 2 2
(10.324) 8
(10.325)
Por otra parte, z, en coordenadas parab´olicas y en esf´ericas es:
8 Esta
1p z 1p (1 + β 2 ) − γ 2 sen αξ + (1 − β)2 − γ 2 sen αη =β− a 2 2 r i z 1 − ǫ2 − γ 2 h p 2 sen ψ sen θ − (ǫ − cos ψ) cos θ − = 1 − ǫ 0 0 a 1 − ǫ2
(10.326)
(10.327)
f´ ormula nos muestra que los valores de β y γ no son arbitrarios: si β > 0, 0 ≤ |γ| ≤ 1 − β y si β < 0, 0 ≤ |γ| ≤ 1 + β.
La ecuaci´ on de Hamilton-Jacobi con variables acci´on-´ angulo / 467 Estas expresiones equivalen a: # " r 1+β 2 −γ 2 1 p (2) 2 2 2 2 4 z = a β+ (1−β ) −2γ (1+β )+γ cos θ1 cos(αξ −αξ ) (10.328) − 2 2 z=a
r
(2)
i p 1 − ǫ2 − γ 2 h 2 sen2 θ cos(ψ − ψ (1) ) 1 − ǫ −ǫ cos θ − 0 0 1 − ǫ2
y ψ (1) se definen as´ı: p p − (1 + β)2 − γ 2 + (1 − β)2 − γ 2 cos θ1 (2) p tan αξ = (1 − β)2 − γ 2 sen θ1 √ 1 − ǫ2 sen θ0 tan ψ (1) = cos θ0
(10.329)
donde αξ
De (10.328) se sigue que: m´ax 2 zm´ın 2 = 1 + β 2 − γ 2 − ǫ2 = β 2 + (1 − ǫ2 ) cos2 θm´ın −β a En tanto que de (10.329): p m´ ax 2 sen2 θ −ǫ cos θ ± zm´ = a cos θ 1 − ǫ 0 0 m´ ın ın
m´ ax De (10.332) y (10.333) obtenemos para β en t´erminos de zm´ ın : 2 m´ın zm´ + (ǫ2 − 1) cos2 θm´ın ax /a β= m´ın /a 2zm´ ax
=
(10.330)
(10.331)
(10.332)
(10.333)
(10.334)
−ǫ cos θ0 cos θm´ın
Esto nos muestra que β es esencialmente la componente z del vector de Runge-Lenz: en coordenadas parab´olicas depende s´olo de variables de acci´on, pero en coordenadas esf´ericas depende adem´as de variables angulares. Por otra parte, de (10.325) y (10.334) se tiene la siguiente expresi´on para cos θ1 en t´erminos de γ, ǫ y cos θ0 , donde se ha llamado C a cos2 θmin : −C + ǫ2 (1 + C sen2 θ0 ) p C 2 − 2ǫ2 C(1 − 2 sen2 θ0 + C sen2 θ0 ) + ǫ4 (1 − C sen2 θ0 )2
(10.335)
Cuando la ´ orbita toca el eje z, sen θm´ın = 0. Entonces: cos θ1 =
−1 + 2ǫ2 − ǫ2 cos2 θ0 1 − ǫ2 cos2 θ0
(10.336)
esto nos permite llegar de (10.322), cuando γ = 0, al expresar a β, θ1 , ξ, η en funci´ on de las cantidades esf´ericas, a la f´ ormula (10.245). (10.322) es, pues, la ecuaci´ on de una elipse en el espacio expresada en coordenadas parab´olicas (v´ease figura 10.12).
468 / Mec´ anica cl´ asica avanzada Tambi´en de (10.334) y (10.325) se llega a una expresi´on para cos θ0 en t´erminos de γ, β y cos θ1 . Las coordenadas ξ y η oscilan entre los l´ımites se˜ nalados por la ecuaci´ on (10.310). Cuando γ = 0, ξm´ın = ηm´ın = 0. Cuando β = 0, ξm´ax = ηm´ax y ξm´ın = ηm´ın . Cuando β = γ − 1, ξm´ın = ξm´ax y cuando β = 1 − γ, ηm´ın = ηm´ax . En general, la trayectoria est´ a confinada a una regi´on en forma de anillo, definida por las paraboloides ξ = ξm´ın , ξ = ξm´ax , η = ηm´ın , η = ηm´ax . z
η = ηmín η = ηmáx
ξ = ξmáx ξ = ξmín
Figura 10.12 L´ımites del movimiento en coordenadas parab´ olicas En el caso β = 0, γ = 1, resulta que ηm´ın = ηmax = ξm´ın = ξmax = a/2 y por tanto el anillo queda reducido a una circunferencia de radio a colocada en el plano x − y. En este caso seg´ un (10.325) ǫ = 0, como debe ser. Cuando β = γ − 1 o β = −γ + 1, el movimiento s´olo es posible a lo largo de curvas colocadas sobre la superficie de un casquete lateral. Las ´ orbitas compatibles con valores dados de E, β, γ se caracterizan por tener un vector de Runge-Lenz con componente z definida, por tener un momento angular con componente z definida y por tener un semieje mayor de longitud definida. El ensamble de ´ orbitas con valores de E, β, γ definidos no tienen una excentricidad definida, aunque la ecuaci´ on (10.325) fija el rango de excentricidades posibles. Puede mostrarse que Iβ /2 y θ1 son variables can´onicamente conjugadas, en tanto que [Iϕ , θ1 ] = 0. Como de (10.287) se puede hallar que: 1 1 (Iϕ − Iβ ) = I(γ − β) (10.337) 2 2 se sigue que esencialmente Jz y θ1 son variables can´onicamente conjugadas y que Jz es el generador infinitesimal de z, las rotaciones que dejan invariante la proyecci´on del vector Jz =
La ecuaci´ on de Hamilton-Jacobi con variables acci´on-´ angulo / 469 de Laplace en el eje z. En una de estas rotaciones el valor de θ1 cambia y por ende el valor de ǫ. Por tanto las rotaciones generadas por Jz en el espacio de representaci´on de O(4), no dejan r´ıgida la ´ orbita; θ1 no es un ´angulo que especifique una orientaci´on de una ´orbita r´ıgida, pues al variarse cambia necesariamente, o sea cambia el valor de l. Para precisar, asumamos que γ = 0. Entonces de (10.310) se sigue que ξm´ın = ηmin = 0, o sea que el anillo se convierte en una regi´on llena, limitada por los paraboloides ξmax = a(1 + β) y ηmax = a(1 − β). Seg´ un la ecuaci´ on de la ´orbita (10.322) cuando η = ηm´ın , ξ vale: 1 ξ = (1 + β)(1 − cos θ1 ) (10.338) 2 cuando ξ = ξm´ın , η vale: 1 (10.339) η = (1 − β)(1 − cos θ1 ) 2 El punto de la ´ orbita (0, ξ) es x = 0, y = 0, r = z = ξ. El punto de la ´orbita (η, 0) es x = 0; y = 0, r = −z = η. En coordenadas esf´ericas estos puntos corresponden a las intersecciones de la ´ orbita vertical con el eje z, para los cuales: a(1 − ǫ2 ) (10.340) 1 ± ǫ cos θ0 expresi´on que se puede obtener de (10.338) y (10.339). ǫ y θ0 est´ an dados por: r 1 + β 2 + (1 − β 2 ) cos θ1 ǫ= (10.341) 2 s 2 (10.342) cos θ0 = −β 2 1 + β + (1 − β 2 ) cos θ1 r=
Cuando θ1 = 0, ǫ = 1 y cos θ0 = −β. Cuando β = 1, ǫ = 1 y cos θ0 = −1. Son dos casos de trayectoria rectil´ınea en un plano que pasa por el eje z. De (10.328) y (10.329) junto con (10.334) y (10.335) se siguen las relaciones entre las variables angulares y las anomal´ıas exc´entricas: (2)
αξ = αξ + ψ − ψ (1) − π (1)
ϕr = −ϕξ − αξ (2)
(10.343) (10.344)
(1)
αξ = αξ + ψ (1) + π
(10.345)
La variable angular ϕϕ , est´ a dada por:
ϕϕ =
∂Σ = ϕ+ ∂Iϕ
Z
∂E m ∂K1 pϕ ∂pϕ m + − 2 ∂Iϕ ξ ∂Iϕ 4ξ ∂Iϕ q dξ 2 2 2mE − pϕ /(4ξ ) + 2mK1 /ξ
∂E m ∂K2 pϕ ∂pϕ Z m + − 2 ∂Iϕ η ∂Iϕ 4η ∂Iϕ + q dη 2 2 2mE − pϕ /(4η ) + 2mK2 /η
(10.346)
470 / Mec´ anica cl´ asica avanzada usando (10.305), (10.306) y (10.307) obtenemos: ϕϕ =
1 ϕ + (ϕξ + ϕη ) 2 Z dξ 1 q − pϕ 4 ξ 2mEξ 2 + 2mK1 ξ − p2ϕ /4
1 − pϕ 4
Z
(10.347)
dη q 2 η 2mEη + 2mK2 η − p2ϕ /4
calculando las integrales con la f´ormula 14.283 del manual de Spiegel y expresando todas las constantes de movimiento en funci´ on de a, β y γ, hallamos:
ϕϕ =
1 1 ϕ + (ϕξ + ϕη ) − sen−1 2 2
2ξ γ2 − a 1+β s 2ξ γ2 1− a (1 + β)2 (10.348)
1 − sen−1 2
γ2 2η − a 1−β s 2η γ2 1− a (1 − β)2
debido a la degeneraci´on se cumple que: 1 (ϕξ + ϕη ) = ωt + Constante 2
(10.349)
Por tanto podemos definir una nueva constante de movimiento que depende de las variables angulares y que debe su car´ acter de constante a la degeneraci´on: 1 ϕ1 = ϕϕ − (ϕξ + ϕη ) 2
(10.350)
Cuando γ = 0, el plano de la ´orbita se corta perpendicularmente con el plano x − y en la l´ınea de nodos. En este caso ϕ vale ϕ1 ; luego ϕ1 es el ´angulo que hace la l´ınea de intersecci´on del plano de la ´orbita con el plano ecuatorial 9 . Cuando z = 0, ξ = η, y adem´as ξ = ξmax , se cumple que ϕ = ϕ1 . Entonces ϕ1 es el ´ angulo de la l´ınea de nodos de aquella elipse que pasa por ξmax en el plano ecuatorial, para otros valores de ξ esto no se cumple. Ejemplo 10.5.1 Hallar la expansi´ on de Fourier para z y x + iy, en coordenadas parab´olicas. V´ease en Max Born The mechanics of the atom, secci´ on 36. 9 N´ otese
que (10.347) y (10.348) no son id´ enticas, pues las integrales indefinidas contienen constantes que se han omitido en (10.348)
La ecuaci´ on de Hamilton-Jacobi con variables acci´on-´ angulo / 471 De (10.326) y (10.317) se sigue que z depende de las variables angulares ϕξ y ϕη . De (10.317) vemos que αξ no es funci´ on par ni impar de ϕξ y que αη no es funci´ on par ni impar de ϕη . Por tanto la expansi´ on de fourier de z contiene la forma sen nξ ϕξ y cos nξ ϕξ y similarmente para la dependencia respecto a ϕη . Por esto es m´as conveniente la siguiente expansi´ on: z=
∞ X
∞ X
Anξ nη ei(nξ ϕξ +nη ϕη )
(10.351)
nξ =−∞ nη =−∞
como z = ξ − η, los coeficientes de Fourier son: Z 2π Z 2π 1 Anξ nη = (ξ − η)e−i(nξ ϕξ +nη ϕη ) dϕξ dϕη 4π 2 0 0
(10.352)
De (10.318), (10.319) se sigue que: p 1h 2 − (1 + β)2 − γ 2 sen αξ 2 i p − (1 − β)2 − γ 2 sen αη dαξ dαη
dϕξ dϕη
=
(10.353)
Reemplazando a (10.326) en (10.352), obtenemos: 1 4π 2
A00 =
Z
2π
0
Z
2π
0
h 1p (1 + β)2 − γ 2 sen αξ a β− 2
i 1p (1 − β)2 − γ 2 sen αη 2 p 1h × 2 − (1 + β)2 − γ 2 sen αξ 2 i p 3 − (1 − β)2 − γ 2 sen αη dαξ dαη = βa 2 +
(10.354)
En los coeficientes donde nξ y nη no son ambos cero, el t´ermino constante β en z se puede omitir, pues desaparece al efectuar la integral, seg´ un se ve en (10.352) directamente. Entonces, usando una notaci´ on obvia y una propiedad de los l´ımites de integraci´ on en (10.352): Anξ nη =
a 4π 2
Z
3π/2
−π/2
Z
3π/2
(−S sen αξ + R sen αη )
−π/2
(1 − S sen αξ − R sen αη )
(10.355)
×einξ (αξ +S
cos αξ +R cos αη )
e+inη (αη +S
cos αξ +R cos αη )
dαξ dαη
472 / Mec´ anica cl´ asica avanzada si llamamos n = nξ +nη , y expresamos las funciones sen αξ y sen αη en forma exponencial, obtenemos: −a 16π 2
Anξ nη =
Z
3π/2
−π/2
Z
3π/2
−π/2
(2R2 − 2S 2 − 2iSeiαξ + 2iSe−iαξ
+2iReiαη − 2iRe−iαη + S 2 ei2αξ
(10.356)
−R2 ei2αη + S 2 e−i2αξ − R2 e−i2αη ) ×einξ αξ +inS
cos αξ +inη αη +inR cos αη
dαξ dαη
Al sustituir αξ → 3π/2 − αξ y αη → 3π/2 − αη , cada una de las integrales resulta proporcional a una integral de la forma: 1 2π
Z
3π/2
eikα+ix cos α dα =
−π/2
=
ei3k/2 2π
Z
2π
e−ikα−ix sen α dα
0
eikπ/2 Jk (x)
(10.357)
donde Jk (x) es la funci´ on de Bessel entera de orden k. Expresando a (10.356) en t´erminos de Jk y haciendo uso de las siguientes propiedades de las funciones Bessel: Jk−1 (x) + Jk+1 (x) =
2k Jk (x) x
Jk−1 (x) − Jk+1 (x) = 2Jk′ (x)
(10.358) (10.359)
obtenemos: Anξ nη = ei nπ/2
i ah RJnξ (nR)Jn′ η (nR) − SJnη (nR)Jn′ ξ (nS) n
(10.360)
Por tanto, la expansi´ on de Fouurier para z es: z=
3 βa 2 +a
nξ
×e
∞ i i nπ/2 h X ′ e RJnξ (nS)Jn′ η (nR) − SJnη (nR)Jn′ ξ (nS) n =−∞ n =−∞
∞ X
η
(nξ ϕξ +nη ϕη )
(10.361)
donde la prima en la sumatoria indica que se excluye el t´ermino nξ = nη = 0. Cuando nξ + nη = 0 no hay inconveniente porque Anξ nξ se anula. Para hacer la expansi´ on de x + iy, notemos que seg´ un (10.290): p x + iy = 2 ξηeiϕ
(10.362)
La ecuaci´ on de Hamilton-Jacobi con variables acci´on-´ angulo / 473 Reemplazando a (10.320) y (10.321) en (10.348) obtenemos: 1 ϕϕ = ϕ + (ϕξ + ϕη ) 2 p (1 + β 2 ) − γ 2 − (1 + β) sen αξ 1 p − sen−1 2 1 + β − (1 + β)2 − γ 2 sen αξ p (1 − β)2 − γ 2 − (1 − β) sen αη 1 −1 p − sen 2 1 − β − (1 − β)2 − γ 2 sen αη
(10.363)
√ Luego usamos la f´ ormula sen−1 x = i ln(−ix + 1 − x2 ) y notamos que en el numerador del argumento se puede formar un cuadrado perfecto para llegar a: 1 ϕϕ = ϕ + (ϕξ + ϕη ) 2 h αξ p α i2 2 ) − γ 2 + iγ cos ξ (1 + β) sen − (1 + β 1 2 2 − i ln p 2 C 1 + β − (1 + β)2 − γ 2 sen αξ h αη i2 αη p − (1 − β)2 − γ 2 + iγ cos (1 − β) sen 2 2 × p 1 − β − (1 − β)2 − γ 2 sen αη
C es una constante que depende de β y γ. Notemos que: p p (x + iy)ei(ϕη −ϕϕ ) = 2 ξη ei(ϕ+ϕη −ϕϕ ) = 2 ξηei(ϕη −ϕϕ )/2 h αξ i αξ p (1 + β 2 ) − γ 2 + iγ cos × (1 + β) sen − 2 2 h αη i αη p (1 − β)2 − γ 2 + iγ cos × (1 − β) sen − 2 2
(10.364)
(10.365)
y seg´ un (10.364),
a (x + iy)ei(ϕη −ϕϕ ) = √ ei(ϕη −ϕξ )/2 C h αξ i αξ p (1 + β)2 − γ 2 + iγ cos × (1 + β) sen − 2 2 h αη i αη p 2 2 (1 − β) − γ + iγ cos × (1 − β) sen − 2 2
(10.366)
Cuando αξ = αη = 0 entonces r = ξ + η = a. Por tanto, salvo un factor de fase constante, el valor de C es 1 − β 2 . Born presenta en lugar de (10.366) una expresi´on que se origina en sus f´ormulas (17) de la secci´ on 36. 10 Esto da lugar a una expansi´ on de Fourier con valores err´oneos para los coeficientes. 10 Comparar
dichas f´ ormulas con las f´ ormulas 15.45 y 14.360 del manual de Spiegel.
474 / Mec´ anica cl´ asica avanzada La expansi´ on de Fourier de (10.366) la escribimos como: (x + iy)ei(ϕη −ϕϕ ) =
∞ X
∞ X
Bnξ nη einξ ϕξ +(nη +1)ϕη
(10.367)
nξ =−∞ nη =−∞
a dado por: El coeficiente Bnξ nη est´ Bnξ nη =
a p 4π 2 1 − β 2
Z
3π/2 Z 3π/2
−π/2
−π/2
(1 − S sen αξ − R sen αη )
h αξ i αξ − (2S + iγ) cos × (1 + β) sen 2 2 h αη i αη − (2R + iγ) cos (1 − β) sen 2 2 ×ei(nξ +1/2)αξ +i(nη +1/2)αη +inS
cos αξ +inR cos αη
(10.368)
dαξ dαη
donde n = nξ + nη + 1. Al expresar las funciones trigonom´etricas en forma exponencial, las integrales que aparecen son del tipo de (10.357). En las simplificaciones debe usarse (10.358). El resultado para n 6= 0 es: Bnξ nη = AJnξ +1 (nS) Jnη +1 (nR) + BJnξ (nS) Jnη (nR) ×
ei(n+1)π/2 n
(10.369)
donde A y B est´ an dados por: a A= p (1 + β + γ − 2iS)(1 − β + γ − 2iR) 4 1 − β2
a B= p (−1 − β + γ − 2iS)(−1 + β + γ − 2iR) 4 1 − β2
(10.370) (10.371)
Para n = 0, las integrales en (10.368) son de tipo exponencial y son diferentes de cero solamente cuando nξ = −1 y nη = 0 o nξ = 0 y nη = −1 ai (2ixy ′ − Syy ′ + Rxx′ ) B−1,0 = p 8 1 − β2
donde:
ai (2iyx′ − Ryy ′ + Sxx′ ) B0,−1 = p 8 1 − β2 x = 1 + β + γ − 2iS ;
y = −1 + β + γ − 2iS
y x′ y y ′ se obtienen de ´estas reemplazando a β por −β.
(10.372)
(10.373)
(10.374)
La ecuaci´ on de Hamilton-Jacobi con variables acci´on-´ angulo / 475 En definitiva: x + iy = B−1,0 e−iϕξ +iϕϕ + B0,−1 e−iϕη +iϕϕ +
∞ X
∞ X
′
Bnξ nη einξ ϕξ +inη ϕη +iϕϕ
(10.375)
nξ =−∞nη =−∞
donde la prima en la sumatoria indica que n no es cero. Este c´ alculo fue usado en el contexto de la vieja mec´anica cu´antica para hallar las intensidades de las l´ıneas espectrales del hidr´ogeno en presencia de un campo el´ectrico (efecto Stark). En presencia de un campo el´ectrico el problema del ´atomo de hidr´ogeno cl´asico es soluble en coordenadas parab´olicas, y cuando el campo el´ectrico es muy d´ebil la soluci´on que hemos hallado en este numeral constituye la aproximaci´on cero a este sistema. Para hallar las intensidades se aplica la f´ormula (10.225), del ejemplo 10.4.1. Notamos que habr´ an dos contribuciones diferentes; una proveniente de z 2 , f´ormula (10.361) y otra proveniente de x2 +y 2 , f´ormula (10.375). Para las componentes de Fourier de z, nϕ = 0 y nξ + nη = n. Las amplitudes de las componentes z corresponden a la radiaci´ on polarizada paralelamente al campo el´ectrico homog´eneo. Para las componentes de Fourier de x ± iy, nϕ = ±1 y nξ + nη + 1 = n. Las amplitudes de las componentes x + iy corresponden a la radiaci´ on polarizada perpendicularmente al campo el´ectrico homog´eneo. Born presenta el an´alisis que hace Kramers del desdoblamiento de Stark de la l´ınea Hα del hidr´ogeno, o sea de las transiciones entre los niveles de n´ umeros cu´anticos principales 2 y 3. Ejemplo 10.5.2 Analizar las reglas de selecci´ on que se deducen de las expansiones de Fourier (10.269), (10.272), (10.359) y (10.368). En la vieja teor´ıa cu´antica y en el l´ımite cl´asico de la moderna teor´ıa cu´antica las variables de acci´on est´ an cuantizadas. As´ı, para el ´atomo de hidr´ogeno tenemos: 11 1 1 h ; Iθ = l − m + ¯ ¯h ; Iϕ = m¯h Ir = nr + 2 2 |m| − m 1 Iξ = n1 + (10.376) + ¯h ; 2 2 Iη =
|m| − m 1 ¯h ; I = m¯h + n2 + 2 2
El n´ umero cu´antico principal est´ a asociado a I = Ir + Iθ + Iϕ = Iξ + Iη + Iϕ y vale nr + l + 1 = n1 + n2 + |m| + 1. As´ı por ejemplo, los estados esf´ericos y parab´olicos para cuando el n´ umero cu´antico principal vale 2 son: n, l, m = 2, 0, 0; 2, 1, −1; 2, 1, 0; 2, 1, 1 n1 , n2 , m = 0, 0, 1; 0, 1, 0; 1, 0, 0; 0, 0, −1 11 Esta
versi´ on de las reglas de cuantizaci´ on es consistente con la moderna teor´ıa cu´ antica.
(10.377)
476 / Mec´ anica cl´ asica avanzada Los n´ umeros enteros que aparecen en las expansiones de Fourier (10.361) y (10.375) del problema anterior corresponden a las transiciones entre estados (v´ease Mec´ anica cu´ antica de Laudau, secci´ on 48). As´ı, en (10.361), nϕ = ∆m = 0 y en (10.375), nϕ = ∆m = 1 y en la compleja conjugada de (10.375), nϕ = ∆m = −1. En esta forma el desarrollo de Fourier del momento de dipolo el´ectrico da las reglas de selecci´ on cl´asicas: respecto a n1 y n2 la regla de selecci´ on es ∆n1 + ∆n2 + 1 = nξ + nη + 1 6= 0, (∆n1 = 0, ∆n2 = −1), o (∆n1 = −1, ∆n2 = 0). Respecto a l y m, de (10.269) y (10.271) se sigue que nθ + nϕ = ±1. Por otra parte, de (10.351) se sigue: ∆l − ∆m = nθ
(10.378)
Entonces vemos que cuando nϕ = ∆m = ±1, nθ = ∆l ∓ 1 y cuando nϕ = ∆m = 0, nθ = ∆l. Cuando, de acuerdo con (10.273), nθ = ∓2 y nϕ = ±1, nθ + nϕ = ∓1. Se sigue entonces que ∆l = ±1 cuando nθ = ±2, nϕ = ∓1, y ∆l = 0 cuando nθ = 0, nϕ = 0, o cuando nθ = ∓1, nϕ = ±1. En conclusi´ on, del desarrollo de Fourier de ~r en coordenadas esf´ericas se sigue que: ∆l = 0, ±1
y
∆m = 0, ±1
(10.379)
lo cual es consistente con la mec´anica cu´antica. En todas las expansiones de Fourier que hemos hallado, ejemplos 10.4.1, 10.4.2 y 10.5.1, se cumple que los coeficientes de Fourier se corresponden con elementos de matriz cu´anticos en el l´ımite cl´asico (v´ease, Landau, Mec´ anica cu´ antica, secci´ on 48). Para detalles acerca de las reglas de cuantizaci´on semicl´ asicas v´ease el art´ıculo de I.C. Percival y las referencias all´ı contenidas.12 , y la secci´ on 13.4 del cap´ıtulo 13 del presente texto. El toroide invariante. En coordenadas esf´ericas es tridimensional y consiste en el lugar geom´etrico de los puntos del espacio f´asico tales que Ir , Iθ , Iϕ tienen valores bien definidos. A partir de la figura 10.11 podemos hallar f´acilmente algunas proyecciones del toroide invariante sobre planos del espacio de configuraci´on. La proyecci´on del toroide sobre el plano de la ´ orbita a lo largo de la l´ınea ϕ0 = Constante y θ0 = Constante es una elipse. ϕ0 = Constante define sobre el toroide una superficie bidimensional, cuya proyecci´ on sobre el plano de la ´orbita es una regi´on circular que se obtiene rotando la elipse alrededor del eje z. θ0 = Constante define sobre el toroide una superficie bidimensional cuya proyecci´on sobre el plano ecuatorial es una regi´on circular que se obtiene rotando la proyecci´on de la elipse sobre el plano x − y alrededor del eje z; esta proyecci´on es un c´ırculo de radio rmax . La proyecci´on del toroide sobre el espacio tridimensional es el volumen obtenido al rotar el c´ırculo del plano x − y, de radio rmax , alrededor del eje z, y es un elipsoide de revoluci´ on con ejes de longitudes rmax y rmax cos θm´ın es claro que ambas dimensiones de este elipsoide dependen de las constantes de movimiento E, l, lz . En coordenadas parab´olicas el toroide invariante es completamente diferente (v´ease figura 10.13). La excentricidad de la ´orbita depende de las variables angulares a trav´es de θ1 . 12 Semiclassical
theory of Bound States. I.C. Percival. Adv. Chem. Phys. Vol. 36, 1977.
La ecuaci´ on de Hamilton-Jacobi con variables acci´on-´ angulo / 477 Seg´ un (10.325), en el toroide en coordenadas parab´olicas son posibles elipses de excentricidades diferentes dentro de un rango definido, que para γ = 0 var´ıan entre β y 1. Tambi´en para γ = 0, cos θ0 var´ıa entre −1 y −β. Entonces, para θ1 = 0 la trayectoria es rectil´ınea que hace un ´ angulo cos−1 (β) con respecto al eje z y para θ1 = π es una elipse de excentricidad β cuyo perihelio est´ a en π. Al barrer θ1 entre 0 y π genera un ensamble de ´ orbitas el´ıpticas con perihelio en el tercer cuadrante y envueltas por las par´ abolas ξmax y ηmax . La rotaci´on de esta regi´on alrededor de z genera la proyecci´on del toroide invariante sobre el espacio tridimensional, que es diferente de la proyecci´on en coordenadas esf´ericas. z η = (1 – β) a
θ1 = π
θ1 = 0
ξ = (1 – β) a
x
Figura 10.13 Toroide invariante en coordenadas parab´ olicas
478 / Mec´ anica cl´ asica avanzada
11 Teor´ıa de perturbaciones
Son muy pocos los problemas mec´anicos que poseen soluciones anal´ıticas exactas. Por eso son necesarios diferentes m´etodos de aproximaci´on para afrontar la mayor parte de los problemas realistas. En astronom´ıa, donde se consideran sistemas de muchos cuerpos interactuando gravitacionalmente, son indispensables los m´etodos num´ericos y los aproximados, para obtener los cambios en los par´ ametros de una ´orbita kepleriana o en los per´ıodos, causados por peque˜ nos efectos debidos a la presencia de los otros planetas. En el siglo XIX hubo gran inter´es en el problema de la estabilidad del sistema solar, que llev´ o al estudio del movimiento de muchos cuerpos interactuando entre s´ı mediante fuerzas gravitacionales, siendo el m´as simple el famoso problema de los tres cuerpos, tema que a´ un es objeto de investigaciones. Los avances han sido notables, en parte como consecuencia de los trabajos matem´aticos de Kolmogorov, Arnold y Moser, quienes han obtenido las condiciones de estabilidad de un sistema m´ ultiplemente peri´odico. Antes del surgimiento de la moderna teor´ıa cu´antica, la teor´ıa cl´asica de perturbaciones fue muy aplicada a sistemas at´omicos, especialmente para el c´ alculo de efectos debidos a la interacci´ on con campos electromagn´eticos. Es notable el trabajo de Max Born (noviembre de 1924).1 Esos esfuerzos no fueron est´eriles ni in´ utiles, pues dieron lugar a la teor´ıa de perturbaciones de la mec´anica cu´antica. Hoy esos estudios se aplican con pocas variaciones a c´ alculos sobre la estructura vibracional en sistemas moleculares, y al an´alisis de los ´ atomos en estados altamente excitados. La teor´ıa cl´ asica de perturbaciones con sus modernos desarrollos se aplica en campos tan dis´ımiles como la f´ısica de las altas energ´ıas (estabilidad de haces en un ciclotr´ on, estabilidad del plasma en una m´aquina Tokamak, etc.), y la ´optica (estabilidad de una cavidad l´aser, propagaci´on de la radiaci´ on l´aser en una fibra ´optica, comportamientos multiestables y ca´oticos en ´ optica cu´antica, etc.), por ejemplo.
1 V´ ease
el texto The mechanics of the atom de Max Born.
479
480 / Mec´ anica cl´ asica avanzada
11.1.
Teor´ıa de perturbaciones dependiente del tiempo
En los problemas perturbativos el punto de partida es un sistema para el cual es conocida la soluci´on anal´ıtica exacta, que se denomina no perturbado, descrito por un hamiltoniano H0 (p, q). El sistema de inter´es difiere del no perturbado por una peque˜ na perturbaci´on. Puede asumirse que la magnitud de la perturbaci´on est´ a determinada por cierto par´ ametro que cuando vale cero hace que el hamiltoniano sea igual a H0 . Entonces el hamiltoniano exacto admite la siguiente expansi´ on en serie de potencias de λ: H(q, p, t; λ) = H0 (q, p, t) + λH1 (q, p, t) + λ2 H2 (q, p, t) + ...
(11.1)
Por simplicidad denotaremos todos los t´erminos de perturbaci´on con H ′ , H = H0 + H ′ . La teor´ıa dependiente del tiempo se caracteriza por encontrar mediante aproximaciones la funci´ on generatriz de la transformaci´ on can´onica de evoluci´ on temporal que satisface la ecuaci´ on de Hamilton-Jacobi dependiente del tiempo. La transformaci´ on se realiza en dos pasos: F (q, q0 , t) = F0 (q, q ′ , t) + F ′ (q ′ , q0 , t)
(11.2)
donde F0 conecta las variables (q, p) con las (q ′ , p′ ) y es una soluci´on completa de la ecuaci´ on de Hamilton-Jacobi dependiente del tiempo del problema no perturbado, o sea que en ausencia de perturbaci´on las (q ′ , p′ ) son constantes. Al aplicar la perturbaci´on, las (q ′ , p′ ) no ser´an constantes sino funciones que var´ıan lentamente con el tiempo, si λ es peque˜ na. F ′ conecta las variables (q ′ , p′ ) con las constantes (q0 , p0 ) del problema perturbado. Al realizar la transformaci´ on (q, p) → (q ′ , p′ ), el hamiltoniano ser´a H + ′ ′ ∂F0 /∂t = H0 + H + ∂F0 /∂t = H , pues por hip´otesis H0 + ∂F0 /∂t = 0, y las ecuaciones de movimiento ser´an: q˙ν′ =
∂H ′ ; ∂p′ν
p˙ ′ν = −
∂H ′ ∂qν′
(11.3)
Estas ecuaciones son rigurosas pues a´ un no se ha hecho ninguna aproximaci´on, pero usando la peque˜ nez de H ′ podemos adoptar un esquema de aproximaciones sucesivas. Cuando λ = 0, (q ′ , p′ ) son ciertas constantes que llamaremos (q0′ , p′0 ). Entonces al reemplazar (q ′ , p′ ) en (11.3) al lado derecho por sus valores no perturbados obtenemos: q˙ν′ 1 =
∂H ′ (q0′ , p′0 ) ; ∂p′ν0
p˙′ν1 = −
∂H ′ (q0′ , p′0 ) ∂qν′ 0
(11.4)
donde (q1′ , p′1 ) son las soluciones de (11.3) al primer orden en λ. Las ecuaciones (11.4) pueden ahora integrarse expl´ıcitamente para darnos a (q1′ , p′1 ) en funci´ on del tiempo, al primer orden en la perturbaci´on. La correcci´on de segundo orden se halla usando la soluci´on de primer orden en el lado derecho de (11.3), y as´ı sucesivamente. Podemos encontrar sistem´ aticamente las correcciones a cualquier orden de aproximaci´ on escribiendo en vez de (11.2) una expansi´ on de F en potencias de λ: F (q, q, t) = F (0) (q, q, t) + λF (1) (q, q, t) + λ2 F (2) (q, q, t) + ...
(11.5)
Teor´ıa de perturbaciones / 481 Las funciones F (n) no pueden considerarse como funciones generatrices de una serie de transformaciones can´ onicas, como F0 y F ′ , por la disposici´on de los argumentos. Se cumple que H(q, p, t) = H(q, p, t) + ∂F/∂t. Entonces: H(q, −∂F/∂q, t) = H(q, ∂F/∂q, t) + ∂F/∂t
(11.6)
Ahora expandimos los dos lados de (11.6) en potencias de λ usando (11.5) y, H = H0 + λH1 + λ2 H2 + ...
(11.7)
La expansi´ on de H0 es: ∂F ∂F (0) ∂H0 ∂F (1) H0 q, , t = H0 q, ,t + λ · ∂q ∂q ∂~p ∂~q (1) (2) 2 1 ∂F ∂ H0 ∂F (1) ∂H0 ∂F 2 + ... · + · · +λ ∂~ p ∂~q 2 ∂~q ∂~p∂~q ∂~q La expansi´ on de H1 es: ∂F (0) ∂F ∂H1 ∂F (1) , t = λH1 q, , t + λ2 · + ... λH1 q, ∂q ∂q ∂~p ∂~q
(11.8)
(11.9)
Esto nos conduce a: H = H0 +
+λ2
h i ∂F (1) ∂F (0) + λ F (1) , H0 + H1 + ∂t ∂t
F (2) , H0 + F (1) , H1
ii h 1h ∂F (2) + F (1) , F (1) , H0 + H2 + 2 ∂t
(11.10) !
+ ...
Si H = 0, entonces F es la soluci´on de la ecuaci´ on de Hamilton-Jacobi del problema exacto. Podemos hallar las aproximaciones sucesivas igualando a cero los coeficientes de cada λn : H0 + h
h
∂F (0) =0 ∂t
i ∂F (1) = −H1 F (1) , H0 + ∂t
i ∂F (2) ii i 1h h h F (2) , H0 + F (1) , F (1) , H0 − H2 = − F (1) , H1 − ∂t 2
(11.11) (11.12) (11.13)
Las ecuaciones (11.11) y (11.12) forman un conjunto de ecuaciones diferenciales para las F (n) , que se caracteriza porque en cada ecuaci´ on el lado derecho depende s´olo de cantidades que se han evaluado en una aproximaci´on anterior.
482 / Mec´ anica cl´ asica avanzada
11.2.
Teor´ıa de perturbaciones independiente del tiempo
Esta teor´ıa se aplica fundamentalmente a sistemas conservativos y ligados que poseen soluciones m´ ultiplemente peri´odicas. El punto de partida es la descripci´on del sistema no perturbado en t´erminos de las variables acci´on-´ angulo. Luego se adopta un esquema de aproximaciones sucesivas a las variables acci´on-´ angulo del sistema perturbado. Est´ a impl´ıcita la suposici´on de convergencia del procedimiento, o sea la existencia de toroides invariantes del sistema perturbado; en general lo anterior no es cierto. El m´etodo se basa en hallar una expansi´ on en potencias de λ para la funci´ on generatriz de la transformaci´ on can´ onica que lleva a las variables acci´on-´ angulo del sistema perturbado. Se supone conocida la soluci´on para el sistema no perturbado y que ´este es no degenerado. Es decir, que no existen n´ umeros enteros n1 , n2 , ...nl tales que: n1 ω10 + n2 ω20 + ...nl ωl0 = 0
(11.14)
donde las ων0 son las frecuencias del sistema no perturbado, y que esta condici´on se cumple para cualquier conjunto de valores de las variables acci´on-´angulo no perturbadas. Las variables can´onicas (I 0 , ϕ0 ) son variables acci´on-´ angulo s´olo para el sistema no perturbado; al aplicar la perturbaci´on siguen siendo can´onicas pero dejan de ser variables acci´on-´ angulo. Esto se sigue de las ecuaciones de movimiento: ∂H I˙ν0 = − 0 ; ∂ϕν
ϕ˙ 0ν =
∂H ∂Iν0
(11.15)
Las Iν0 dependen del tiempo y las ϕ0ν no son funciones lineales del tiempo. Para λ = 0, H = H0 y en ese caso se cumple que H0 s´olo es funci´ on de las Iν0 . H, sin embargo, tiene la expresi´on: H(I 0 , ϕ0 , t) = H0 (I 0 ) + λH1 (I 0 , ϕ0 , t) + λ2 H2 (I 0 , ϕ0 , t) + ...
(11.16)
Mediante una transformaci´ on can´onica es posible, si el sistema perturbado es integrable, pasar a unas variables can´onicas (I, ϕ) tales que H sea funci´ on s´olo de las Iν .2 0 Llamaremos F (ϕ , I) a la funci´ on generatriz de esa transformaci´ on, del tipo F2 . Las siguientes son las f´ ormulas de transformaci´ on: Iν0 =
∂F ; ∂ϕ0ν
ϕν =
∂F ∂Iν
(11.17)
Las nuevas variables deben satisfacer las siguientes condiciones: (a) Las coordenadas del sistema (q, p) deben ser funciones peri´odicas de las ϕν con per´ıodo 2π. (b) H debe transformarse en una funci´ on que depende s´olo de las Iν . (c) Las variables (ϕ0 , I 0 ) han de ser funciones peri´odicas de las ϕν con per´ıodo 2π. Las coordenadas (q, p) son funciones peri´odicas tanto de las ϕ0ν como de las ϕν . Esto implica que una celdilla fundamental en el espacio ϕ0ν se transforma en otra del espacio ϕν . Entonces debe cumplirse que ϕν es igual a ϕ0ν m´as una funci´ on peri´odica de las ϕ0ν con per´ıodo 2π. 2 Esta
teor´ıa fue desarrollada por H. Poincar´ e (1892) y H. von Zeipel (1916).
Teor´ıa de perturbaciones / 483 La funci´ on F (ϕ0 , I) puede expandirse en una serie de potencias de λ. Cuando λ = 0, F se convierte en la funci´ on generatriz de la transformaci´ on can´onica identidad, de ah´ı que deba ser del tipo F2 : F (ϕ0 , I) =
l X
ϕ0ν Iν + λF (1) (ϕ0 , I) + λ2 F (2) (ϕ0 , I) + ...
(11.18)
ν=1
Entonces (11.16) y (11.18) nos conducen a: Iν0 = Iν + λ
(2) ∂F (1) 2 ∂F + λ + ... ∂ϕ0ν ∂ϕ0ν
ϕν = ϕ0ν + λ
(11.19)
∂F (1) ∂F (2) + λ2 + ... ∂Iν ∂Iν
(11.20)
F (1) , F (2) , ... deben ser funciones peri´odicas de las ϕ0ν con per´ıodo 2π. La ecuaci´ on de Hamilton-Jacobi del problema perturbado es: ∂F 0 ∂F 0 ∂F 2 + λH1 ϕ , + λ H2 ϕ , + ... = H(I) H0 ∂ϕ0 ∂ϕ0 ∂ϕ0
(11.21)
Ahora reemplazamos (11.19) en (11.21) y expandimos cada t´ermino de (11.21) en potencias de λ. Llamamos λn H (n) (I) al n-´esimo t´ermino de la expansi´ on de H(I). En seguida igualamos los coeficientes de cada λn y obtenemos una secuencia de ecuaciones diferenciales, as´ı: H0 (I) = H (0) (I)
(11.22)
X ∂H0
(11.23)
ν
∂Iν
·
∂F (1) + H1 (ϕ0 , I) = H (1) (I) ∂ϕ0ν
1 X X ∂ 2 H0 ∂F (1) ∂F (1) X ∂H0 ∂F (2) · · · + 2 µ ν ∂Iν ∂Iµ ∂ϕ0ν ∂ϕ0µ ∂Iν ∂ϕ0ν ν +
X ∂H1 ∂F (1) · + H2 (ϕ0 , I) = H (2) (I) 0 ∂I ∂ϕ ν ν ν
(11.24)
.................................... n−1 X n−s X
l X
X
s=0 k=1 ν1 ,ν2 ,...νk =1 i1 +i2 +...ik (i2 )
·
1 ∂ k Hs ∂F (i1 ) · k! ∂Iν1 ∂Iν2 ...∂Iνk ∂ϕ0ν1 =s
(ik )
∂F ∂F ... + Hn (ϕ0 , I) = H (n) (I) ; ∂ϕ0ν2 ∂ϕ0νk
n = 0, 1, 2, ...
(11.25)
484 / Mec´ anica cl´ asica avanzada Todas estas ecuaciones son de la forma: l X ∂H0 ∂F (n) · + Φn (ϕ0 , I) = H (n) (I) 0 ∂I ∂ϕ ν ν ν=1
(11.26)
donde Φn es una funci´ on que depende s´olo de F (1) , F (2) , ...F (n−1) . La ecuaci´ on (11.23) permite determinar a la vez a H (1) (I) y a F (1) . Como F (1) es funci´ on peri´odica de las ϕ0ν , el valor medio de (11.23) sobre una celdilla fundamental en el espacio de las ϕ0ν , o sea sobre el toroide invariante del movimiento no perturbado, es cero. Por tanto: H (1) (I) = hH1 (ϕ0 , I)i donde h(...)i denota: 1 (2π)l
h(...)i =
Z
2π 0
dϕ01
(11.27) Z
0
2π
dϕ02 ...
Z
0
2π
dϕ0l (...)
(11.28)
La energ´ıa del movimiento perturbado es, en la primera aproximaci´on, igual a la energ´ıa del movimiento no perturbado m´as una correcci´on dada por el promedio de la funci´ on de perturbaci´on sobre el toroide invariante del movimiento no perturbado. Este promedio, cuando se cumpla la hip´otesis erg´ odica, tambi´en es igual al promedio temporal de H1 sobre el movimiento no perturbado. Para calcular a F (1) , es necesario resolver la ecuaci´ on diferencial: l X ∂H0 ∂F (1) . = − H1 (ϕ0 , I) 0 ∂I ∂ϕ ν ν ν=1
(11.29)
donde el signo {H1 } denota la parte oscilante de H1 , o sea la diferencia H1 − hH1 i, que puede representarse por una serie de Fourier de la forma: XX X 0 0 0 ′ An1 n2 ...nl (I)ei(n1 ϕ1 +n2 ϕ2 +...nl ϕl ) (11.30) ... {H} = n1
n2
nl
donde la tilde en la sumatoria denota la omisi´on del t´ermino con n1 = n2 = ...nl = 0. F (1) tiene una expansi´ on similar: XX X 0 0 0 ′ F (1) = ... Bn1 n2 ...nl (I)ei(n1 ϕ1 +n2 ϕ2 +...nl ϕl ) (11.31) n1
n2
nl
Los coeficientes de Fourier de F (1) se obtienen directamente de los de {H1 } al reemplazar a (11.30) y (11.31) en (11.29): B~n (I) =
−A~n (I) i~n · ~ ω 0 (I)
(11.32)
En la aproximaci´on de primer orden se sigue de (11.20): ϕν = ϕ0ν + λ
∂F (1) (ϕ0 , I) ∂Iν
(11.33)
Teor´ıa de perturbaciones / 485 lo cual nos dice que las variables angulares perturbadas presentan peque˜ nas oscilaciones con amplitud del orden de λ. El cambio en las frecuencias se obtiene de: ων0 (I) =
∂H(I) ∂H (1) (I) = ων0 (I) + λ ∂Iν ∂Iν
(11.34)
y resulta ser peque˜ no. De (11.19) se obtiene para las Iν0 : Iν = Iν + λ
∂F (1) (ϕ0 , I) ∂ϕ0ν
(11.35)
lo cual muestra que las Iν0 que en el movimiento no perturbado son constantes, ahora est´ an sometidas a oscilaciones de amplitud del orden de λ. Que no haya degeneraci´ on es una exigencia necesaria para que (11.32) tenga sentido. As´ı no haya degeneraci´ on pueden presentarse los llamados peque˜ nos divisores, o sea valores de n1 , n2 , ...nl tales que ~n · ~ω 0 toma valores peque˜ nos. De (11.24) se sigue que la parte oscilante en el lado izquierdo debe anularse, lo cual nos da una ecuaci´ on diferencial para F (2) : ∂F (1) ∂F (1) 1 X X ∂ 2 H0 · · 2 µ ν ∂Iν ∂Iµ ∂ϕ0ν ∂ϕµ (11.36) X ∂H0 ∂F (2) X ∂H1 ∂F (1) + H2 (ϕ0 , I) = 0 + · + 0 0 ∂I ∂ϕ ∂I ∂ϕ ν ν ν ν ν ν En tanto que la correcci´on de segundo orden a la energ´ıa viene dada por: X ∂H1 ∂F (1) 0 H2 (I) = hH2 (ϕ , I)i + · ∂Iν ∂ϕ0ν ν 1 X X ∂ 2 H0 + 2 µ ν ∂Iµ ∂Iν
∂F (1) ∂F (1) · ∂ϕ0µ ∂ϕ0ν
(11.37)
Podemos ahora usar (11.31) y (11.32) en (11.37) para obtener: H (2) = hH2 i −
l X X n nν A−~ n ′ ∂A~ 0 ∂I ~ n · ω ~ ν ν=1 ~ n
+
l l 1 X X ∂ωµ0 X ′ A~n A−~n nν nµ 2 µ=1 ν=1 ∂Iν (~n · ~ω 0 )2
(11.38)
~ n
donde se ha usado la f´ ormula: ~ hei(~n+m) · ϕi = δ~n,−m ~
(11.39)
486 / Mec´ anica cl´ asica avanzada H (2) puede tambi´en escribirse en la forma: H (2) = hH2 i −
l |A~n |2 ∂ 1 X′ X nν 2 ∂Iν ~n · ω ~0 ν=1
(11.40)
~ n
que equivale tambi´en a: H
(2)
= hH2 i −
l X X
~ n·~ ω 0 >0
∂ nν ∂Iν ν=1
|A~n |2 ~n · ~ω 0
(11.41)
Para la correcci´on de orden n, se sigue de (11.26) que: H (n) (I) = hΦn (ϕ0 , I)i
(11.42)
en tanto que F (n) es soluci´on de la ecuaci´ on: l X
ων0
ν=1
∂F (n) = − {Φn } ∂ϕ0ν
Podemos expresar a {Φn } como una serie de Fourier: X (n) ′ im· ~ ϕ ~0 {Φn } = Am ~ (I) e
(11.43)
(11.44)
m ~
de donde se sigue que los coeficientes de Fourier de F (n) son: (n)
Bm ~ (n) =
−Am ~ im ~ ·ω ~0
(11.45)
Esto nos dice que a cada orden es necesaria la condici´on de no degeneraci´on del movimiento no perturbado. Poincar´e mostr´o que las series de Fourier para las F (n) son convergentes en sentido asint´ otico. Por esto pueden truncarse a partir de valores razonables de los nν y obtenerse resultados precisos, independientemente de la presencia de los “peque˜ nos divisores” que necesariamente aparecen para nν grandes al tomar la serie completa. Ejemplo 11.2.1 Encontrar las correcciones de primero y segundo orden para un oscilador arm´onico con perturbaci´on anarm´ onica. El oscilador anarm´ onico con correcciones c´ ubicas y cu´articas es soluble exactamente por cuadraturas. Pero es ilustrativa la manera de aplicar la teor´ıa de perturbaciones para obtener las variables acci´on-´ angulo del problema perturbado. El hamiltoniano no perturbado es: H0 =
1 p2 + m(ω 0 )2 q 2 2m 2
(11.46)
y la perturbaci´on: H1 = aq 3 ;
H2 = bq 4
(11.47)
Teor´ıa de perturbaciones / 487 De acuerdo con el ejemplo 9.5.5, las variables acci´on-´ angulo del problema no perturbado se hallan mediante la transformaci´ on can´onica con funci´on generatriz F1 , dada por: F (q, ϕ0 ) =
1 mω02 cot ϕ0 2
(11.48)
que da lugar a la transformaci´ on: 0 1/2 2I sen ϕ0 ; p = (2mI 0 ω 0 )1/2 cos ϕ0 q= mω 0
(11.49)
Expresando a H0 , H1 y H2 en t´erminos de I 0 y ϕ0 , obtenemos: H0 = I 0 ω 0
(11.50)
H1 = a
2I 0 mω 0
3/2
H2 = b
2I 0 mω 0
2
sen3 ϕ0
(11.51)
sen4 ϕ0
(11.52)
De (11.27) obtenemos directamente: H (1) = hH1 i = 0
(11.53)
Como ∂H0 /∂I 0 = ω 0 , se sigue de (11.29) que F (1) obedece la ecuaci´ on: ∂F (1) a =− 0 ∂ϕ0 ω
2I mω 0
3/2
sen3 ϕ0
(11.54)
Es decir, el t´ermino c´ ubico en la perturbaci´on no da lugar a cambio en la energ´ıa del oscilador. Pero como F (1) es diferente de cero, las expresiones (11.49) para p y q s´ı resultan modificadas al primer orden. Al introducir la perturbaci´on, I 0 deja de ser constante, pues de (11.35) y (11.54) se sigue que presenta oscilaciones de frecuencias w0 y 3w0 . Ahora, usemos (11.24) para hallar a H (2) : ∂H1 ∂F (1) (2) 0 (11.55) · H (I) = hH2 (ϕ , I)i + ∂I ∂ϕ0 El c´ alculo nos da: H (2) = −
15a2 I2 I2 3b + 3 0 4 2 4 m (ω ) 2 m (ω 0 )2
(11.56)
De (11.54) se sigue la siguiente expresi´on para F (1) : F (1) =
a 3ω 0
2I mω 0
3/2
sen2 ϕ0 cos ϕ0 + 2 cos ϕ0
(11.57)
488 / Mec´ anica cl´ asica avanzada 0por tanto: ∂F λa ϕ= = ϕ0 + ∂I 2Iω 0
2I mω 0
3/2
sen2 ϕ0 cos ϕ0 + 2 cos ϕ0
(11.58)
Ahora resolvemos esta ecuaci´ on para ϕ0 en t´erminos de ϕ, al primer orden en λ: 3/2 λa 2I 0 ϕ =ϕ− sen2 ϕ cos ϕ + 2 cos ϕ (11.59) 2Iω 0 mω 0 A este mismo orden, I 0 en funci´ on de (I, ϕ) es: 3/2 λa 2I I0 = I − 0 sen3 ϕ ω mω 0
(11.60)
Al reemplazar (11.59) y (11.60) en la expresi´on (11.49) para q, que sigue siendo v´alida en el sistema perturbado, obtenemos: 1/2 λaI 2I sen ϕ − 2 0 3 (3 + cos 4ϕ) (11.61) q= mω 0 m (ω ) Ejercicio 11.2.1 Aplicar la teor´ıa de perturbaciones al p´endulo simple, tomando como par´ ametro peque˜ no la relaci´on entre la energ´ıa de libraci´ on y la energ´ıa de la separatriz (peque˜ nas oscilaciones). Mostrar que: H(I) = ω 0 I − F (1)
λGI 16
2
(11.62)
GI 2 =− (8 sen ϕ − sen 4ϕ) 192ω 0
ver el ejemplo 10.3.2.
11.3.
Multiplicidad de conjuntos de variables acci´ on´ angulo en los sistemas degenerados
Los ejemplos 10.3.5 y 10.4.4 ilustran la propiedad general de los sistemas degenerados consistente en que la separaci´on de variables de la ecuaci´ on de Hamilton-Jacobi es posible en diferentes sistemas de coordenadas, lo que a su vez conlleva a la posibilidad de definir diferentes conjuntos de variables acci´on-´ angulo. Entonces un sistema m´ ultiplemente peri´odico con degeneraci´on se caracteriza por poseer diferentes conjuntos de per´ıodos, correspondientes a los diferentes conjuntos de variables acci´on-´ angulo. Si f denota alguna coordenada o momento generalizado, cuando el sistema es degenerado existen varios conjuntos de variables acci´on-´ angulo (I,ϕ), (I ′ ,ϕ′ ), ..., con lo cual f posee la propiedad: f (I1 , I2 , ...Il ; ϕ1 + 2π, ϕ2 + 2π, ...ϕl + 2π) = (11.63) f (I1 , I2 , ...Il ; ϕ1 , ϕ2 , ...ϕl )
Teor´ıa de perturbaciones / 489 f (I1′ , I2′ , ...Il′ ; ϕ′1 + 2π, ϕ′2 + π, ...ϕ′l + 2π) = (11.64) f (I1′ , I2′ , ...Il′ ; ϕ′1 , ϕ′2 , ...ϕ′l , ), etc. Es decir, las diferentes expresiones de f en variables acci´on-´ angulo poseen propiedades de periodicidad similares. Como ilustraci´ on, ver las f´ ormulas (10.269) ejemplo 10.4.2, y (10.361) ejemplo 10.5.1, mediante las cuales se expresa a z en t´erminos de las variables acci´on-´ angulo esf´ericas y parab´olicas en el caso de una part´ıcula en un potencial 1/r. Se ve que la relaci´ on entre los diferentes conjuntos de variables no es trivial y que las variables de acci´on esf´ericas dependen no s´olo de las variables de acci´on parab´olicas sino tambi´en de las variables angulares parab´olicas. La ecuaci´ on (10.344) nos da la relaci´on entre ϕr y las variables acci´on-´ angulo parab´olicas: −1 A + B cos(αη − αξ ) ϕr = −ϕξ − tan (11.65) B sen (αη − αξ ) que nos muestra que ϕr es igual a una funci´ on lineal de las variables angulares parab´olicas m´as una funci´ on peri´odica de esas variables. Teorema 11.3.1 Todos los sistemas de variables angulares en que una funci´ on f (I, ϕ) tiene per´ıodo fundamental 2π, est´ an conectados entre s´ı por las f´ormulas: ϕν =
l X
nνµ ϕ′µ + ψν (ϕ′1 , ϕ′2 , ...ϕ′l , I1′ , I2′ , ...Il′ ) (11.66)
µ=1
ν = 1, 2, ...l donde las nνµ forman una matriz de elementos enteros y determinante ±1 y las ψν son funciones peri´odicas de las ϕ′ν con per´ıodo 2π. Seg´ un el teorema, buscamos una transformaci´ on: ϕν = fν (ϕ′ , I ′ )
(11.67)
para la cual es preservada la periodicidad de cualquier variable din´amica F (como la z citada anteriormente): F (ϕ, I) = F ′ (ϕ′ , I ′ )
(11.68)
Ahora llamemos ϕν a: ϕν = fν (I ′ ; ϕ′1 + 2π, ϕ′2 , ...ϕ′l )
(11.69)
Entonces: F (I; ϕ1 , ϕ2 , ...ϕl ) = F ′ (I ′ ; ϕ′1 + 2π, ϕ′2 , ...ϕ′l ) = (11.70) F ′ (I ′ ; ϕ′1 , ϕ′2 , ...ϕ′l ) = F (I; ϕ1 , ϕ2 , ...ϕl )
490 / Mec´ anica cl´ asica avanzada Lo cual significa que ϕν y ϕν difieren por un m´ ultiplo de 2π entero que llamaremos 2πnν1 : fν (I ′ ; ϕ′1 + 2π, ϕ′2 , ...ϕ′l ) = fν (I ′ ; ϕ′1 , ϕ′2 , ...ϕ′l ) + 2πnν1
(11.71)
De manera similar se cumple:
fν I ′ ; ϕ′1 , ϕ′2 , ...ϕ′µ + 2π, ...ϕ′l = fν (I ′ ; ϕ′1 , ϕ′2 , ...ϕ′l ) + 2πnνµ ;
ν, µ = 1, 2, ...l
(11.72)
esto s´olo es posible si fν es de la forma: fν (I ′ , ϕ′ ) =
l X
nνµ ϕ′µ + ψν (ϕ′ , I ′ )
(11.73)
µ=1
donde ψν es funci´ on peri´odica de las ϕ′µ con per´ıodo 2π. Claramente vemos que (11.65) es una realizaci´ on de la f´ormula (11.66). Evidentemente la expresi´on para ϕ′ν en t´erminos de (ϕ) es de la forma (11.66). Esto requiere que la matriz inversa de (nνµ ) tenga igualmente elementos enteros. La condici´on necesaria para esto es que det (nνµ ) = ±1. Funci´ on generatriz de la transformaci´ on (ϕ, I)→ (ϕ′ , I ′ ). La transformaci´ on (11.66) se puede escribir como: ϕν =
l X
nνµ ϕ′µ + ψν (ϕ′ , I) ;
ν = 1, 2, ...l
(11.74)
µ=1
Lo cual indica que la transformaci´ on can´onica se puede obtener mediante una funci´ on generatriz de la forma G(ϕ′ , I), del tipo F3 : ϕν = −
∂G ; ∂Iν
Iν′ = −
∂G ; ∂ϕ′ν
ν = 1, 2, ...l
(11.75)
Con lo cual G es de la forma: G(ϕ′ , I) = −
l X
nνµ Iν ϕ′µ + ψ (ϕ′ , I)
(11.76)
ν,µ=1
lo cual implica que las ψν deben ser derivadas parciales de ψ y por tanto se debe cumplir: ∂ψµ ∂ψν = ∂Iµ ∂Iν
(11.77)
Las f´ ormulas de transformaci´ on para las Iν′ son: Iν′ =
l X
µ=1
nνµ Iν −
∂ψ ∂ϕ′ν
La funci´ on ψ debe ser peri´odica en las ϕν y en las ϕ′ν . Por tanto: X ψ= C~n (I)ei~n·ϕ~ ~ n
(11.78)
(11.79)
Teor´ıa de perturbaciones / 491 Entonces (11.74) y (11.78) toman la forma: ϕν =
l X
nνµ ϕ′µ −
X ∂C~n (I)
nνµ Iν − i
X
µ=1
Iν′
=
l X
µ=1
∂Iν
~ n
ei~n·ϕ~
′
C~n (I)nν ei~n·ϕ~
(11.80)
′
(11.81)
~ n
Como tanto las (I, ϕ) como las (I ′ , ϕ′ ) son variables acci´on-´ angulo, las (I, I ′ ) deben ′ ser constantes y las (ϕ, ϕ ) deben ser funciones lineales del tiempo. Esto implica una de las dos condiciones siguientes: C~n (I) = 0
para
~n 6= 0
(11.82)
o que en el exponente de la serie de Fourier s´olo aparecen combinaciones de las ϕ′ν tales que: n1 ϕ′1 + n2 ϕ′2 + ...nl ϕ′l = (n1 ω1′ + n2 ω2′ + ...nl ωl′ ) t (11.83) +n1 δ1′ + n2 δ2′ + ... + nl δl′ = constante Claramente la condici´on (11.83) requiere que el sistema sea degenerado, ~n · ω ~ ′ = 0. En conclusi´ on, para un sistema no degenerado, hay varios conjuntos de variables acci´on-´ angulo, conectados entre s´ı mediante las f´ormulas: ϕν =
l X
µ=1
nνµ ϕ′µ −
∂ψ ; ∂Iν
Iν′ =
l X
nνµ Iν
(11.84)
µ=1
con funci´ on generatriz: G(ϕ′ , I) = −
l X l X
nνµ Iν ϕ′µ + ψ(I)
(11.85)
ν=1 µ=1
donde nνµ es una matriz de elementos enteros y determinante ±1. En el caso degenerado, asumimos que entre las ων′′ existen l − s relaciones de conmensurabilidad: l X
nν ων′′ = 0
(11.86)
ν=1
Es posible realizar una transformaci´ on can´onica auxiliar a nuevas variables acci´ona´ngulo (I ′ , ϕ′ ) tal que l − s de las frecuencias ων′ sean id´enticamente cero y las s restantes sean no nulas e independientes entre s´ı: ωα′ ;
α = 1, 2, ...s
(Inconmensurables) (11.87)
ωρ′ = 0 ;
ρ = s + 1, s + 2, ...l
492 / Mec´ anica cl´ asica avanzada La funci´ on generatriz de tal transformaci´ on es de la forma: F =−
l X
Cνµ Iν′′ ϕ′µ
(11.88)
ν,µ=1
De donde: ϕ′′ν =
l X
Cνµ ϕ′µ ;
Iν′ =
l X
Cνµ Iµ′′
(11.89)
µ=1
µ=1
donde las ων′′ satisfacen las relaciones (11.86). Claramente: ϕ′ν =
l X
Cνµ ϕ′′µ
(11.90)
µ=1
lo cual implica que para satisfacerse (11.87) es necesario: l X
Cµρ ϕ′′µ = 0
para
ρ = s + 1, s + 2, ...l
(11.91)
µ=1
Es decir, las Cµρ se obtienen de los nµ que aparecen en las l − s relaciones de conmensurabilidad (11.86). Ejemplo 11.3.1 Considerar el movimiento de una part´ıcula en un potencial 1/r. Este problema es degenerado. Realizar una transformaci´ on a variables acci´on-´ angulo tales que las frecuencias satisfagan las condiciones (11.87). En coordenadas esf´ericas las dos condiciones de degeneraci´on pueden escribirse como: ωr − ωθ = 0 ;
ωϕ − ωθ = 0
(11.92)
De la funci´ on generatriz F = (ϕϕ − ϕθ )I1 + (ϕr − ϕθ )I2 + ϕr I3 se sigue que las variables acci´on-´ angulo buscadas son: ϕ1 = ϕϕ − ϕθ ;
ϕ2 = ϕr − ϕθ ;
ϕ3 = ϕr
(11.93)
y, I1 = Iϕ ;
I2 = Iθ + Iϕ ;
I3 = Ir + Iθ + Iϕ
(11.94)
mk 2 I33
(11.95)
Las nuevas frecuencias son: ω1 = 0 ;
ω2 = 0 ;
ω3 =
En coordenadas parab´olicas la transformaci´ on buscada puede obtenerse con la funci´ on generatriz: ϕξ + ϕη − ϕ I1 + (ϕξ − ϕη )I2 − ϕξ I3 (11.96) F = 2
Teor´ıa de perturbaciones / 493 que da lugar a la transformaci´ on: I1 = Iϕ ;
I2 = Iη +
ϕ1 = ϕϕ −
ϕξ + ϕη ; 2
Iϕ ; 2
I3 = Iξ + Iη + Iϕ
ϕ2 = ϕη − ϕξ ;
ϕ3 = ϕξ
(11.97) (11.98)
En tanto que ω1 , ω2 y ω3 est´ an dadas por las f´ormulas (11.95). Con esta transformaci´ on, los resultados del cap´ıtulo 10 referentes a las constantes de movimiento que resultan de la degeneraci´ on se expresan como: θ1 = −ϕ2 ;
φ1 = ϕ1
(11.99)
La clasificaci´on dada en (11.87) nos permite llamar a las ϕ′α y Iα′ variables acci´on´angulo propias, y a las ϕ′ρ , Iρ′ , variables impropias o degeneradas; las ϕ′ρ permanecen constantes en el curso del movimiento. El n´ umero s de frecuencias ωα′ no nulas e independientes se llama el grado de periodicidad del sistema y el n´ umero l − s se llama el grado de degeneraci´ on. Consideraremos ahora las f´ ormulas de transformaci´ on (11.80) y (11.81) en el caso degenerado. Con el fin de que la divisi´ on entre variables degeneradas y no degeneradas persista, requerimos que las ϕρ no dependan de las ϕ′α y que las ϕ′ρ no dependan de las ϕα . Esto implica que los elementos nρα se anulen. Las f´ormulas de transformaci´ on que toman en cuenta lo anterior y adem´as que las ϕα y las ϕ′α son funciones lineales del tiempo, y que las ϕρ , ϕ′ρ , Iν , Iν′ , son constantes, son: ϕα =
l X
nαµ ϕ′µ + ψα (ϕ′σ , I)
(11.100)
µ=1
ϕρ =
l X
nρσ ϕ′σ + ψρ (ϕ′σ , I)
(11.101)
σ=s+1
Iα′ =
s X
nβα Iβ
l X
nνρ Iρ − i
(11.102)
β=1
Iρ′ =
ν=1
X
C~nσ (I)nρ ei~nσ ·ϕ~ σ
(11.103)
~ nσ
donde el sub´ındice σ se coloca a los vectores para indicar que solamente tienen componentes degeneradas. Como los nνµ son enteros y los nρα son nulos, entonces se cumple que: det nνµ = ±1
y
det nαβ = ±1
(11.104)
En conclusi´ on, las variables de acci´on no degeneradas est´ an determinadas un´ıvocamente, aparte de una transformaci´ on lineal entera homog´enea de determinante ±1. Por
494 / Mec´ anica cl´ asica avanzada su parte, las variables de acci´on degeneradas no necesitan transformarse integralmente y pueden depender de variables angulares degeneradas; los nνρ no necesitan ser enteros. Esto podemos ilustrarlo con el ejemplo 11.3.1 y las f´ormulas de la secci´ on 10.5, referentes al problema de Kepler. Las variables angulares no degeneradas son ϕ′3 = ϕξ y ϕ3 = ϕr , las variables angulares degeneradas son ϕ′2 = ϕη − ϕξ , ϕ′1 = ϕϕ − (ϕξ + ϕη )/2, ϕ2 = ϕr − ϕθ y ϕ1 = ϕϕ − ϕθ . Vemos la correspondencia entre las f´ormulas (11.65) y (11.100). Por otra parte, I3′ = Iξ + Iη + Iϕ y I3 = Ir + Iθ + Iϕ , o sea que I3′ = I3 , que corresponde a (11.102). Una f´ormula del tipo (11.103) es la que expresa a I2 = Iθ + Iϕ en t´erminos de I3′ , I2′ , I1′ , ϕ′2 , que se obtiene f´acilmente de la f´ormula (10.325), secci´ on 10.5. h i p I22 = 12 I3′2 1 − β 2 + γ 2 − (1 − β 2 )2 − 2γ 2 (1 + β 2 ) + γ 4 cos ϕ′2 (11.105)
11.4.
Teor´ıa de perturbaciones de sistemas degenerados
En la secci´ on 11.2 obtuvimos las f´ormulas para las correcciones a la energ´ıa y a la funci´ on generatriz cuando un sistema no degenerado se somete a una perturbaci´on. Ya en la f´ ormula (11.45) encontramos un resultado que no se puede aplicar cuando hay degeneraciones. En la f´ormula (11.42), para las correcciones a la energ´ıa, aparece un promedio sobre todas las variables angulares, pero hemos visto que en un sistema degenerado hay l − s nuevas constantes de movimiento, las l − s variables angulares que permanecen constantes, con valores dependientes s´olo de las condiciones iniciales. Por esto la trayectoria de fases no ocupa una regi´on l-dimensional sino una de s´olo s dimensiones. Un promedio sobre las variables angulares degeneradas es m´as bien un promedio sobre todos los movimientos que resultan de cambiar las condiciones iniciales, o sea un promedio sobre un ensamble, lo cual es inadmisible cuando se considera un solo sistema. En conclusi´ on, en (11.42) no tiene sentido promediar sobre las ϕ0ρ , quedando H (n) dependiente de las variables angulares ϕ0ρ : (11.106) H (n) Iα ; ϕ0ρ , Iρ
Esto tiene una raz´ on f´ısica m´as profunda: las variables (ϕ0 , I 0 ) que se obtienen de las variables del problema perturbado (ϕ, I) al hacer λ = 0 no est´ an determinadas por el movimiento no perturbado sino por la perturbaci´on. Es decir, no podemos partir de cualquier conjunto de variables acci´on-´ angulo del sistema no perturbado sino que antes debemos encontrar un conjunto de variables acci´on-´ angulo “exactas en la aproximaci´on cero”. Este comportamiento se refleja en la teor´ıa cu´antica de perturbaciones de sistemas degenerados, donde se deben formar combinaciones lineales de las funciones de onda degeneradas para obtener las funciones de onda exactas en la aproximaci´on cero, que son las funciones que se obtienen de las perturbadas al hacer λ = 0. Esto en mec´anica cu´antica equivale a buscar una combinaci´ on lineal de las funciones degeneradas que diagonalice la perturbaci´on, en teor´ıa de perturbaciones degeneradas de primer orden.3 3 V´ ease
la secci´ on 12.5, cap´ıtulo 12.
Teor´ıa de perturbaciones / 495 Debido a su car´ acter degenerado, otras variables de acci´on degeneradas, conectadas con las Iρ0 por relaciones de la forma (11.103), deben introducirse en lugar de las Iρ0 mediante una adecuada elecci´on de las coordenadas. Tal elecci´on, obviamente, est´ a determinada por la perturbaci´on (o m´as exactamente, por las simetr´ıas que tenga la perturbaci´on). Debemos realizar una transformaci´ on can´onica preliminar, escogida de tal manera que, al primer orden, H1 dependa s´olo de variables de acci´on. La transformaci´ on es (I 0 , ϕ0 ) → (I 0 ′ , ϕ0 ′ ), con funci´ on generatriz: G(ϕ0 , I 0 ′ ) =
l X
Iν0 ′ ϕ0ν + V (ϕ0ρ , I 0 ′ )
(11.107)
ν=1
La f´ ormulas de transformaci´ on son: Iα0 =
∂G = Iα0 ′ ; ∂ϕ0α
ϕ′α =
∂G ∂V = ϕ0α + 0 ′ ; ∂Iα0 ′ ∂Iα
Iρ0 =
∂G ∂V = Iρ0 ′ + ∂ϕ0ρ ∂ϕ0ρ ′ ϕ0ρ ′ =
∂G ∂V = ϕ0ρ + 0 ′ ∂Iρ0 ′ ∂Iρ
(11.108) (11.109)
G en (11.107) tiene una parte que depende solamente de las variables ϕ0ρ e Iρ0 ′ , la cual se halla resolviendo la ecuaci´ on de Hamilton-Jacobi siguiente: ∂G = H (1) (I 0 ′ ) (11.110) H1 Iα0 , ϕ0ρ , ∂ϕ0ρ En este punto est´ a garantizando que la perturbaci´on no depender´a de variables angulares al promediar sobre las variables angulares no degeneradas y que se cumple siempre la condici´on m ~ ·~ ω 0 6= 0. Ahora expresamos a H en t´erminos de (I ′ , ϕ′ ): H = H0 (Iα′ ) + λH1 (ϕ0 ′ , I 0 ′ ) + λ2 H2 (ϕ0 ′ , I 0 ′ ) + ...
(11.111)
y, como en la secci´ on 11.2, buscamos una transformaci´ on can´onica (I ′ , ϕ′ ) → (I, ϕ), lo cual dar´ a lugar nuevamente a las f´ormulas (11.22), ... (11.25), escribiendo (ϕ0 , I 0 ) en lugar de (ϕ0 ′ , I 0 ′ ). Como H no depende de Iρ′ , ahora en lugar de (11.26) se tiene: s X ∂H0 ∂F (n) · = H (n) (I) − Φn (ϕ0 , I) 0 ∂I ∂ϕ α α α=1
(11.112)
Al primer orden, en vez de (11.29) tenemos: s X ∂H0 ∂F (1) · = − H1 (ϕ0 , I) 0 ∂Iα ∂ϕα α=1
(11.113)
donde {H1 } = H1 − hH1 i y h...i denota un promedio sobre las variables angulares ϕ0α .4 Es claro que la ecuaci´ on (11.113) no permite determinar completamente a F (1) , pues 4 La
soluci´ on de la forma (11.32) a´ un existe, siendo bien definida salvo posibles divergencias debidas 0 ≈ 0. a la presencia de peque˜ nos denominadores en los arm´ onicos altos, ~ nα · ~ ωα
496 / Mec´ anica cl´ asica avanzada cualquier soluci´on de (11.113) est´ a indeterminada por la adici´ on de una funci´ on de Iν y ϕ0ρ . Llamaremos G(1) a la parte de F (1) determinada por (11.113), de modo que: F (1) = G(1) + R(1)
(11.114)
donde R(1) deber´ a quedar determinada en la siguiente aproximaci´on. Ahora, la ecuaci´ on (11.24) puede escribirse como: s
s
1 X X ∂ 2 H0 ∂G(1) ∂G(1) · 2 α=1 ∂Iα ∂Iβ ∂ϕ0α ∂ϕ0β β=1
+
l X ∂H 0
α=1
∂Iα
(2)
·
l X ∂H1
(11.115) (1)
∂F ∂F + · + H2 (ϕ0 , I) = H (2) (I) 0 ∂ϕ0α ∂I ∂ϕ ν ν ν=1
De esta ecuaci´ on podemos determinar a H (2) (I), a R(1) y a una parte G(2) de F (2) . Indicaremos con h...i los promedios sobre las ϕ0α y los promedios sobre las ϕ0ν completas por hh...ii. Entonces: H (2) (I) = hhΦ2 ii
(11.116)
donde Φ2 es completamente conocida: s
Φ2 =
s
1 X X ∂ 2 H0 ∂G(1) ∂G(1) · · 2 α=1 ∂Iα ∂Iβ ∂ϕ0α ∂ϕ0β β=1
+
s X ∂H1
α=1
∂Iα
(11.117)
∂G(1) · + H2 (ϕ0 , I) ∂ϕ0α
R(1) es soluci´on a la ecuaci´ on: l X ∂H1 ∂R(1) . = −{hΦ2 i} ∂Iρ ∂ϕ0ρ ρ=s+1
(11.118)
donde: {hΦ2 i} = hΦ2 i − hhΦ2 ii
(11.119)
F (2) es soluci´on a: s X ∂H0 ∂F (2) · = −{Φ2 } ∂Iα ∂ϕ0α α=1
(11.120)
pero (11.120) determina s´olo una parte G(2) , quedando por determinar una funci´ on R(2) 0 que depende de ϕρ y Iν , en la aproximaci´on siguiente. La ecuaci´ on secular. Consideremos primero el cambio en los coeficientes de Fourier de una variable din´amica al pasar de un sistema de variables acci´on-´ angulo a otro, (I, ϕ) → (I, ϕ). Asumamos que la transformaci´ on can´onica es del tipo G(I, ϕ),
Teor´ıa de perturbaciones / 497 de modo que (I, ϕ) pueden tomarse independientes, y con funciones de (I, ϕ). Sean las expansiones de Fourier de f (I, ϕ) = f (I, ϕ): X X im· ~ ϕ ~ f (I, ϕ) = f~n (I)ei~n·ϕ~ = f (I, ϕ) = fm (11.121) ~ (I)e ~ n
m ~
on de f~n (I), as´ı: Entonces, claramente f m ~ (I) pueden expresarse en funci´ I I I X 1 ~ f~n (I)ei~n·ϕ~ e−i~n·ϕ~ dl ϕ ... fm (11.122) ~ (I) = (2π)l ~ n
Llamaremos i~ α ·~ a e ϕ: ′
gα~⋆ α~ ′ (I)
a los coeficientes de la expansi´ on de Fourier de ei~α·ϕ~ respecto
~′ ~
ei~αϕ~ = gα~⋆ α~ ′ (I) eiα ·ϕ
(11.123)
donde se supone que ϕ puede expresarse en t´erminos de (I, ϕ). Ahora en (11.122) sea ~n = α ~ −α ~′ y m ~ = β~ − β~ ′ . Entonces (11.122) y (11.123) nos conducen f´acilmente a: XX f β− gα~⋆ β~ (I) fα~ −~α′ (I) gα~ ′ β~′ (I) ~ β ~ ′ (I) = α ~
=
α ~
XX α ~
α ~′
(11.124)
g+ ~ −~ α′ (I) gα ~ ′ (I) ~ (I) fα ~ ′β β~ α
⋆ donde g + ~ . Si formamos matrices con los coeficientes de Fourier, entonces (11.124) ~ α = gα ~β β~ nos dice que f~n y fm an conectados por medio de una transformaci´ on unitaria. ~ est´ Ahora examinemos las expansiones de Fourier de hH1 (I 0 , ϕ0ρ )i respecto a las variables can´ onicas (Iρ0 , ϕ0ρ ) y (Iρ0 ′ , ϕ0ρ ′ ) conectadas por las f´ormulas (11.108) y (11.109). La transformaci´ on can´ onica buscada, por definici´on, conduce a una expresi´on que no depende de las ϕ′ρ . Si llamamos f (Iρ0 , ϕ0ρ ) a hH1 (Iρ0 , ϕ0ρ , Iα )i y f ′ a la correspondiente expresi´on en t´erminos de (Iρ0 ′ , ϕ0ρ ′ ), podemos hacer corresponder la ecuaci´ on de Hamilton-Jacobi (11.110) con la (11.124). La transformaci´ on can´onica buscada debe dar lugar a coeficientes de Fourier de la forma: ′ 0′ (1) 0 ′ fβ− (I )δβ, ~β ~′ ~ β ~ ′ (I ) = H
Por tanto (11.124) para este caso puede escribirse as´ı: i h XX 0 0 (1) 0 g+ (I )δα~ α~ ′ gα~ ′ β~ ′ (I 0 ) = 0 ~ −~ α′ (I ) − H ~ (I ) fα β~ α
α ~
(11.125)
(11.126)
α ~′
donde hemos usado la f´ ormula X + gβ~ ~ ′ = δβ, ~β ~′ ~ α gα ~β
(11.127)
α ~
En otras palabras, la transformaci´ on can´onica es tal que diagonaliza la matriz fα~ −~α′ (I 0 ) formada con los coeficientes de Fourier de hH1 (I 0 , ϕ0ρ )i respecto a las variables angulares degeneradas. H (1) (I 0 ′ ) se obtienen resolviendo la ecuaci´ on secular: i h (11.128) det fα~ −~α′ (I 0 ) − H (1) (I 0 ′ )δα~ α~ ′ = 0
498 / Mec´ anica cl´ asica avanzada en tanto que la transformaci´ on can´onica se obtiene a partir de los vectores propios de la matriz fα~ −~α′ (I 0 ), suministrando la conexi´on entre las variables angulares ϕ0ρ y ϕ0ρ ′ . Debe notarse que las matrices que aparecen en este desarrollo son de dimensi´ on infinita; por tanto (11.128) debe entenderse como el paso al l´ımite de una secuencia de determinantes. Vemos que encontrar las variables acci´on-´ angulo exactas en la aproximaci´on cero equivale a diagonalizar la matriz formada con los coeficientes de Fourier de la perturbaci´ on. Tambi´en encontramos que resolver la ecuaci´ on de Hamilton-Jacobi independiente del tiempo, equivale, siempre, a diagonalizar la matriz de los coeficientes de Fourier del respectivo hamiltoniano. Ejemplo 11.4.1 Encontrar las variables de acci´on perturbadas en el efecto Stark del ´tomo de hidr´ogeno cl´asico, en coordenadas esf´ericas. a El hamiltoniano para este problema es de la forma H = H0 + λH1 , donde: H0 = −
m(Ze2 )2 2(I30 )2
(11.129)
es la energ´ıa del movimiento kepleriano en ausencia del campo y: λH1 = eEz
(11.130)
es la perturbaci´on. z est´ a dada por la f´ormula (10.268), " 0 2 #1/2 I1 z = 1− (x0 cos ϕ02 − y 0 sen ϕ02 ) I20
(11.131)
x0 y y0 son las coordenadas cartesianas del electr´on en el plano de la ´orbita, y el eje menor es x. La u ´nica variable angular no degenerada es ϕ03 , de la cual dependen x0 y y 0 , seg´ un las f´ ormulas (10.222) y (10.223). Por tanto: 3 hx0 i = − ǫ0 a0 ; 2
hy 0 i = 0
(11.132)
En consecuencia, tomando a E como λ: hH1 (I30 , ϕ02 , I10 , I20 )i = " 0 2 #1/2 " 0 2 #1/2 I1 I2 3 0 . 1− cos ϕ02 − ea 1 − 0 2 I2 I30
(11.133)
a0 es igual a: a0 =
(I30 )2 mZe2
(11.134)
En esta expresi´on no aparecen ni ϕ01 ni ϕ03 . Por tanto I10 y I30 son constantes durante el movimiento perturbado y aparecen como par´ ametros. Las u ´ nicas variables son entonces ϕ02 y I20 , indicando que en el movimiento perturbado la ´orbita no permanece
Teor´ıa de perturbaciones / 499 r´ıgida sino que presenta oscilaciones de la excentricidad y del perihelio en el plano de la ´orbita, el cual a su vez gira uniformemente alrededor del eje z y oscila alrededor de la l´ınea de nodos (V´ease la figura 10.11). La ecuaci´ on de Hamilton-Jacobi (11.110) que nos determina la variable de acci´on I20 exacta en la aproximaci´on cero para este caso es: " 0 2 0 2 0 2 #1/2 0 3ea E I2 I1 I1 − cos ϕ02 1− = H (1) (I 0 ′ ) (11.135) − + 2 I30 I20 I30 la cual nos da expl´ıcitamente a I20 = ∂G/∂ϕ02 y entonces a G. Las integrales resultan bastante dif´ıciles. Si s´olo queremos hallar a H (1) (I 0 ′ ), notemos que (11.108) al ser integrada sobre un per´ıodo de ϕ02 , nos da: I I ∂V1 1 1 0′ 0 0′ dϕ02 (11.136) I2 dϕ2 − I2 = 2π 2π ∂ϕ02 y que seg´ un (11.109) V1 es una funci´ on peri´odica de ϕ02 , con lo cual: I 1 I20 ′ dϕ02 I20 ′ = 2π
(11.137)
lo cual nos suministra la expresi´on para H (1) que buscamos. Llamemos (I30 )2 = A, (I10 )2 = B, [2H (1) /(3ea0 E)]2 = C y (I20 )2 = x. Por tanto 0 2I2 dI20 = dx, o sea: √ 2 x dI20 = dx (11.138) lo cual nos permite escribir: I I √ dϕ02 1 1 ∂ϕ0 x I20 ′ = dx I20 02 dI20 = 2π dI2 2π dx
(11.139)
De (11.135) se sigue que: cos2 ϕ02 =
C x B B 1− − + A x A
Por tanto: d(sec
2
ϕ02 )
1 = C
1 B − + 2 dx A x
(11.140)
(11.141)
En consecuencia:
√ dϕ02 (x2 − AB) AC = √ dx 2 x(A − x)(x − B)[(A − x)(x − B) − ACx]1/2
Entonces (11.139) nos da: √ I (x2 − AB) dx AC I20 ′ = 4π (A − x)(x − B)[(A − x)(x − B) − ACx]1/2
(11.142)
(11.143)
500 / Mec´ anica cl´ asica avanzada La integral se hace usando el m´etodo de los residuos, teniendo en cuenta que en el plano complejo el integrando es una funci´ on biforme (positivo entre xm´ın y xm´ax y negativo entre xm´ax y xm´ın ), presentando una l´ınea de ramificaci´ on. Por otra parte el integrando posee singularidades en x = A, x = B y x = ∞, con polos en esos puntos. El residuo en x = A vale −2π/C 1/2 , el residuo en x = B vale 2π[B/(AC)]1/2 y el residuo en x = ∞ vale 2π (el cual se obtiene con la sustituci´on y = 1/x). En consecuencia: √ √ 1 √ I20 ′ = A − B − CA (11.144) 2 que es lo mismo que: " (1) # 1 0′ 0′ 0′ 0 ′ 22 H I2 = I2 − I3 − (I2 ) (11.145) 0 2 3ea Por tanto H (1) vale: H (1) (I 0 ′ ) = ±
3eEa0 ′ 0 ′ (I1 − I30 ′ − 2I20 ′ ) 2I10 ′
(11.146)
Este ejemplo ilustra el m´etodo de las perturbaciones seculares, que hacen que las variables angulares degeneradas, que en el problema no perturbado son constantes, pasen a ser funciones lineales del tiempo dando lugar a oscilaciones en los par´ ametros de la orbita que aumentan con la intensidad de la perturbaci´on. ´ En efecto, las frecuencias perturbadas son: ω30 ′ = ω30 + λ ω20 ′ = λ
∂hH1 i ∂I30 ′
∂hH1 i ; ∂I20 ′
(11.147)
ω10 ′ = λ
∂hH1 i ∂I10 ′
(11.148)
Las frecuencias que en el movimiento no perturbado son nulas, en el perturbado pasan a ser “frecuencias lentas”, en tanto que las frecuencias no degeneradas son “frecuencias r´apidas”. Ejemplo 11.4.2 Calcular las correcciones de segundo orden en el ´atomo de Hidr´ogeno cl´ asico en un campo el´ectrico uniforme (efecto Stark cuadr´atico). Si trabajamos con coordenadas parab´olicas, H (0) y las frecuencias est´ an dadas por (10.300) y (10.306). Entonces la ecuaci´ on (11.37) para la correcci´on de segundo orden de la energ´ıa toma la forma: H (2) (I) = 1 ∂ 2 H0 2 ∂I32
*
∂F (1) ∂ϕ03
2 +
+
∂ω ∂F (1) . ∂I2 ∂ϕ02
+
∂ω ∂F (1) . ∂I3 ∂ϕ03
(11.149)
y F (1) es soluci´on a la ecuaci´ on: ω0
∂F (1) + W (I, ϕ0 ) = 0 ∂ϕ03
(11.150)
Teor´ıa de perturbaciones / 501 siendo W igual a: 3 W = H1 − hH1 i = eEz − eEaβ (11.151) 2 Podr´ıamos partir de la expresi´on para W en coordenadas parab´olicas para calcular a F (1) y luego a H (2) . Sin embargo usaremos el siguiente procedimiento equivalente: como en coordenadas parab´olicas el promedio de eEz sobre las variables angulares es igual al promedio temporal, debido a que heEzit no contendr´a variables angulares, podemos realizar inicialmeste los promedios temporales en coordenadas esf´ericas. Luego, antes de promediar sobre la otra variable angular pasamos de coordenadas esf´ericas a coordenadas parab´olicas usando las ecuaciones (10.326) y (10.327). El resultado ser´a el mismo que si se calculan los promedios temporales en coordenadas parab´olicas. Finalmente, promediando sobre θ1 obtenemos a H (2) en coordenadas parab´olicas. heEzit y eEz est´ an dados por: heEzit =
3 eEaǫ cos θm´ın cos θ0 2
(11.152)
eEz = eF a cos θm´ın
−(1 − ǫ2 )1/2 sen θ0 sen ψ + ǫ cos θ0 − cos θ0 cos ψ
Por tanto W en coordenadas esf´ericas es: W = eF a cos θm´ın 1 × −(1 − ǫ2 )1/2 sen θ0 sen ψ + ǫ cos θ0 − cos θ0 cos ψ 2
(11.153)
La ecuaci´ on (11.150) toma la forma: ∂F (1) eF a = cos θm´ın 0 ∂ϕ3 2ω 0 h i × 2(1 − ǫ2 )1/2 sen θ0 sen ψ + ǫ cos θ0 + 2 cos θ0 cos ψ
(11.154)
Usando la ecuaci´ on de Kepler se cumple:
∂F (1) ∂ψ ∂F (1) 2π ∂F (1) = = · · 0 0 ∂ϕ3 ∂ψ ∂ϕ3 ∂ψ 1 − ǫ cos ψ
(11.155)
por tanto tenemos que: ∂F (1) = ∂ψ
h eF a cos θ 2(1 − ǫ2 )1/2 sen θ0 sen ψ m´ ın 4πω 0 +ǫ cos θ0 + 2 cos θ0 cos ψ −2ǫ(1 − ǫ2 )1/2 sen θ0 sen ψ cos ψ −ǫ2 cos θ0 cos ψ − 2ǫ cos θ0 cos2 ψ
(11.156) i
502 / Mec´ anica cl´ asica avanzada Integrando respecto a ψ hallamos la siguiente expresi´on para F (1) , luego de omitir una constante de integraci´ on que no contribuir´ a a H (2) ya que W tiene media cero: F (1) =
h eF a − 2(1 − ǫ2 )1/2 sen θ0 cos ψ cos θ m´ ın 4πω 0 + cos θ0 sen ψ − ǫ(1 − ǫ2 )1/2 sen θ0 sen2 ψ −ǫ2 cos θ0 sen ψ − ǫ cos θ0 sen ψ cos ψ
(11.157)
i
Esta funci´ on satisface el requisito de la teor´ıa can´onica de perturbaciones de ser una funci´ on peri´odica de θ1 y ϕξ , como puede verse f´acilmente usando (10.328), (10.329), (10.341) a (10.345). Si quisi´eramos aplicar la f´ormula (11.149) directamente en coordenadas esf´ericas, deber´ıamos haber tomado hH1 i = 0 lo cual dar´ıa lugar a la aparici´ on en F (1) y ∂F (1) /∂ϕ02 de un t´ermino proporcional a ψ, que se incrementa linealmente con el tiempo (llamado secular); esto evidencia que la f´ormula (11.36) s´olo puede aplicarse en coordenadas en las cuales la perturbaci´on sea “diagonal”, es decir, que no contenga variables angulares. Usando la propiedad: ∂F (1) ∂F (1) = − ∂ϕ02 ∂θ0
(11.158)
Llegamos a la siguiente expresi´on para ∂F (1) /∂20 : ∂F (1) = ∂ϕ02
h eF a cos θm´ın 2(1 − ǫ2 )1/2 cos θ0 cos ψ 0 2ω +(2 − ǫ2 )sen θ0 sen ψ 2 1/2
+ǫ(1 − ǫ )
(11.159) 2
cos θ0 sen ψ
−ǫ sen θ0 sen ψ cos ψ
i
Por otra parte, usando las siguientes relaciones: ∂ cos θm´ın = ∂I2
γ2 I3 (1 − ǫ2 )3/2 cos θm´ın
∂ǫ = ∂I2
−(1 − ǫ2 − γ 2 ) I3 (1 − ǫ2 )1/2 ǫ cos2 θm´ın
∂ψ = ∂I2
−
I2 sen ψ I32 ǫ (1 − ǫ cos ψ)
(11.160)
Teor´ıa de perturbaciones / 503 donde γ = I1 /I3 , obtenemos al hacer todos los c´ alculos: n h ∂W −eEa γ 2 ǫ cos θ0 = 2 3/2 ∂I2 2I3 (1 − ǫ ) cos θm´ın +2(1 − ǫ2 )1/2 sen θ0 sen ψ + 2 cos θ0 cos ψ
i
h +(1 − ǫ2 )(1 − ǫ2 − γ 2 ) − ǫ−1 cos θ0 + 2(1 − ǫ2 )−1/2 ×sen θ0 sen ψ − +
(11.161)
2(1 − ǫ2 )1/2 ǫ−1 sen θ0 cos ψ sen ψ 1 − ǫ cos ψ
2ǫ−1 cos θ0 sen2 ψ io 1 − ǫ cos ψ
Usando la siguiente relaci´ on: Z 2π 1 ∂W ∂F (1) ∂W ∂F (1) · · (1 − ǫ cos ψ) dψ = 0 ∂I2 ∂ϕ2 t 2π 0 ∂I2 ∂ϕ02
(11.162)
obtenemos usando (11.159), (11.161) y (11.162) despu´es de un c´ alculo largo pero directo: h (eEa)2 ∂W ∂F (1) (9 − 13ǫ2 − γ 2 + 4ǫ4 + ǫ2 γ 2 ) . = − ∂I2 ∂ϕ02 t 16ω 0 I3 (1 − ǫ2 ) (11.163) i +(−4 + 3ǫ2 + 4γ 2 + ǫ4 + ǫ2 γ 2 ) cos2 θ0 Por otra parte podemos escribir los otros dos t´erminos de la ecuaci´ on (11.149) as´ı: * 2 + 1 ∂ 2 H0 ∂W ∂F (1) ∂F (1) · 2 ∂I32 ∂ϕ03 ∂I3 ∂ϕ03 t t
3ω 0 =− 2I3 =−
1 2ω 0
*
W ω0
2 +
3 ∂ + I3 ∂I3
+ t
∂W · ∂I3
−W ω0
(11.164)
t
hW 2 it
De (10.268) se sigue que: 1 hW 2 it = (eE)2 a cos2 θm´ın (1 − ǫ2 + 5ǫ2 cos2 θ0 ) 2
(11.165)
Con este resultado (11.164) puede escribirse como: −
(eEa)2 [20(1 − ǫ2 ) + (4 + 10ǫ2 ) cos2 θ0 ] (1 − ǫ2 − γ 2 ) · 16I3 ω 0 1 − ǫ2
(11.166)
504 / Mec´ anica cl´ asica avanzada Resumiendo los resultados dados por las ecuaciones (11.163) y (11.166) llegamos a:
∂W ∂F (1) · ∂I2 ∂ϕ02
t
+
∂W ∂F (1) · ∂I3 ∂ϕ03
1 ∂ 2 H0 + 2 ∂I32 t
*
∂F (1) ∂ϕ03
2 +
t
(11.167)
2
=−
(eEa) [(29 − 24ǫ2 − 21γ 2 ) + 9ǫ2 cos2 θm´ın cos2 θ0 ] 16I3 ω 0
Si ahora pasamos a coordenadas parab´olicas mediante las ecuaciones (10.325), (10.341) a (10.345), llegamos a la siguiente expresi´on para el lado derecho de (11.167): (eEa)2 h − · 17 − 3β 2 − 9γ 2 16I3 ω 0 i p − 12 [(1 + β 2 ) − γ 2 ][(1 − β 2 ) − γ 2 ] cos θ1 (11.168) El promedio sobre la variable angular ϕ2 (θ1 = −ϕ2 ) nos conduce a la expresi´on final para H (2) : H (2) (I) = −
(eEa)2 (17 − 3β 2 − 9γ 2 ) 16I3 ω 0
(11.169)
que expresada en t´erminos de las Iν es: H (2) (I) = −
(eE)2 I 4 [17I 2 − 3(Iξ − Iη )2 − 9Iϕ2 )] 16m3 (Ze2 )4
(11.170)
Este es el mismo resultado de Epstein en (1916) usando un m´etodo de aproximaciones sucesivas, expuesto por Born (Op. cit., p. 591). El m´etodo de aproximaciones descrito en la secci´ on 11.2 puede tambi´en fallar cuando el sistema no perturbado no posee degeneraci´on intr´ınseca pero ocurre que las frecuencias se tornan conmensurables para ciertas condiciones iniciales. Cuando esto ocurre se habla de degeneraci´ on accidental. En este sentido es incorrecta la distinci´on que algunos textos de mec´anica cu´antica hacen al referirse a la degeneraci´on presente en los niveles de energ´ıa del ´atomo de hidr´ogeno respecto al n´ umero cu´antico orbital l como “accidental”. En astronom´ıa se presenta este tipo de degeneraci´on, como en el caso del movimiento de algunos planetas menores (Aquiles, Patroclo, H´ector y N´estor) que tienen casi el mismo per´ıodo de revoluci´ on que J´ upiter. En la mayor´ıa de los sistemas la degeneraci´on accidental es m´as frecuente que la degeneraci´on intr´ınseca.
11.5.
Perturbaciones adiab´ aticas
Perturbaciones peque˜ nas y perturbaciones lentas. Veamos la diferencia en una expansi´ on de perturbaciones para perturbaciones peque˜ nas y para perturbaciones adiab´aticas. En el primer caso hay un par´ ametro peque˜ no en el sistema determinado por la intensidad de la perturbaci´on. El par´ ametro peque˜ no de una perturbaci´on lenta est´ a dado por la relaci´on entre la frecuencia de la perturbaci´on y las frecuencias
Teor´ıa de perturbaciones / 505 r´apidas del sistema. Cuando el par´ ametro toma el valor cero, el sistema posee solamente oscilaciones r´apidas, y a medida que aumenta el valor del par´ ametro, aparecen las contribuciones de las frecuencias lentas. Asumamos que el sistema posee s´olo una frecuencia r´apida y que el hamiltoniano se puede separar en la forma: H = H0 (I, λ~y , λt) + λH1 (I, ϕ, λ~y , λt)
(11.171)
donde I y ϕ son las variables acci´on-´ angulo del movimiento no perturbado (λ = 0) del grado de libertad r´apido, y ~ y = (q, p) son las variables can´onicas de los restantes grados de libertad, no necesariamente expresadas en variables acci´on-´ angulo. Debido a que cuando λ = 0 el sistema es de un grado de libertad, entonces es integrable. Construcci´ on de invariantes adiab´ aticos can´ onicos. Para calcular el efecto de la perturbaci´on buscamos una transformaci´ on can´onica de (I, ϕ, ~y ) a (I, ϕ, ~y) tal que on generatriz el nuevo hamiltoniano no dependa de la variable angular r´apida ϕ. La funci´ es de la forma: F = Iϕ + ~p~q + λF (1) I, ϕ, ~p, ~q, t + ... (11.172) y las f´ ormulas de transformaci´ on de primer orden son: I =I +λ
∂F (1) ; ∂ϕ (1)
∂F p~ = ~p + λ ; ∂~q
ϕ=ϕ−λ
∂F (1) ∂I
(11.173)
(1)
∂F ~q = ~q − λ ∂~p
(11.174)
Ahora reemplazamos a (11.173) y (11.174) en (11.171) y expandimos al primer orden en λ para obtener: ∂F (1) H0 (I, λ~y , λt) = H0 I, λ~y, λt + λω ∂ϕ
siendo ω = ∂H0 /∂I la frecuencia r´apida. Con la transformaci´ on can´ onica el nuevo hamiltoniano total ser´a: ∂F (1) I, ϕ, λ~y, λt H I, ϕ, λ~y, λt = H(I, ϕ, λ~y , λt) + λ ∂(λt)
(11.175)
(11.176)
En esta expresi´on ahora retenemos s´olo los t´erminos de primer orden en λ: ∂F (1) H I, ϕ, λ~y , λt = H0 (I, λ~y , λt) + λω + λH1 I, ϕ, λ~y , λt ∂ϕ
Al orden cero (11.177) nos da: H 0 I, λ~y , λt = H0 (I, λ~y , λt)
(11.177)
(11.178)
y al primer orden:
∂F (1) + H1 I, ϕ, λ~y , λt H 1 I, ϕ, λ~y , λt = ω ∂ϕ
(11.179)
506 / Mec´ anica cl´ asica avanzada Como por definici´on la transformaci´ on can´onica elimina en H la dependencia de ϕ, se debe cumplir que F (1) satisfaga la ecuaci´ on diferencial: ω
∂F (1) = −{H1 } ∂ϕ
(11.180)
En tanto que la energ´ıa al primer orden satisface la expresi´on: H I, λ~y, λt = H0 I, λ~y, λt + λhH1 i
(11.181)
donde {...} y h...i denotan aqu´ı la parte oscilante y el promedio respectivamente, respecto a la variable angular ϕ. En (11.180) vemos que no hay complicaciones, como en (11.29) y (11.32), debidas a posibles resonancias entre ω y arm´onicos superiores de las frecuencias lentas. La ecuaci´ on (11.173) nos da los invariantes adiab´aticos a orden cero en λ e I, y a primer orden en λ e I: I (I, ϕ, λ~y , λt) = I − λ
∂F (1) ∂ϕ
(11.182)
o equivalentemente: I =I+
λ {H1 } ω
(11.183)
Realmente cualquier funci´ on de I puede escogerse como un invariante adiab´atico. Mediante la construcci´ on de un invariante adiab´atico, si existe, se reduce el sistema de l grados de libertad a l − 1 grados de libertad. Esto se logra al encontrar la transformaci´ on can´ onica que elimina en H la dependencia respecto a ϕ, con lo cual I queda como un par´ ametro constante. Si uno de los restantes l − 1 grados de libertad sufre una oscilaci´ on r´apida en comparaci´ on a los dem´ as grados de libertad, podemos introducir un segundo par´ ametro peque˜ no, transformar a variables acci´on-´ angulo el grado de libertad r´apido y hallar un segundo invariante adiab´atico. El proceso puede continuarse para obtener una secuencia de invariantes adiab´aticos, hasta que el sistema es reducido a un grado de libertad, que puede integrarse para obtener el invariante final. Esto significa que todo sistema posee l invariantes adiab´aticos aproximados obtenidos mediante promedios, as´ı no sea integrable (es decir que no posea l constantes de movimiento en involuci´ on). Ejemplo 11.5.1 Este ejemplo se refiere a un sistema hamiltoniano no aut´onomo de un grado de libertad, que por tanto posee un comportamiento an´alogo al de un sistema de dos grados de libertad. Se trata de un oscilador lineal sometido a una variaci´on adiab´atica de sus par´ ametros: Ho.l. =
1 1 G(λt) p2 + F (λt) q 2 2 2
(11.184)
Podemos hallar las variables acci´on ´angulo mediante la funci´ on generatriz: 1/2 1 F q 2 tan ϕ (11.185) F1 = − 2 G
Teor´ıa de perturbaciones / 507 Entonces el hamiltoniano transformado toma la forma siguiente: H = ω0 I −
λR′ I sen 2ϕ 2R
(11.186)
p √ donde R(λt) = F/G, ω0 (λt) = F G y la prima denota derivada respecto a λt. La ecuaci´ on (11.186) tiene ahora la forma (11.171) y podemos aplicar los resultados de la teor´ıa de los adiab´aticos can´ onicos. Al orden cero el invariante adiab´atico es: I=
H0 = constante ω0
(11.187)
La ecuaci´ on (11.183) nos da el invariante de primer orden: I = I (1 + λP sen 2ϕ)
(11.188)
donde P (λt) = −R′ /(2ω0 R). O sea que al primer orden I tiene una peque˜ na componente que oscila con una frecuencia el doble de la frecuencia r´apida ω0 . De (11.188) se sigue: I˙ = λP˙ I sen 2ϕ + 0(λ2 )
(11.189)
Como P˙ = λP ′ , vemos que efectivamente I˙ es del orden de λ2 , siendo I un invariante al primer orden. Veamos las posibles resonancias entre ω0 y los arm´onicos de las frecuencias asociadas a los cambios adiab´aticos de los par´ ametros. Para ello expandamos a P˙ en una serie de Fourier: X ′ P˙ = λ an einω1 λt (11.190) n
siendo ω1 λ la frecuencia de la oscilaci´on lenta y ω1 /ω2 del orden de la unidad. Entonces, seg´ un (11.189) y (11.190), I˙ tendr´a la siguiente expansi´ on de Fourier: i I X′ h i(nω1 λt+2ϕ) I˙ = λ2 an e − ei(nω1 λt−2ϕ) 2i n
(11.191)
a: Ahora, integremos a I˙ sobre un per´ıodo de la oscilaci´on lenta. Esto nos dar´ " λ2 X′ ∆I e2i(2πω0 /(λω1 )+ϕ0 ) − e2iϕ0 = an 2i n i(nω1 λ + 2ω0 ) I # e−2i(2πω0 /(λω1 )+ϕ0 ) − e−2iϕ0 (11.192) − i(nω1 λ − 2ω0 ) Vemos que ∆I/I ser´a del orden de λ2 , a no ser que haya una conmensurabilidad entre las oscilaciones en t y en ϕ: s ω0 = (11.193) λω1 2
508 / Mec´ anica cl´ asica avanzada donde s es un entero del orden de 1/λ. En este caso los t´erminos con n = ±s en (11.192) ser´an constantes en t, y ∆I/I ser´a del orden de λ: 2π ∆I ≈ λ|as | I ω1
(11.194)
O sea que si la resonancia es mantenida por tiempos del orden de un per´ıodo de la oscilaci´ on lenta, 2π/(λω1 ), el invariante de primer orden es destruido.
11.6.
Sistema de osciladores lineales con acoplamiento no lineal
Consideremos l osciladores lineales con frecuencias propias ω10 , ω20 , ...ωl0 acoplados anarm´ onicamente. El hamiltoniano es de la forma H = H0 + λH1 + λ2 H2 + ..., donde: X p2 1 ν (11.195) + m(ων0 )2 qν2 H0 = 2m 2 ν H1 =
X
aν qν3 +
ν
H2 =
XX µ
X
bν qν4 +
ν
+
′
XXX µ
XX µ
ν
aµν qµ2 qν +
ν
XXX µ
′
′
ν
′
aµνλ qµ qν qλ
(11.196)
λ
(bµν qµ2 qν2 + b′µν qµ3 qν )
ν
bµνλ qµ2 qν qλ +
XXXX µ
λ
ν
λ
(11.197) ′
bµνλρ qµ qν qλ qρ
ρ
donde µ, ν, λ y ρ var´ıan entre 1 y l. Los coeficientes a y b presentan en sus ´ındices las mismas propiedades de simetr´ıa que los productos de los qν que multiplican. La prima en la sumatoria significa que se omiten los t´erminos con ´ındices iguales. Caso no degenerado. Cuando las ων0 son inconmensurables se dice que son no degeneradas. En las variables acci´on-´ angulo (ϕ0 , I 0 ), H0 es: H0 =
l X
ων0 Iν0
(11.198)
ν=1
H1 y H2 en funci´ on de (ω 0 , I 0 ) se obtienen sustituyendo: qν = Qν sen ϕν ;
Qν =
2Iν0 mων0
1/2
;
ϕν = ϕ0ν
(11.199)
Como en H1 s´olo entran productos de sen ϕν un n´ umero impar de veces, se sigue que: H (1) = hH1 i = 0
(11.200)
Teor´ıa de perturbaciones / 509 Para hallar a H (2) aplicamos la f´ormula (11.40), lo cual requiere hallar los coeficientes de Fourier A~n de H1 . Para escribir a H1 como una serie de Fourier usamos la identidad trigonom´etrica: 4 sen α sen β sen γ =
−sen (α + β + γ) + sen (−α + β + γ)
(11.201)
+sen (α − β + γ) + sen (α + β − γ) la cual nos da: 1X aν Q3ν [−sen (3ϕν ) + 3sen ϕν ] 4 ν
H1 =
+
1X aµν Q2µ Qν [−sen (2ϕµ + ϕν ) 4 µν
+2 sen ϕν + sen (2ϕµ − ϕν )] +
(11.202)
1X aµνλ Qµ Qν Qλ [−sen (ϕµ + ϕν + ϕλ ) 4 µνλ
+3 sen (ϕµ + ϕν − ϕλ )] La ecuaci´ on (11.202) tiene la forma de una serie de Fourier seno: X H1 = B~n sen (~n · ϕ ~)
(11.203)
~ n
donde todos los coeficientes de Fourier B (ν) (nν ) son cero excepto: 1X 3 aµν Q2µ Qν B1ν = aν Q3ν + 4 2 µ
(11.204)
1 B3ν = − aν Q3ν 4
(11.205)
1 νµ B21 = − aνµ Q2ν Qµ 4
(11.206)
µν B2−1 =
1 aνµ Q2ν Qµ 4
3 νµλ B111 = − aνµλ Qν Qµ Qλ 2 νµλ B11−1 =
3 aνµλ Qν Qµ Qλ 2
(11.207) (11.208) (11.209)
En (11.40) aparecen |A~n |2 = A~n A−~n , donde A~n est´ an relacionadas con los B~n por: A~n =
B~n − B−~n 2i
(11.210)
510 / Mec´ anica cl´ asica avanzada entonces: |A~n |2 =
1 (B~n − B−~n )2 4
(11.211)
con lo cual los |A~n |2 diferentes de cero son: 1 |Aν1 |2 = Cν = 64
3aν Q3ν + 2
X
aµν Q2µ Qν
µ
!
(11.212)
1 2 6 a Q 64 ν ν
|Aν3 |2 = Cν′ =
2 |Aνµ 21 | = Cνµ =
(11.213)
1 2 4 2 a Q Q 64 νµ ν µ
(11.214)
9 2 a Q2 Q2 Q2 16 νµλ ν µ λ
2 |Aνµλ 111 | = Cνµλ =
(11.215)
luego (11.40) toma la forma: 1XX 3X bν Q4ν + bνµ Q2ν Q2µ 8 ν 4 ν µ
H (2) =
−
X 1 ∂ (Cν + Cν′ ) 0 ∂I ω ν ν ν
− −
XX ν
µ
2 0 ∂Cνµ 0 ∂Cνµ − ω 4ω µ ν 4(ων0 )2 − (ωµ0 )2 ∂Iν ∂Iµ
XXX ν
µ
λ
(11.216)
∂Cνµλ 1 ων0 + ωµ0 + ωλ0 ∂Iν
1 + 0 ων + ωµ0 − ωλ0
∂Cνµλ ∂Cνµλ ∂Cνµλ + − ∂Iµ ∂Iµ ∂Iλ
Seg´ un (11.199) y (11.212) a (11.215) las cantidades C son de tercer grado en las Iν , de modo que todos los t´erminos de H (2) son cuadr´aticos en las Iν . La energ´ıa total tiene entonces la siguiente dependencia de las variables de acci´on: X 1 XX 0 ω Iν Iµ (11.217) H(I) = ων0 Iν + 2 ν µ νµ ν Es claro que la condici´on de inconmensurabilidad de las frecuencias queda reducida a excluir los casos: 2ων0 = ωµ0 ;
ων0 + ωµ0 = ωλ0
para todos los valores de ν, µ, λ.
(11.218)
Teor´ıa de perturbaciones / 511 Ejemplo 11.6.1 Aplicar la teor´ıa de perturbaciones de estados degenerados al sistema construido por dos osciladores lineales con frecuencias conmensurables, sometidos a una perturbaci´on anarm´ onica del tipo (11.196). Las trayectorias en el espacio de configuraci´on para el movimiento no perturbado son las figuras de Lissajous. H0 es: H0 =
1 2 px + p2y + m(ωx0 )2 x2 + m(ωy0 )2 y 2 2m
(11.219)
donde rωx0 = sωy0 , siendo r y s enteros. La perturbaci´on es de la forma:
H1 = ax x3 + ay y 3 + axy x2 y + ayx y 2 x
(11.220)
La soluci´on al movimiento no perturbado en variables acci´on-´ angulo est´ a dada por (11.198) y (11.199). Para tratar la degeneraci´ on es conveniente separar la frecuencia no degenerada mediante una transformaci´ on can´ onica de la forma (11.89), que para este caso es: ϕ01 = ϕ′x ;
ϕ02 = −rϕ′x + sϕ′y
Ix′ = I10 − rI20 ;
Iy′ = sI20
(11.221) (11.222)
donde las primas denotan las variables de acci´on originales. H0 en t´erminos de las I 0 es: H0 (I 0 ) = ω10 I10
(11.223)
donde las frecuencias est´ an dadas por: ω10 = ωx0 ;
ω20 = 0
(11.224)
La soluci´on al movimiento no perturbado es: x=
2(I10 − rI20 ) mω10
y=
2s2 I20 rmω10
1/2
1/2
sen ϕ01 (11.225)
(rϕ01 + ϕ02 ) sen s
El promedio de H1 sobre un ciclo de la variable angular ϕ01 es: 1/2 s I10 − rI20 2I20 ϕ0 = − axy sen 2 δr,2s 0 0 2 mω1 rmω1 s 1/2 2s2 I20 I10 − rI20 ϕ0 sen 2 2 δs,2r 0 0 rmω1 mω1 s
hH1 (I10 , I20 , ϕ02 )i 1 + ayx 2
(11.226)
512 / Mec´ anica cl´ asica avanzada Si r 6= 2s o s 6= 2r el procedimiento falla porque hH1 i = 0, pero el resultado (11.218) es v´alido en ese caso, mostrando que s´olo hay correcciones de orden superior al primero. Para precisar asumamos que 2ωx0 = ωy0 . Entonces: q 0 −axy 0 0 I2 sen ϕ02 hH1 (I10 , I20 , ϕ02 )i = I − 2I (11.227) 1 2 2(mω10 )3/2 La ecuaci´ on de Hamilton-Jacobi para este problema es: q A x C=− x3 − I10 + C = 0 ; x = I20 ; 2 sen ϕ02 Las ra´ıces dependen del signo del discriminante: 0 3 0 3 2 I1 I A2 C =− 1 D= − + + 6 2 6 4 sen2 ϕ02
(11.228)
(11.229)
que depende esencialmente de la magnitud de H (1) , o sea de la energ´ıa. Si D > 0, una ra´ız es real y dos son complejo conjugadas. Si D = 0, todas las ra´ıces son reales, siendo dos de ellas iguales entre s´ı; esto ocurre para valores de H (1) (I) y ϕ02 bien determinados. Si D < 0, todas las ra´ıces son reales y diferentes entre s´ı. Para D > 0, la ra´ız real es: 3/2 2/3 I10 C √ C √ 0 + (11.230) I2 = + − + D + D 3 2 2 Cuando D = 0 las ra´ıces son: I10 I10 I0 ; I20 = 2 1 ; 3 6 6 Cuando D < 0 las ra´ıces son: I10 2θ I10 2θ 2π 0 I2 = 1 + cos ; 1 + cos + 3 3 3 3 3 I10 2θ 4π 1 + cos + 3 3 3
(11.231)
(11.232)
donde cos θ = (6/I10 )3/2 C/2. La figura 11.1 muestra el comportamiento de las ra´ıces reales en funci´ on de C −1 . CT es el valor de C para el cual D = 0, que ocurre cuando: 0 3/2 0 3/2 I (1) ′ (mω1 ) =2 1 (11.233) −C = H (I ) axy sen ϕ02 6 √ Para A muy grande tenemos que D ≈ C/2. En ese caso se cumple que: I20 ≈ C 2/3 = A2/3 (sen ϕ02 )−2/3 ;
A2 ≫ (I10 )3
(11.234)
De (11.108) vemos que I20 ′ es igual al valor medio de I20 sobre un per´ıodo de ϕ02 . Entonces: H (1) (I ′ ) =
axy (I20 ′ )3/2 0 3/2 (mω1 ) h(sen ϕ02 )−2/3 i3/2
(11.235)
Teor´ıa de perturbaciones / 513 I 20/ 3
2 I 10 / 3 I 10/ 3
1/CT
1/C
Figura 11.1 Ra´ıces reales en funci´on de C −1
11.7.
Movimiento cerca de una resonancia aislada
Para precisar, sea un sistema de dos grados de libertad sometido a una perturbaci´on peque˜ na. Si se presenta una resonancia entre las frecuencias no perturbadas: r ω2 = ω1 s
(11.236)
entonces debemos usar la teor´ıa de perturbaciones de sistemas degenerados. Primero realizamos una transformaci´ on can´onica del tipo (11.88) para aislar una de las frecuencias. Una funci´ on generatriz adecuada es: F2 = (rϕ1 − sϕ2 )I 1 + ϕ2 I 2
(11.237)
que da lugar a las f´ ormulas de transformaci´ on: I1 = rI 1 ;
I2 = I 2 − sI 1
ϕ1 = rϕ1 − sϕ2 ;
ϕ2 = ϕ2
(11.238) (11.239)
Cuando se aplica la perturbaci´on, como vimos en el efecto Stark lineal, ϕ˙ 1 pasa a on de Fourier de ser una frecuencia lenta y ϕ˙ 2 es una frecuencia r´apida. Si en la expansi´ H1 en las variables acci´on-´ angulo iniciales, (I, ϕ), efectuamos la transformaci´ on (11.238) y (11.239), obtenemos: H1 =
XX l
m
Hl,m (I)ei[lϕ1 +(ls+mr)ϕ2 ]/r
(11.240)
514 / Mec´ anica cl´ asica avanzada Ahora, en vez de “diagonalizar” a H1 como en la secci´ on 11.4, podemos usar la teor´ıa de las perturbaciones adiab´aticas teniendo en cuenta que en resonancia, ϕ˙ 2 ≫ ϕ˙ 1 . La f´ ormula (11.181) nos da para este caso: H = H 0 (I) + λhH 1 i
(11.241)
donde hH 1 i es el promedio sobre ϕ2 . Como el promedio da lugar al factor δm,−sp : X (11.242) hH 1 i = H−pr,ps (I)e−ipϕ1 p
Como H no depende de ϕ2 , se cumple que I 2 = constante = I 20 . Notemos que I 2 = I2 + (s/r)I1 ; por tanto la resonancia modifica sustancialmente las constantes de ultiplo de I1 , o sea que la modificaci´on movimiento. Si s ≫ r, I 2 es simplemente un m´ m´as importante ocurre para las resonancias con s peque˜ nos. Con I 2 constante, el movimiento en el plano I 1 − ϕ1 es el de un sistema de un grado de libertad, que es integrable. Chirikov5 ha mostrado que para cualquier sistema ese movimiento es aproximadamente como el de un p´endulo o como el de un oscilador arm´onico, seg´ un la degeneraci´on sea accidental o intr´ınseca. Como el movimiento no perturbado es degenerado, en la superficie de secci´ on I 1 −ϕ1 , con ϕ2 = constante, habr´ an s puntos formando una circunferencia de radio I 1 (ver secci´ on 10.2). Para λ 6= 0 la perturbaci´on altera el toroide y las intersecciones de la trayectoria con la superficie de secci´ on modificando por tanto las soluciones peri´odicas. Si existen, los puntos fijos sobre la superficie de secci´ on, que llamaremos P0 (I 10 , ϕ10 ), son soluci´on al sistema de ecuaciones: ∂H ∂H =0 (11.243) = 0 ; ∂ϕ1 P0 ∂I 1 P0 que representan las soluciones peri´odicas para el hamiltoniano perturbado. Cuando λ = 0, todas las soluciones son peri´odicas, pero para λ 6= 0 s´olo quedan las soluciones peri´odicas dadas por (11.243). Las amplitudes de Fourier en (11.242) generalmente decaen cuando p aumenta. Entonces podemos describir el movimiento en las variables integrables (I 1 − ϕ1 ) usando solamente los t´erminos con p = 0, ±1: H = H 0 (I) + λH00 (I) + 2λHr,−s (I) cos ϕ1
(11.244)
notando que los coeficientes con p = 1 y p = −1 s´olo difieren en la fase, de modo que puede hacerse H−r,s = Hr,−s con la simple adici´ on a ϕ1 de una constante. Las f´ ormulas (11.243) y (11.244) nos dan las siguientes ecuaciones para la localizaci´on de los puntos fijos: ∂H00 (I) Hr,−s (I) ∂H 0 (I) +λ + 2λ cos ϕ10 = 0 ∂I 10 ∂I 10 ∂I 10 2λHr,−s (I) sen ϕ10 = 0 5 Chirikov,
B.V., 1979, en Physics Reports, pp. 265-379.
(11.245)
Teor´ıa de perturbaciones / 515 Entonces los puntos fijos est´ an localizados en ϕ10 = 0, nπ. Como ∂I1 /∂I 1 = r y a determinado ∂I2 /∂I 1 = −s, vemos que ∂H 0 /∂I 1 = sω1 − rω2 = 0. Por tanto I 10 est´ por: Hr,−s ∂H00 ±2 =0 ∂I 10 ∂I 10
(11.246)
Para puntos de la superficie de secci´ on diferentes a los puntos fijos, se cumple que: I˙ 1 = −2λHr,−s sen ϕ1
(11.247)
∂H00 ∂Hr,−s ∂H 0 +λ + 2λ cos ϕ1 ϕ˙ 1 = ∂I 1 ∂I 1 ∂I 1
(11.248)
O sea que los desplazamientos de I 1 respecto a un punto fijo son del orden de λ. En cuanto a ϕ1 , el comportamiento es diferente seg´ un la degeneraci´on sea accidental o intr´ınseca. Si la degeneraci´ on es accidental, entonces H 0 = H 0 (I 1 , I 2 ) y por esto la amplitud de las oscilaciones de ϕ1 es del orden de la unidad. Si la degeneraci´on es intr´ınseca, entonces H 0 (I 1 , I 2 ) = H0 (sI1 + rI2 ) = H 0 (I 2 ) y, entonces, ∂H 0 /∂I 1 = 0 y las oscilaciones de ϕ1 son del orden de λ. Degeneraci´ on accidental. En este caso I 1 permanece en las cercan´ıas del punto fijo, pero ϕ1 puede alejarse del mismo. Entonces podemos escribir: I 1 = I 10 + ∆I 1
(11.249)
Esto nos permite expandir a H(I) en las cercan´ıas de I 10 . Para ello usamos en (11.244) las expresiones: H 0 (I) = H 0 (I 0 ) +
∂H 0 1 ∂2H 0 ∆I 1 + (∆I 1 )2 + ... 2 ∂I 2 ∂I 10 10
(11.250)
H00 (I) = H00 (I 0 ) +
∂H00 1 ∂ 2 H00 ∆I 1 + (∆I 1 )2 + ... 2 ∂I 2 ∂I 10 10
(11.251)
Hrs (I) = Hrs (I 0 ) +
∂Hrs 1 ∂ 2 Hrs (∆I 1 )2 + ... ∆I 1 + 2 ∂I 2 ∂I 10 10
(11.252)
Reteniendo los t´erminos de orden m´as bajo en λ y ∆I 1 obtenemos: ∆H = H − H 0 (I 0 ) − λH00 (I 0 ) =
1 ∂2H 0 (∆I 1 )2 + 2λHr,−s cos ϕ1 2 ∂I 2 10
(11.253)
∆H describe el movimiento en las cercan´ıas de la resonancia, y puede escribirse como: ∆H =
1 G(∆I 1 )2 − F cos ϕ1 2
(11.254)
516 / Mec´ anica cl´ asica avanzada donde: G(I 0 ) =
∂ 2H 0 2
∂I 10
;
F (I 0 ) = −2λHr,−s (I 0 )
(11.255)
Este resultado nos muestra que el movimiento cerca a cualquier resonancia, para cualquier sistema, es aproximadamente similar al de un p´endulo (el diagrama de fases presenta rotaci´on, separatriz y vibraci´on, ver ejemplo 10.3.2). Si GF > 0, el punto fijo estable est´ a en ϕ1 = 0 y el punto fijo inestable en ϕ1 = ±π. on cerca al punto estable es baja: La frecuencia del movimiento en I 1 − ϕ1 para la libraci´ !1/2 √ ∂2H 0 ω1 = F G = λ1/2 −2Hr,−s · (11.256) 2 ∂I 10 y, seg´ un la f´ ormula (10.104), se hace cero en la separatriz. El m´aximo desplazamiento en ∆I 1 est´ a dado en la mitad de la separatriz y vale: 1/2 r −2H F r,−s (11.257) = λ1/2 2 m´ax ∆I 1 = 2 G ∂ H0 2
∂I 10
Degeneraci´ on intr´ınseca. En este caso, de (11.247) y (11.248), se sigue que tanto I 1 como ϕ1 permanecen cerca del punto fijo porque ∂H 0 /∂I 1 = 0. En las proximidades del punto el´ıptico ϕ10 escribimos ϕ1 = ∆ϕ1 , y por tanto:
1 cos ϕ1 = 1 − (∆ϕ1 )2 + ... ; ϕ1 ≈ 0 (11.258) 2 En las proximidades del punto hiperb´ olico ϕ10 = π (o ϕ10 = −π) escribimos ϕ1 = ±π + ∆ϕ1 y por lo tanto: 1 cos ϕ1 = −1 + (∆ϕ1 )2 + ... ; 2
ϕ1 ≈ ±π
(11.259)
En este caso ∆H en vez de (11.254) toma la forma: ∆H =
1 1 G(∆I 1 )2 + F (∆ϕ1 )2 2 2
(11.260)
donde: G=
∂2H 0 2
∂I 10
+λ
∂ 2 H00 2
∂I 10
+λ
∂ 2 Hr,−s
(11.261)
2
∂I 10
F = ∓2λHr,−s
(11.262) 2
Como para degeneraci´on intr´ınseca ∂ 2 H 0 /∂I 10 = 0, se sigue que F y G son del orden de λ. Cerca del punto fijo el´ıptico la frecuencia de oscilaci´on es: " !#1/2 √ ∂ 2 H00 ∂ 2 Hr,−s ω1 = F G = λ −2Hr,−s (11.263) + 2 2 ∂I 10 ∂I 10
Teor´ıa de perturbaciones / 517 y la relaci´ on de semiejes de la elipse es:
∆I = ∆ϕ1
r
1/2
F −2Hr,−s = 2 G ∂ (H00 + Hr,−s )
(11.264)
2
∂I 10
Cerca del punto fijo hiperb´ olico no hay oscilaciones. Las ´orbitas no son el´ıpticas sino hiperb´ olicas, siendo el ´ angulo entre las as´ıntotas: r F (11.265) tan χ = G Vemos que no hay gran diferencia cualitativa entre las trayectorias de fase en los casos con degeneraci´ on intr´ınseca y accidental, s´olo que en el segundo caso las oscilaciones en ∆I 1 tienen amplitud muy peque˜ na en comparaci´ on con las de ϕ1 . Lo anterior suponiendo que G 6= 0. Ejemplo 11.7.1 Analizar el movimiento cerca a la resonancia del sistema de dos osciladores con acoplamiento no lineal del ejemplo 11.6.1. En este caso la degeneraci´ on es intr´ınseca, con r = 2, s = 1. H1 est´ a dado por (11.227), de modo que, reemplazando sen ϕ02 por cos ϕ02 y haciendo λ = axy : hH1 i =
−1 (I 0 − 2I20 )(I20 )1/2 cos ϕ02 2(mω10 )3/2 1
(11.266)
Entonces: 2H2,−1 =
−1 (I 0 − 2I20 )(I20 )1/2 2(mω10 )3/2 1
(11.267)
en tanto que H0 (I0 ) = ω10 I10 . Por tanto: 2
∂ 2 H2,−1 2
∂I 20
=
i h 1 −3/2 −1/2 I (I ) + 6(I ) 10 20 20 2(mω10 )3/2
(11.268)
En cercan´ıas del punto el´ıptico F y G ser´an: F =
λ (I 10 − 2I 20 )(I 20 )1/2 (mω10 )3/2
(11.269)
G=
h i λ −3/2 −1/2 I (I ) + 6(I ) 10 20 20 4(mω10 )3/2
(11.270)
ω1 ser´a: ω1 =
1/2 λ (I 10 − 2I 20 )(I 10 + 6I 20 ) 2(mω10 )3/2 I 20
(11.271)
518 / Mec´ anica cl´ asica avanzada Libración
Rotación Resonancia:
Separatriz
I20 = I20 ϕ02 = ϕ20 I20
ϕ20
λ=0 Punto hiperbólico a
Punto elíptico b
Figura 11.2 Movimiento cerca a la resonancia del sistema de dos osciladores con acoplamiento no lineal. Superficie de secci´on I20 − ϕ02 . La relaci´ on entre las oscilaciones m´aximas en I20 y ϕ02 est´ a dada por: 1/2 ∆I20 = 2I 20 (I 10 − 2I 20 )(I 10 + 6I 20 ) 0 ∆ϕ2
(11.272)
La figura 11.2 muestra la superficie de secci´ on I20 − ϕ02 , en coordenadas polares, con y sin perturbaci´on. Resonancias de orden superior. Si λ no es demasiado peque˜ na, el hamiltoniano (11.240) puede dar lugar a contribuciones seculares que modifiquen o destruyan el invariante adiab´atico I 2 . Tales resonancias son entre arm´onicos de la oscilaci´on pendular I 1 − ϕ1 , de frecuencia ω1 , y la frecuencia fundamental ω2 . En el l´ımite adiab´atico esas resonancias dan lugar a cadenas de “islas”, o sea, a movimientos pendulares alrededor de los puntos fijos en el plano J1 − χ1 de las variables acci´on-´ angulo del movimiento pendular I 1 − ϕ1 [ver ecuaciones (10.99) y (10.100)]. Nuevamente se debe efectuar una transformaci´ on can´onica que elimine la frecuencia degenerada, o sea, pasar a las variables angulares χ1 y χ2 dadas por χ1 = pχ1 − qϕ2 ; χ2 = ϕ2 , donde p y q son los n´ umeros enteros de la resonancia de segundo orden. El paso siguiente consiste en encontrar los par´ ametros que describen el movimiento pendular alrededor de los puntos fijos de J1 − χ1 . El hamiltoniano que describe la resonancia primaria es de la forma (11.254) o (11.260), que en las cercan´ıas del punto el´ıptico se comportan similarmente, y para peque˜ nas libraciones puede expandirse, de acuerdo con la ecuaci´on (10.105), en la forma: 1 λGJ12 + ... (11.273) 16 donde J1 y χ1 son las variables acci´on-´ angulo del movimiento pendular en el plano ∆I 1 − ϕ1 alrededor de un punto el´ıptico, dadas en el ejemplo 10.3.2. Si el movimiento K0 (J1 , J2 ) = H 0 (I 10 , J2 ) + ω1 J1 −
Teor´ıa de perturbaciones / 519 es “exactamente” pendular, J1 es constante. Cuando hay resonancias secundarias, el movimiento en el plano ∆I 1 − ϕ1 no es exactamente pendular, sino como el mostrado en la figura 11.3, que muestra la cadena de islas asociada a la resonancia cuando 5ω1 = ω2 , donde ω1 = χ˙ 1 . A la resonancia secundaria le corresponden cinco puntos fijos el´ıpticos, en cada uno de los cuales es generado un movimiento pendular secundario. ∆I1 cos ϕ1
J1 sen χ1
∆I1 cos ϕ1
a
b
Figura 11.3 Cadena de islas asociada a la resonancia: a. Aparecen las separatrices y las curvas de libraci´ on; b. Cadena de islas formadas en la resonancia secundaria.
En la figura 11.3a, aparecen las separatrices y las curvas de libraci´ on. Las l´ıneas punteadas corresponden a la resonancia primaria y las l´ıneas continuas corresponden a las “islas” formadas en la resonancia secundaria. En la figura 11.3b, se han llevado las “islas” de la resonancia secundaria a variables acci´on-´ angulo. En un paso siguiente, uno podr´ıa transformar las variables (J, χ) a unas nuevas variables (J, χ) donde sea removida la resonancia 5ω1 = ω2 , dando lugar nuevamente a curvas de tipo pendular como las de la figura 11.2b. Para tener en cuenta la forma como una resonancia secundaria modifica la soluci´on, ′ reintroducimos los t´erminos de H 1 ignorados al promediar sobre ϕ2 , al ir de (11.240) a (11.242): ′
H 1 (I, ϕ) = H 1 (I, ϕ) − hH 1 (I, ϕ1 )i
(11.274)
que tiene la expansi´ on de Fourier: ′
H 1 (I, ϕ) =
XX l
′
H lm (I)eilϕ1 /r+i(ls+mr)ϕ2 /r
(11.275)
m
donde la prima indica que se suprimen los t´erminos d.c. en ϕ2 , ls + mr = 0. En las cercan´ıas del punto el´ıptico ϕ10 = 0: ′
H1 =
XX l
m
′
H lm (I 10 + ∆I 1 , I 2 )eil∆ϕ1 /r+i(ls+mr)ϕ2 /r
(11.276)
520 / Mec´ anica cl´ asica avanzada Ahora transformemos esta expresi´on a variables acci´on-´ angulo, mediante la f´ormula: ∆ϕ1 =
2J1 R
1/2
sen χ1 ;
R=
F R
1/2
(11.277)
Si estamos en las cercan´ıas de punto el´ıptico, con movimiento de libraci´ on, ∆I 1 y ∆ϕ1 son peque˜ nas, por lo que J1 /R ha de ser peque˜ no. Entonces (11.276) al orden m´as bajo en ∆I 1 y ∆ϕ1 nos da para el nuevo hamiltoniano, tomando χ2 = ϕ2 y J2 = I 2 : √ XX i(l/r) 2J1 /R sen χ1 +i(ls/r+m)χ2 ′ K1 = (11.278) H lm (I 10 , J2 )e l
m
Usando la f´ ormula: eix sen θ =
∞ X
Jn (x) einθ
(11.279)
n=−∞
donde Jn son las funciones Bessel enteras de orden n, podemos escribir a K1 como: XXX ′ (11.280) K1 = Γlmn (I 10 , J2 )einχ1 +i(ls/r+m)χ2 l
donde:
m
n
" 1/2 # l 2J1 Γlmn (I 10 , J2 ) = H lm (I 10 , J2 )Jn r R
(11.281)
En (11.280) resulta claro que pueden existir resonancias entre χ1 y χ2 cuando: ls χ˙ 2 r+m √ √ o sea, cuando ω 1 = χ˙ 1 = F G = 0( λ) y ω 2 = 0(1) son conmensurables, nχ˙ 1 = −
p ω2 = ; ω1 q
p, q : enteros
(11.282)
(11.283)
Resulta ahora que la frecuencia χ˙ 1 = pχ˙ 1 − q χ˙ 2 es mucho menor que χ˙ 2 . Entonces χ˙ 2 puede ser eliminada con una transformaci´ on can´onica mediante: F2 = (pχ1 − qχ2 )J 1 + χ2 J 2 lo cual nos da para para K 1 : XXX ′ K1 = Γlmn ei[nχ1 +p(nq+p(ls/r+m))χ2 ]/p l
m
(11.284)
(11.285)
n
on Ahora la variable angular χ2 puede ser eliminada mediante una transformaci´ can´ onica adecuada, que equivale a promediar sobre χ2 . Introduciendo un nuevo par´ ametro peque˜ no λ1 , (11.273) y (11.285) nos conducen a: K = K 0 (J 1 , J 2 ) + λ1 K 1 (J 1 , J 2 , χ1 )
(11.286)
Teor´ıa de perturbaciones / 521 en K 1 s´olo aparecen los t´erminos con n dados por: ls +m =0 nq + p r
(11.287)
siendo nq, ls/r y mp enteros. Esto equivale a dejar en (11.280) s´olo los t´erminos con: nχ1 +
ls + mr χ2 = −jpχ1 + (ks + jq − ks)χ2 = j(qχ2 − pχ1 ) r
(11.288)
o sea, con: l = k ; m = jq − ks ; j, k : enteros r Entonces la expansi´ on (11.280) toma la forma: X K−jp,jq e−ijχ1 K1 = n = −jp ;
(11.289)
(11.290)
j
donde: K−jp,jq =
X
Γkr,jq−ks,−jp
(11.291)
k
Ahora, como K no depende de χ2 , J 2 es constante: q J 2 = J2 + J1 = constante p
(11.292)
que es el invariante adiab´atico para las oscilaciones que dan lugar a las “islas”. El movimiento en J 1 − χ1 es integrable, siendo las oscilaciones de ∆J 1 y χ1 alrededor del punto fijo el´ıptico, como en (11.254), de forma pendular y por tanto aplicables los resultados para este tipo de movimiento. Como K 1 proviene de la parte oscilante de H 1 , el arm´onico m´as bajo en (11.290) se obtiene para j = ±1. Asumamos que q = 1, que corresponde a la resonancia con el fundamental de la oscilaci´on χ2 = ϕ2 . Entonces el coeficiente de Fourier del t´ermino dominante en (11.290) es: ! r X l 2J1 H kr,±1−ks J−p (11.293) K−p,±1 = r R k p o sea, proporcional a Jp [(l/r) 2J1 /R]. De (11.256) se sigue que ω1 = 0(λ)1/2 y de (11.283) que ω2 = pω1 . Como ω2 = O(1), se cumple que p espun entero del orden de λ−1/2 . De (11.257) se sigue que m´ax ∆I 1 = 2R, por lo tanto 2J1 /R es del orden de la unidad. El desarrollo asint´ otico de Jn (x) para n grande es: x n (11.294) Jn (x) ≈ (2πn)1/2 en 2n como λ es peque˜ no, p es grande y podemos escribir: ! !p r r 2J1 l 2J1 l −1/2 p Jp ≈ (2πp) e r R 2rp R h √ √ i (11.295) = O (e λ)1/ λ
522 / Mec´ anica cl´ asica avanzada lo cual nos muestra la peque˜ nez del t´ermino dominante en K 1 . F , el t´ermino de interacci´on en el movimiento pendular secundario es, de acuerdo con (11.255), proporcional a Kp,±1 , o sea a Jp . De (11.256) se sigue que las oscilaciones pendulares en las “islas” es muy baja, en tanto que de (11.257) se concluye que la amplitud de las oscilaciones √ 1/(2√λ) 1/(4√λ) √ J1 , que son muy peque˜ nas y adem´as “islas” es proporcional a λ1 (e λ) decrecen r´apidamente cuando J1 decrece. Para λ peque˜ no, las oscilaciones “islas” son despreciables, pero para λ relativamente grande, se sigue de (11.295) que pueden llegar a ser importantes, incluso comparables a las de la resonancia primaria. La r´apida reducci´on del tama˜ no de las cadenas de “islas” de orden superior cerca a los puntos fijos nos indica que dichos puntos son relativamente estables cuando las perturbaciones no son muy grandes. Pero para perturbaciones grandes aparecer´an muchos nuevos puntos fijos el´ıpticos y cadenas de “islas” de orden superior de tama˜ no apreciable, as´ı como frecuencias de libraci´ on, que alteran dr´asticamente los invariantes adiab´aticos o sea los toroides invariantes.
11.8.
Movimientos regulares e irregulares
Se denomina irregular, ca´otico o estoc´ astico al movimiento de un sistema de varios grados de libertad en que por aumento de una perturbaci´on desaparecen constantes de movimiento uniformes, alterando la topolog´ıa de los toroides invariantes. El teorema de Kolmogorov, Arnold y Moser establece que para perturbaciones suficientemente peque˜ nas existen a´ un toroides invariantes (movimientos regulares), si el sistema satisface ciertas condiciones. La existencia de toroides invariantes usualmente se cuantifica por medio de la medida de la regi´on del espacio f´asico ocupada por toroides invariantes. La estocasticidad global se presenta cuando la regi´on ocupada por toroides invariantes tiene una medida suficientemente peque˜ na, o sea que el movimiento esencialmente es ca´otico, y se puede caracterizar por el valor del par´ ametro de perturbaci´on. Aplicaciones de una superficie de secci´ on en s´ı misma. Sobre el toroide invariante de un sistema de dos grados de libertad, el movimiento puede ser parametrizado por las variables angulares ϕ1 , ϕ2 , o por el tiempo, as´ı: ϕ1 = ω1 t + ϕ10 ;
ϕ2 = ω2 t + ϕ20
(11.296)
Como ω1 y ω2 son funciones de las variables de acci´on I1 , I2 , que para un sistema integrable son constantes de movimiento uniformes, se sigue entonces que la raz´ on entre ω1 y ω2 es igualmente una constante: ~ = α(I)
~ ω1 (I) ~ ω2 (I)
(11.297)
Para α = r/s, con r y s n´ umeros enteros, ω1 y ω2 son conmensurables y el movimiento degenera en una curva bidimensional, que se repite despu´es de r giros en ϕ1 y s giros en ϕ2 . Como r y s pueden ser grandes, y entre cualquier par de n´ umeros racionales siempre hay muchos racionales, se sigue que las ´orbitas peri´odicas son arbitrariamente pr´oximas entre s´ı en el espacio f´asico.
Teor´ıa de perturbaciones / 523 El concepto de movimiento sobre un toro puede generalizarse a m´as de dos grados de libertad. Si se toma t = 0 cuando la trayectoria cruza la superficie de secci´ on en el punto x0 , en t = 2π/ω2 cruzar´a en el punto x1 , en t = 4π/ω2 cruzar´a en x2 y as´ı sucesivamente. Entre dos intersecciones consecutivas ϕ1 avanza por ω1 ∆t = 2πα, donde α es el n´ umero r/s. Como la energ´ıa E es funci´ on de I1 e I2 , para E fija, α puede asumirse funci´ on de I1 solamente. Los puntos de las sucesivas intersecciones con la superficie de secci´ on est´ an relacionados entre s´ı mediante cierto mapeo o aplicaci´on discreta, llamada aplicaci´on can´onica. Llamando x al conjunto (I, ϕ): xn+1 = C(xn )
(11.298)
o expl´ıcitamente: x1,n+1 = I1,n ;
ϕ1,n+1 = ϕ1,n + 2πα(I1,n+1 )
(11.299)
donde escribimos a α como una funci´ on de I1,n+1 . La anterior es la aplicaci´on “twist”, que aplica c´ırculos en c´ırculos, pero con un n´ umero de rotaci´on α que en general depende del radio. La figura 11.4 muestra la aplicaci´on para α irracional (l´ıneas continuas) y para α racional (l´ıneas a trazos) con s = 6. Trayectoria de fases
Puntos fijos con r entero y s = 6 I1 x0 x1
ϕ1
I2 x2 ϕ2
ϕ2 = constante a
α irracional b
Figura 11.4 Toroide invariante de un sistema de dos grados de libertad ϕ1 y ϕ2 . A la izquierda, curva bidimensional que se repite despu´es de r giros en ϕ1 y s giros en ϕ2 . Al lado derecho, mapa de Poincar´e formado por puntos xi donde la trayectoria cruza la superficie de secci´on. Directamente de (11.299) se sigue que: I1,n+1 , ϕ1,n+1 =1 J I1,n , ϕ1,n
(11.300)
o sea que la aplicaci´on transforma una regi´on arbitraria de la superficie de secci´ on en otra conservando el ´ area.
524 / Mec´ anica cl´ asica avanzada Lo anterior es v´alido para sistemas integrables. Si este sistema es perturbado ligeramente, el hamiltoniano ser´a ahora funci´ on de los ´angulos: ~ ϕ ~ + λH1 (I, ~ ϕ H(I, ~ ) = H0 (I) ~)
(11.301)
En la superficie de secci´ on I1 − ϕ1 definida por ϕ2 = constante (m´ odulo 2π), esperamos que la aplicaci´on “twist” cambie en una aplicaci´on “twist” perturbada: In+1 = In + λf (In+1 , ϕn ) (11.302) ϕn+1 = ϕn + 2πα(In+1 ) + λg(In+1 , ϕn ) donde se ha omitido el sub´ındice 1. f y g son funciones peri´odicas de ϕn . Como la transformaci´ on de n a n + 1 es generada por las ecuaciones de Hamilton, la aplicaci´on (11.302) debe conservar el ´area. Esta aplicaci´on puede tomarse como una transformaci´ on can´ onica con funci´ on generatriz: F2 (In+1 , ϕn ) = In+1 ϕn + 2πA(In+1 ) + λB(In+1 , ϕn )
(11.303)
donde: α=
∂A ; ∂In+1
f =−
∂B ; ∂ϕn
g=
∂B ∂In+1
(11.304)
La condici´on de conservaci´ on del ´area (11.300) implica ahora que: ∂f ∂g + =0 ∂In+1 ∂ϕn
(11.305)
Cuando f no depende de I y g = 0, entonces de (11.302) se obtiene la aplicaci´on “twist” radial perturbada: In+1 =
In + λf (ϕn )
ϕn+1 =
ϕn + 2πα(In+1 )
(11.306) Cuando f = sen ϕn esta aplicaci´on se llama la aplicaci´on est´ andar (o aplicaci´on de Chirikov). Una involuci´ on C = i es una aplicaci´on can´onica tal que al repetirse dos veces reproduce las condiciones iniciales. Entonces: xn+2 = i(xn−1 ) = i2 (xn ) = xn
(11.307)
La aplicaci´on “twist” radial es un producto de involuciones si f (−ϕ) = −f (ϕ). Las dos involuciones que dan lugar a la aplicaci´on “twist” radial son: I = In + f (ϕ)n ;
ϕ = −ϕn
(11.308)
ϕn+1 = −ϕ + 2πα(I)
(11.309)
y, In+1 = I ;
La factorizaci´on en involuciones ayuda a determinar los puntos fijos, pues los puntos fijos de las involuciones son de per´ıodo 1. Por ejemplo, (11.308) tiene los puntos fijos
Teor´ıa de perturbaciones / 525 dados por ϕ1 = 0, π para todo I1 , y (11.309) tiene puntos fijos dados por 2ϕ2 = 2πα(I2 )− 2πm con m entero. A partir de las ecuaciones de Hamilton podemos hallar la correspondiente aplicaci´on sobre una superficie de secci´ on. Las ecuaciones de Hamilton del hamiltoniano (11.301) son: dIi ∂H1 ; = −λ dt ∂ϕi
dϕi ∂H1 ∂H0 +λ = dt ∂Ii ∂Ii
(11.310)
La ecuaci´ on para I1 sobre la superficie de secci´ on ϕ2 = constante = ϕ20 , entre la n y la n + 1-´esima iteraci´ on, es: ∂H1 dI1 (In+1 , I2 , ϕn + ω1 t, ϕ20 + ω2 t) = −λ dt ∂ϕ1
(11.311)
donde I2 , ω1 y ω2 son funciones de In+1 . En la n-´esima iteraci´ on en (11.311) t = 0 y en la n + 1-´esima iteraci´ on t = T2 . Luego el salto en la acci´on I1 en una iteraci´ on es: Z T ∂H1 ∆I1 = −λ dt (In+1 , I2 , ϕn + ω1 t, ϕ20 + ω2 t) (11.312) ∂ϕ1 0 Entonces de (11.302) se sigue que: λf (In+1 , ϕn ) = ∆I1 (In+1 , ϕn+1 )
(11.313)
La funci´ on g que define el cambio en ϕn se obtiene de la condici´on de conservaci´ on del ´area, (11.305): Z ϕ ∂f g(I, ϕ) = − dϕ (11.314) ∂I El problema inverso consiste en hallar el hamiltoniano asociado a la aplicaci´on can´onica. Para la aplicaci´on (11.306), podemos asumir que el ´ındice n hace las veces del par´ ametro “tiempo”. La funci´ on delta peri´odica permite seleccionar los tiempos de cruce de la trayectoria con la superficie de secci´ on: δ1 (n) =
∞ X
m=−∞
δ(n − m)
(11.315)
Entonces (11.306) toma la forma: dI = λf (ϕ)δ1 (n) ; dn
dϕ = 2πα(I) dn
(11.316)
donde In y ϕn son I(n − ǫ) y ϕ(n − ǫ). Estas ecuaciones son de forma hamiltoniana con: Z I Z θ H(I, ϕ, n) = 2π α(I ′ )dI ′ − λδ1 (n) f (ϕ′ )dϕ′ (11.317) que es un hamiltoniano no aut´ onomo de un grado de libertad.
526 / Mec´ anica cl´ asica avanzada Ejemplo 11.8.1 Construir un hamiltoniano para la aplicaci´on est´ andar (11.306). Dicha aplicaci´on es: In+1 =
In + K sen ϕn
ϕn+1 =
ϕn + In+1
(11.318) Las ecuaciones de movimiento seg´ un (11.316) son: dI = K sen ϕ δ1 (n) ; dn
dϕ =I dn
(11.319)
y el hamiltoniano seg´ un (11.317) es: H=
1 2 I + Kδ1 (n) cos ϕ 2
(11.320)
Es conveniente usar la expansi´ on de Fourier de la funci´ on delta peri´odica, (11.315): δ1 (n) = 1 + 2
∞ X
cos 2πqn
(11.321)
q=1
entonces: H=
∞ X 1 2 I + K cos ϕ ei2πnm 2 m=−∞
(11.322)
donde el n´ umero de iteraci´ on n es una variable temporal, resultando H no aut´onomo. H puede tambi´en escribirse en la forma: H = H 0 + H1
(11.323)
donde: H0 =
1 2 I + K cos ϕ 2
(11.324)
y, H1 = 2K cos ϕ
∞ X
cos 2πqm
(11.325)
q=1
Como se ve, H0 es el hamiltoniano de un p´endulo y H1 es una perturbaci´on consistente en una serie de impactos peri´odicos en el tiempo. Ejemplo 11.8.2 Construir la aplicaci´on correspondiente al movimiento en las cercan´ıas de la separatriz, en una superficie de secci´ on, para un sistema de dos grados de libertad.
Teor´ıa de perturbaciones / 527 Por aplicar la teor´ıa de las perturbaciones seculares a una resonancia dada en un sistema cuasi-integrable y promediando sobre las variables angulares r´apidas, el hamiltoniano que describe el movimiento cerca a la resonancia toma la forma (11.254): 1 H = H0 (I) + Gp2 − λF cos q 2
(11.326)
Como este hamiltoniano describe un movimiento cuasiperi´odico, con una parte r´apida: I = constante ;
ϕ = ωϕ (I)t + ϕ0
(11.327)
y una parte lenta correspondiente al movimiento integrable de un p´endulo, la aplicaci´on en cualquier superficie de secci´ on, ϕ = constante o q = constante, es la aplicaci´on can´onica (11.299). Para hallar la aplicaci´on perturbada, correspondiente a (11.302), debemos considerar los t´erminos resonantes que fueron despreciados al promediar la resonancia ω2 /ω1 = r/s sobre la variable angular r´apida ϕ como en (11.242). Entonces, de (11.240), el hamiltoniano completo, que contiene resonancias entre ϕ y el movimiento lento q, y movimiento ca´otico en cercan´ıas de la separatriz, es: 1 H = H0 (I) + Gp2 2 − λF cos q + λ
X
l>1,m6=0
Hlm cos
lϕ mq − + ∆lm r r
(11.328)
donde G, F , Hlm y ∆lm dependen s´olo de I. Ahora podemos aplicar la f´ ormula (11.312) para hallar a f de la aplicaci´on perturbada en una superficie de secci´ on, que depende s´olo de los t´erminos reintroducidos en (11.328). La figura 11.5 muestra el movimiento en las superficies de secci´ on p − q y I − ϕ, donde la parte rayada representa el movimiento en la separatriz junto con la componente estoc´ astica. Ver m´as adelante. Por conveniencia, buscamos la aplicaci´on sobre la superficie de secci´ on I − ϕ con q ≈ ±π. Como los coeficientes de Fourier decaen al aumentar l y m, retendremos s´olo el t´ermino dominante con l = m = 1. Entonces (11.328) y (11.312) nos dan: Z ∞ ϕ q i ∂ h f (In+1 , ϕn ) = − dt H11 cos (11.329) − + ∆11 ∂ϕ r r −∞ Seg´ un la ecuaci´ on (10.105), para la trayectoria separatriz se cumple: q = 4 tan−1 (eω0 t ) − π donde ω02 = λF G. f toma la forma: Z ωϕ (In+1 )t ϕn A(In+1 ) +∞ q dt − − f (In+1 , ϕn ) = sen r r r r −∞
(11.330)
(11.331)
donde A es H11 y ∆11 ha sido incluido en ϕn que mide a ϕ en el n-´esimo cruce por la superficie de secci´ on colocada en la separatriz, q ≈ ±π. Teniendo en cuenta que
528 / Mec´ anica cl´ asica avanzada p
q
ωq +π
–π Superficie de sección ϕ = constante
a Iy
ϕ Ix
ωϕ
Superficie de sección q = constante b
Figura 11.5 Movimiento en las superficies de secci´on para un sistema de dos grados de libertad: a. Secci´ on p − q; b. Secci´ on I − ϕ.
q(−ω0 t) = −q(ω0 t), expandiendo la funci´ on seno y notando que s´olo la parte sim´etrica contribuye a la integral, obtenemos: f (In+1 , ϕn ) =
A −ϕn α2 (Q0 ) sen ω0 r r
(11.332)
donde:
mq(s) αm (Q0 ) = cos − Q0 s ds 2r −∞ Z
∞
(11.333)
es la integral de Arnold-Melnikov, y: Q0 =
ωϕ rω0
(11.334)
Teor´ıa de perturbaciones / 529 La integral (11.333) es impropia pero consta de una parte oscilante que promedia a cero durante el movimiento sobre la separatriz y una parte constante que viene de la regi´on con s ≤ 1/Q0 . Melnikov la evalu´ o, siendo para Q0 ≫ m:6 αm (Q0 ) =
4π (2Q0 )m−1 e−πQ0 /2 (m − 1)!
(11.335)
Como ω02 = λF G, entonces Q0 ≈ λ1/2 y vale la expansi´ on asint´ otica (11.335). Entonces podemos escribir: f = f0 sen ϕn ;
f0 =
8πA 2 −πQ0 /2 Q e ωϕ 0
(11.336)
De acuerdo con el ejemplo 10.3.1, para las oscilaciones de un p´endulo en las cercan´ıas de la separatriz se cumple que el per´ıodo vale: T = ω0−1 ln
32 ωϕ I 1+ λF
(11.337)
El cambio en ϕ durante este tiempo es ωϕ T , lo cual conduce al n´ umero de rotaci´on de la aplicaci´on “twist”: 2πα =
32 ωϕ ln ω0 |W |
(11.338)
donde: W = −F −
ωϕ I λF
(11.339)
Si escogemos a ωϕ independiente de I, con lo cual el problema no se altera esencialmente, resulta que f no depende de I, y seg´ un (11.314) podemos tomar g ≡ 0. Es conveniente cambiar de variables de I a W . En las variables W , ϕ, la aplicaci´on separatriz es: Wn+1 = Wn − W0 sen ϕn ϕn+1 = ϕn + Q0 r ln
32 |Wn+1 |
(11.340)
donde: W0 =
8πA 2 −πQ0 /2 ωϕ I0 = Q0 e F F
(11.341)
No degeneraci´ on y no degeneraci´ on isoenerg´ etica. Tratemos de explorar las consecuencias debidas a la dependencia lineal de las frecuencias sobre los movimientos en una superficie de secci´ on.7 6 V´ ease 7 V´ ease
1976.
el ap´ endice A, en Chirikov, Op. cit. el texto de V. Arnold, Les m´ ethodes math´ ematiques de la m´ ecanique classique, Mir, Mosc´ u,
530 / Mec´ anica cl´ asica avanzada Asumamos que hay una relaci´on entre las frecuencias, para dos grados de libertad, de la forma: f (ω1 , ω2 ) = 0
(11.342)
Diferenciando hallamos de df = 0: ∂ω1 ∂ω2 ∂f ∂I1 ∂I1 ∂ω1 ω ˜ I f~ω = ∂ω ∂ω2 ∂f 1 ∂I2 ∂I2 ∂ω2
Si f es de la forma:
f = m1 ω 1 + m2 ω 2 = 0
=0
(11.343)
(11.344)
con m1 y m2 enteros, f~ω es un vector con componentes m1 y m2 . Entonces (11.343) se satisface solamente si se cumple la condici´on necesaria: det ω ˜I = 0
(11.345)
det ω˜I 6= 0 es la condici´on necesaria de no degeneraci´ on de las frecuencias (o de no dependencia lineal de las frecuencias). En el caso no degenerado los movimientos son cuasiperi´odicos con un n´ umero de frecuencias igual al n´ umero de grados de libertad, con lo cual existen toroides invariantes l-dimensionales. Las curvas de fase son h´elices sobre los toroides y las frecuencias de revoluci´ on cambian de un toroide a otro. En el caso general no s´olo las dos frecuencias sino su relaci´on α var´ıa de un toroide a otro. Si la derivada de α respecto a la variable de acci´on que numera los toros es diferente de cero para un valor dado de la energ´ıa, diremos que el sistema es isoenerg´eticamente no degenerado. La condici´on de no degeneraci´on isoenerg´etica se escribe como: ∂ω1 ∂ω2 ω1 ∂I1 ∂I1 ∂ω ∂ω2 1 6= 0 (11.346) det ω2 ∂I2 ∂I2 ω1
ω2
0
la cual se deduce f´ acilmente de las expresiones dα(I1 , I2 ) 6= 0 y dE = ω1 dI1 +ω2 dI2 = 0. Las condiciones de no degeneraci´on y de no degeneraci´on isoenerg´etica son independientes, es decir, la una no implica la otra. Consideremos la aplicaci´on “twist” sobre el punto de intersecci´on de una curva de fases con la superficie de secci´ on. Esa aplicaci´on deja invariantes los c´ırculos meridianos conc´entricos de intersecci´on de los toros invariantes con la superficie de secci´ on. Cada c´ırculo gira un ´ angulo igual a 2πα. Si el sistema no es isoenerg´eticamente degenerado, el angulo de rotaci´on de los c´ırculos invariantes sobre la superficie de secci´ ´ on cambiar´a de un c´ırculo a otro, es decir, α necesariamente cambia al pasar de un c´ırculo a otro. Como α es una funci´ on continua de I1 , con E constante, al ir variando I1 , α tomar´a tanto
Teor´ıa de perturbaciones / 531 valores racionales como irracionales, de modo que en ciertos c´ırculos habr´ a puntos fijos discretos y en otros no. Una y otra clase de c´ırculos forman un conjunto denso, pero en casi todos los c´ırculos el ´ angulo de rotaci´on no ser´a un m´ ultiplo racional de 2π. Si ahora la aplicaci´on es perturbada, como en (11.306), la propiedad de un c´ırculo con α racional de tener puntos fijos debe desaparecer. La trayectoria sobre un toro resonante no perturbado es cerrada y no llega sino a muy pocos puntos del mismo, pero al aplicar una peque˜ na perturbaci´on llenar´a todos los puntos del toro. En tanto que si el toro es no resonante, una perturbaci´on peque˜ na no ocasiona un cambio grande en las trayectorias de fase y en la topolog´ıa misma del toro. En una resonancia particular, ω1 /ω2 = r/s, la condici´on de no degeneraci´on isoenerg´etica (11.346) se convierte en: r2
∂ 2 H0 ∂ 2 H0 ∂ 2 H0 + s2 − 2rs 6= 0 2 2 ∂I1 ∂I2 ∂I1 ∂I2
(11.347)
Esta condici´on a la vez es una condici´on de no linealidad del movimiento alrededor de un punto fijo. Al analizar el movimiento cerca a una resonancia aislada encontramos que es descrito por un hamiltoniano de la forma (11.253): ∆H =
∂2H 0 2
∂I 1
(∆I 1 )2 + 2λHr,s cos ϕ1
(11.348)
2
tomando a Hrs real. Si ∂ 2 H 0 /∂I = 0, entonces la no linealidad aparece solamente al orden λ2 y el ancho de la separatriz no estar´ a restringido a ser del orden de λ1/2 , seg´ un (11.256). Entonces la condici´ on de no linealidad es, de (11.255): G=
∂2H 0 2
∂I 1
6= 0
(11.349) 2
Esta condici´on separa los sistemas con degeneraci´on accidental (∂ 2 H 0 /∂I 6= 0) o 2 fuertemente no lineales, de los sistemas con degeneraci´on intr´ınseca (∂ 2 H 0 /∂I = 0) o d´ebilmente no lineales. Para ver la equivalencia de (11.349) y (11.347), pasamos de las on can´onica (11.238) y (11.239): variables (I 1 , I 2 ) a las (I1 , I2 ) mediante la transformaci´ ∂2H 0 ∂ ∂H0 ∂I1 ∂H0 ∂I2 = . . 6= 0 (11.350) + ∂I12 ∂I2 ∂I 1 ∂I 1 ∂I1 ∂I 1 y como seg´ un (11.238), ∂I1 /∂I 1 = r y ∂I2 /∂I 1 = s, obtenemos inmediatamente a (11.347). O sea que la condici´on de no degeneraci´on isoenerg´etica es a la vez una condici´on de no linealidad del movimiento en proximidades de una resonancia aislada. El teorema de K. A. M. Si un sistema integrable es perturbado, hemos visto en (11.45) que las resonancias entre los grados de libertad pueden destruir la convergencia de las expansiones en series de potencias alrededor del sistema no perturbado. Sin embargo el teorema de K. A. M. dice que “si un sistema hamiltoniano es no degenerado, entonces la mayor parte de los toroides invariantes no resonantes no desaparecen bajo una perturbaci´on hamiltoniana lo suficientemente peque˜ na, sino que se deforman ligeramente de modo que en el espacio de fases del sistema perturbado existen igualmente
532 / Mec´ anica cl´ asica avanzada toroides invariantes, o sea adherencias de las curvas de fase que son h´elices cuasiperi´odicas con un n´ umero de frecuencias igual al n´ umero de grados de libertad. Tales toroides son la mayor´ıa en el sentido que la medida del complemento de su uni´on es del orden de λ”. Las condiciones a ser satisfechas son: (i) No linealidad suficiente. O sea que en cierto rango de valores de I~ las frecuencias son independientes: ~ 6= 0 m.~ ~ ω(I)
(11.351)
donde ω ~ = ∂H0 /∂ I~ y m ~ es un vector de componentes enteras. (ii) La perturbaci´on es funci´ on de clase C M , o sea que posee derivadas continuas hasta de orden M . (iii) El estado del sistema es lo suficientemente alejado de una resonancia para satisfacer que: |m ~ ·~ ω| ≥ C|m| ~ −τ
(11.352)
para todo m, ~ donde τ depende de l y M , y C depende de λ, de la magnitud del hamiltoniano de perturbaci´on H1 , y de la no linealidad G del hamiltoniano no perturbado H0 . Como (11.352) no puede satisfacerse para C muy grande y C se incrementa con λ, |H1 | y 1/G, hay una condici´on de “perturbaci´on suficientemente peque˜ na” para que existan toros de K. A. M. (i) y (iii) tambi´en implican una condici´on de no linealidad moderada. Este teorema fue probado por Arnold (1961) para H1 anal´ıtica y por Moser (1962) para cuando H1 es de clase C M , basados en una conjetura de Kolmogorov (1954). La dificultad de la prueba del teorema radica en los peque˜ nos denominadores que aparecen en todo el procedimiento de expansi´ on en series de potencias. Las pruebas utilizan los m´etodos de convergencia r´apida (superconvergentes), an´alogos al m´etodo de Newton para resolver num´ericamente una ecuaci´ on algebraica, que permite neutralizar el efecto de los peque˜ nos divisores que aparecen en cada aproximaci´on. Para ilustrar esto, consideremos la aplicaci´on “twist” perturbada con dos grados de libertad, (11.302), correspondiente a las intersecciones de la trayectoria con la superficie de secci´ on: I1 (ϕ1 + 2πα) = I1 (ϕ1 ) + λf (ϕ1 ) Usemos expansiones de Fourier respecto a ϕ1 : X X bk eikϕ1 I1 (ϕ1 ) = ak eikϕ1 ; λf (ϕ1 ) =
(11.353)
(11.354)
Entonces:
I1 (ϕ1 + 2πα) − I1 (ϕ1 ) =
X
ak eik2πα − 1 eikϕ1
(11.355)
con lo cual se obtiene la siguiente relaci´on entre los coeficientes: ak =
bk ik2πα e
−1
(11.356)
Teor´ıa de perturbaciones / 533 Los m´odulos de estos coeficientes se relacionan por: |bk | (11.357) 2 sen πkα Vemos que ak no tiende a cero tan r´apido como bk y que son indefinidos cuando α es racional. El anterior es el problema de los denominadores nulos que impide la convergencia de las series de perturbaciones. Pero como α es funci´ on de I1 , el valor de I1 puede escogerse de modo que el denominador nunca sea resonante. B´asicamente el m´etodo de c´ alculo consiste en variar las condiciones iniciales en cada paso del procedimiento de expansi´ on para asegurarse de estar lo suficientemente lejos de las resonancias y poder proseguir la expansi´ on al paso siguiente. En una expansi´ on superconvergente la aproximaci´on n + 1-´esima se realiza alrededor de los valores de las variables obtenidos de la n-´esima aproximaci´on y no alrededor de los valores no perturbados, como se hace en una expansi´ on ordinaria. Como hemos visto, si hay una resonancia entre los dos grados de libertad del sistema no perturbado, la perturbaci´on induce un cambio en las trayectorias del espacio de fases, lo mismo que en las frecuencias. Si la acci´on perturbada I1 es pr´oxima a la no perturbada I0 , pueden existir curvas invariantes de K. A. M. “cercanas” a las curvas invariantes no perturbadas. El anterior es el significado de la condici´on de independencia lineal m ~ ·~ ω 6= 0, que garantiza que I1 → I0 cuando λ → 0. Para un valor fijo de λ, la no linealidad necesaria en G puede estimarse de la condici´on ∆I1 ≪ I0 , siendo I0 la acci´on no perturbada y ∆I1 el m´aximo valor de la diferencia I1 − I0 . De (11.238) se sigue que: |ak | =
(11.358)
∆I1 = r∆I 1 Para un sistema con degeneraci´on accidental, (11.257) nos dice que: 1/2 2λHrs ∆I 1 = 4 G
(11.359)
Por tanto ∆I1 ≪ I0 impone la condici´on: G≫
32r2 λHrs I02
(11.360)
La condici´on de suavidad de la perturbaci´on, (ii), puede asociarse con la propiedad de las curvas de K. A. M. de existir solamente separadas de todas las “islas” de perturbaciones. Si las “islas” entre dos resonancias de orden bajo llenan todo el espacio de fases entre ellas, podemos razonablemente esperar que no haya una curva de K. A. M. ¿C´omo relacionar esto con la condici´on (ii) del teorema?. Asumamos que ω1 /ω2 = s y que H0 depende linealmente de I2 , de modo que ω2 es una constante independiente de I1 e I2 . En la siguiente resonancia, ω1 /ω2 = s + 1, de modo que la diferencia en ω1 entre dos resonancias sucesivas es δω1 = ω2 , como puede verse en la figura 11.6. Entre dos resonancias primarias hay una serie de resonancias secundarias en ω1 /ω2 = s+p/q (p, q enteros y p < q). El hamiltoniano tiene la expresi´on: X H = H0 + λ Hlm ei(lϕ1 −mϕ2 ) (11.361) l,m
534 / Mec´ anica cl´ asica avanzada Tomemos en la sumatoria los valores de l que dan lugar a resonancias secundarias, l = q, 8
ω 1 /ω 2 = s ω 1 /ω 2 = s + 1
a 4 2λG′H 1m 4 2λG′H 1m
4 2λG′H 1m
0
1/4 1/3
1/2
2/3 3/4
b
1
G′∆I 1 ω2
Figura 11.6 Intervalos que muestran resonancias.
m(p, q) = p + sq
(11.362)
y analicemos el movimiento en las cercan´ıas de una resonancia secundaria. De (11.359) el ancho de la separatriz en cada resonancia es:
∆I 1 = 4
2λHqm G
1/2
(11.363)
8 Condiciones de validez del teorema de K. A. M.: (i) Las curvas perturbadas son cercanas a las curvas no perturbadas no resonantes. (ii) Las resonancias son lo suficientemente separadas, de acuerdo con la condici´ on de suavidad de la perturbaci´ on. (iii) En la figura 11.6b los intervalos rayados muestran resonancias secundarias. La suavidad de la perturbaci´ on exige que las resonancias secundarias sean aisladas.
Teor´ıa de perturbaciones / 535 y de las expresiones ∆I1 = q∆I 1 y g = q 2 ∂ 2 H0 /∂I12 = q 2 G′ , obtenemos para la contribuci´ on de todas las resonancias secundarias sobre el valor de ∆I1 : 1/2 X X 2λ 1/2 Hqm (11.364) ∆I1 = 4 G′ p,q y para el ensanchamiento de las frecuencias: X X ∂ω1 X ∆I1 = G′ ∆I1 ∆ω1 = ∂I1 1/2 X 2λ 1/2 = 4 Hqm G′ p,q
(11.365)
La relaci´ on entre la suma de los anchos de las islas secundarias y la separaci´on entre las resonancias primarias es: P X ∆ω1 1/2 = 4(2λG′ )1/2 ω2−1 Hqm (11.366) δω1 p,q Si H1 tiene M derivadas continuas respecto a ϕ1 y ϕ2 , las derivadas altas tienen la forma: X (11.367) Hqm (iq)k1 (−im)M−k1 ei(qϕ1 −mϕ2 ) p,q
Las cuales ser´an continuas a condici´on de que Hqm sean lo suficientemente peque˜ nas para q y m grandes. Para que la serie converja, es necesario que para q y m grandes los t´erminos se comporten como 1/q 2 por lo menos, ya que m es lineal en q de acuerdo con (11.362). Entonces las amplitudes de Fourier para q grandes han de comportarse como: Hqm ≈
A q M+2
(11.368)
con el fin de que λH1 sea de clase C M . Seg´ un (11.362) y la desigualdad p < q, hay q coeficientes de Hqm con el mismo valor de q y diferentes valores de p. Estos coeficientes corresponden a resonancias y son todos grandes y de magnitud comparable. Por tanto: X 1/2 1/2 Hqm ≈ qHqm′ (11.369) donde m′ es un valor de m convenientemente escogido. De (11.366), (11.368) y (11.369) se sigue entonces que: √ P ∞ X ∆ω1 4 2ω1 σ ≈ 4(2λG′ A)1/2 ω2−1 (11.370) q −M/2 = δω1 ω2 q=1
donde: σ=ζ
M 2
,
ω1 = (λAG′ )1/2
(11.371)
536 / Mec´ anica cl´ asica avanzada y ζ es la funci´ on zeta de Riemann. ζ(1) = ∞, ζ(2) = 1, 64493, ζ(3) = 1, 20205 y ζ(x) → 1 para x → ∞. Entonces (11.370) existe si M > 2. De modo que independientemente del valor del coeficiente de la sumatoria, obtenemos la importante condici´on para la existencia de una superficie de K. A. M.: que el n´ umero de derivadas continuas de la perturbaci´on satisfaga que M >2
(11.372)
Podemos comparar este resultado con la condici´on (iii) de K. A. M., (11.352), escrita para dos dimensiones como: ω1 r ′ τ −1 (11.373) ω2 − s > C s
El lado izquierdo es el ancho de una resonancia secundaria aislada. Tomando el ancho total a ser examinado como la distancia entre dos resonancias de orden inferior, o sea el intervalo unidad, hay a lo sumo s valores de r en tal intervalo que deben ser excluidos seg´ un la condici´on (i) del teorema. La medida de Lebesgue M de las resonancias excluidas se obtiene multiplicando a (11.373) por s y sumando sobre s: M = C′
∞ X
s−τ = C ′ ζ(τ )
(11.374)
s=1
Comparando a (11.374) con (11.370) vemos que: C′ ≈
ω1 ; ω2
ω1 =
√ λAG′ ;
τ=
M 2
(11.375)
Entonces τ > 1 es suficiente para que exista una superficie de K. A. M. Chirikov ha determinado la condici´on necesaria correspondiente a (11.372) para l grados de libertad: M ≥ 2l − 2
(11.376)
y Moser la condici´on suficiente: M ≥ 2l + 2
(11.377)
suponiendo que C tiende a cero con λ y es tomada suficientemente peque˜ na. Asumiendo que la suma en (11.370) converge a σ, vemos que las superficies de K. A. M. no existen si α = ω1 /ω2 cae dentro de una de las regiones rayadas en la figura 11.6b. Como el ancho de esas regiones es proporcional a (λG)1/2 y decrece con el incremento de q, α debe estar lo suficientemente lejos de un n´ umero racional p/q. Para λ peque˜ no es f´ acil cumplir esto, pero cuando λ se incrementa, solamente aquellos irracionales que son m´as dif´ıciles de aproximar por racionales pueden dar lugar a √ superficies de K. A. M. El n´ umero “m´ as irracional” en este sentido es la media dorada ( 5 − 1)/2. La condici´on sobre el valor de λ se obtiene de (11.370) haciendo el lado izquierdo igual a uno: λG′ ≤
ω22 32Aσ 2
(11.378)
Teor´ıa de perturbaciones / 537 Por otra parte (11.360) y (11.378) dan la condici´on de λ no linealidad moderada: ω22 32λA < G′ < 2 I0 32Aσ 2 λ
(11.379)
usando r2 Hrs /q 2 ≈ A. El teorema de Poincar´ e-Birkhoff. Cualquier punto del c´ırculo con α(I) = r/s es un punto fijo de la aplicaci´on “twist” no perturbada (11.299) con per´ıodo s. El teorema dice que para alg´ un m´ ultiplo par de s, 2ks con k = 1, 2, ..., permanecen 2ks puntos fijos al colocarse una perturbaci´on, siendo ks de ellos el´ıpticos y ks hiperb´ olicos. Asumamos que α(I) aumenta al aumentar I. Entonces hay una curva de K. A. M. por fuera de la curva racional, que se mueve en sentido contrario a las agujas del reloj (flechas externas), α > r/s, y una curva de K. A. M. dentro de la curva racional que se mueve en sentido de las agujas reloj, para s iteraciones de la aplicaci´on “twist” perturbada (11.302). Por tanto entre estas dos debe haber una curva cuya coordenada angular ϕ no cambia despu´es de s iteraciones de la aplicaci´on (curva s´olida, que no es una curva de K. A. M). Iy Curva estacionaria
Circunferencia K.A.M. α > r/s
Circunferencia α = r/s
Ix Circunferencia K.A.M. α < r/s
s = 3, k = 1
Figura 11.7 La figura muestra una curva de K. A. M. (por fuera de la curva racional) que se mueve en sentido contrario al del reloj, una curva racional que se mueve en sentido del reloj y una curva s´ olida que no es de K. A. M. Ahora mediante una aplicaci´on que preserve el ´area llevamos los puntos de la curva s´olida radialmente a alguna curva rayada como lo muestra la figura 11.7. Las curvas continua y rayada deben encerrar la misma ´area. Esto es posible s´olo si las curvas se cruzan entre s´ı un n´ umero par de veces. Cada intersecci´on cuando es iterada s veces retorna a
538 / Mec´ anica cl´ asica avanzada su posici´on inicial, es un punto fijo. De modo que para un n´ umero par de intersecciones, debe haber 2ks de tales puntos, que son los puntos fijos de Poincar´e-Birkhoff. El teorema no da el valor de k, que en la figura se ha tomado k = 1. Los puntos son alternativamente de naturaleza el´ıptica e hiperb´ olica. Los puntos con α 6= r/s cercanos a un punto el´ıptico tienden a girar alrededor de ´el, en tanto que los puntos cercanos a un punto hiperb´ olico mediante repetidas aplicaciones tienden a alejarse indefinidamente del punto fijo. En la secci´ on 11.7 mediante transformaci´ on a un sistema de coordenadas fijo en un punto el´ıptico estudiamos el comportamiento de los puntos cercanos a ´el y encontramos que tienen un movimiento pendular. Luego encontramos que las resonancias de orden superior dan lugar a la aparici´ on de nuevos puntos fijos en las cercan´ıas del punto el´ıptico, alrededor de los cuales nuevamente se presentan oscilaciones pendulares de amplitud mucho m´as peque˜ na, seg´ un (11.295) proporcional a (1/s)s+1/2 . Hasta aqu´ı vemos un cuadro lleno de curvas de K. A. M. de gran complejidad. Sin embargo, veremos que el comportamiento estoc´ astico no resulta de las resonancias de orden superior, sino que puede ocurrir en resonancias de orden bajo como resultado de la bifurcaci´ on de las separatrices. Hablando a grosso modo podemos decir que los punto el´ıpticos est´ an asociados a la estructura de islas del espacio f´asico y los puntos hiperb´ olicos al comportamiento estoc´ astico de la regi´ on entre toroides de K. A. M. En el ap´endice 9 del libro de Arnold hay una serie de proposiciones referentes a los puntos fijos de las aplicaciones can´onicas.9 Bifurcaci´ on de las separatrices. Sabemos que un p´endulo tiene una separatriz que une suavemente las ´orbitas hiperb´ olicas que pasan por los puntos de equilibrio inestable en π y −π. El teorema de Poincar´e-Birkhoff nos dice que hay ks puntos hiperb´ olicos en un sistema integrable. Hay una separatriz suave que une un punto hiperb´ olico a sus vecinos pr´oximos para tales sistemas. En un sistema cuasi-integrable con dos o m´as grados de libertad la situaci´ on es m´as compleja. Basta recordar que en los hamiltonianos usados para obtener la estructura de islas, (11.244) o (11.286), hay una serie de t´erminos que han sido despreciados al construir los correspondientes invariantes. La estructura de islas corresponde pues a un sistema truncado. En cualquier singularidad hiperb´ olica convergen cuatro curvas, correspondientes a las dos trayectorias separatrices incidentes Γ+ y a las dos trayectorias separatrices salientes Γ− . Un punto x pertenece a Γ+ si la transformaci´ on repetida T n x cuando n → ∞ − trae a x a la singularidad, y pertenece a Γ si la transformaci´ on inversa T −n x cuando n → ∞ trae a x a la singularidad. Como el per´ıodo sobre la separatriz del sistema truncado es infinito, lo mismo ser´a sobre la separatriz del sistema verdadero, y el movimiento de x hacia la singularidad resulta m´as y m´as lento mientras x est´e m´as cerca del punto fijo hiperb´ olico. Ahora consideremos la separatriz Γ− que sale del punto singular hiperb´ olico adyacente. En vez de llegar suavemente coincidiendo con Γ+ , como sucede con el p´endulo o con cualquier separatriz de un sistema integrable, la curva Γ− que sale de un punto hiperb´ olico se cruza con la curva Γ− que sale de un punto hiperb´ olico vecino desplazado 2π/(ks). Esta intersecci´on se llama un punto homocl´ınico. Las intersecciones entre trayectorias de resonancia vecinas diferentes se llaman puntos heterocl´ınicos. En esto consiste la bifurcaci´ on de las separatrices, en que una curva Γ+ no coincide con − una curva Γ . Esto establece una diferencia fundamental entre el comportamiento de 9 V´ ease
V. Arnold, Op. cit.
Teor´ıa de perturbaciones / 539
Curva K.A.M. x′′′
x′′ x′
Curva K.A.M. Punto elíptico
x
Γ+
Γ– Γ–
Γ+
Curva K.A.M. Curva K.A.M.
Figura 11.8 Bifurcaci´ on de las separatrices Γ. Las l´ıneas punteadas indican la separatriz del sistema truncado integrable. Las l´ıneas continuas indican la separatriz del sistema completo no integrable.
las trayectorias del sistema truncado y del sistema completo integrable. Si hay una intersecci´on, entonces hay un n´ umero infinito de intersecciones, todas puntos homocl´ınicos. La intersecci´on en el punto homocl´ınico x implica el cruce en x′ y luego en x′′ , con x′′ m´as pr´oximo a x′ que x′ a x. Como las ´areas encerradas por las intersecciones (´ areas sombreadas en la figura 11.8) son aplicaciones unas de otras, son conservadas, de modo que Γ− oscila m´as y m´as, siendo las intersecciones sucesivas m´as pr´oximas entre s´ı y las oscilaciones de amplitud mayor en virtud de la conservaci´ on de las ´areas. En la figura 11.8 se muestran s´olo las primeras intersecciones. Los puntos homocl´ınicos por s´ı solos no describen completamente el comportamiento de la regi´ on pr´oxima a las separatrices. Como el n´ umero α(I) local en las cercan´ıas de los puntos singulares el´ıpticos tiende a infinito en la separatriz debido a que el per´ıodo del movimiento sobre ´esta es infinito, entonces en las cercan´ıas de la separatriz hay un n´ umero infinito de resonancias secundarias correspondientes a valores grandes de α. Cada uno tiene su propio conjunto de puntos singulares hiperb´ olicos y el´ıpticos que alternan, con la correspondiente bifurcaci´ on de separatrices y con m´ ultiples puntos he-
540 / Mec´ anica cl´ asica avanzada terocl´ınicos. Todas esas trayectorias llenan densamente el espacio accesible a ellas, para dos grados de libertad limitado por dos superficies de K. A. M. La intersecci´on de las trayectorias en puntos homocl´ınicos demuestra que un toroide de K. A. M. no puede existir en tales puntos puesto que hay un dr´astico cambio de topolog´ıa. Cuando la perturbaci´on aumenta, seg´ un el teorema de K. A. M., la medida de la regi´on de toroides disminuye y aumenta la de la regi´on estoc´ astica. La magnitud de la bifurcaci´ on de las separatrices para λ peque˜ no es exponencialmente peque˜ na, raz´ on por la cual pasa desapercibida en las diferentes formas de la teor´ıa de perturbaciones. Su sola existencia genera las divergencias que ocurren en las series de perturbaciones. Si esas series fueran convergentes, el sistema no tendr´ıa bifurcaci´ on de las separatrices ni estados de movimiento irregular. Aplicaci´ on completa sobre una superficie de secci´ on para un sistema no integrable de dos grados de libertad. Asumamos que en la superficie de secci´ on al aumentar I1 disminuye la frecuencia ω1 y que en I1 = 0 el n´ umero de rotaci´on es irracional, por ejemplo α(0) = 1/π. Al aumentar I1 , ω1 decrece hasta alcanzar la primera resonancia de orden bajo en ω1 = ω2 /4, dando lugar como en la figura 11.3, a una cadena de islas; es decir hay cuatro puntos fijos que como resultado de la perturbaci´on y seg´ un el teorema de Poincar´e-Birkhoff pasan a ser ocho, altern´andose los el´ıpticos e hiperb´ olicos, con una isla alrededor de cada punto el´ıptico. Cerca de los cuatro puntos fijos hiperb´ olicos la presencia de puntos homocl´ınicos y heterocl´ınicos est´ a asociada a una regi´ on de movimiento ca´otico limitada por dos superficies de K. A. M. “rotacionales”. Al aumentar I1 , la siguiente resonancia de orden bajo aparece en ω1 = ω2 /5, que da lugar a cinco puntos el´ıpticos y a una cadena de cinco islas. Al aumentar I1 aparecen nuevas resonancias. Hay adem´as infinidad de resonancias intermedias cuya amplitud es peque˜ na. Por ejemplo, entre ω1 = ω2 /4 y ω1 = ω2 /5 hay una resonancia en ω1 = 2ω2 /9. De acuerdo con (11.257) la amplitud de una resonancia es del orden de: 1/2 λH r,−s ∆I1 ≈ 2 ∂ H0
(11.380)
2
∂I 1
Seg´ un (11.293) el coeficiente de Fourier dominante en el hamiltoniano que describe el movimiento en las islas es aproximadamente: m´ax Hr,−s ≈ Js (π)
(11.381)
de modo que la relaci´ on de amplitudes en s = 5 y s = 9 es aproximadamente: J9 (π) ∆I1 (s/r = 9/2) ≈ 0, 1 (11.382) ≈ ∆I1 (s/r = 5) J5 (π) Adem´as, en cada punto hiperb´ olico de las resonancias secundarias se genera una regi´ on de movimiento ca´otico. La figura 11.9 muestra esquem´ aticamente la apariencia de la superficie de secci´ on. Las l´ıneas s´olidas son superficies de K. A. M. Las que rodean el origen, I1 = 0, son distorsi´on de los c´ırculos no perturbados y corresponden al nuevo invariante I1 = constante,
Teor´ıa de perturbaciones / 541 el cual es calculado aplicando el teorema de la media, descrito en la secci´ on 11.5. Las l´ıneas s´olidas que rodean los puntos singulares el´ıpticos no se pueden calcular con este m´etodo sino con el de las perturbaciones seculares (secci´on 11.7). Para las trayectorias cercanas a las separatrices no hay un invariante y las trayectorias llenan toda el ´ area comprendida entre dos l´ıneas de K. A. M. “rotacionales”.
Figura 11.9 Superficie de secci´on de resonancias secundarias
En cada una de las “islas” alrededor de un punto el´ıptico podemos transformar de las variables I 1 , ϕ1 a unas variables acci´on-´ angulo J1 , χ1 . Esto transforma la cadena de islas en un conjunto de c´ırculos conc´entricos como en la figura 11.3b. Las resonancias entre la frecuencia del movimiento alrededor del punto fijo y las frecuencias fundamentales crean cadenas de islas de segundo orden, similares a las de primer orden. An´ alisis de la estabilidad. En los sistemas hamiltonianos no integrables la estabilidad lineal parece ser una condici´on necesaria y suficiente para la estabilidad no lineal, en el sentido que la estabilidad lineal garantiza la existencia de superficies de K. A. M. cerca a un punto fijo. El an´alisis de la estabilidad de un estado de movimiento en un sistema hamiltoniano se reduce al an´alisis de la estabilidad de la correspondiente aplicaci´on can´ onica en una superficie de secci´ on de Poincar´e. Un punto fijo x0 de una aplicaci´on que preserve el ´ area T se dice que es estable si para cada vecindad U de x0 existe una subvecindad V ⊆ U tal que para todo k siempre se cumple que T k (V ) ⊆ U . Poniendo el or´ıgen de coordenadas en x0 y linealizando T alrededor de ese punto, halla˜ que es simplicial. mos que su parte lineal es una matriz 2 × 2 de coeficientes reales, A, ˜ entonces 1/λ tambi´en lo es, y por ser real, λ y Debido a esto, si λ es un autovalor de A, λ⋆ son autovalores. De modo que los autovalores λ, λ⋆ , 1/λ, 1/λ⋆ , est´ an determinados ˜ Si los autovalores son por la ecuaci´ on λ2 − λ tr A˜ + 1 = 0 donde tr es la traza de A. complejo conjugados, λ1,2 = e±iσ , representan soluciones estables con tr A˜ = 2 cos σ y ˜ < 2. Si son reales y rec´ıprocos, por ejemplo λ1,2 = e±σ , con |tr A| ˜ = |2 cosh σ| > 2, |trA| se tienen soluciones creciente y decreciente. El caso inestable puede dividirse en dos posibilidades, tr A˜ > 2 (λ1 > 1) y tr A˜ < −2 (λ1 < −1). Las ra´ıces pueden ser iguales con
542 / Mec´ anica cl´ asica avanzada λ1 = λ2 = ±1, y corresponden a la transici´on exacta entre los casos estable e inestable. El movimiento linealizado presenta entonces tres clases de ´orbitas: el´ıpticas, hiperb´ olicas y rectil´ıneas. Un punto fijo hiperb´ olico es inestable y las ´orbitas cercanas a ´el se separan exponencialmente. Un punto fijo el´ıptico es estable y las ´orbitas cercanas a ´el se separan linealmente. Si en un punto el´ıptico hay resonancias de orden bajo, sabemos, el an´alisis de estabilidad lineal no es suficiente pues pueden presentarse nuevos puntos fijos hiperb´ olicos, de acuerdo con el teorema de Poincar´e-Birkhoff. Ejemplo 11.8.3 Hacer el an´alisis de estabilidad de la aplicaci´on separatriz (11.340): Wn+1 =
Wn − W0 sen ϕn
ϕn+1 =
ϕn + Q0 r ln
32 |Wn+1 |
(11.383)
Los puntos fijos de per´ıodo 1, o sea de una sola iteraci´ on, est´ an en: Q0 r ln o sea:
32 = 2πm |W1 |
(11.384)
W1 =
±32e−2πm/(Q0r) ,
ϕ1 =
0, π
m : entero (11.385)
Si llamamos x1 = (W1 , ϕ1 ) y T la aplicaci´on, estos puntos satisfacen x1 = T x1 . Linealizando alrededor de x1 obtenemos xn = x1 + ∆xn : ∆xn+1 = A˜ ∆xn
(11.386)
siendo A˜ la matriz jacobiana de la aplicaci´on: ∂W ∂W n+1
∂Wn A˜ = ∂ϕn+1 ∂Wn
n+1
∂ϕn
∂ϕn+1 ∂ϕn
(11.387)
˜ Para evaluar la estabilidad se requiere la traza de A: tr A˜ = 2 +
W0 Q0 r cos ϕ W1
(11.388)
Para estabilidad se requiere que tr A˜ < 2, de modo que para W1 > 0 los puntos fijos con ϕ1 = 0 son todos inestables. Para ϕ1 = π hay estabilidad cuando: W1 > Ws = W0
Q0 r 4
(11.389)
o sea: W1 >
2πrA 3 −πQ0 /2 Q0 e F
(11.390)
Teor´ıa de perturbaciones / 543 Es de esperarse que el valor de Ws que marca el l´ımite entre los puntos con ϕ1 = π estables e inestables represente un importante par´ ametro indicativo de estocasticidad cuando W < Ws . La aplicaci´on separatriz es de importancia para comprender el comportamiento ca´otico de los sistemas cuasi-integrables, pues las separatrices siempre rodean las resonancias de esos sistemas. La aplicaci´on separatriz, que describe el comportamiento en las cercan´ıas de la separatriz, claramente exhibe comportamiento ca´otico para W → 0. Ejercicio 11.8.1 Hallar los puntos fijos de per´ıodo 1 y analizar la estabilidad de la aplicaci´on de Fermi: Un+1 =
|Un + sen ϕn |
ϕn+1 =
ϕn +
2πM Un+1
(177)
(11.391)
donde M es una constante. Ejercicio 11.8.2 Hallar los puntos fijos de per´ıodo 1 y analizar la estabilidad de la aplicaci´on est´ andar (11.318). Ejercicio 11.8.3 Mostrar que la aplicaci´on est´ andar es una aproximaci´on a la aplicaci´on de Fermi y a la aplicaci´on separatriz linealizadas. Irregularidad global. La existencia de regiones ca´oticas est´ a asociada con las resonancias y se da aun para valores peque˜ nos del par´ ametro λ. No hay una transici´on brusca entre los reg´ımenes regular e irregular en alg´ un valor cr´ıtico de λ. Sin embargo es u ´til poder cuantificar el grado de “estocasticidad” y decir cuando el movimiento es dominantemente estoc´ astico. Chirikov (1979) ha observado que al aumentar la perturbaci´on ocurre en alg´ un valor m´as o menos definido que las superficies de K. A. M. rotacionales que encierran una regi´ on estoc´ astica de un sistema de dos grados de libertad se “rompen”, permitiendo que las trayectorias estoc´ asticas ocupen una regi´on m´as grande del espacio f´ asico. Con esta idea elabor´o el concepto de sobreposici´ on de las separatrices y defini´o un par´ ametro de estocasticidad. Hay muchos otros criterios pero este es de los m´as usados, al menos como un indicador del orden de magnitud de la perturbaci´on para el cual el sistema se comporta de modo esencialmente irregular. Si (∆Im´ax )1 y (∆Im´ax )2 son los anchos de las separatrices vecinas separadas por una l´ınea de K. A. M. rotacional, y δI12 es la distancia entre las resonancias correspondientes, o sea entre los puntos fijos centrales de las “islas”, el criterio de estocasticidad global puede formularse como: (∆Im´ax )1 + (∆Im´ax )2 2 ≥ δI12 3
(11.392)
Cuando existen las superficies de K. A. M. que limitan las regiones estoc´ asticas se habla de estocasticidad local o aislada y cuando tales superficies desaparecen se habla de estocasticidad global o conectada. En el ejemplo 11.8.3 hallamos un par´ ametro cr´ıtico para el cual se pierde la estabilidad lineal de las principales resonancias en la aplicaci´on separatriz; este par´ ametro tambi´en da una burda estimaci´ on de la estocasticidad, pero por no ser una condici´on necesaria para la estocasticidad conectada resulta ser un criterio
544 / Mec´ anica cl´ asica avanzada demasiado fuerte. Greene (1979)10 hall´o que aunque la p´erdida de estabilidad lineal de las islas de per´ıodo 1 es una condici´on muy fuerte, tal criterio aplicado a islas de per´ıodo alto cercanas a una superficie de K. A. M. puede dar una mejor descripci´on. Este es un criterio alterno al de Chirikov y m´as exacto en muchos casos. Ejemplo 11.8.4 Analizar diferentes criterios de irregularidad global para la aplicaci´on est´ andar (11.318). (a) P´erdida de estabilidad de los puntos fijos el´ıpticos de per´ıodo 1. Tales puntos est´ an en: I1 = 2πm ,
m : entero ;
La matriz A˜ es: 1 ±K A˜ = 1 1±K
ϕ1 = 0, 1
(11.393)
(11.394)
donde el signo m´as corresponde a ϕ1 = 0 y el menos a ϕ1 = π. La condici´on de estabilidad: |2 ± K| < 2
(11.395)
nos dice que el punto ϕ = 0 es siempre inestable. No hay puntos fijos el´ıpticos de per´ıodo 1 si: K>4
(11.396)
(b) Sobreposici´on de separatrices de resonancias primarias. Es conveniente considerar el hamiltoniano de la aplicaci´on, obtenido en el ejemplo 11.8.1. Si asumimos que ϕ var´ıa lentamente con el tiempo, dϕ/dn ≪ 2π, entonces esperamos que en H1 , ecuaci´ on (11.325), contribuir´ a s´olo el t´ermino de variaci´on m´as lenta, de modo que: 1 2 I + K cos ϕ + 2K cos ϕ cos 2πn (11.397) 2 La parte correspondiente a H0 , ecuaci´ on (11.324), describe un movimiento pendular, siendo la frecuencia de libraci´ on alrededor del punto el´ıptico ϕ = π: √ ω0 = K (11.398) H=
El m´aximo desplazamiento de I es hallado de H0 tomando cos ϕ = 1 en I = 0, o sea H0 = K. Entonces el valor m´aximo de I est´ a en cos ϕ = −1: √ ∆Im´ax = 2 K (11.399) De acuerdo con (11.393), la distancia entre las resonancias primarias δI es igual a 2π, y por tanto la relaci´on entre el ancho total de la separatriz y la distancia entre dos resonancias consecutivas es: 2∆Im´ax 4ω0 = (11.400) δI 2π 10 V´ ease
el texto de Lichtenberg A. J. y M. A. Lieberman, Regular and stochastic motion, SpringerVerlag, Nueva York, 1983.
Teor´ıa de perturbaciones / 545 La frecuencia de H1 es 2π, de modo que el n´ umero de rotaci´on local cerca al punto el´ıptico de libraci´ on α0 = ω0 /2π. Entonces: 2∆Im´ax = 4α0 (11.401) δI La observaci´ on num´erica dice que la transici´on a la estocasticidad global ocurre aproximadamente cuando aparecen las islas de sexto orden, con α ≈ 1/6, entonces (11.401) nos conduce a la “regla de los dos tercios”, 2∆Im´ax /δI ≈ 2/3. Sin embargo, un estimado de K puede obtenerse directamente de (11.400) tomando simplemente 2∆Im´ax /δI ≈ 1 como un indicativo de la sobreposici´on de las separatrices: √ 4 K = 2π , K ≈ 2, 47 (11.402) Con la regla de los dos tercios se obtiene: K ≈ 1, 46
(11.403)
(c) Sobreposici´on del primero y del segundo arm´onicos. Definimos la condici´on de sobreposici´on del primero y del segundo arm´onicos como: ∆I1 m´ax + ∆I2 m´ax = δI12 = π
(11.404)
donde los sub´ındices indican resonancias de per´ıodos 1 y 2 respectivamente. Para calcular el ancho ∆I2 necesitamos el segundo arm´onico de Fourier en la expansi´ on de H en potencias de K ya que en (11.397) K cos ϕ contiene s´olo el primer arm´onico. El hamiltoniano describe un sistema no aut´onomo de un grado de libertad, que equivale a uno de dos grados de libertad seg´ un la secci´ on 9.2. Como la regi´ on del espacio f´ asico en que aparece el segundo arm´onico est´ a alejada de las resonancias primarias, la teor´ıa de perturbaciones ordinaria puede usarse para hacer la expansi´ on de H hasta el segundo orden en K donde esperamos que aparezca el segundo arm´onico. El hamiltoniano (11.323) puede escribirse como: H=
+∞ X 1 2 I + λK cos(ϕ − 2πmn) 2 m=−∞
(11.405)
El t´ermino de orden cero I 2 /2, describe un movimiento en I − ϕ cuya soluci´on es ϕ = In + ϕ0 , I = constante, siendo ϕ0 una constante. Seg´ un (11.393) los puntos fijos de la aplicaci´on est´ andar est´ an en I = 2pπ para las resonancias primarias. Entonces la perturbaci´on dar´ a lugar a puntos fijos de las resonancias secundarias en: I = (1p + 1)π ;
p : entero
(11.406)
que se encuentran entre dos resonancias primarias. La frecuencia del movimiento de orden cero es (2p + 1)π y la frecuencia de la fuerza impulsora externa es 2πm, presentando resonancias de la forma r/s = (2p + 1)/m. Los punto fijos en 0 y π de (11.393) corresponden a m = 0, o sea al movimiento pendular, con lo cual las resonancias secundarias vienen de r = 2p + 1 y s = 1 y basta tomar a H como (11.397), escrito en la forma: 1 H = Iχ + Iϕ2 + K cos ϕ + 2K cos ϕ cos χ 2
(11.407)
546 / Mec´ anica cl´ asica avanzada Realicemos una transformaci´ on can´onica para obtener una variable angular r´apida y una lenta: Iχ =
rI χ ;
Iϕ = I ϕ − sI χ
ϕ = rχ − sϕ ;
(11.408)
χ=χ
Entonces: 2 1 I ϕ − sI χ 2 rχ − ϕ rχ − ϕ + K cos + 2K cos cos χ s s
H + = rI χ +
(11.409)
Ahora ϕ es una variable angular lenta y podemos aplicar la teor´ıa de perturbaciones adiab´aticas, secci´ on 11.5, v´alida aqu´ı por no haber divisores nulos. Para buscar una expansi´ on en potencias de K, al orden cero aplicamos (11.178): H 0 = rI χ +
2 1 I ϕ − sI χ 2
(11.410)
Al primer orden promediamos la perturbaci´on sobre la variable angular r´apida χ: H1 = 0
(11.411)
Entonces, seg´ un (11.180): 2π
∂F (1) = − cos(rχ − ϕ) − 2 cos(rχ − ϕ) cos χ ∂χ
(11.412)
y por tanto: −2πF (1) =
1 1 sen (rχ − ϕ) + sen [(r − 1)χ − ϕ] r r−1 1 sen [(r + 1)χ − ϕ] + r+1
(11.413)
y, 2π
∂F (1) = ∂χ
1 1 cos(rχ − ϕ) + cos[(r − 1)χ − ϕ] r r−1
(11.414)
1 + cos[(r + 1)χ − ϕ] r+1 Para hallar a H 2 , aplicamos la f´ormula (11.37) con los promedios tomados sobre χ: H2 =
(1) 2 2 ∂F ∂F (1) 1 X X ∂ 2 H0 2 µ=1 ν=1 ∂I ν ∂I µ ∂ϕν ∂ϕµ
(11.415)
Teor´ıa de perturbaciones / 547 Con el resultado, al segundo orden: 2 K 1 2 cos 2ϕ H= I − 2 4
(11.416)
donde se ha omitido una constante y regresado a la notaci´ on inicial. ϕ es la variable angular lenta, dada por (11.408): ϕ = −ϕ + (2p + 1)πn
(11.417)
y describe el movimiento alrededor de las islas de resonancias secundarias. Seg´ un la ecuaci´ on (11.416) la m´axima oscilaci´on de I es ∆I2 m´ax = K/2, con lo cual y con (11.399) y (11.404) toma la forma: √ K = π K ≈ 1, 46 (11.418) 2 K+ 2 que es el resultado obtenido por Chirikov, y que adem´as justifica la regla de los “dos tercios”. Experimentalmente, o sea resolviendo num´ericamente la aplicaci´on (11.318), se obtiene que la transici´on a la estocasticidad global seg´ un Chirikov ocurre cuando K ≈ 0, 99. Chirikov mejor´ o el resultado (11.418) tomando el espesor de la capa estoc´ astica en cercan´ıas de la separatriz. Ejemplo 11.8.5 Calcular el efecto del espesor de la separatriz sobre el valor de K a partir del cual ocurre la transici´on a la estocasticidad global. El c´ alculo se basa en el ejemplo 11.8.2. La funci´ on W en (11.339) proviene de 1 − κ2 del ejemplo 10.3.2, que se puede escribir como: E − Es (11.419) 1 − κ2 = − 2Es notando que la energ´ıa de la separatriz es precisamente F . Entonces W es: W =
E − Es Es
(11.420)
o sea la desviaci´ on de la energ´ıa respecto a la separatriz dividida por la energ´ıa de la separatriz. Seg´ un el ejemplo 11.8.1, la aplicaci´on separatriz (11.340) linealizada toma la forma de la aplicaci´on est´ andar si: In = −
Q0 ∆Wn W1
y
K=
Q0 W0 W1
(11.421)
siendo seg´ un (11.334) Q0 igual a: 2π Q0 = √ K
(11.422)
Hemos tomado r = 1 (resonancia de orden 1) y √ tomado las frecuencias impulsora y de la aplicaci´on seg´ un (11.398) y (11.393) iguales a K y 2π respectivamente.
548 / Mec´ anica cl´ asica avanzada Como en (11.341) A es H11 que para nuestro caso podemos tomar igual a F . De (11.421) y (11.341) podemos obtener el par´ ametro de estocasticidad K en funci´ on de Q0 y W1 : K=
8πQ30 −πQ0 /2 e W1
(11.423)
donde K est´ a asociado al ancho de las separatrices de las “islas” de segundo orden. Tal ancho, seg´ un (11.420), est´ a descrito por W , o sea por W1 en (11.423), que seg´ un (11.422) puede expresarse en funci´ on de K: W1 = 4(2π)4 K −5/2 e−π
2
√ / K
(11.424) √ De (11.399) se sigue que el valor de I en la separatriz es I0 = 2 K. La energ´ıa del l´ımite exterior de la capa estoc´ astica cercana a la separatriz es igual a la energ´ıa de la separatriz, K, m´as el ancho de la capa, dado seg´ un (11.420) por ∆E = W F , o sea que: K + ∆E = K(1 + W1 )
(11.425)
es la energ´ıa del l´ımite exterior de la capa estoc´ astica. Como E = I 2 /2 + K cos ϕ para 2 el p´endulo, en ϕ = π es igual a I /2 − K, encontramos que: 1 2 I − K = K(1 + W1 ) , 2
I 2 = 2K(2 + W1 )
(11.426)
y como W ≪ 1:
√ W1 I =2 K 1+ 4
(11.427)
De modo que el ancho de la separatriz respecto a la acci´on es: ∆Is = I − I0 =
√ 1 W1 K 2
(11.428)
Si sumamos este ancho en (11.418) obtenemos un criterio de sobreposici´on mejorado: h √ i √ 2 K 1 + (2π)4 K −5/2 e−π / K 2 K + =π 2
(11.429)
K ≈ 1, 2
(11.430)
del cual se obtiene el valor:
que coincide un poco m´as con el valor experimental K ≈ 0, 99.
12 Correspondencia con la mec´ anica cu´ antica de Heisenberg
En este cap´ıtulo presentaremos la mec´anica cl´asica con una notaci´ on similar a la usada en la mec´anica cu´antica de Heisenberg, conocida tambi´en como mec´anica matricial. Las f´ ormulas no tendr´an suposiciones cu´anticas y ser´an v´alidas cl´asicamente. Con esto podremos hacer ´enfasis en las diferencias y correspondencias que existen entre los formalismos cl´ asico y cu´antico, y a la vez retomar las ideas originales de Werner Heisenberg expuestas en su trabajo famoso de julio de 1925.1 Veremos que la representaci´on de las variables din´amicas por medio de matrices y la asignaci´on de valores propios a las variables din´amicas son posibles dentro de un formalismo puramente cl´ asico. Veremos tambi´en el punto exacto donde la mec´anica cl´asica admite el reemplazo de los corchetes de Poisson por conmutadores y la no conmutatividad de las matrices. Finalmente se˜ nalaremos d´ onde est´ an las verdaderas diferencias entre las mec´anicas cl´ asica y cu´antica. Para ilustrar la correspondencia entre la mec´anica cu´antica y la mec´anica cl´asica mostraremos c´ omo el procedimiento de diagonalizaci´on de la matriz hamiltoniana corresponde con el de resolver la ecuaci´ on de Hamilton-Jacobi, y presentaremos las f´ormulas de la teor´ıa cl´ asica de perturbaciones con la notaci´ on matricial. Se corrobora as´ı la idea expresada por Dirac en su art´ıculo de noviembre de 1925: “En un reciente art´ıculo Heisenberg plante´o una nueva teor´ıa donde sugiere que no son err´oneas las ecuaciones de la mec´anica cl´asica, sino m´as bien que son las operaciones matem´aticas mediante las cuales se extraen resultados f´ısicos a partir de ellas las que requieren modificaci´on. Toda la informaci´on sumunistrada por la teor´ıa cl´asica puede ser usada en la nueva teor´ıa”.2
1 Traducido al ingl´ es por B. L. van der Waerden en Sources of quantum mechanics, Dover, Nueva York, 1968. 2 Reproducido por van der Waerden, Op. cit.
549
550 / Mec´ anica cl´ asica avanzada
12.1.
Representaci´ on matricial de variables din´ amicas
Consideraremos un sistema acotado l-dimensional en un estado de movimiento regular, es decir, integrable y que por tanto se puede describir mediante variables acci´ on-´ angulo. Tal sistema es m´ ultiplemente peri´odico y cualquier variable din´amica puede expresarse como una serie de Fourier. El formalismo podr´ıa extenderse a estados no acotados mediante la sutituci´ on de las series por integrales de Fourier. Representaci´ on de variables din´ amicas por matrices herm´ıticas infinitas. Sea f una variable din´amica y (I, ϕ) un conjunto de variables acci´on-´ angulo del sistema, entonces: X f (I, ϕ) = f~n (I) ei~n·ϕ~ (12.1) ~ n
donde ~n son vectores l-dimensionales de componentes enteras. Es conveniente escribir a ~n como la diferencia entre dos vectores de componentes enteras, ~n = α ~ −α ~ ′ . El vector ~ α ~ puede escribirse de modo que I = α ~ ∆I, donde ∆I es un n´ umero lo suficientemente peque˜ no con las dimensiones de acci´on;3 por tanto las componentes de α ~ son n´ umeros enteros muy grandes, si I~ es grande. Sumar en (12.1) sobre todos los valores de las I~ (que var´ıan entre cero e infinito) equivale a sumar sobre α ~ , o sea: X XX ′ fα~ −~α′ (~ α ∆I)ei(~α−~α )·ϕ~ (12.2) f (~ α ∆I, ϕ ~) = α ~
α ~
α ~′
Por ser f real, se cumple que fα~⋆−~α′ (I) = fα~ ′ −~α (I). La suma sobre α ~ en (12.2) puede ser divergente, lo cual ha de tenerse en cuenta en los desarrollos que siguen. Esto corresponde con las dificultades de normalizaci´ on de las ondas planas en la mec´anica cu´antica. Si formamos el producto de dos variables din´amicas, sus coeficientes de Fourier dependen de los coeficientes de Fourier de cada variable, as´ı: X (f g)β− fβ−~ (12.3) ~ β ~ ′ (I) = ~ α (I)gα ~ ′ (I) ~ −β α ~
La convergencia de la expansi´ on (12.1) exige que los coeficientes para ~n altos sean peque˜ nos, por tanto s´olo son de inter´es los ~n bajos. Por otra parte, si ∆I es peque˜ no, siempre los α ~ en I~ = α ~ ∆I ser´an grandes, es decir que |~n| es del orden de la unidad y: |~n| ≪ |~ α|
(12.4)
Entonces se cumple para toda funci´ on de I~ que: F (~ α ∆I) = F (~ α′ ∆I) + (~ α−α ~ ′) · 3 Puede
∂F ∆I ∂ I~
considerarse a ∆I como la resoluci´ on en las medidas de las Iν .
(12.5)
Corespondencia con la mec´anica cu´antica de Heisenberg / 551 Esto nos permite definir matrices cl´asicas aproximadamente herm´ıticas, as´ı: fα~ ,~α′ ≡ fα~ −~α′ (~ α ∆I)
(12.6)
entonces es claro que: fα~⋆′ ,~α = fα~⋆′ −~α (~ α′ ∆I) = fα~ ,~α′ + (~ α′ − α ~) ·
∂fα~ −~α′ ∆I ∂ I~
(12.7)
es aproximadamente autoadjunta. Como α ~ y α ~ ′ pueden recorrer todos los vectores de ′ componentes enteras resulta que las fα~ ,~α son matrices infinitas. Correspondencia con las matrices cu´ anticas. En mec´anica cu´antica I~ y ϕ ~ son operadores cuyos vectores propios los denotaremos respectivamente por |~ αi y |~ ϕi. En el conjunto de estados |~ αi deben incluirse, si existen, los estados del continuo para tener un conjunto completo. La transformaci´ on de la representaci´on I~ a la representaci´on ϕ ~ es: X X ′ |~ ϕi = |~ α′ ih~ α′ |~ ϕi = |~ α′ i e−i~α ·ϕ~ (12.8) α ~′
α ~′
El valor esperado de una variable din´amica f en el estado |~ ϕi est´ a dado por: XX ′ h~ ϕ|f |~ ϕi = h~ α|f |~ α′ i ei(~α−~α )·ϕ~ (12.9) α ~
α ~′
Comparando (12.2) con (12.9) resulta clara la correspondencia de los coeficientes de Fourier fα~ −~α′ y las matrices cl´ asicas fα~ ,~α′ , con las matrices cu´anticas h~ α|f |~ α′ i. e−i~α·ϕ~ son las funciones de onda de la representaci´on ϕ ~ con valores definidos de α ~, ~ i∂/∂ ϕ o sea funciones propias del operador herm´ıtico asociado a I, ~: −
1 ∂ −i~α·ϕ~ e =α ~ e−i~α·ϕ~ i ∂ϕ ~
(12.10)
Ciertamente hay algunas dificultades en la definici´on de las variables acci´on-´ angulo en mec´anica cu´antica, analizadas en el art´ıculo de August´ın y Rabitz (1979).4 En la secci´ on §48 del libro de mec´anica cu´antica de Landau-Lifshitz (ver bibliograf´ıa) est´ a demostrada la correspondencia entre los elementos de matriz de un operador cu´antico y los coeficientes de Fourier de la correspondiente variable din´amica cl´asica. No tenemos hasta ahora ninguna justificaci´on para relacionar la matriz cl´asica fα~ ,~α′ con transiciones entre estados cuantizados descritos por α ~ yα ~ ′ . El ejemplo 10.5.2 sobre radiaci´ on dipolar da una evidencia de la asociaci´ on entre emisi´on de radiaci´ on y transiciones en mec´anica cl´ asica. Cambio de representaci´ on. Si por medio de una transformaci´ on can´onica pasamos de un conjunto de variables acci´on-´ angulo (I, ϕ) a otro (I, ϕ), por medio de una 4 Action-angle
variables in quantum mechanics, Journal of Chemical Physics, 71 (12), 4956, (1979).
552 / Mec´ anica cl´ asica avanzada funci´ on generatriz G3 (I, ~ϕ), las variables angulares y de acci´on se deben transformar ~ I~ = −∂G3 (I, ϕ)/∂ ϕ, ~ las funciones e−i~α·ϕ~ como: como ϕ ~ = −∂G3 (I, ϕ)/∂ I, X ′ ~ (12.11) gα~ ,~α′ (I)e−i~α ·ϕ e−i~α·ϕ~ = α ~′
y las amplitudes de Fourier de las variables din´amicas como: XX fβ− g+ ~ β ~ ′ (I) = ~ −~ α′ (I) gα ~ (I) ~ (I) fα ~ ′ ,β β,~ α
α ~
(12.12)
α ~′
⋆ donde g + ~ (I). ~ α (I) = gα ~ ,β β,~ Podemos tomar los resultados de la secci´ on 11.3, referentes a los cambios de sistemas de variables acci´on-´ angulo. Para sistemas no degenerados, las f´ormulas (11.84) y (11.85) de tal secci´ on establecen que: l X
∂ ψ(I) ; ϕν = nνµ ϕµ − ∂I ν µ=1
Iν =
l X
nµν Iµ
(12.13)
µ=1
donde nνµ es una matriz n ˜ de elementos enteros y determinante ±1 y ψ depende s´olo de las variables de acci´on. Entonces: ~
~
e−i~α·ϕ~ = e−i~α·(˜nϕ)−i~α·δ
(12.14)
siendo α ~ ·~δ una fase que s´olo depende de I~ y de α ~ . Por tanto para sistemas no degenerados: ~
gα~ ·~α′ = e−i~α·δ δα~ ′ ,~αn˜
(12.15)
Para sistemas degenerados rigen las f´ormulas (11.100) a (11.103): ϕβ =
l X
nβν ϕν + ψβ (ϕσ , I) ;
ν=1
ϕτ =
l X
Iβ =
s X
nγβ Iγ
γ=1
nτ σ ϕσ + ψτ (ϕσ , I)
(12.16)
ν=s+1
Iτ =
l X
nντ Iτ − i
ν=1
X σ σ C~nσ (I) nτ ei~n ·ϕ~ ~ nσ
Las variables no degeneradas tienen sub´ındices β = 1, 2, ...s, y las degeneradas σ = s + 1, s + 2, ...l. El super´ındice σ indica vectores de l − s componentes. Las variables angulares ϕστ son constantes y los n´ umeros nτ σ no necesitan ser enteros. ψν (ϕσ , I) son funciones peri´odicas de las variables angulares degeneradas. Entonces, usando el convenio de la suma: α ~ ·ϕ ~ = αβ nβν ϕν + ατ nτ σ ϕσ + αν ψν (ϕσ , I)
(12.17)
Corespondencia con la mec´anica cu´antica de Heisenberg / 553 ei~α·ϕ~ puede escribirse en la forma: eα~ ·ϕ~ = eiαβ nβτ ϕτ h(ϕσ , I)
(12.18)
donde las ϕτ son no degeneradas y h es una funci´ on peri´odica de las gα~ ,~α′ = hα~ σ ,~ασ′ δα~ τ ′ ,~ατ n˜ τ
ϕστ .
En consecuencia: (12.19)
siendo α ~ = (~ ασ , α ~ τ ). Notemos que: X g+ ~β ~ ′ = δβ, ~′ ~ gα ~ ,β
(12.20)
β,~ α
α ~
y por tanto: X h+ ~σ α ~σ
β ,~ ασ
hα~ σ ,β~ ′ σ = δβ~σ ,β~ ′ σ
(12.21)
o sea que g y h son matrices unitarias de dimensi´ on infinita. Las matrices unitarias de cambio de representaci´on son no conmutativas. Si se ˜ se cumple: realizan dos transformaciones sucesivas, descritas por las matrices g˜ y k, ~
~
~
~
gα~ ,~α′ kα~ ′ ,β~ =
e−i~α·(δg +˜ng δk ) δβ,~ ~ αn ˜g n ˜k
kα~ ,~α′ gα~ ′ ,β~ =
e−i~α·(δk +˜nk δg ) δβ,~ ~ αn ˜kn ˜g
(12.22)
Como puede verse, las matrices unitarias que describen las transformaciones can´onicas satisfacen una ´ algebra no conmutativa. Aqu´ı estamos considerando solamente transformaciones can´onicas entre diferentes conjuntos de variables acci´on-´ angulo, que cambian expansiones de Fourier en expansiones de Fourier. Es claro que al pasar a variables can´onicas que no sean de acci´on-´ angulo una expansi´ on de Fourier se cambia por una expansi´ on en otro conjunto de funciones ortogonales igualmente v´alida; en la formulaci´ on de la mec´anica cu´antica este trabajo fue hecho por Born, Jordan y Heisenberg entre septiembre y noviembre de 1925. Valores propios y vectores propios de una variable din´ amica. Dada una variable din´ amica f , ¿existe alg´ un conjunto de variables acci´on-´ angulo para el cual la funci´ on dependa s´olo de las variables de acci´on?. Si existe, en tales variables se debe cumplir: (12.23) f I(I, ϕ), ϕ(I, ϕ) = f (I)
Esto significa que en la expansi´ on de Fourier de f s´olo aparece la componente constante o d.c.: f β− ~ β ~ ′ = f 0 (I) δβ, ~β ~′
(12.24)
o en t´erminos de las matrices cl´ asicas (12.6): ~ f β, ~β ~ ′ = f 0 (β ∆I) δβ, ~β ~′
(12.25)
554 / Mec´ anica cl´ asica avanzada Los n´ umeros f 0 son los valores propios de la matriz f. De (12.12) y (12.20) se sigue que: XX + gβ,~ ~ ,~ α′ gα ~ ′ ,~ α =0 ~ ,~ α′ (I) − f 0 (I)δα ~ α fα α ~
(12.26)
α ~′
Esta expansi´ on se satisface s´olo si f 0 (I) son las ra´ıces de la ecuaci´ on secular: det fα~ ,~α′ − f 0 (~ α ∆I) δα~ ,~α′ = 0 (12.27)
En conclusi´ on, encontrar las variables acci´on-´ angulo en las cuales una variable din´ amica no dependa de las variables angulares equivale a diagonalizar la matriz cl´asica formada con los coeficientes de Fourier. Los vectores propios de la matriz son a su vez los elementos de la matriz de la transformaci´ on unitaria g que conecta las dos representaciones: X (12.28) fα~ ,~α′ gα~ ′ ,β~ (I) = f 0 (I) gα~ ,β~ (I) α ~′
De lo anterior resulta que si el hamiltoniano es diagonal, entonces toda constante de movimiento, cuando no hay degeneraci´on, es igualmente diagonal. Por ser matem´aticamente v´alida la correspondencia entre matrices infinitas y operadores lineales, concluimos que en mec´anica cl´asica es posible hacer corresponder a cada variable din´ amica un operador lineal.
Ejemplo 12.1.1 Hallar las matrices cl´asicas para q, p y H de un oscilador arm´onico lineal. Las expresiones de q y p en variables acci´on-´ angulo dadas en el ejemplo 10.3.1, permiten obtener f´ acilmente los coeficientes de Fourier: 1/2 I qα−β (I) = i (−δα,β+1 + δα,β−1 ) 2mω (12.29) 1/2 Imω (δα,β+1 + δα,β−1 ) pα−β (I) = 2 Usando la definici´on (12.6) se sigue que: 1/2 α ∆I qα,β = i (−δα,β+1 + δα,β−1 ) 2mω
pα,β =
α ∆Imω 2
1/2
(δα,β+1 + δα,β−1 )
Las matrices adjuntas correspondientes son: 1/2 1/2 (α + 1) ∆I (α − 1) ∆I ⋆ qβ,α = i δα,β−1 − i δα,β+1 2mω 2mω p⋆β,α
1/2 1/2 (α − 1) ∆Imω (α + 1) ∆Imω δα,β−1 + δα,β+1 = 2 2
(12.30)
(12.31)
Corespondencia con la mec´anica cu´antica de Heisenberg / 555 Vemos claramente que si α ≫ 1 las matrices de q y p son autoadjuntas. La matriz hamiltoniana es: Hα,β = α ∆I ωδα,β
(12.32)
Esta matriz es autoadjunta sin aproximaciones. Los valores propios son los diferentes valores de la energ´ıa del oscilador arm´onico. Por ser H positivo, resulta que: Hα,β = 0
para
α<0
(12.33)
Adem´as por ser ∆I peque˜ no, los valores propios de H son muy pr´oximos entre s´ı, formando un continuo en el l´ımite ∆I → 0.
12.2.
Corchetes de Poisson y conmutadores de matrices cl´ asicas
En contradicci´on con lo corrientemente aceptado, la mec´anica cl´asica admite la representaci´on de las variables din´amicas mediante matrices no conmutativas aproximadamente herm´ıticas. Esta representaci´on permite asociar conmutadores de matrices cl´asicas con los corchetes de Poisson. Los resultados cu´anticos se obtienen formalmente colocando ∆I = ¯h. Conmutadores cl´ asicos. El conmutador de las matrices de dos variables din´amicas f y g es: X (fβ,~ (12.34) ~ α gα ~ α fα ~ ′ − gβ,~ ~′ ) ~ ,β ~ ,β α ~
En t´erminos de las amplitudes de Fourier de f y g, (12.34) toma la forma: i Xh ~ ~ ∆I) f ~ ′ (~ fβ−~ (~ α ∆I) − g ( β α ∆I) (12.35) ′ ~ α (β ∆I) gα ~ ~ ~ −β β−~ α α ~ −β α ~
Notemos que la siguiente expresi´on vale cero: i Xh ~ ~ ~ ~ fβ−~ ( β ∆I) g ( β ∆I) − g ( β ∆I) f ( β ∆I) =0 ~ α ~′ ~ α ~′ α ~ −β β−~ α ~ −β
(12.36)
α ~
En efecto, cada αν toma valores entre −∞ y +∞. Si cambiamos en los t´erminos ~ ′ , entonces cada δν negativos de (12.36) a α ~ por ~δ mediante la f´ormula β~ − α ~ = ~δ − β ′ ′ tomar´a valores entre βν + βν − ∞ y βν + βν + ∞, o sea entre −∞ y +∞. Entonces por cada t´ermino en (12.36) con signo + hay uno con signo −. Matrices de corchetes de Poisson. El corchete de Poisson de dos variables din´amicas es: [f, g] =
∂f ∂g ∂f ∂g · − · ∂ϕ ~ ∂ I~ ∂ I~ ∂ ϕ ~
(12.37)
556 / Mec´ anica cl´ asica avanzada La serie de Fourier del corchete de Poisson es: X X ∂gm ∂fm ~ ~ ~ ϕ ~ [f, g] = i ~n · f~n ei(~n+m)· − g ~ ~ ~n ∂ I ∂ I m ~ ~ n
(12.38)
Las componentes de Fourier de [f, g] pueden escribirse en t´erminos de las de f y g as´ı: [f, g]~l = i
X ~ n
∂g~l−~n ∂f~l−~n ~n · f~n − g~n ∂ I~ ∂ I~
~−β ~ ′ y a ~n por β~ − α Cambiando a ~l por β ~ , se sigue: X ∂gα~ −β~ ′ ∂fα~ −β~ ′ ~ [f, g]β− = i( β − α ~ ) · f − g ~ β ~ α ~ α ~′ β−~ β−~ ∂ I~ ∂ I~ α ~
(12.39)
(12.40)
En esta expresi´on el corchete de Poisson depende de I~ = β~ ∆I; por tanto las ~ componentes de Fourier de f y g ser´an tambi´en funciones de β∆I. Si se realiza un ~ ∆I, se sigue que: cambio infinitesimal en I~ dado por (~ α − β) gα~ −β~ ′ ~ ∆I = g ~ ′ (~ ~ · (~ α − β) ~ ′ (β ∆I) α ~ −β α ∆I) − gα ~ −β ∂ I~
(12.41)
~ ≪ |~ ~ debido a que |~ α − β| α|, |β|. Entonces el corchete de Poisson puede escribirse en la forma: [f, g]β− ~ β ~′ = i −i X h ~ ~ fβ−~ α ∆I) − gβ−~ α ∆I) ~ α (β ∆I)gα ~ ′ (~ ~ α (β ∆I)fα ~ ′ (~ ~ − β ~ − β ∆I
(12.42)
α ~
aqu´ı hemos usado la identidad (12.36). ~ ∆I, siendo por tanto [f, g] ~ ~ ′ Notemos que en el lado derecho de (12.42) I~ = β β−β ~ ∆I. Entonces la definici´on (12.6) nos permite identificar el lado izquierdo funci´ on de β de (12.42) con [f, g]β, ~β ~ ′ . Comparando a (12.35) con (12.42) obtenemos el resultado: [f, g]β, ~β ~′ =
−i ˜ (f g˜ − g˜f˜)β− ~ β ~′ ∆I
(12.43)
Vemos que la matriz del corchete de Poisson de dos variables din´amicas puede expresarse como el conmutador de las correspondientes matrices cl´asicas, multiplicado por −i/∆I: gg] = [f,
−i ˜ (f g˜ − g˜f˜) ∆I
(12.44)
En conclusi´ on, en la mec´anica cl´asica es posible asociar a las variables din´amicas un ´ algebra no conmutativa que coincide con el ´algebra de los corchetes de Poisson. Ejemplo 12.2.1 Evaluar directamente el conmutador de q y p, y el corchete de Poisson, para un oscilador arm´onico.
Corespondencia con la mec´anica cu´antica de Heisenberg / 557 De (12.30) se sigue: X i ∆I p qβ,α pα,β ′ = β (12.45) 2 α i p h p p p β ′ + 1 − β ′ − 1 δβ,β ′ + β ′ − 1 δβ,β ′ −2 × − β ′ + 1 δβ,β ′ +2 +
con una expresi´on an´aloga al permutar a p con q. El valor del conmutador es: X (qβ,α pα,β ′ − pβ,α qα,β ′ ) = α
i ∆I
p p p β β + 1 − β − 1 δβ,β ′ ≈ i ∆I δβ,β ′
(12.46)
donde la segunda relaci´ on resulta de la suposici´on β ≫ 1. Seg´ un (12.43) y (12.46) la matriz de los corchetes de Poisson debe ser: (12.47)
[q, p]β,β ′ = δβ,β ′
Si se aplica directamente (12.40) y se usa el siguiente resultado: 1/2 X X ∂pα−β ′ I i(β − α) qβα = i(β − α) i ∂I 2mω α α 1 mω 1/2 ×(−δβ,α+1 + δβ,α−1 ) (δα,β ′ +1 + δα,β ′ −1 ) (12.48) 2 2I y la expresi´on an´aloga con q y p intercambiados, se obtiene igualmente (12.47). Obviamente, la matriz de [q, p] = 1 tiene s´olo unos en la diagonal siendo ceros los dem´ as elementos. Ejemplo 12.2.2 Evaluar la matriz del corchete de Poisson de H con q para un oscilador arm´onico.
y,
La matriz hamiltoniana est´ a dada por (12.32). En consecuencia: 1/2 X β ∆I ′ (−δβ,β ′ +1 + δβ,β ′ −1 ) Hβ,α qα,β = β ∆I ωi 2mω α X α
qβ,α Hα,β ′ = i
β ∆I 2mω
1/2
β ′ ∆I ω(−δβ,β ′ +1 + δβ,β ′ −1 )
El conmutador es entonces: 1/2 X βω ∆I (−δβ,β ′ +1 − δβ,β1′ ) (Hβ,α qα,β ′ − qβ,α Hα,β ′ ) = i ∆I 2m α Seg´ un (12.43) y (12.51), el corchete de Poisson es: 1/2 Iω [H, q]β−β ′ = − (δβ,β ′ +1 + δβ,β ′ −1 ) 2m
que, como debe ser, coincide con la matriz de q. ˙
(12.49)
(12.50)
(12.51)
(12.52)
558 / Mec´ anica cl´ asica avanzada
12.3.
Problemas mec´ anicos a la manera de Heisenberg
En su trabajo de julio de 1925 Heisenberg se˜ nala que la din´amica de un problema en la vieja mec´anica cu´antica comprende dos aspectos: (i) La integraci´ on de las ecuaciones de movimiento, y¨ + f (y) = 0. (ii) La determinaci´oHn de las constantes de movimiento a trav´es de la cuantizaci´on de la variable de acci´on, p dq = 2πα¯h = 2πI. La condici´on (ii) se puede expresar en la forma: I X mx˙ dx = 2πm xn (I) x−n (I) n2 ω(I) = 2πI (12.53) n
siendo xn los coeficientes de Fourier de x. Como x es real, x−n = x⋆n . Una forma m´as compacta de la condici´on (ii) es entonces: m
X n
n
∂ nω(I) |xn (I)|2 = 1 ∂I
(12.54)
llamada en la vieja mec´anica cu´antica regla de suma de Kuhn-Thomas. La generalizaci´ on a varios grados de libertad es inmediata: X ∂ m (12.55) ~n · ~n · ~ω (I) |x~n (I)|2 = 1 ∂ I~ ~ n
La matriz de la forma (12.6) asociada con x es: xα~ ,~α′ = xα~ −~α′ (~ α ∆I)
(12.56)
Entonces (12.55) se puede escribir como: i X ∂ h (~ α − α~′ ) · ω ~ (I) |xα~ ,~α′ (I)|2 = 1 (~ α−α ~ ′) · m ∂ I~ ′
(12.57)
Usando una expresi´on an´aloga a (12.41) podemos escribir tambi´en: X 2m (~ α−α ~ ′ ).~ω (~ α ∆I) |xα~ ,~α′ |2 = ∆I
(12.58)
α ~
α ~′
Notemos que la regla de suma de Thomas-Kuhn no es otra cosa que el corchete de Poisson de x y p. De la relaci´on general (12.43), y del hecho de ser x y p variables can´ onicamente conjugadas, se sigue que: X (xβ,~ (12.59) ~ α pα ~ ′ − pβ,~ ~ α xα ~ ′ ) = i ∆I δβ, ~β ~′ ~ ,β ~ ,β α ~
Teniendo en cuenta que: ~ ·ω pα~ β~ = mi(~ α − β) ~ α~ xα~ ,β~ ′ Las ecuaciones (12.59) y (12.60) nos dan, para β~ = β~ ′ , la relaci´on (12.58).
(12.60)
Corespondencia con la mec´anica cu´antica de Heisenberg / 559 Entonces seg´ un Heisenberg, la ecuaci´ on de movimiento y¨ + f (y) = 0 y la condici´on sobre el conmutador de x y p dan lugar a un sistema de ecuaciones que determina un´ıvocamente las componentes de la matriz de x y los valores de energ´ıa del sistema. Las f´ ormulas que hemos obtenido son id´enticas a las de Heisenberg, reemplazando a ∆I por h ¯. ¿En d´ onde est´ an entonces las diferencias de fondo entre las mec´ anicas cu´ antica y cl´ asica?: (i) En la identificaci´ on de las matrices fα~ ,β~ con transiciones entre los estados cu´anticos ~ caracterizados por α ~ y β. (ii) En se˜ nalar que ∆I no puede ser arbitrariamente peque˜ no sino que toma el valor ¯h, o sea que I~ est´ a necesariamente cuantizada. (iii) En reemplazar a (~ α−α ~ ′) · ~ ω (~ α ∆I) ≈ (~ α−α ~ ′ ) · ~ω (~ α′ ∆I) por la frecuencia de Bohr ωα~ ,~α′ = (Eα~ − Eα~ ′ )/¯ h asociada a la transici´on entre los estados cuantizados caracterizados por α ~ yα ~ ′ . Esto equivaldr´ıa a asociar al “estado cl´asico α ~ ” la energ´ıa Eα~ = ∆I α ~ ·ω ~ de modo que (Eα~ − Eα~ ′ )/∆I = (~ α−α ~ ′ ) · ~ω ser´ıa un arm´onico. Esta asociaci´ on es acorde con la regla de combinaci´ on de frecuencias de Bohr, pero no predice las energ´ıas correctas, pues, por ejemplo, para un oscilador arm´onico deber´ıan ser Eα = ∆I (α + 1/2)ω; por esto Heisenberg propuso no asumir a priori una expresi´on para las ωα~ ,~α′ , sino m´as bien obtenerlas como un resultado. (iv) En se˜ nalar que debe existir un estado base del cual no puede salir el sistema emitiendo radiaci´ on; xα0 ,α0 −1 = 0 si α0 caracteriza el estado base. Con s´olo estas cuatro condiciones el formalismo cl´ asico desarrollado en este cap´ıtulo da lugar al formalismo de la mec´anica cu´antica seg´ un Heisenberg. Las reflexiones acerca del ´algebra de operadores no conmutativos caben perfectamente dentro del esquema cl´asico. Ejemplo 12.3.1 Resolver el oscilador arm´onico lineal en la mec´anica cu´antica de Heisenberg.5 La ecuaci´ on de movimiento x ¨ + ω02 x = 0 conduce a una soluci´on para los elementos de la matriz de x de la forma: xα,β cos(ωα,β t)
(12.61)
donde los elementos de la matriz x ˜ y las frecuencias ωα,β son cantidades a determinar. La condici´on adicional (12.58) nos da: X 2m (12.62) ωα,α′ |xα,α′ |2 = ¯h α′
La ecuaci´ on de movimiento nos da: 2 (ωα,β − ω02 ) xα,β = 0
(12.63)
ωα,β est´ an asociadas a las transiciones α → β: hωα,β = Eα − Eβ ¯ 5 V´ ease,
van der Waerden, Op. cit.
(12.64)
560 / Mec´ anica cl´ asica avanzada siendo Eα y Eβ las energ´ıas de los estados α y β. Esta ecuaci´ on nos dice que para cada α debe existir al menos un β ′ para el cual xα,β ′ 6=0 . Para este β ′ , (12.63) nos dice que necesariamente: (Eα − Eβ ′ )2 = ¯h2 ω02
(12.65)
Esta es una ecuaci´ on cuadr´atica en Eβ ′ , con las soluciones: hω 0 Eβ ′ = Eα ± ¯
(12.66)
lo cual nos indica que hay dos β ′ para los cuales xα,β ′ 6= 0, que llamaremos β ′ y β ′′ . Para ´estos dos β ′ las frecuencias satisfacen la relaci´on: (12.67)
ωα,β ′ = −ωα,β ′′ Entonces (12.62) nos dice que: ¯ 2mωα,β ′ |xα,β ′ |2 − |xα,β ′′ |2 = h
(12.68)
Los elementos de la matriz energ´ıa son: Hα,β
= =
(p2 )α,β mω02 (x2 )α,β + 2m 2 X pα,β ′ pβ,β ′ ω02 mxα,β ′ xβ ′ ,β + 2m 2 ′
(12.69)
β
De (12.60) se sigue que: X xα,β ′ xβ ′ ,β Hα,β = m ω02 − ωα,β ′ ωβ ′ ,β 2 ′
(12.70)
En particular para α = β tenemos: Hα,α = mω02 |xα,β ′ |2 + |xα,β ′′ |2
(12.71)
β
Hay dos posibilidades, que β ′′ exista o que no exista. Si β ′′ no existe y ωβ ′ ,α = ω0 , de (12.68) se sigue que: 2mω0 |xα,β ′ |2 = ¯h
(12.72)
y de (12.71) se sigue que: Eα = Hα,α = mω02 |xα,β ′ |2 =
¯hω0 2
(12.73)
Como Eα 6= Eβ si α 6= β, se sigue que hay a lo sumo un ´ındice α = α0 para el cual se cumple (12.73). Si tal α0 existe, podemos formar la secuencia de n´ umeros α0 , α1 , α2 , ...αk , αk+1 , ... tales que α′k = αk+1 y α′′k = αk−1 . Estos n´ umeros describen los estados para los cuales Ek+1 > Ek . Claramente, α′0 = α1 y α′′0 no existe. De (12.30) podemos adelantar que αk+1 = αk + 1. Para k > 0, (12.71) y (12.68) nos dan: (12.74) Hαk ,αk = mω02 |xαk ,αk+1 |2 + |xαk ,αk−1 |2
Corespondencia con la mec´anica cu´antica de Heisenberg / 561 h = 2mω0 |xαk ,αk+1 |2 − |xαk ,αk−1 |2 ¯
(12.75)
La ecuaci´ on (12.75) es una f´ ormula de recurrencia que permite a partir de |xα0 ,α1 |2 2 ¯ /(2mω0 ) y |xα0 ,α−1 |2 = 0: obtener cualquier |xαk ,αk+1 | . As´ı que, al usar |xα0 ,α1 |2 = h |xαk ,αk+1 |2 =
h(k + 1) ¯ 2mω0
(12.76)
Tambi´en esto nos permite identificar la secuencia α0 , α1 , α2 , ... con los n´ umeros enteros 0, 1, 2, ... Entonces la relaci´on de recurrencia nos dice que: |xk,k+1 |2 =
h(k + 1) ¯ ; 2mω0
|xk,k−1 |2 =
¯hk 2mω0
Por tanto (12.74) nos da, en vez del resultado cl´asico (12.32): 1 Ek = h ¯ ω0 k + 2
(12.77)
(12.78)
Como puede verse, lo espec´ıfico del tratamiento cu´antico de este problema estriba en: (i) Tomar a ∆I como h ¯ . (ii) Tomar en vez de (α − α′ )ω0 a ωα,α′ = (Eα − Eα′ )/¯h. (iii) Suponer la existencia de un estado base.
12.4.
Ecuaci´ on de Hamilton-Jacobi y diagonalizaci´ on de la matriz hamiltoniana
Para un sistema m´ ultiplemente peri´odico la matriz hamiltoniana cl´asica puede obtenerse de los coeficientes de Fourier de la funci´ on hamiltoniana H(q, p). La ecuaci´ on de Hamilton-Jacobi (secci´on 9.6), se caracteriza por definir la funci´on de Hamilton caracter´ıstica mediante la cual se realiza la transformaci´ on can´onica que lleva a unas nuevas veriables, donde todas las coordenadas son c´ıclicas, esto es: α ∆I) δα~ ,β~ H(q, p) = H(I) ⇒ H α~ ,β~ = H(~
(12.79)
como en la ecuaci´ on (12.32). Entonces la transformaci´ on can´onica buscada diagonaliza la matriz hamiltoniana, cuyos elementos son Hα~ −β~ (~ α ∆I) = Hα~ ,β~ . Las cantidades H(~ α ∆I), donde α ~ recorre todos los vectores l-dimensionales de componentes enteras, son los valores propios de la matriz infinita Hα~ ,β~ , que se obtiene resolviendo la ecuaci´ on secular (12.27). Los vectores propios de la matriz hamiltoniana son las cantidades gα~ ,~α′ , que seg´ un (12.11) realizan la transformaci´ on de las variables angulares ϕν a las ϕν . O sea que las gα~ ,~α′ definen la funci´ on de Hamilton caracter´ıstica de la transformaci´ on can´onica, para el tipo F3 , dada por: ϕ ~ =−
∂ Σ(I, ϕ) ; ∂ I~
Como gα~ ,~α′ (I) es: gα~ ,~α′ (I) =
1 (2π)l
I
~I = − ∂ Σ(I, ϕ) ∂ ~ϕ
′
~
~ α ·ϕ l ~ dϕ e−i~α.ϕ+i~
(12.80)
(12.81)
562 / Mec´ anica cl´ asica avanzada de (12.80) se sigue que: gα~ ,~α′ (I) =
1 (2π)l
I
∂
′
~
ei~α· ∂ I~ Σ(I,ϕ)+i~α ·ϕ dl ~ϕ
Adem´as, la f´ ormula inversa es: # " X ∂Σ ϕ −i~ α′ ·~ i~ α· = ln gα~ ,~α′ e ∂ I~ α ~′
(12.82)
(12.83)
Estas f´ ormulas muestran la conexi´on entre las transformaciones can´onicas y las matrices unitarias que realizan los cambios de representaci´on de las matrices cl´asicas, con clara correspondencia con la mec´anica cu´antica. Ejemplo 12.4.1 Estudiar la diagonalizaci´on de la matriz hamiltoniana de un oscilador arm´onico sometido a una fuerza constante. F´ısicamente el problema es muy simple porque el u ´nico efecto de la fuerza constante es cambiar la posici´on de equilibrio y desplazar el valor de la energ´ıa sin alterar la frecuencia de las oscilaciones. Sin embargo es ilustrativo de la conexi´on entre la soluci´on de la ecuaci´ on de Hamilton-Jacobi y la diagonalizaci´on de la matriz hamiltoniana. Si H0 es el hamiltoniano del oscilador no perturbado, el hamiltoniano de este problema ser´a: H = H0 + λx y en las variables acci´on-´ angulo de H0 toma la forma: 1/2 2I sen ϕ H = Iω + λ mω
(12.84)
(12.85)
Queremos pasar a las variables acci´on-´ angulo I − ϕ del hamiltoniano H mediante una transformaci´ on can´onica. La ecuaci´ on de Hamilton-Jacobi del problema es, seg´ un las f´ ormulas (9.286): 1/2 2I ∂Σ Iω − λ −E (12.86) sen mω ∂I Entonces: ϕ=−
mω 1/2 −1 ∂Σ λ (E − Iω) = sen−1 ∂I 2I
Si llamamos A = λ21/2 /(mω)1/2 , y notamos que: 2 2 A ∂Σ A E(I) = Iω − = −ω − 2ω ∂ϕ 2ω entonces la ecuaci´ on de Hamilton-Jacobi para Σ es: 2 ωI 1/2 ∂Σ A ∂Σ = I −1/2 + ωI −1/2 + sen ∂I A ∂ϕ 2ω
(12.87)
(12.88)
(12.89)
Corespondencia con la mec´anica cu´antica de Heisenberg / 563 Esta ecuaci´ on resulta complicada, raz´ on por la cual desistiremos de la funci´ on generatriz del tipo F3 . Notemos que la funci´ on generatriz del tipo F3 para la transformaci´ on inversa se obtiene cambiando en −F3 las variables I, ϕ por I, ϕ (ver secci´ on 9.5). Entonces las f´ormulas para la transformaci´ on inversa son: ϕ=
∂F3 (I, ϕ) ; ∂I
I=
∂F3 ∂ϕ
(12.90)
que coinciden con las f´ ormulas de la transformaci´ on original mediante una funci´ on generatriz del tipo F2 . F2 es soluci´on a la ecuaci´ on: 1/2 ∂F2 ∂F2 ω sen ϕ − E(I) = 0 (12.91) +A ∂ϕ ∂ϕ o sea: 1/2 2 ∂F2 Eω E A2 A 2 2 I= sen ϕ sen ϕ + 4 sen ϕ + (12.92) = − ∂ϕ 2ω 2 ω ω A2 Notemos que:
sen ϕ 1 1 ∂ ∂Σ · = − ∂ϕ ∂E ω ω (1 + 2mEω 2 λ−2 − cos2 ϕ)1/2
(12.93)
y en consecuencia:
" −1/2 # 2mEω 2 ϕ 1 ∂Σ2 −1 cos ϕ 1 + = + sen ∂E ω ω λ2 H De la expresi´on para I, 2πI = I dϕ se deduce que: E = Iω −
λ2 2mω 2
(12.94)
(12.95)
un (12.82) y (12.94), la matriz asociada a esta transforde donde ω −1 dE/dI = 1, y, seg´ maci´ on, que es la inversa de gα,β , es: I ′ −1 1 ei(α−α )ϕ−iα sen (cos ϕ/C) dϕ (12.96) Γα,α′ = 2π donde C = (1 + 2mEω 2 /λ2 )1/2 . Notemos que: e−iα sen
−1
x
= e−iαπ/2 [−iUα (x) + Tα (x)]
(12.97)
donde T y U son polinomios de Chevishev de primera y segunda clase respectivamente. En consecuencia: I cos ϕ ′ 1 Γα,α′ = ei(α −α) ϕ−i απ/2 Tα dϕ 2π C (12.98) I cos ϕ ′ 1 dϕ ei(α −α) ϕ−i(α+1)π/2 Uα + 2π C
564 / Mec´ anica cl´ asica avanzada No es simple hallar una expresi´on general para la transformada de Fourier de Tα (cos ϕ/C) y de Uα (cos ϕ/C). Aun conociendo la forma anal´ıtica de Γα,β , resulta dif´ıcil obtener una expresi´on cerrada para las sumatorias infinitas en (12.12). Por esto lo m´as c´ omodo es realizar los c´ alculos en forma num´erica. En este caso es necesario truncar las matrices para hacerlas finitas y proceder a realizar las integraciones mediante un algoritmo como el de Gauss. Una vez obtenida la matriz Γ el proceso de diagonalizaci´on es simple. Como puede verse, el m´etodo para obtener la matriz gα~ ,β~ a partir de la ecuaci´ on de Hamilton-Jacobi puede ser u ´til en problemas cu´anticos realistas en que sea especialmente dif´ıcil diagonalizar directamente la matriz hamiltoniana.
12.5.
Teor´ıa de perturbaciones con matrices cl´ asicas
Veremos que las f´ormulas de la teor´ıa cl´asica de perturbaciones, de primero y segundo orden, pueden escribirse en forma an´aloga a las correspondientes f´ormulas de la mec´anica cu´antica para las correcciones a la energ´ıa. Perturbaciones de primer orden. Para el caso no degenerado la correcci´on de primer orden a la energ´ıa est´ a dada por la f´ormula (11.27): H (1) (I) = hH1 (ϕ0 , I)i
(12.99)
Si la funci´ on H1 se expresa como una serie de Fourier, la correcci´on de primer orden est´ a determinada por los elementos diagonales de la matriz correspondiente: H (1) (~ α ∆I) = H1 α~ ,~α
(12.100)
que corresponde en mec´anica cu´antica con h~ α|H1 |~ αi. Para el caso degenerado, antes de hallar la correcci´on de primer orden, es necesario encontrar las variables acci´on-´ angulo “correctas” o “estabilizadas” en la aproximaci´on cero. Para ello es necesario buscar entre los posibles conjuntos de variables acci´on-´ angulo degeneradas Iσ0 − ϕ0σ de orden cero, aquel con el cual la perturbaci´on no depende de las variables angulares. A su vez esto se consigue resolviendo la ecuaci´ on de HamiltonJacobi (11.110). En t´erminos de matrices esto se logra diagonalizando la matriz formada con los coeficientes de Fourier de la perturbaci´on respecto a las variables degeneradas. Simult´ aneamente se hallan los valores propios perturbados al primer orden y la transformaci´ on can´ onica que lleva a las variables “correctas” de orden cero, mediante la f´ormula: h i (1) det H1 ~σ,σ~′ − H~σ δ~σ ,~σ′ = 0 (12.101)
donde ~σ y ~σ ′ son vectores de l − s componentes enteras, y: XX (1) g~σ+,~σ′ H~σ′ ,~σ′′ g~σ′′ ,~τ = H~σ δ~σ ,~τ ~ σ′
(12.102)
~ σ′′
En mec´anica cu´antica, la matriz que diagonaliza la perturbaci´on proporciona los coeficientes con los cuales se forman las funciones de onda exactas de la aproximaci´on cero como combinaciones lineales de las funciones de onda degeneradas. Ver la secci´ on
Corespondencia con la mec´anica cu´antica de Heisenberg / 565 §39 del libro de mec´anica cu´antica de Landau-Lifshitz, Op. cit. Perturbaciones de segundo orden. Seg´ un la f´ormula (11.40), la correcci´on de segundo orden a la energ´ıa est´ a dada por: H (2) (~ α ∆I) = −
|Aα~ ,β~ |2 1X ~ · ∂ (~ α − β) ~ · ~ω 2 ∂ I~ (~ α − β) ~
(12.103)
β6=α ~
donde Aα~ ,β~ est´ a dada por el coeficiente de Fourier de la expansi´ on de H1 en las variables acci´on-´ angulo no perturbadas. Tanto ω ~ como A ~ tienen como argumento a I~ = α ~ ∆I. α ~ ,β
Como en (12.41), podemos escribir: |Aα~ ,β~ |2 ∆I ~ · ∂ (~ α − β) = ~ ·ω 2 ∂ I~ (~ α − β) ~ |Aα~ ,β~ |2 |Aα~ ,β~ |2 − ~ · ~ω ~ · ~ω (~ α − β) (~ α − β) ~ ∆I/2 α ~ ∆I (~ α+β)
(12.104)
~−α El primer t´ermino de (12.104) cambia de signo al cambiar a α ~ − β~ por β ~ . Por tanto en la sumatoria (12.103) las contribuciones provenientes del primer t´ermino de (12.104) se cancelan. En el denominador del segundo t´ermino de (12.104), ~ω est´ a evaluada ~ ∆I/2. Si reemplazamos al denominador de la siguiente manera: en (~ α + β) " # ~ ∆I (~ α + β) ~ ·~ ~ · ~ω (β ~ ∆I) (~ α − β) ω →α ~ · ~ω(~ α ∆I) − β (12.105) 2 ~ ∆I|2 en la expresi´on para H (2) , con lo cual cometemos un error del orden de |(~ α − β) llegamos a la f´ ormula: H (2) (~ α ∆I) =
X
~ =α β6 ~
|Aα~ ,β~ |2
~ ∆I) ∆I α ~ ·ω ~ (~ α ∆I) − ∆I β~ · ~ω(β
(12.106)
Si llamamos: α ~ ∆I · ~ ω (~ α ∆I) = Eα~ ′
(12.107)
~ ∆I|2 como: La ecuaci´ on (12.103) puede escribirse con un error del orden de |(~ α − β) H (2) (~ α ∆I) =
X |Aα~ ,β~ |2 ′ ~ β
Eα~ − Eβ~
(12.108)
que coincide formalmente con la f´ormula cu´antica de la teor´ıa de perturbaciones de segundo orden.
566 / Mec´ anica cl´ asica avanzada
13 Correspondencia con la mec´ anica cu´ antica de Schr¨ odinger Este cap´ıtulo trata de mostrar la conexi´on de los trabajos de Hamilton y Jacobi con la formulaci´ on de Schr¨odinger de la mec´anica cu´antica. Se har´ a ´enfasis en la relaci´on existente entre la acci´on principal de Hamilton y la fase de la funci´ on de onda, y entre las soluciones de la ecuaci´ on de Liouville y la amplitud de la funci´ on de onda. Al pasar de la mec´anica cl´ asica a la formulaci´ on de Schr¨odinger son necesarios cambios conceptuales m´as dr´asticos respecto a la formulaci´ on de Heisenberg, pues se requiere postular la existencia de comportamientos ondulatorios. Tambi´en presentaremos algunos desarrollos modernos de las ideas de Einstein, Bohr y Sommerfeld acerca de la cuantizaci´on de un sistema cl´asico, debidos a Brillouin, Maslov y Keller. Finalmente obtendremos las f´ormulas de la aproximaci´on de W.K.B.
13.1.
Ideas de Hamilton acerca de las transformaciones can´ onicas
Hamilton present´ o en 1824 un trabajo a la Academia Irlandesa de Ciencias acerca de la conexi´on entre la din´ amica y la ´optica. Desde el punto de vista moderno, tal formalismo presenta una conexi´on entre la din´amica y el l´ımite cl´asico de la mec´anica ondulatoria, y no es aplicable a la ´optica por las dificultades resultantes de ser cero la masa del fot´on. Seg´ un el principio de Fermat las ecuaciones param´etricas de la trayectoria de un rayo de luz, x(l), y(l), z(l), son tales que la siguiente integral es una extremal: Z n(~r(l)) dl (13.1) siendo n el ´ındice de refracci´ on del medio en el punto ~r. El principio de m´ınima acci´on aplicado a una part´ıcula sometida a un potencial V , ecuaci´ on (9.49), expresa que: Z [E − V (~r)]1/2 dl (13.2) 567
568 / Mec´ anica cl´ asica avanzada tiene un valor estacionario para la trayectoria real. En los dos casos se deben tomar variaciones “∆”. La trayectoria de una part´ıcula y la de un rayo de luz coinciden haciendo: n(~r) = A [E − V (~r)]1/2
(13.3)
En un medio inhomog´eneo y anisotr´ opico n depende no s´olo de la posici´on sino de la direcci´ on de los rayos, esto es, de ~r y ~r˙ . Lo anterior permitir´ıa asociar propiedades corpusculares a la luz. Hamilton se propuso elaborar esta conexi´on dentro de un modelo ondulatorio de la luz teniendo en cuenta que la relaci´ on (13.3) es v´alida independientemente del modelo usado. Es natural partir del concepto de “frente de ondas”, introducido por Huygens en 1690. Cada punto ~r de un frente de ondas en el tiempo t genera una onda secundaria que alcanzar´ a otro punto ~r ′ del frente de ondas en un tiempo posterior t′ . El tiempo empleado por la luz en ir de ~r a ~r ′ depender´a solamente de ~r y ~r ′ . El lugar geom´etrico de los puntos alcanzados por la luz en el tiempo t′ es una superficie de ondas secundarias, definida por una funci´ on Σ(~r, ~r ′ ), donde ~r hace de par´ ametro, mediante la f´ormula: Σ(~r, ~r ′ ) = t − t′
(13.4)
Σ describe el camino ´optico entre ~r y ~r ′ y fue llamada por Hamilton funci´ on caracter´ıstica del medio. Seg´ un el principio de Huygens, la envolvente de las ondas secundarias en el tiempo t′ es el frente S ′ que se ha propagado en el espacio, como se ilustra en la figura 13.1.
α′′
α′ α
r′
N
r″
T
Σ′
r
Σ S″ S′ S
Figura 13.1 Propagaci´on en el espacio de la envolvente S Denotemos por α ~ = (α1 , α2 , α3 ) a los cosenos directores de la normal a S en el punto ~r y por α ~ ′ a los cosenos directores de la normal a S ′ en el punto ~r ′ . Decimos que ~r ′ corresponde con ~r si la onda secundaria que emerge de ~r toca a la envolvente S ′ en ~r ′ . La l´ınea descrita por los vectores α ~, α ~ ′, α ~ ′′ , ..., que llamamos N , es ortogonal a los
Corespondencia con la mec´anica cu´antica de Schr¨odinger / 569 frentes de onda. Como S ′ es la envolvente de las superficies Σ correspondientes a los puntos de S, las superficies Σ tambi´en son ortogonales a la l´ınea N en los puntos ~r, ~r ′ , ~r ′′ , ... Si denotamos por d~r ′ a un vector tangente a la superficie S ′ en ~r ′ , se cumple que: ∂Σ(~r, ~r ′ ) · d~r ′ = 0 ∂~r ′
(13.5)
Como α ~ ′ son los cosenos directores de N en el punto ~r ′ , tambi´en ser´an ortogonales a d~r . Se sigue entonces que: ∂Σ(~r, ~r ′ ) ′ ′ · d~r ′ = 0 (13.6) − λ α ~ ∂~r ′ ′
donde λ′ es cierta funci´ on de ~r ′ . La ecuaci´ on (13.6) implica que: 1 ∂Σ 1 ∂Σ 1 ∂Σ = ′ = ′ α′1 ∂x′ α2 ∂y ′ α3 ∂z ′
(13.7)
Similarmente, en el punto ~r se debe cumplir: 1 ∂Σ 1 ∂Σ 1 ∂Σ = = α1 ∂x α2 ∂y α3 ∂z
(13.8)
Adem´as: α′1 2 + α′2 2 + α′3 2 = 1
(13.9)
Las ecuaciones (13.4) y (13.7) a (13.9) permiten expresar las seis cantidades (x′ , y , z , α′1 , α′2 , α′3 ) en t´erminos de (x, y, z, α1 , α2 , α3 ). Entonces, dada una funci´ on caracter´ıstica del medio Σ, las seis ecuaciones (13.4) y (13.7) a (13.9) describen un´ıvocamente la l´ınea de las normales N en el medio ´optico anisotr´ opico. Es necesario aclarar que la l´ınea N no necesariamente coincide con la l´ınea T de un rayo luminoso que pasa por ~r; esta coincidencia ocurre solamente en un medio ´optico isotr´opico, en el cual los vectores ~r˙ , ~r˙ ′ , ~r˙ ′′ , ... son respectivamente paralelos a los vectores α ~, α ~ ′, α ~ ′′ , ... La funci´ on Σ determina una transformaci´ on en el espacio que cambia cualquier superficie S en una nueva S ′ . Si dos superficies Σ y S ′ se tocan en un punto ~r ′ , entonces las correspondientes superficies transformadas Σ′ y S ′′ se tocan en un punto ~r ′′ correspondiente a ~r ′ . Sophus Lie por esta raz´ on llama a las transformaciones (~r, α ~ ) → (~r ′ , α ~ ′) 1 transformaciones de contacto. Entonces cada funci´ on Σ define una transformaci´ on de contacto, que transforma un frente de ondas S en el frente de ondas S ′ envolvente de todas las ondas secundarias emergentes de S, en el intervalo de tiempo t′ − t. De (13.7) y (13.8) se sigue que: ′
′
∂Σ(~r, ~r ′ ) = λ~ α; ∂~r 1 En
∂Σ(~r, ~r ′ ) = λ′ α ~′ ∂~r ′
(13.10)
din´ amica hamiltoniana se usa el nombre de transformaciones can´ onicas para designar a estas transformaciones.
570 / Mec´ anica cl´ asica avanzada Entonces bajo desplazamientos arbitrarios d~r y d~r ′ , Σ cambia de valor en: dΣ = λ~ α · d~r + λ′ α ~ ′ · d~r ′
(13.11)
De acuerdo con (13.4), dΣ = dt′ − dt. Si tomamos el punto ~r fijo y consideramos dos frentes de onda pr´oximos, en los puntos ~r ′ y ~r ′ + d~r ′ , entonces dt′ ser´a la diferencia de tiempo entre esos frentes de onda, dada por: dt′ =
dl′ ′ n c
(13.12)
donde c es la velocidad de la luz en el vac´ıo, dl′ la distancia normal entre los dos frentes de onda finales y n′ es el ´ındice de refracci´ on del medio en el punto ~r ′ en la direcci´ on α′ ′ normal a S . De (13.11) y (13.12) se sigue entonces: dl′ ′ n = λ′ α ~ ′ · d~r ′ c
(13.13)
Como para el desplazamiento de ~r ′ que consideramos se cumple que d~r ′ = α ~ ′ dl′ , ′ ′ ′ podemos escribir dl = α ~ .d~r . Obtenemos entonces el resultado: λ′ =
n′ ; c
λ=−
n c
(13.14)
donde la segunda expresi´on se sigue de argumentos similares, tomando a ~r ′ fijo y variando el punto inicial ~r. En conclusi´ on: dΣ =
n n′ ′ α ~ · d~r ′ − α ~ · d~r c c
(13.15)
donde n′ y n son funciones respectivamente de (~r ′ , α ~ ′ ) y (~r, α ~ ), o equivalentemente de (~r ′ , ~r˙ ′ ) y (~r, ~r˙ ), porque debe existir una relaci´on definida entre α ~ y ~r˙ , y α ~ ′ y ~r˙ ′ . Tambi´en dΣ puede escribirse como: dΣ = ~ p ′ · d~r ′ − p~ · d~r
(13.16)
los vectores ~ p y p~ ′ tienen dimensiones de T L−1 y su magnitud es menor en los puntos donde la velocidad de la luz es mayor y viceversa. Si tomamos ahora los tiempos t y t′ infinitesimalmente pr´oximos, tambi´en lo ser´an los puntos ~r y ~r ′ , lo mismo que α ~ yα ~ ′ , y n y n′ . Decimos en este caso que la transformaci´ on de contacto es infinitesimal: ~r ′ = ~r + ~r˙ ∆t ;
~ ′ = p~ + ~p˙ ∆t p
Como Σ(~r, ~r) = 0, tambi´en se cumple que, al orden m´as bajo en ∆t: ∂Σ(~r, ~r ′ ) ′ · ~r˙ ∆t Σ(~r, ~r ) = ∂~r ′ ~r ′ =~r Definimos la funci´ on M (~r, ~r ′ ) como: ∂Σ(~r, ~r ′ ) ˙ ˙ M (~r, ~r˙ ) = · ~ r ′ = ~p · ~r ∂~r ′ ~ r =~ r
(13.17)
(13.18)
(13.19)
Corespondencia con la mec´anica cu´antica de Schr¨odinger / 571 Entonces se sigue que: ∂M (~r, ~r˙ ) ∂Σ(~r, ~r ′ ) = ~p = ∂~r ′ ~r ′ =~r ∂~r˙
(13.20)
Seg´ un (13.18) y (13.19), cuando ~r y ~r ′ son infinitesimalmente cercanos: Σ(~r, ~r ′ ) = M (~r, ~r˙ ) ∆t
(13.21)
Por tanto, para una separaci´on finita entre ~r y ~r ′ se cumple: Z ~r ′ Z t′ ′ ˙ ~p · d~r M (~r, ~r) dt = Σ(~r, ~r ) =
(13.22)
~ r
t
La longitud del camino ´ optico entre ~r y ~r ′ tambi´en puede escribirse, usando (13.15) y (13.16), como: Z ~r ′ Z ′ n 1 ~r ′ Σ(~r, ~r ) = α ~ · d~r = n dl (13.23) c c ~r ~ r Entonces, el principio de Fermat, (13.1), equivale a la condici´on de que Σ sea una extremal. La condici´on ∆Σ = 0 determina la forma de la l´ınea de los rayos T de la figura 13.1. Comparando a (13.23) con (13.2) vemos que M es proporcional a la energ´ıa cin´etica del problema mec´anico equivalente. La transformaci´ on de contacto (13.10), cuya funci´ on generatriz es Σ, puede expresarse como una transformaci´ on can´onica libre de primera clase: p~ = −
∂Σ(~r, ~r ′ ) ; ∂~r
~′ = p
∂Σ(~r, ~r ′ ) ∂~r ′
(13.24)
donde (~r ′ , p~ ′ ) son las “viejas” variables can´onicas y (~r, p~) las “nuevas”. Comparando con los resultados de la secci´ on 9.3, f´ormula (9.44), encontramos que Σ coincide formalmente con la acci´on de Lagrange y M con ~p · ~q. Sin embargo hay una discrepancia dimensional a trav´es de un factor constante B con dimensiones de energ´ıa. O sea que BΣ es la acci´on de Lagrange y B~ p es el momento mec´anico. La acci´on de Lagrange BΣ obedece la ecuaci´ on de Hamilton-Jacobi independiente del tiempo, que para una part´ıcula de masa m en un potencial V es: 2 ∂Σ V E 1 + 2 = 2 (13.25) 2m ∂~r B B Usando la conexi´on dada por (13.3), podemos escribir a (13.25) como: 2 ∂Σ 2m 1 = 2 2 n2 = 2 n2 ∂~r A B c
(13.26)
donde c es una constante con dimensiones de velocidad: c=
AB (2m)1/2
(13.27)
572 / Mec´ anica cl´ asica avanzada Formalmente (13.26) es la ecuaci´ on de la eiconal de la ´optica,2 que permite encontrar a Σ si se conocen las propiedades ´opticas del medio expresadas a trav´es de n. N´ otese que la relaci´on (13.27) aparentemente no permite el concepto de fot´on entendido como una part´ıcula de masa cero. Sin embargo el formalismo resulta perfectamente adaptado a la descripci´on de propiedades ondulatorias de part´ıculas de masa diferente de cero. Podemos concluir que a la acci´on de Lagrange de un sistema mec´anico se le puede asociar la onda secundaria emergente de un punto en cierto movimiento de propagaci´on de ondas. Este resultado sirvi´ o a Schr¨odinger para hallar la conexi´on entre la mec´anica y la ´ optica cl´ asicas por una parte, y la mec´anica ondulatoria (mec´anica cu´antica) por otra. Sin embargo, la ecuaci´ on de la eiconal (13.26) no coincide con la ecuaci´ on de ondas m´as que en el l´ımite asint´ otico de peque˜ nas longitudes de onda, en el cual la ´optica ondulatoria coincide con la ´optica geom´etrica. Frecuencia y vector de propagaci´ on. Para una onda plana monocrom´ atica la amplitud tiene la forma: ~
C = aei(k·~r−ωt+α)
(13.28)
y para una onda arbitraria: C = aeiϕ
(13.29)
donde ϕ es la eiconal que obedece la ecuaci´ on (13.26) s´olo en el l´ımite de ondas cortas. Desarrollando a ϕ en potencias de ~r y t, para ~r y t peque˜ nos se obtiene: ϕ=α+t
∂ϕ ∂ϕ + ~r · ∂t ∂~r
(13.30)
Como es de esperarse, el frente de ondas emergente de un punto es en las cercan´ıas del mismo casi plano, con: ~k = ∂ϕ ; ∂~r
ω=−
∂ϕ ∂t
(13.31)
Por otra parte, expandiendo a S cerca a ~r = 0 obtenemos: S = −Et + BΣ ≈ −Et + B~r ·
∂Σ = −Et + B~r · p~ ∂~r
(13.32)
Si admitimos que S = Dϕ, donde D es otra constante, encontramos que p~ es proporcional a ~k y E proporcional a ω: E = Dω ;
p ~=
D~ k B
(13.33)
La funci´ on M , seg´ un (13.19) puede escribirse como: n(~r, α ~) M (~r, ~r˙ ) = α ~ · ~r˙ c 2 Eiconal
viene del griego, icono = imagen. La funci´ on eiconal permite localizar im´ agenes.
(13.34)
Corespondencia con la mec´anica cu´antica de Schr¨odinger / 573 y se denomina la indicatriz del medio ´optico en el punto ~r. La velocidad del frente de ondas en el punto ~r en la direcci´ on α ~ tiene magnitud v(~r, α ~ ) = c/n(~r, α ~ ). Por tanto: α ~ · ~r˙ M (~r, ~r˙ ) = ; v(~r, α ~)
p~ =
α ~ ~v (~r, α ~) = v(~r, α ~) v(~r, α ~ )2
(13.35)
Por esto el vector p~, que es proporcional a ~k cuando la onda es plana monocrom´ atica, se llama el vector de lentitud normal del frente de ondas en el punto ~r en la direcci´ on α ~. ~ en un punto Los vectores ~r˙ y ~p. Exploremos la relaci´on entre los vectores ~r y α dado ~r. Para ello usamos la noci´ on matem´atica de homotecia, o sea la transformaci´ on de cambio de escala. Si realizamos a la superficie M (~r, ~r˙ ) una transformaci´ on de homotecia con par´ ametro ǫ respecto a ~r˙ , en un punto ~r, obtenemos: M (~r, ǫ~r˙ ) = ǫ~ p · ~r˙
(13.36)
al notar que p~ depende de la direcci´ on de ~r pero no de su magnitud. Por otra parte, consideremos el desplazamiento del frente de ondas S durante un tiempo infinitesimal ǫ (v´ease figura 13.2). La onda secundaria que emerge del punto ~r, en el tiempo ǫ, ser´a, seg´ un (13.18): Σ(~r, ~r ′ ) = p~ · ~r˙ ǫ
(13.37)
Comparando a (13.36) y (13.37) se sigue que Σ y M son iguales al orden de ǫ2 . Cuando el tiempo entre S(t) y S(t + ǫ) es infinitesimal, la onda secundaria emergente de ~r que toca a S(t + ǫ) y la indicatriz del medio ´optico en ~r son homot´eticas. Si ahora hacemos tender ǫ a cero, obtenemos que en cada punto ~r los vectores α ~ y ~r tienen una relaci´ on bien definida. La direcci´ on del plano tangente a la indicatriz en ~r˙ se llama conjugada de la direcci´ on de ~r˙ . O sea que ~r˙ y ~ p son dos vectores conjugados en cada punto ~r. En general ~r˙ no es perpendicular al plano tangente a la indicatriz en ~r˙ . Si el medio es isotr´opico, en cada punto ~r la indicatriz ser´a una superficie esf´erica; en el caso contrario n depender´a de ~r y ~r˙ , con lo cual Σ y p~ depender´an igualmente de ~r˙ , dando lugar a que M no sea esf´erica (v´ease figura 13.2).
13.2.
Funci´ on de distribuci´ on de probabilidades
Para una part´ıcula, la contraparte cu´antica de la proyecci´on de un toroide invariante sobre el espacio tridimensional es |ψ|2 , siendo ψ una funci´ on propia de tres operadores que conmutan (para un problema de fuerzas centrales, por ejemplo, tales operadores pueden ser H, l2 y lz ). La densidad que describe el ensamble de trayectorias sobre el toroide invariante es ρ, que satisface la ecuaci´ on de Liouville (secci´on 4.8): ∂ρ + [ρ, H] = 0 ∂t
(13.38)
574 / Mec´ anica cl´ asica avanzada T
Punto de tangencia r r
p Plano tangente a la indicatriz en r
Σ(r, r ′) M(r, r ′)
S(t)
S(t + ε)
Figura 13.2 Desplazamiento del frente de ondas S durante un tiempo infinitesimal ǫ.
Como H no depende de las variables angulares, esta ecuaci´ on toma la forma, ∂ρ ∂ρ ∂ρ ∂ρ + ω2 + ω3 =0 + ω1 ∂t ∂ϕ1 ∂ϕ2 ∂ϕ3
(13.39)
Como las ων son las “velocidades” sobre el toroide, esta ecuaci´ on tiene la forma de una ecuaci´ on de continuidad para la densidad ρ: 3
∂ρ X ∂ (ων ρ) = 0 + ∂t ν=1 ∂ϕν
(13.40)
Cuando el sistema es estacionario, t no aparece en ρ expl´ıcitamente y por tanto: 3 X ∂ (ων ρ) = 0 ∂ϕ ν ν=1
(13.41)
Seg´ un esta expresi´on, el flujo de probabilidad sobre el toroide no tiene divergencia. Por tanto, al aplicar el teorema de Gauss a un tubo de trayectorias: Z (~ ω ρ) · d~σ = 0 (13.42) Como consecuencia, conociendo a ρ en un punto se puede calcular a ρ en cualquier otro punto de la misma trayectoria: ρω = ρ0 ω
dσ0 dσ
(13.43)
donde ω = |~ ω |, y dσ0 es el ´area de cruce normal al tubo de caracter´ısticas en el punto (~ p0 , ~r0 ). Realmente (13.43) vale en el l´ımite cuando dσ0 tiende a cero, en cuyo caso
Corespondencia con la mec´anica cu´antica de Schr¨odinger / 575 dσ/dσ0 denota el jacobiano de la aplicaci´on de los puntos de una secci´ on de cruce en otra por medio de las trayectorias: p~0 , ~r0 ρ(~ p, ~r) = ρ(~ p0 , ~r0 ) J (13.44) p~, ~r Una posible soluci´on de (13.41) es una funci´ on arbitraria de las variables de acci´on. Sin embargo no es la m´as interesante. Funci´ on de distribuci´ on en el espacio de configuraci´ on. Si por alg´ un procedimiento se obtiene una ρ particular, entonces la densidad en el espacio de configuraci´on x − y − z ser´a: Z Q(~r) = ρ(~ p, ~r) d3 p~ (13.45) En el espacio de configuraci´on hay igualmente un flujo de probabilidad, descrito por la ecuaci´ on de continuidad para Q: ∂ ∂Q + · (~r˙ Q) = 0 ∂t ∂~r
(13.46)
donde ~r˙ = ∂H/∂~ p. Cuando Q no depende expl´ıcitamente del tiempo, obedece ecuaciones an´alogas a (13.41) y (13.42). La ecuaci´ on an´aloga a (13.43) es: Qv = Q0 v0
dA0 dA
(13.47)
siendo dA un elemento de ´ area en el espacio ordinario, y v = |~r˙ |. Si se conoce a Q sobre una superficie dA0 que corta un tubo de trayectorias caracter´ısticas en el espacio de configuraci´on, (13.47) permite hallar a Q en cualquier otra superficie que corte el mismo tubo de trayectorias. El formalismo de las variables acci´on-´ angulo permite encontrar la densidad de probabilidad Q(~r), en una forma alterna a (13.47) que hace m´as transparente la conexi´on con Σ y con la proyecci´on del ensamble de trayectorias en el espacio de fases sobre el espacio de configuraci´on. ~ ϕ Como en ~r(I, ~ ) las I~ son constantes, se sigue que las posibles posiciones de la part´ıcula en el espacio de configuraci´on, ~r, est´ an determinadas por las ϕ ~. Entonces el promedio de una funci´ on de ~r sobre el toroide invariante puede expresarse como un promedio sobre el espacio de configuraci´on. En efecto: I 1 ~ ϕ f (~r(I, ~ )) d3 ϕ ~ (13.48) hf (~r)i = (2π)3 ~ ϕ La funci´ on ~r(I, ~ ), con I~ = constante, puede interpretarse como un cambio de coordenadas de ϕ ~ a ~r. Por tanto (13.48) puede escribirse como: Z ϕ ~ 1 d3~r (13.49) f (~ r ) J hf (~r)i = 3 (2π) ~r
576 / Mec´ anica cl´ asica avanzada En t´erminos de Q este mismo promedio es: Z hf (~r)i = Q(~r) f (~r) d3~r
(13.50)
de donde concluimos que Q es esencialmente el jacobiano de la transformaci´ on de ϕ ~ a ~r con I~ fijo: −1 ϕ ~ ~r 3 (2π) Q(~r) = J (13.51) =J ~r ϕ ~ Podemos igualmente hallar la funci´ on de distribuci´ on en el espacio de los momentos: ϕ ~ (13.52) (2π)3 Qp (~ p) = J p~ El lugar geom´etrico de los puntos para los cuales Q = ∞ se denomina “superficie c´ austica”. Para esos puntos, o bien v = 0, o bien las trayectorias se cruzan haciendo que dA = 0. Si la secci´ on de cruce se convierte un una l´ınea, diremos que m1 = 1 y si se convierte en un punto, que m1 = 2. El n´ umero de veces que un momento can´onico cambie de signo en alguna c´ austica lo notaremos m2 . El n´ umero m = m1 +m2 determina la fase de la funci´ on de onda semicl´ asica construida con Q y Σ. La f´ormula (13.51) permite tambi´en interpretar las c´ austicas como el lugar geom´etrico de las singularidades de la aplicaci´on del espacio de fases sobre el espacio de configuraci´on ϕ ~ → ~r. Tales singularidades se denominan lagrangianas. Ejemplo 13.2.1 Hallar la funci´ on Q para el problema de Kepler en coordenadas esf´ericas. En este caso Ir , Iθ e Iϕ son constantes. De las f´ormulas que expresan a r, θ y ϕ en t´erminos de las variables angulares ϕr , ϕθ y ϕϕ , dadas en la secci´ on 10.4, se sigue que: (2π)3 Q(~r) =
∂ϕr ∂ϕθ ∂ϕϕ 1 r2 sen θ ∂r ∂θ ∂ϕ
(13.53)
De la ecuaci´ on (10.192) se sigue: ∂ϕr I 1 = 2 ∂r a pr
(13.54)
La separaci´on de variables en la ecuaci´ on de Hamilton-Jacobi para el problema conduce a: ~ r, θ, ϕ) = Σr (Ir , Iθ , Iϕ , r) + Σθ (Iθ , Iϕ , θ) + Σϕ (Iϕ , ϕ) Σ(I,
(13.55)
de donde se sigue: ∂pθ ∂ϕθ ; = ∂θ ∂Iθ
∂ϕϕ ∂pϕ = ∂ϕ ∂Iϕ
(13.56)
Como pθ y pϕ est´ an dados por: p2θ = l2 −
lz2 ; sen2 θ
pϕ = lz
(13.57)
Corespondencia con la mec´anica cu´antica de Schr¨odinger / 577 obtenemos: l ∂ϕθ ; = ∂θ pθ
∂ϕϕ =1 ∂ϕ
(13.58)
De donde obtenemos finalmente: Q(~r) =
mk 1 (1 − ǫ2 )1/2 2 (2π)3 a r sen θ pr pθ
(13.59)
Esta es la densidad de probabilidad para un ensamble de sistemas con los mismos valores de E, l, lz , donde cada sistema posee un valor distinto de las ϕν . La regi´on descrita por Q(~r) se obtiene tambi´en a partir de una ´orbita individual mediante estas tres operaciones: primero, dejando la o´rbita fija se toma el conjunto de todas las posiciones de la part´ıcula sobre la misma; segundo, dejando fijo el plano de la ´orbita, se toma el conjunto de puntos del plano obtenido al rotar el anterior conjunto alrededor del foco, obteni´endose as´ı una corona sobre el plano de la ´orbita; finalmente, se toma el conjunto de puntos del espacio obtenido al rotar la corona alrededor del eje z. La regi´on as´ı obtenida resulta ser un elipsoide de revoluci´ on con ejes de longitudes rm´ax y rm´ax cos θm´ın , colocado con el eje menor sobre el eje z, y que adem´as posee en el centro un agujero elipsoidal con ejes de longitudes rm´ın y rm´ın cos θm´ın . Q(~r) vale cero fuera del elipsoide y dentro del agujero, es infinita sobre las superficies de los elipsoides, y en los dem´ as puntos est´ a dada por (13.59). N´ otese que los elipsoides interior y exterior son las superficies c´ austicas. La regi´on que hemos descrito es, para el caso del ´atomo de hidr´ogeno, el l´ımite cl´asico de la densidad de probabilidad cu´antica |ψnlm |2 . Vemos que no presenta los nodos angulares 2 caracter´ısticos de |Ylm |2 , ni los nodos de la densidad de probabilidad radial Rnl (r). Adem´as, la densidad de probabilidad cu´antica no es cero para r mayor que rm´ax ni para r menor que rm´ın , aunque decae exponencialmente en estas regiones, y tampoco presenta superficies c´ austicas. Ejemplo 13.2.2 Estudiar la funci´ on de distribuci´ on en el caso lz = l = 0. Comparar con la correspondiente densidad cu´antica para el ´atomo de hidr´ogeno. En este caso rm´ın = 0, las ´orbitas son rectil´ıneas y la intersecci´on del toroide invariante con el espacio de configuraci´on es una esfera. Q(r) es cero para r > 2a, infinito en r = 0 y r = 2a, y en los dem´ as puntos est´ a dada por: Q(r) =
1 (2π)2 ar(2ar − r2 )1/2
(13.60)
Esta expresi´on no se obtiene directamente de (13.59) porque para l = 0, pθ no est´ a definido. En (13.53), ∂ϕθ /∂θ es indeterminada pero hemos asumido que es una constante que se halla por normalizaci´ on. Q(r) es isotr´opica y corresponde a los estados s de la mec´anica cu´antica. Q(r) diverge en r = 0 y r = 2a, que son los puntos de retorno, y tiene un m´ınimo en r = 3a/2. El valor medio de r calculado con esta Q es 3a/2 y coincide exactamente con el valor medio cu´antico. Si bien en este caso no se cumplen las condiciones de validez de la aproximaci´on cl´ asica,3 el problema ilustra la correspondencia entre las dos descripciones. 3 V´ ease
la secci´ on 49 del libro de Mec´ anica cu´ antica de Landau-Lifshitz, Op. cit.
578 / Mec´ anica cl´ asica avanzada
2
2πϕ21s
1
2πQr
1
2
2 Figura 13.3 Funci´on de distribuci´ on 2πQ(r) en el caso lz = l = 0 y densidad cu´antica 2πψ1s para el ´atomo de hidr´ogeno
En la figura 13.3, la curva discontinua corresponde a la distribuci´ on en mec´anica cu´antica para el estado 1s del ´atomo de hidr´ogeno, que es exponencial. Las unidades son at´omicas. Como puede verse, la mayor discrepancia se presenta cerca al punto de retorno r = 0 y a la superficie c´ austica r = 2, donde la part´ıcula tiene energ´ıa cin´etica muy peque˜ na, estando por tanto all´ı m´as expuesta a los efectos de tipo cu´antico. La distribuci´ on cl´asica tiene la forma de una esfera con densidad que var´ıa radialmente, de radio 2a, en tanto que la distribuci´ on en mec´anica cu´antica decae exponencialmente y existe para r entre 0 y 2a, as´ı como entre 2a e ∞. La densidad en el espacio de momentos se halla f´acilmente de la relaci´on Qr r2 dr = Qp p2 dp. En unidades at´omicas el resultado es: Qp (p) =
1 1 2π 2 p2 (1 + p2 )2
(13.61)
El resultado cu´antico es:4 ϕ21s (p) =
8 1 π 2 (1 + p2 )4
(13.62)
Ejemplo 13.2.3 Demostrar que la funci´ on de distribuci´ on Q(r) definida por (13.51) satisface la ecuaci´ on de continuidad (13.46). En este caso Q no depende expl´ıcitamente del tiempo. El jacobiano est´ a dado por: ∂ϕλ ∂ϕσ ∂ϕρ ϕ ~ = ǫλσρ (13.63) J ~r ∂x ∂y ∂z 4 V´ ease
la secci´ on 36 del libro de Landau-Lifshitz, Op. cit.
Corespondencia con la mec´anica cu´antica de Schr¨odinger / 579 donde ǫλσρ es el tensor de Levi-Civita. Por otra parte la velocidad tiene la expresi´on: ~r˙ =
X ∂~r ωµ ∂ϕµ µ
(13.64)
Entonces (convenio de suma): ∂ ∂ϕλ ∂ϕµ ∂ϕρ ∂ ∂xi (x˙ i J) = ωµ ǫλσρ ∂xi ∂xi ∂ϕµ ∂x ∂y ∂z
(13.65)
´esta expresi´on es nula porque: ∂ ∂xi ∂ 2 xi = =0 ∂xi ∂ϕµ ∂ϕµ ∂xi
(13.66)
∂xi ∂ 2 ϕρ ∂ ∂ϕρ ∂ = = δµρ = 0 ∂ϕµ ∂xi ∂xi ∂ϕµ ∂xj ∂xi
(13.67)
y,
Ejemplo 13.2.4 Expresar la funci´ on de distribuci´ on Q(~r) en t´erminos de la acci´on de Lagrange Σ. Recordando que: ϕν =
~ ~r) ∂Σ(I, ∂Iν
(13.68)
se sigue de (13.63) que: (2π)3 Q(~r) = ǫλσρ
∂2Σ ∂2Σ ∂2Σ ∂x∂Iλ ∂y∂Iσ ∂z∂Iρ
(13.69)
~ ~r), Se sigue entonces que a cada soluci´on de la ecuaci´ on de Hamilton-Jacobi, Σ(I, le corresponde una funci´ on de distribuci´ on. No es necesario resolver por separado la ecuaci´ on de continuidad en el espacio de configuraci´on. En otras palabras, los campos ~ ~r) y Q(I, ~ ~r) no son independientes. En mec´anica cu´antica esto implicar´ıa que la Σ(I, funci´ on de onda compleja queda determinada simplemente por una funci´ on real. Relaci´ on con la teor´ıa erg´ odica y con el teorema K.A.M. Si el sistema es no degenerado y asumimos que los efectos cu´anticos son una perturbaci´on peque˜ na, sabemos que los toroides invariantes han de resultar ligeramente distorsionados. Entonces el problema cu´antico no difiere esencialmente del cl´asico. Como las frecuencias son inconmensurables la trayectoria cl´ asica, cuando t → ∞, llena completamente el toroide y se cumple que el promedio temporal de una variable din´amica coincide con el promedio tomado sobre las coordenadas del toroide: Z I 1 T 1 l´ım f (q, p)dt = f (q, p) dl ϕ ~ (13.70) T →∞ T 0 (2π)l Si el sistema es degenerado, las frecuencias son conmensurables. Entonces las trayectorias son peri´odicas y cubren una regi´on de dimensi´ on menor a la del toroide. El
580 / Mec´ anica cl´ asica avanzada teorema K.A.M. dice que en este caso, aun si la perturbaci´on es muy peque˜ na, los toroides invariantes pueden cambiar dr´asticamente en su topolog´ıa; para la mayor parte de las condiciones iniciales las trayectorias son estoc´ asticas o sea que no est´ an colocadas sobre regiones de geometr´ıa definida en el espacio f´asico. Para el problema de fuerzas centrales en coordenadas esf´ericas, adem´as de Ir , Iθ e Iϕ hay una constante de movimiento adicional ϕθ − ϕϕ (y en el problema de Kepler adem´as ϕr − ϕθ es constante). Cuando se aplica una perturbaci´on las constantes que dependen s´olo de variables angulares pasan a ser veriables angulares de frecuencia lenta dando lugar a que la trayectoria no sea cerrada sino que ocupe toda la regi´on definida por las variables de acci´on constantes. Entonces es de esperarse que a causa de los efectos cu´anticos, en un sistema degenerado se cumpla tambi´en la igualdad (13.70).
13.3.
La mec´ anica ondulatoria
Es posible, en la ´optica geom´etrica, describir la propagaci´on de los rayos por medio del principio de Fermat, ∆Σ = 0, y la propagaci´on de los frentes de ondas por medio de la ecuaci´ on de la eiconal. En ´optica f´ısica la luz es una onda electromagn´etica, y la ´optica geom´etrica es una primera aproximaci´on que describe correctamente la propagaci´on cuando la longitud de onda es peque˜ na en comparaci´ on con las dimensiones caracter´ısticas de la geometr´ıa del problema. Schr¨odinger encontr´o que para un sistema mec´anico hay un comportamiento similar. La trayectoria de las part´ıculas est´ a determinada por el principio de m´ınima acci´on y las soluciones de la ecuaci´ on de Hamilton-Jacobi describen el movimiento de unas superficies de acci´on constante. La mec´anica cl´asica resulta ser la aproximaci´on de ondas cortas de una teor´ıa m´as general, llamada mec´anica ondulatoria. Las ondas de materia est´ an determinadas por dos campos en el espacio ordinario, la ~ ~r), que distribuci´ on de probabilidades Q(~r) y las superficies de acci´on constante Σ(I, 5 corresponden a la amplitud y la fase de la onda. Seg´ un el ejemplo 13.2.4, Σ determina a Q. Schr¨odinger encontr´o la ecuaci´ on diferencial que obedecen las ondas de materia. Propagaci´ on de las superficies de acci´ on constante. Las funciones de Hamilton S y Σ est´ an relacionadas por: ~ t) = Σ(~r, C) ~ − Et S(~r, C,
(13.71)
~ es un conjunto de constantes de movimiento. Las superficies Σ = constante perdonde C manecen fijas en el espacio de configuraci´on, en tanto que las superficies S = constante se mueven. Si en t = 0, S = Σ = σ, entonces en un tiempo posterior dt, la superficie S = σ ya no coincidir´ a con la superficie Σ = σ sino con la superficie Σ = σ + E dt. La velocidad del movimiento de un punto fijo sobre S la llamaremos u: u=
dl dt
(13.72)
5 Esta correspondencia tiene implicaciones en las teor´ ıas gauge de la f´ısica de part´ıculas elementales. V´ ease L.A. S´ anchez, J. Mahecha, Rev. Mex. Fis. 49(2003)364. Tambi´ en http://xxx.lanl.gov/abs/hep-th/0308160
Corespondencia con la mec´anica cu´antica de Schr¨odinger / 581 donde dl es el desplazamiento del punto durante el tiempo dt. La condici´on S(0) = S(dt) = σ nos determina el valor de u. En efecto: S(dt) − S(0) =
∂S ~ ∂S · dl + dt = 0 ∂~r ∂t
(13.73)
Como por su definici´on d~l est´ a en la direcci´ on normal a S, se sigue que: E u = ∂Σ ∂~r
(13.74)
Σ obedece la ecuaci´ on de Hamilton-Jacobi independiente del tiempo, de donde: ∂Σ 1/2 = (2mT )1/2 (13.75) ∂~r = [2m(E − V )] Por tanto la velocidad de los puntos del frente S para una part´ıcula es: u=
E E = 1/2 p (2mT )
(13.76)
La relaci´ on E = pu, donde p es el momento lineal de la part´ıcula y u la velocidad del frente S, es an´aloga a E = pc en el caso de los fotones. u = E/mv es peque˜ na cuando v es grande y viceversa, y resulta ser proporcional a la magnitud del vector de lentitud normal an´alogo al de la ´ optica geom´etrica. u es llamada la velocidad de fase y v = p/m es la velocidad de la part´ıcula (llamada en mec´anica ondulatoria la velocidad de grupo). Cuando la velocidad de las part´ıculas es peque˜ na, las superficies S se mueven r´apidamente y cuando las part´ıculas se mueven r´apidamente, la velocidad de los frentes ~ t) puede considerarse como un campo o fluido, definido en toda es peque˜ na. S(~r, C, la regi´ on del espacio de configuraci´on accesible a la part´ıcula. Cuando el potencial no depende de la velocidad, las curvas caracter´ısticas en el espacio de configuraci´on son ortogonales a las superficies S. Al moverse las part´ıculas el campo S se propaga con velocidad u(~r) en cada punto. A su vez las part´ıculas mismas caracterizan otro campo, ~ con un flujo de velocidad en cada punto dado por ~r˙ . el de las densidades Q(~r, C), Ejemplo 13.3.1 Hallar las velocidades u y v para un oscilador arm´onico lineal y analizar los campos Q y S. Las velocidades de los frentes S y de las part´ıculas son respectivamente: u=±
1 2
ωA
1 ωA = 1/2 2 cos(ωt) x2 1− 2 A
1/2 x2 v = ±Aω 1 − 2 = ωA cos(ωt) A
(13.77)
(13.78)
Vemos que v var´ıa entre −Aω y +Aω, en tanto que u var´ıa entre −∞ y −ωA/2 y entre ωA/2 e ∞.
582 / Mec´ anica cl´ asica avanzada
y µ ωA 1 ωA 2 t 0 T/4
T/2
3T/4
T
Figura 13.4 Velocidades u y v para un oscilador arm´onico lineal
Vemos que en los puntos de retorno x = ±A los frentes S “rebotan” con velocidad muy grande; adem´as la densidad de los frentes S es mayor donde u es baja y es cero donde u es infinita. O sea, los frentes son densos donde la densidad de las part´ıculas es peque˜ na y viceversa (v´ease figura 13.4). Para este problema, de (13.51) se sigue que Q vale: Q=
1 1 ω = 2 1/2 2πA 2π|v| x 1− 2 A
O sea que Q tiene un comportamiento similar a |u|. La expresi´on para Σ es: 1/2 " # 2 1/2 1 mE x x Σ= A sen−1 + x 1 − 2 2 2 A A Notemos que Σ determina a Q. En efecto: " # 2 1/2 ∂ ∂Σ ∂ 2x 1/2 2πQ = 1 − mω (2mIω) = ∂I ∂x ∂I 2I
(13.79)
(13.80)
(13.81)
Cuando x = 0, Σ es cero y Q = 1/(2πA) y cuando x = A, Σ = πA(mE/2)1/2 en tanto que Q es infinita. Es interesante notar que Σ no es una funci´ on univaluada de x, pues para x = 0, Σ = 0 si t = 0 y Σ = 2πI si t = T . Igualmente ∂Σ/∂x = ±(2mE − m2ω 2 x2 )1/2 posee dos ramas, una para los tiempos anteriores a la llegada a los puntos de retorno y otra para
Corespondencia con la mec´anica cu´antica de Schr¨odinger / 583 los tiempos posteriores. En consecuencia, si no se toma valor absoluto, Q es tambi´en en sentido estricto una funci´ on multivaluada. Finalmente, como: ∂Σ x = sen−1 ∂I A se sigue que: I Q dx = 1
(13.82)
(13.83)
como debe ser.
Ondas materiales. Las part´ıculas microsc´opicas tienen un comportamiento ondulatorio evidenciado por: (i) La densidad en un haz de part´ıculas tiene oscilaciones o variaciones espaciales definidas, es decir, las trayectorias no se pueden distribuir arbitrariamente. (ii) La regi´ on accesible a un sistema ligado de part´ıculas va m´as all´a de los puntos de retorno cl´ asicos, aunque la probabilidad de encontrar las part´ıculas fuera de la regi´ on cl´ asica decrece exponencialmente. (iii) Hay fen´omenos de interferencia y difracci´ on. Para hablar de frentes de acci´on constante no son necesarias las nociones de “ondas” o “longitud” de onda. Al evaluar la distribuci´ on Q se encuentra que no presenta ninguna oscilaci´ on sino variaciones suaves con la posici´on. Esto es consecuente con la concepci´on de la mec´anica cl´ asica como el comportamiento l´ımite de un movimiento ondulatorio cuando la longitud de onda es peque˜ na. Vimos c´ omo de la formulaci´ on de la mec´anica cl´asica con matrices conmutativas emerge de manera natural la mec´anica cu´antica de Heisenberg al introducir algunas hip´otesis motivadas en la espectroscop´ıa at´omica. Desafortunadamente no hay una manera suave de obtener la mec´anica cu´antica de Schr¨odinger a partir de la ecuaci´ on de Hamilton-Jacobi y la funci´ on de distribuci´ on cl´asica, pues estos elementos cl´asicos son ajenos a conceptos tales como “funci´on de onda”, “ecuaci´on de onda”, “principio de superposici´on”. Es necesario un dr´astico cambio conceptual para introducir en la mec´anica las nociones ondulatorias. La ecuaci´ on de Schr¨ odinger. Schr¨odinger admiti´o la descripci´on de sistemas microsc´opicos mediante una amplitud de ondas an´aloga a la que describe otros fen´omenos ondulatorios: ψ(~r, t) = A(~r)eiϕ(~r,t)
(13.84)
Quien inici´ o este tipo de teor´ıas fue Louis de Broglie, cuando en 1923 estudi´ o la posible conexi´on entre las propiedades ondulatorias y corpusculares de la materia. Parti´o de la idea siguiente. Si trat´andose de part´ıculas se est´ a describiendo el mismo fen´oneno mediante los principios de Fermat y de m´ınima acci´on, en el l´ımite de ondas cortas se cumple la siguiente implicaci´on: Z 2 Z 2 dl = 0 (v = constante) y ∆ p(~r, E) dl = 0 ∆ r , v) 1 1 u(~ (13.85) 1 (E = constante) → p ∝ u
584 / Mec´ anica cl´ asica avanzada que es el mismo resultado (13.76). Para la velocidad de fase de una part´ıcula se cumple: c u(~r, ν) = = λ(~r, ν) ν n(~r, ν)
(13.86)
siendo n el ´ındice de refracci´ on, c una constante y ν la frecuencia de las ondas. Entonces de (13.76) o (13.85) se sigue que: p=
E E h = = u λ(~r, ν)ν λ(~r, ν)
(13.87)
siendo h = E/ν una constante. Como en (13.32) y (13.33), puede decirse que la fase de la onda, ϕ, es proporcional a la acci´on S: ϕ(~r, t) =
2π Σ(~r, E) Et S(~r, t) = − h ¯h ¯ h
(13.88)
Entonces: ψ(~r, t) = A(~r)eiΣ(~r,E)/¯h−iEt/¯h
(13.89)
ha de ser la forma de la funci´ on de onda en el l´ımite de ondas cortas. Schr¨odinger asumi´o que en general ϕ satisface una ecuaci´ on de ondas ordinaria donde la velocidad de la onda es la velocidad de fase u, y adem´as exigi´o que debe ser consistente con los resultados ya conocidos referentes al l´ımite asint´ otico de ondas cortas caracterizado por la ecuaci´ on (13.89). Esto es: ∇2 ψ −
1 ∂2ψ =0 u2 ∂t2
(13.90)
Como para el l´ımite de ondas cortas u est´ a dada por (13.76), para ese caso (13.90) toma la forma: 2m(E − V ) ∂ 2 ψ = ∇2 ψ E2 ∂t2
(13.91)
La funci´ on de onda de un fen´omeno estacionario es de la forma: Ψ(~r, t) = ψ(~r)e−iEt/¯h
(13.92)
por lo cual ψ debe obedecer la ecuaci´ on: −
¯2 2 h ∇ ψ(~r) + V (~r)ψ(~r) = Eψ(~r) 2m
(13.93)
que es la ecuaci´ on de Schr¨odinger independiente del tiempo. El comportamiento ondulatorio aparece s´olo al hacer la identificaci´on (13.88), o sea que est´ a ligado directamente al hecho de no ser cero la constante de Planck (ϕ no es infinita ni λ es cero). Esto de alguna manera ha de estar relacionado con el hecho de no poderse medir las variables de acci´on I con precisi´ on ∆I = 0, del cual surge la mec´anica cu´antica de Heisenberg. Si en (13.93) reemplazamos a ψ por: ψ(~r) = eiΣ(~r,E)/¯h A(~r)
(13.94)
Corespondencia con la mec´anica cu´antica de Schr¨odinger / 585 obtenemos una ecuaci´ on diferencial para Σ que en el l´ımite ¯h → 0 es precisamente la ecuaci´ on de Hamilton-Jacobi. Adem´as Schr¨odinger postul´ o que |ψ|2 es la densidad de probabilidad en el espacio de configuraci´on. Para un estado estacionario se debe cumplir: Q(~r) = |ψ(~r)|2
(13.95)
Resulta de (13.94) y (13.95) que para el l´ımite asint´ otico de ondas cortas: Q(~r) = A(~r)2
(13.96)
Por tanto el l´ımite cl´ asico de la funci´ on de onda puede expresarse en t´erminos de las funciones cl´ asicas Q(~r), (13.69), y Σ: ψ(~r, t) = [Q(~r)]1/2 eiΣ(~r,E)/¯h−iEt/¯h o, en t´erminos de Σ: 1/2 ∂2Σ ∂2Σ ∂2Σ ψ(r, t) = ǫλσρ eiΣ(~r,E)/¯h−iEt/¯h ∂x∂Iλ ∂y∂Iσ ∂z∂Iρ J.H. van Vleck (1928) mostr´o que: 1/2 ∂ 2 S hq|ψi = C det eiS/¯h ∂q∂p
(13.97)
(13.98)
(13.99)
obedece a la ecuaci´ on de Schr¨odinger si ¯h → 0. N´ otese la similitud entre (13.98) y la ecuaci´ on de van Vleck.6
13.4.
La funci´ on de onda semicl´ asica seg´ un Keller y Maslov
Para un sistema acotado los valores de las variables de acci´on, y por tanto de la energ´ıa y otras constantes de movimiento, est´ an cuantizados. En la secci´ on 12.1, se se˜ nal´ o que las variables de acci´on satisfacen las condiciones Iν = αν ¯h, donde las αν son enteras. Al imponer ciertas condiciones sobre las frecuencias vimos en el ejemplo 12.3.1 que para un oscilador arm´onico la acci´on est´ a cuantizada seg´ un I = (k + 1/2)¯h, siendo k un entero. Veremos ahora c´ omo tales reglas de cuantizaci´on se pueden obtener a partir de la funci´ on de onda semicl´ asica. Bohr y Sommerfeld postularon las reglas de cuantizaci´on para un sistema separable en la forma Iν = αν ¯ h. Einstein en 1917 las generaliz´o para sistemas no separables pero integrables, para los cuales existe un conjunto de variables de acci´on definidas por los contornos cerrados independientes que haya sobre un toroide invariante, en la forma: I 1 Iν = p~ · d~q = αν ¯ h (13.100) 2π γν 6 M.C.
Gutzwiller, Chaos in classical and quantum mechanics, Springer, New York, 1990 deduce la f´ ormula de van Vleck a partir de una aproximaci´ on de fase estacionaria al propagador de Feynman.
586 / Mec´ anica cl´ asica avanzada donde los γν son los diferentes contornos. Brillouin en 1926 esboz´o una teor´ıa de las funciones de onda semicl´ asicas que conduce a reglas de cuantizaci´on como la del oscilador arm´onico, I = (k + 1/2)¯h, basada en consideraciones sobre los puntos de retorno del movimiento cl´ asico. Keller en 1958 y Maslov en 1972 elaboraron una teor´ıa completa acerca de las funciones de onda semicl´ asicas y las reglas de cuantizaci´on que generaliza los trabajos de Bohr, Sommerfeld, Einstein y Brillouin. En la actualidad muchos problemas espec´ıficos en f´ısica at´omica y molecular son adecuadamente estudiados mediante estas teor´ıas semicl´ asicas, denominadas gen´ericamente “la aproximaci´on W.K.B”. Acci´ on de Lagrange con dos puntos de retorno. Consideremos una part´ıcula en movimiento unidimensional acotado con dos puntos de retorno. La trayectoria de fases es cerrada y el toroide invariante es una circunferencia. La figura 13.5 muestra una trayectoria t´ıpica. La soluci´on a la ecuaci´ on de HamiltonJacobi para este problema es: Z Σ(x) = ± [2m(E − V )]1/2 dx (13.101) p p2
x x1
x2
p1
Figura 13.5 Trayectoria de fases cerrada En la trayectoria hay dos puntos en los cuales p se anula y cambia de signo que son x1 y x2 . Tanto p como Σ son funciones bivaluadas de x. Los dos valores de p o Σ para cada valor de x est´ an sobre diferentes “hojas”, an´alogas a las hojas de Riemann de la teor´ıa de las funciones de variable compleja, definidas por la l´ınea de ramificaci´ on x1 x2 . Para p las dos hojas son x1 p2 x2 y x1 p1 x2 . En x1 y x2 , p es singular por ser dp/dx infinita. Similarmente, en la representaci´on de momentos p1 p2 definen una l´ınea de ramificaci´ on que separa el plano xp en las hojas p1 x1 p2 y p1 x2 p2 . La correspondiente acci´on reducida es Σ(p), conectada con Σ(x) mediante la f´ormula (9.217): Σ(p) = Σ(x) − xp
(13.102)
Corespondencia con la mec´anica cu´antica de Schr¨odinger / 587 Para un valor dado de E, Σ(x) define parte de la trayectoria de fases, formada por los puntos (x, dΣ/dx). Pero Σ puede usarse s´olo para la trayectoria sobre una hoja, ya que la ecuaci´ on de Hamilton-Jacobi no determina a Σ en x1 y x2 . Para pasar a la otra hoja es necesario continuar la funci´ on. En efecto, Σ(p) est´ a bien definida en los puntos x1 y x2 sobre dos hojas, p1 x1 p2 y p1 x2 p2 . Esto permite la extensi´ on anal´ıtica de Σ(x) de una hoja a la otra usando la ecuaci´ on (13.102). La continuaci´on a lo largo de la trayectoria puede lograrse, pues, por transformaciones sucesivas entre las representaciones x y p. Podemos definir las funciones multivaluadas Σ y Σ en t´erminos de funciones univaluadas as´ı: Σ1 (x) en x1 p2 x2 Σ(x) = Σ2 (x) en x1 p1 x2 (13.103) Σ1 (p) en p1 x1 p2 Σ(p) = Σ2 (p) en p1 x2 p2
La variable de acci´on es un n´ umero cuya magnitud es igual al cambio experimentado por Σ al completar un circuito, dividido por 2π (secci´on 10.3): I=
1 [Σ2 (x2 ) − Σ1 (x2 )] 2π
(13.104)
Efecto de la multiformidad de Σ sobre la funci´ on de onda semicl´ asica. Podemos concluir de (13.69) que Q no es univaluada por no serlo Σ. Entonces se deduce de (13.97) que la funci´ on de onda semicl´ asica resulta ser multivaluada a no ser que se imponga una condici´on adicional. Escribamos a ψ en la forma: Σ Et 1 ψ = exp i − − i ln Q (13.105) h ¯ h ¯ 2 Al hacer un circuito completo sobre la trayectoria de fases la funci´on de onda debe tomar el mismo valor. Esto se consigue solamente haciendo que el cambio del argumento del exponencial en (13.105) al completar un circuito sea un m´ ultiplo entero de 2πi, o sea: i ∆Σ − ∆ ln Q = 2πn h ¯ 2
(13.106)
donde n es un n´ umero entero. Esto da lugar a la siguiente expresi´on para la cuantizaci´on de I = ∆Σ/2π: i I =h ¯ n+ ∆ ln Q (13.107) 4π Para el caso descrito por (13.101), sobre las dos ramas Q difiere s´olo en el signo [v´ease por ejemplo la expresi´on (13.81)].
588 / Mec´ anica cl´ asica avanzada Las funciones univaluadas Σ1 y Σ2 , definidas en (13.103), permiten encontrar las funciones univaluadas correspondientes Q1 y Q2 . En efecto: m 1/2 1 2πQ1,2 = ±ω (13.108) 2 [E − V (x)]1/2
implica que:
ln Q2 (x2 ) − ln Q1 (x2 ) = ln Q2 (x1 ) − ln Q1 (x1 ) = −πi
(13.109)
El cambio completo en ln Q, partiendo de un punto sobre la rama superior pr´oximo a x2 y regresando al mismo punto luego de pasar por dos discontinuidades es: ∆ ln Q = −2πi
(13.110)
En consecuencia, (13.109) es: 1 I =h ¯ n+ 2
(13.111)
En conclusi´ on, las condiciones de cuantizaci´on correctas se obtienen al definir la funci´ on de onda semicl´ asica en t´erminos de la funci´ on Q no tomada como intr´ınsecamente positiva. La funci´ on ´ındice de Maslov. La funci´ on “signo” aplicada a la derivada dp/dx es u ´til para contabilizar el n´ umero de singularidades de las funciones Σ(x) y Σ(p) al pasar de una hoja a la otra. Se define como: dp +1 si >0 dx dp = SGN (13.112) dx dp −1 si <0 dx
para todos los valores de dp/dx 6= 0. Maslov define la funci´ on “´ındice” para asociar un n´ umero entero a todos los puntos colocados sobre la misma hoja, as´ı: σ(x) = N´ umero entero sobre cada hoja
x1 p2 x2 − x1 p1 x2
σ(p) = N´ umero entero sobre cada hoja
p1 x1 p2 − p1 x2 p2
(13.113)
σ(p) y σ(x) est´ an conectados en cada punto que no sea de retorno en p o en x por la relaci´ on: dp (13.114) σ(p) = σ(x) + SGN dx Si se toma en un punto x0 a Σ(x0 ) = 0, entonces se define el valor inicial de σ(x) por la condici´on σ(x0 ) = 0. Sea x0 = x2 + ǫ, entonces σ(x) = 0 para toda la hoja x1 p2 x2 . Para un punto entre p2 y x1 , SGN(dp/dx) = +1; entonces por (13.114), σ(p) = +1 en toda la hoja p1 x1 p2 . Ahora tomemos un punto entre x1 y p1 ; entonces
Corespondencia con la mec´anica cu´antica de Schr¨odinger / 589 SGN(dp/dx) = +1, y por (13.114), σ(x) = 2 en la hoja x1 p1 x2 . Para un punto entre p1 y x2 , SGN(dp/dx) = +1; entonces por (13.114), σ(p) = 3 para toda la hoja p1 x1 p2 . Finalmente, sea el punto de partida x0 , donde SGN(dp/dx) = +1; entonces por (13.114) se cumple que σ(x) = 4. Concluimos que σ(x) es una funci´ on multivaluada entera que se incrementa en 4 al completar un circuito. Denotemos por la letra m el cambio en σ(x) al completar un circuito dividido por dos: m=
∆σ 2
(13.115)
Para el caso que estamos considerando, m = 2 que coincide con el n´ umero de singularidades en Σ al completar un circuito. Ver el comentario que sigue a la ecuaci´ on (13.52). Maslov generaliza el resultado (13.110) en la forma: ∆ ln Q = −imπ
(13.116)
para un sistema con un n´ umero cualquiera de puntos de retorno en x y en p. La funci´ on ´ındice permite incluir en la fase de la funci´ on de onda semicl´ asica los efectos provenientes de la no uniformidad de Q, en la forma: ψ(~r) = |Q(~r)|1/2 eiΣ(~r,E)/¯h−iπσ(~r)/4
(13.117)
con esto se est´ a diciendo que la fase es fija sobre cada hoja. Las condiciones de cuantizaci´on resultan de exigir que ψ sea univaluada. As´ı, para el caso ilustrado en la figura 13.5, ψ1 (x2 ) = ψ2 (x2 )
(13.118)
Esto exige que, al completar un circuito: ∆Σ π ∆σ − = 2πn h ¯ 4 Por tanto: m I = n+ ¯ h 4
(13.119)
(13.120)
Para el movimiento de un electr´on en el ´atomo de hidr´ogeno, las coordenadas esf´ericas r, θ y las parab´olicas ξ, η son del tipo considerado en la figura 13.5, siendo entonces m = 2. Esto justifica las f´ ormulas de cuantizaci´on semicl´ asica dadas en el ejemplo 10.5.2. La coordenada ϕ se comporta de manera diferente por estar asociada a una rotaci´on, o sea que la trayectoria de fases no tiene puntos de retorno ni en ϕ ni en pϕ (la proyecci´on de la trayectoria de fases sobre el plano pϕ − ϕ es una l´ınea recta). En consecuencia ∆σ = 0 para el grado de libertad ϕ. F´ ormulas de conexi´ on de W.K.B. Para una dimensi´ on la funci´ on de onda de W.K.B., seg´ un se sigue de (13.117) y (13.108) es: 1/2 mω eiΣ(~r,E)/¯h−iEt/¯h−iπσ(~r)/4 (13.121) ψ(~r, t) = π|p|
590 / Mec´ anica cl´ asica avanzada A pesar de ser construida a partir de las cantidades cl´asicas Q, Σ y σ, esta funci´ on es v´alida para valores de x entre x = −∞ y x = +∞ diferentes a los puntos de retorno. Fuera de los puntos de retorno Σ es imaginaria, lo cual nos permite afirmar que en general: |ψ(r, t)|2 =
mω −2ImΣ(~r,E)/¯h e π|p|
(13.122)
y la probabilidad resulta exponencialmente amortiguada en las regiones donde ImΣ > 0 y tiende a cero cuando ¯h → 0, en correspondencia con el hecho de ser tales regiones cl´ asicamente prohibidas. La cola exponencial que exhibe ψ corresponde al efecto “t´ unel” de la mec´anica cu´antica. Las f´ ormulas de conexi´on permiten pasar a trav´es de los puntos de retorno, para obtener una funci´ on definida entre x = −∞ y x = +∞ (excluyendo a x = x1 y x = x2 y los alrededores de los mismos donde los efectos cu´anticos no permiten la aproximaci´on semicl´ asica). En la regi´ on cl´ asicamente inaccesible p y Σ son imaginarios puros, con signos +i o −i dependiendo de la hoja. Cuando el signo es −i resulta que |ψ|2 no se amortigua sino que crece exponencialmente en la regi´on cl´asicamente prohibida, lo cual no es aceptable. Por tanto a la regi´ on cl´asicamente prohibida s´olo puede pasarse desde la hoja con p > 0. Llamemos 3 a la regi´on −∞ < x < x1 y 4 a la regi´on x2 < x < +∞. Para llegar a la regi´ on 4 la part´ıcula necesariamente provino de la regi´on 1 (p > 0), o sea que no realiz´ o cambio de hoja; entonces, estando en la misma hoja, σ4 = σ1 = 0. Para llegar a la regi´ on 3, la part´ıcula necesariamente provino de la regi´on 2 (p < 0), o sea que debi´ o cambiar de hoja a fin de que ImΣ > 0. Como en cada cambio de hoja σ cambia en 2, se sigue que σ2 = 2 y σ3 = 0. En resumen, σ1 = 0, σ2 = 2, σ3 = 0, σ4 = 0. Por tanto: mω 2π|p|
1/2
Z exp i
mω ψ2 (x) = 2π|p|
1/2
exp −i
mω 2π|p|
1/2
Z exp −
mω ψ4 (x) = 2π|p|
1/2
Z exp −
ψ1 (x) =
ψ3 (x) =
x0
[2m(E − V )]1/2 dx ¯h
x2
Z
x0 x2
x1
x x
x2
[2m(E − V )]1/2 dx π −i ¯h 2
[2m(V − E)]1/2 dx ¯h
[2m(V − E)]1/2 dx ¯h
(13.123)
(13.124)
(13.125)
(13.126)
√ Se han introducido los factores 1/ 2 pues al ampliar el rango de x desde −∞ hasta +∞ se cambia la normalizaci´ on. Cuando la funci´ on de onda en un intervalo dado es multiforme, debe tomarse la suma aritm´etica de las funciones de onda asociadas a las diferentes hojas. En el presente caso, la regi´ on x1 < x < x2 tiene dos hojas y la funci´ on correcta es ψ1 + ψ2 . Si
Corespondencia con la mec´anica cu´antica de Schr¨odinger / 591 multiplicamos las cuatro funciones (13.123) a (13.126) por eiπ/4 , las fases relativas no cambian. Entonces: 1/2 Z x mω [2m(E −V )]1/2 dx π ; x1 < x < x2 cos + π|p| ¯h 4 x2 1/2 Z x1 mω [2m(V −E)]1/2 dx iπ (13.127) ψ(x) = ; −∞ < x < x1 exp − + 2π|p| ¯h 4 x 1/2 Z x [2m(V −E)]1/2 dx iπ mω ; x2 < x < ∞ exp − + 2π|p| ¯h 4 x2 este es el resultado usual de la aproximaci´on W.K.B.
592 / Mec´ anica cl´ asica avanzada
Bibliograf´ıa Textos generales de mec´ anica cl´ asica
1. Arnold V. I. M´ethodes math´ematiques de la m´ecanique classique. Editions Mir, Moscou, 1976. 2. Corben H. C. y Stehle P. Classical mechanics. 2nd ed. J. Wiley, New York, 1960. 3. Gantmacher F. Lectures in analytical mechanics. Mir publishers, Moscow, 1970. 4. Goldstein H. Mec´ anica cl´ asica. Aguilar, Madrid, 1963. 5. Goldstein H. Classical mechanics. 2nd ed. Addison Wesley, Reading, 1980. 6. Hauser W. Introducci´ on a los principios de la mec´ anica. Uthea, M´exico, 1969. 7. Landau L. y Lifshitz E. M. Mec´ anica. Revert´e, Barcelona, 1965. 8. Marion J. Classical dynamics of particles and systems. Academic Press, New York, 1970. 9. Pars, L.A. A treatise on analytical dynamics. John Wiley, New York, 1968. 10. Scheck F. Mechanics: from Newton’s laws to deterministics chaos. Springer, Berlin, 1995. 11. Ter Haar D. Elements of hamiltonian mechanics. North-Holland, Amsterdam, 1965. 12. Whittaker E. T. A treatise on the analytical dynamics of particles and rigid bodies. 4th ed. Cambridge University. Press, Cambridge, 1960.
593
594 / Mec´ anica cl´ asica avanzada Colecciones de problemas
13. Kotkin G. L. y Serbo V. G. Problemas de mec´ anica cl´ asica. Editorial Mir, Mosc´ u, 1980. 14. Spiegel M. R. Teor´ıa y problemas de mec´ anica te´ orica. McGraw-Hill, M´exico, 1976.
Textos especializados de mec´ anica cl´ asica
15. Abraham R. y Marsden J. E. Foundations of mechanics. Benjamin, New York, 1967. 16. Born M. The mechanics of the atom. 2nd printing. Ungar, New York, 1967. 17. Lichtenberg A. J. y Lieberman M. A. Regular and stochastic motion. Springer-Verlag, New York, 1983. 18. Percival I. and Richards D. Introduction to dynamics. Cambridge University Press, Cambridge, 1982. 19. Thirring W. Classical dynamical systems. Springer-Verlag, New York, 1978. 20. Yourgrau W. y Mandelstam S. Variational principles in dynamics and quantum theory. 3d ed. Saunders, Philadelphia, 1968.
Textos de matem´ aticas
21. Abramowitz M. y Stegun I. A. Handbook of mathematical functions. Dover, New York, 1965. 22. Ahlfors L. V. An´ alisis de variable compleja. Aguilar, Madrid, 1966. 23. Arnold V. I. Equazioni differenziali ordinarie. Edizioni Mir, Mosca, 1979. 24. Arnold V. I. Geometrical methods in the theory of ordinary differential equations. Springer-Verlag, New York, 1983. 25. Elsgoltz L. Ecuaciones diferenciales y c´ alculo variacional. Editorial Mir, Mosc´ u,
Bibliograf´ıa / 595 1969. 26. Korn G. A. y Korn T. M. Mathematical handbook for scientists and engineers. McGraw-Hill, New York, 1961. 27. Spiegel M. R. Manual de f´ ormulas y tablas matem´ aticas. McGraw-Hill, M´exico, 1970. 28. Whittaker E. T. y Watson G. N. A course of modern analysis. 4th ed. Cambridge University Press, Cambridge, 1927.
Textos de otras ´ areas
29. Galindo A. y Pascual P. Mec´ anica cu´ antica. Alhambra, Madrid, 1978. 30. Gutzwiller M.C. Chaos in classical and quantum mechanics. Springer, New York, 1990. 31. Landau L. D. y Lifshitz E. Th´eorie du champ. Editions Mir, Moscou, 1966. 32. Landau L. D. y Lifshitz E. M´ecanique cuantique: th´eorie non relativiste. Editions Mir, Moscou, 1967. 33. Van der Waerden B. L. (ed). Sources of quantum mechanics. Dover, New York, 1968.
Monograf´ıas especializadas
34. Augustin S. D. y Rabitz H. “Action-angle variables in quantum mechanics”. Journal of chemical physics, vol. 71, No 12, p 4956, 1979. 35. Chirikov B. V. “A universal instability of many-dimensional oscillator systems”. Physics reports, vol. 52, No 5, p 263, 1979. 36. Keller J. B. “Corrected Bohr-Sommerfeld quantum conditions for nonseparable systems”. Annals of physics, vol. 4, p 180, 1958. 37. Percival I. C. “Semiclassical theory of bound states”. Advances in chemical physics. vol. 36, p 61, 1977.
596 / Mec´ anica cl´ asica avanzada
597
´Indice alfab´ etico Fermi, de, 543 Moser, de, 429 Poincar´e, de, 427 separatriz, 526, 542 Aproximaci´on cl´asica, 475, 583, 590 WKB, de, 589, 591 Areolar, velocidad, 130 Arnold, V., 422, 529, 538 integral de, 528 teorema de, 522, 531 Astronom´ıa, 149 August´ın, S.D., 551 Aut´onomo, hamiltoniano, 525 Autoadjunta, matriz, 551
Abramowitz, 282, 294, 298 Absidales, distancias, 132, 140 Acci´on(es) adiab´aticos, invariantes, 415 discontinuidad en la,, 430, 588 Hamilton, de,, 328 Lagrange, de, 328 perturbaciones adiab´aticas , 505 principal, 330 reducida, 330 variables de, 429 Adiab´aticas, perturbaciones,, 504 Adiab´aticos, invariantes,, 415, 430 Ahlfors, L. V., 241 ´ Algebra de Lie grupo de rotaciones, del, 244, 395, 461 y corchetes de Poisson, 397 Angulares, variables degeneradas, 488 lentas, 500, 505, 513 oscilador arm´onico, en el, 438 problema de Kepler, en el, 445, 462 r´apidas, 500, 504, 513 y de acci´on, 429 ´ Angulo(s) orbita Kepleriana, en una, 457 ´ como coordenadas generalizadas, 222 condiciones sobre los, 226 dispersi´ on, de, 159, 162 Euler, de, 222 rotaci´on, de, 227, 245 Antisim´etrica matriz, 249 Aplicaci´on “twist”, 429, 523, 524 est´ andar, 544
Barrera centr´ıfuga, 131, 135 Bernoulli, regla de oro, 19, 35 Bifurcaci´on de las superficies, 538 Bohr, ´atomo de, 144, 155 Born, M., 153, 470, 473, 479 Boyle, ley de, 81 Brillouin aproximaci´on de, 589, 591 reglas de cuantizaci´on, 586 Br´ ujula de Foucault, 314 C´alculo de variaciones, 59 Cambio de la forma funcional, 379 Campo electromagn´etico, 65 Can´onicas, transformaciones, 104, 107, 319, 343, 400 dependientes del tiempo, 105 ejemplos de, 110, 347, 358 grupo de, 355 infinitesimales, 374 libres, 109, 346 598
´Indice alfab´etico / 599 oscilador arm´onico, del, 104 Ca´ oticos, movimientos regulares, 522 Caratheodory, lema de, 362 Cascar´ on esf´erico, 21 C´austicas, superficies, 444, 576 Cayley-Klein, par´ ametros de, 236 para el trompo, 301 Centr´ıfuga, aceleraci´ on, 94 Centr´ıfugo, potencial, 131 Centro fuerzas, de, 125 masas, de, 125, 161 Chirikov, B. V., 529, 543, 547 criterio de, 543 Clase integral el´ıptica de primera, 284 transformaci´ on can´ onica libre de primera, 109, 348 Completidad, relaci´ on de, 215 Condiciones ligadura, de, 9 ortogonalidad, de, 174, 180, 208 C´onicas, secciones, 140 Conjunto coordenadas generalizadas, de, 13 variables de acci´on-´ angulo, de, 434 Conmutador, 397, 555 Conservaci´ on, teoremas de, 68, 380 Constante(s) e integrabilidad de las ecuaciones de movimiento, 421 generadores de transformaciones can´onicas como, 381 integraci´ on, de, 70 movimiento, de, 70, 421, 437 Planck, de, 123, 414, 584 propiedades de simetr´ıa, y, 381 Construcci´on de Pionsot, 277 Contacto, transformaci´ on de, 569 Coordenadas c´ıclicas, 76 esf´ericas, 129, 445 generalizadas, 12 independientes, 46 parab´olicas, 443, 462 Corben, H., 201, 273
Corchetes Lagrange, de, 402, 409 Poisson, de, 378, 380, 555 Coriolis, fuerza de, 94, 252 Cosenos directores, 210, 568 Covarianza de las ecuaciones de Hamilton, 103 de las ecuaciones de Lagrange, 42 Cuerda masas discretas, con, 195 oscilaciones de la, 202 uniforme, 202 Cuerpo r´ıgido, 205 asim´etrico, 287 din´amica del, 253 libre, 277 momento angular del, 256 sim´etrico con un punto fijo, 295 sistema de coordenadas del, 206 Curvas de fase, 100, 121, 323, 423 D’Alambert, principio de, 35 Degeneraci´ on accidental, 504, 515 figura de Lissajous, en una, 443 frecuencias, en las, 181 intr´ınseca, 516 para el problema de Kepler, 492 isoenerg´etica, 530 movimiento bajo fuerzas centrales, en el, 445 oscilador isotr´opico, en el, 442 Delaunay, elementos de, 457 Densidad funci´ on de, 573, 576, 585 probabilidad, de, 573, 576, 585 Derivada parcial, 41, 94 total respecto al tiempo, 67, 73, 95 Desplazamiento virtual, 16, 18 Determinante jacobiano, 350, 404, 523 matriz de rotaci´on, de la, 216, 220 secular, 171, 186 Di´ adicos Pauli, de, 232
600 / Mec´ anica cl´ asica avanzada traza cero, de, 232 Diada, 212 Diagonalizaci´ on frecuencias propias y modos con el m´etodo de, 191 matrices de masa y de constantes de resorte, de las, 191 matriz de rotaci´on, de la, 225 matriz de una perturbaci´on, de la, 497 tensor de inercia, del, 260 Din´ amica hamiltoniana, 88 ecuaci´ on general de la, 35, 55 lagrangiana, 42 variable, 69, 378 Dipolar radiaci´ on, 451, 459 reglas de selecci´ on para radiaci´ on, 475 Dispersi´ on bajo fuerzas centrales, 156 Ecuaci´ on(es) Hamilton-Jacobi, de, 107, 112, 364, 368, 371, 435, 445 can´ onicas, 88 continuidad, de, 573 din´ amica en coordenadas generalizadas, de la, 40 est´ atica en coordenadas generalizadas, de la, 28 estado de un gas real, de, 82 Euler en un sistema de referencia rotante, de, 271 Euler, de, 270, 281, 287 Euler-Lagrange, de, 97 general de la din´ amica, 35 general de la est´ atica, 19 Kepler, de, 148, 449 ligadura, de, 9 movimiento, de, 6, 38, 42, 88 Newton, de, 5 onda, de, 204, 584 secular, 171, 186, 262, 496 transformaci´ on can´onica, de una, 363 valores propios, de, 179
Whitaker, de, 325 Efecto Stark cuadr´atico, 500 lineal, 498 Einstein, reglas de cuantizaci´on, 585 Eje(s) instant´ aneo de rotaci´on, 279 principales, 261 rotaci´on, de, 244 simetr´ıa, de, 79 Elementos de matriz, 223 Elipsoide de inercia, 264, 277 Energ´ıa cin´etica, 42, 72, 255 conservaci´ on de la, 70, 89 funci´ on de Jacobi, 71, 74 potencial, 42, 296 total, 73 Ensamble, 18 Equilibrio est´ atico, 19 estable, 30 Espacio configuraci´on, de, 14 fases, de, 98, 104 momentos, de, 98 no euclidiano, 29, 179 Est´ atica coordenadas generalizadas, con, 29 ecuaci´ on general de la, 19 Estabilidad de los puntos fijos, 541 Estado de un sistema mec´anico, 3 Euler ´angulos de, 222, 226, 247 ecuaciones, 270, 287 par´ ametros de, 229 teorema sobre desplazamiento de un cuerpo r´ıgido, 217 funciones homog´eneas, 71 Evoluci´ on temporal, transformaci´ on can´onica de, 113, 374 Extremal, 59 Fase, 572 Fermat, principio de, 330, 567
´Indice alfab´etico / 601 Fermi, aplicaci´on de, 543 Figuras de Lissajous, 132 Fijos, puntos el´ıpticos e hiperb´ olicos, 516 Fourier, expansi´ on de, 149, 437, 450, 470, 497, 550 Frecuencias degeneradas, 186, 491, 493 lentas, 505 multiplemente peri´odicas, 436 nulas, 171 r´apidas, 505 resonantes, 513 Frente ondas, de, 572, 580 superficies de acci´on constante, de, 580 Fuerza(s) aplicada, 19 centrales, 125 disipaci´on de Rayleigh, de, 66 disipativa(s), 66, 67 electromagn´eticas, 65 generalizada, 29 inercial de D’Alambert, 35 ligadura, de, 17 no centrales, 132 Funci´ on(es) Hamilton principal, de, 366, 367 Hamilton, principal, de, 580 hamiltoniana, 86 hamiltoniana caracter´ıstica, 568 distribuci´ on, de, 117, 573, 576, 585 el´ıpticas de Jacobi, 282, 288 generatriz, 343, 362 transformaci´ on can´ onica, de una, 108 transformaci´ on de Legendre, de una, 86 lagrangiana, 42 onda, de, 583 theta, 286 Gantmacher, F., 30, 167, 250, 336, 415 Generador infinitesimal, 243 General, ecuaci´ on din´ amica, de la, 35
est´ atica, de la, 19 Generatriz funci´ on de una transformaci´ on can´onica, 343 transformaci´ on can´onica, de una, 108 transformaci´ on de Legendre, de una, 86 Goldstein, H, 66, 167, 259 Grados de libertad cuerpo r´ıgido, de un, 205 sistema din´amico, de un, 12 vibracionales, 182 Grupo SU (2), 236 puntual, 264 rotaciones, de, 221, 230 simplicial, 403 transformaciones can´onicas, de, 355 Hamilton ´optica geom´etrica, 567 ecuaciones, 88 funci´ on de, 568, 580 principio de, 58, 100, 329 Hamilton-Jacobi diagonalizaci´on de la matriz Hamiltoniana, y, 561 ecuaci´ on de la eiconal, y, 572 ecuaci´ on dependiente del tiempo, 366 ecuaci´ on independiente del tiempo, 371 fuerzas centrales, para, 438 mec´anica cu´antica, y, 580 perturbaciones degeneradas, y, 495 variables de acci´on-´ angulo, con, 435 Hamiltoniano constante de movimiento, como, 89 corchetes de Poisson, y, 380 generador infinitesimal, como, 376 momento can´onico, como, 393 transformaciones can´onicas infinitesimales, y, 374 variable din´amica, como, 378 Hauser, W., 167 Heisenberg, W., 549, 558 desigualdad de, 123
602 / Mec´ anica cl´ asica avanzada mec´anica cu´antica de, 397 Heterocl´ınicos, 538 Hidr´ogeno, ´ atomo de, 577 Homoc´ıclicos, puntos, 538 Huygens, principio de, 568 Identidad de Jacobi, 384 Impacto, par´ ametro, 157 Indicatriz, funci´ on, 573 ´Indice funci´ on de Maslov, 588 refracci´ on, de, 567 Integral(es) acci´on, de, 58, 321, 329 Arnold-Melnikov, de, 528 el´ıptica, 284, 433 movimiento, de, 421 Poincar´e-Cart´ an, de, 323 polos, por, 439 primeras, 421 Intr´ınseca, degeneraci´ on, 516 Invariantes adiab´aticos, 415, 430 integrales de Poincar´e, 333, 336 -Cart´ an, 323, 334 Inversiones, 220 Involuci´ on aplicaci´on, 524 variables din´ amicas en, 422 Irregular(es), movimiento(s), 522, 543 Islas resonancia, en una, 518, 522 resonancias de orden superior, en, 518, 541 Jacobi, identidad de, 384 Jacobiano, determinante, 350, 404, 523, 575, 576 KAM superficie, 537, 540 teorema de, 522, 531 Keller, reglas de cuantizaci´on, 585 Kepler ecuaci´ on de, 147, 449 leyes de, 130, 145
problema de, 445, 462 variables de acci´on-´ angulo, 445 esf´ericas, 492 parab´olicas, 462, 492 Klein, par´ ametros de Cayley y, 236, 301 Kolmogorov, teorema de, 522, 531 Kovalevski, trompo de, 270 Laboratorio, coordenadas de, 161 Lagrange acci´on de, 328 corchetes de, 402 multiplicadores de, 21, 38, 62 Lagrangiana formulaci´ on, 44 funci´ on, 42 singularidad, 576 Landau, L. D., 463, 551, 565, 577 Legendre, transformaci´ on de, 86, 355 Lema de Caratheodory, 362 Lentidud normal de un frente de onda, 573 Li Hua Chung, teorema de, 332, 337 Libraci´ on, 433 Libres, transformaciones can´onicas, 110, 346 Lichtenberg, A, 544 Lie, ´algebra de, 244, 395, 461 Lieberman, M. A., 544 Lifshitz, E., 463, 551, 565, 577 Ligadura(s) holon´omicas, 10 cuerpo r´ıgido, de, 205 escler´onomas, 10 fuerza(s) de, 11, 17, 21 ideales, 18 no hol´ onomas, 10 no integrables, 10 re´onomas, 10 trabajo virtual de las fuerzas de, 18 L´ınea de nodos, 223 Lineal estabilidad, 541 mol´ecula, 182 momento, 76 transformaci´ on, 175
´Indice alfab´etico / 603 Linealizado, movimiento, 542 L´ıneas caracter´ısticas, tubo de, 323 Liouville ecuaci´ on de, 573 teorema sobre la funci´ on de distribuci´ on, 114, 406 Teorema sobre sistemas integrables, 422 Lissajous, figuras de, 132 Longitud ´ optica de un camino, 568, 571 Magn´etico campo, 73 n´ umero cu´antico, 475 Marion, J., 148, 165, 167 Masa centro de, 125 matriz de, 169, 184 reducida, 126 Maslov ´ındice de, 588 funci´ on de, 588 Matriz(ces) Hamiltoniana cl´ asica, 561 constantes de resorte, de, 168 derivadas de las funciones de ligadura, 23 masa, de, 169, 184 mec´anica cl´ asica con, 550 Pauli, de, 232 rotaci´on, de, 33, 207, 210, 224, 229, 236 simplicial, 403, 405 transformaci´ on, de, 497 Maupertuis, principio de minima acci´on de, 331 Mec´anica cu´antica, 580 estad´ıstica, 114 Schr¨odinger, 580, 585 Media espacial, 575 Melnikov, integral de, 528 Mersenne, f´ ormula de, 202 M´etodo perturbaciones, de, 479 variacional, 152
Modos normales de oscilaci´on, 167, 181 Mol´ecula de CO2 , 181 Momento angular, 78, 256 espacio de, 98 inercia, de, 256 lineal, 77 Momentos generalizados, 85 representaci´on de, 91 Moser, teorema de, 522, 531 Movimiento acotado, 80, 432 bajo fuerzas centrales, 125 ca´otico singular, 522 multiplemente peri´odico, 436 no acotado, 432 planetario, 130 regular, 522 separatriz, 432 N´ umero cu´antico, 139, 144, 461, 475, 585, 587 grados de libertad, de, 10 puntos de retorno, de, 589 Nutaci´ on, 303 O(4), 461 O(6), 461 Onda ecuaci´ on de, 584 frente(s) de, 572, 580 funci´ on de, 583 longitud de, 572, 583 materia, de, 580 plana, 572 Operador, 397 ´ Optica geom´etrica, 330, 567 ´ Orbita(s) cerrada, 132 circulares, 139, 144 ecuaci´ on diferencial de las, 131 espacio de fase, en el, 100 precesi´ on de las, 132, 133 Ortogonal(es)
604 / Mec´ anica cl´ asica avanzada matriz, 208, 222 transformaciones, 208 Ortogonalidad condiciones de, 208 vectores propios, de, 180, 261 Ortonormales, vectores propios, 180 Oscilaciones longitudinales y transversales, 182, 189 Oscilador(es) acoplados, 508 arm´onico, 61, 101, 104, 106, 136, 368, 559, 581 bidimensional, 423, 438 no lineales, 508, 511, 517 perturbado, 486, 506 Par´ ametro de impacto, 157 Part´ıcula de masa reducida, 126 Pauli di´adicos de, 232 matrices de, 232 P´endulo de Foucault, 311 simple, 419, 431 Peque˜ nas oscilaciones cuerda, de una, 195 modos normales de, 167 mol´ecula triat´ omica lineal, de, 167 sistemas de varios grados de libertad, 167 Per´ıodo(s) orbitas el´ıpticas, de, 146 ´ funciones el´ıpticas, de, 282 p´endulo, del, 432 puntos fijos de una aplicaci´on, de, 542 Percival, I. C., 476 Perihelio, 499 Pionsot, representaci´on de, 280 Planck, constante de, 414, 584 Plano invariante, 279 Plodia, 279 Poincar´e integral de, 333, 336 superficie de secci´ on, 427 teor´ıa de perturbaciones, 482
Poinsot, construcci´ on de, 277 Poisson corchetes de, 378, 380, 555 ecuaciones de, 382 Potencial centr´ıfugo, 131 dependiente de la velocidad, 66 energ´ıa, 66 escalar, 65 generalizado, 66 vectorial, 65 Precesi´ on ´orbitas, de las, 132, 149 eje de rotaci´on, del, 302 nutaci´on, con, 303 pseudoregular, 304 r´apida y lenta, 302 trompo, 304 r´apido, de un, 302 Principio Hamilton, de, 97, 100 D’Alambert, de, 35 Fermat, de, 567, 571 m´ınima acci´on, de, 328, 331 trabajos virtuales, de los, 19 Problema Kepler, de, 140, 445, 462 valores y vectores propios, de, 179 variables de acci´on-´ angulo, con, 445, 462, 492 Producto(s) escalar de matrices, 214 masa, de, 256 Propagaci´on ondas, de, 580 superficies de acci´on constante, de, 580 Propiedades de simetr´ıa hamiltoniana y teoremas de conservaci´ on, de la, 381 hamiltoniana, de la, 95 lagrangiana, de la, 67, 68 teoremas de conservaci´ on, y, 68 Punto de retorno, 132, 446, 464 Puntuales, transformaciones, 42, 101, 357
´Indice alfab´etico / 605 Rabitz, H., 551 Raices m´ ultiples diagonalizaci´on del tensor de inercia, en la, 261 ecuaci´ on secular, de la, 182 Rayos, 568 Reglas de cuantizaci´on, 475, 585 Regla de suma, 558 R´ıgido, cuerpo, 205, 253 Rodadura, ligadura de, 8 Rotaciones grupo de, 221 infinitesimales, 241, 376 Rutherford, E., 160 dispersi´ on de, 159 Schr¨odinger ecuaci´ on de, 584 mec´anica cu´antica de, 585 Secci´ on eficaz, 157 diferencial, 158, 165 total, 158 superficie de, 522 Separaci´ on de variables ecuaci´ on de Hamilton-Jacobi, en la, 436 metodo de, 436 Separatriz bifurcaci´ on de, 538 sobreposici´on, 543, 544 Simetr´ıa hamiltoniano, propiedades de, 95, 380 cambio de escala, de, 95 rotaci´on, de, 69, 74 teoremas de conservaci´ on, y, 68, 94, 380 Simplicial grupo, 403 matriz, 403 transformaci´ on, 404 Sistema coordenadas generalizadas, de, 13 ecuaciones de la din´ amica, de, 38 ecuaciones de la est´ atica, de, 20
ejes pricipales, de, 261 integrable, 421 referencia, de, 3, 161, 310 separable, 442 variables de acci´on-´ angulo, de, 429, 434, 488 Smirnov, V. I., 257 Spiegel, M. R., 198, 464, 473 Stark efecto cuadr´atico, 500 efecto lineal, 498 Stegun, I., 282, 294, 298 Stehle, P., 201, 273 SU(2), 461 Superficie(s) acci´on constante, de, 580 c´ austica, 444, 576 KAM rotacional, de, 540 secci´ on de Poincar´e, de, 427, 522 Temporal, evoluci´ on, 113, 374 Tensor inercia, de, 253, 256 m´etrico, 180 Teor´ıa Hamilton-Jacobi, de, 364 can´onica de perturbaciones, 482 cu´antica Heisenberg, de, 397 Schr¨odinger, de, 585 perturbaciones adiab´aticas, 504 degeneradas, 494 dependiente del tiempo, 480 independiente del tiempo, 482 matrices, con, 564 Teorema(s) Huygens, de, 568 conservaci´ on energ´ıa, de la, 70, 95 momento angular, del, 78, 95 momento, del, 76, 95 propiedades de simetr´ıa, y, 68, 94, 380 Euler sobre
606 / Mec´ anica cl´ asica avanzada desplazamiento de un cuerpo r´ıgido, el, 217 funciones homog´eneas, de, 71 Jacobi, de, 366, 389 KAM, 522, 531 Li Hua Chung, de, 332, 337 Liouville, de, 114, 406 Poincar´e-Birkhoff, de, 537 sistemas integrables, sobre los, 422 virial, del, 80 Thomas-Kuhn, regla de suma de, 558 Tiempo condici´on inicial, como, 70 variable din´ amica, como, 390, 392 Toroide(s) invariante, 420, 422, 423, 476 no resonantes, 531 resonantes, 531 Trabajo fuerzas aplicadas, de las, 57 virtual, 19 Transformaci´ on(es) homogr´afica y par´ ametros de CayleyKlein, 240 homot´etica, 573 cambio de escala, de, 96, 107 can´ onica, 107, 319, 343, 400 libre, 109, 346 can´ onicas infinitesimales, 374 contacto, de, 107, 569 coordenadas normales, a, 175 relativas y de centro de masa, a, 125 rotantes, 92 Galileo, de, 68 identidad, 347, 374 Legendre, de, 86, 355 lineal, 360 ortogonales, 208 puntuales, 42, 101, 357 simplicial, 404 unitarias, 562 variables acci´on-´ angulo, a, 429, 435 Trayectoria circuitosa, 55
fases, de, 97 real, 55 variada, 55, 319 Traza matriz aplicaci´on, de una, 542 rotaci´on, de, 220 Trompo dormido, 306 Foucault, de, 314 r´apido, 302 sim´etrico con un punto fijo, 295 Tubo de trayectorias, 323, 434, 575 Unidad di´adico, 214 Universal, integral invariante, 334 Valores propios degenerados, 188, 190 ecuaci´ on de, 171, 179 matriz hamiltoniana, de la, 561 herm´ıtica, de una, 554 tensor de inercia, del, 261, 267 Van der Waerden, B. L., 549 Van Vleck, J.H.,, 585 Variables acci´on, de, 436 acci´on-´ angulo, 429 din´amicas, 6, 378 Variaci´on que incluye el tiempo, 320 Variacional, m´etodo, 152 Vector(es) Laplace, de, 459, 463 propagaci´on, 572 propios ortogonales, 180 ortogonalidad de los, 180 peque˜ nas oscilaciones, en, 179 tensor de inercia, del, 261, 267 Velocidad angular, 244, 246, 254 areolar, 130 generalizada, 14 precesi´ on, de, 133, 152
´Indice alfab´etico / 607 superficies de acci´on constante, de las, 581 Vibraciones cuerda, de una, 195 molecula triat´ omica lineal, de la, 182 Virtual desplazamiento, 15 trabajo, 19 Volumen en el espacio de fases, 116, 121, 406 Watson, G. N., 282, 299 Whitaker, E. T., 282, 299, 326 ecuaciones de, 325 WKB, aproximaci´on de, 591
Se termin´o de imprimir en la Imprenta Universidad de Antoquia en febrero de 2006