INTRODUCCIÓN AL FORMALISMO DE LA MECÁNICA CUÁNTICA P. García González, J. E. Alvarellos y J. J. García Sanz
Índice General Prólogo
iii
1 INTRODUCCIÓN GENERAL 2 ESPACIOS DE HILBERT 2.1 Introducción . . . . . . . . . . . . . . . . . . . 2.2 Espacios vectoriales o lineales . . . . . . . . . 2.3 Base lineal de un espacio vectorial . . . . . . 2.4 Producto escalar . . . . . . . . . . . . . . . . 2.5 Espacios de Hilbert . . . . . . . . . . . . . . . 2.6 Bases ortonormales en espacios de Hilbert . . 2.7 Operadores lineales en un espacio de Hilbert . 2.8 Operaciones con operadores lineales . . . . . 2.9 Operador adjunto. Representación matricial . 2.10 Operadores hermíticos y autoadjuntos . . . . 2.11 Operadores unitarios. Cambios de base . . . . 2.12 Proyectores ortogonales . . . . . . . . . . . . 2.13 Espectro puntual. Autovalores y autovectores 2.14 Vectores no normalizables . . . . . . . . . . . 2.14.1 Delta de Dirac . . . . . . . . . . . . . 2.14.2 La transformación de Fourier . . . . . 2.14.3 Bases ortonormales generalizadas . . . 2.15 Espectro continuo . . . . . . . . . . . . . . . 2.16 Descomposición espectral . . . . . . . . . . . 2.17 Conjunto compatible de operadores . . . . . . 2.18 Formas lineales. Notación de Dirac() . . . . 2.19 Isomorsmos entre espacios de Hilbert() . . . 2.20 Producto tensorial de espacios de Hilbert() .
1
. . . . . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . . . . .
15 15 17 21 23 29 36 44 45 53 56 60 64 67 76 83 89 93 93 104 111 114 120 121
3 POSTULADOS DE LA MECÁNICA CUÁNTICA 125 3.1 Introducción . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 125 3.2 Descripción de los sistemas físicos. Estados y observables . . . 125 i
ii
ÍNDICE GENERAL 3.3 Probabilidad en las medidas de observables . . . . . . . 3.4 Reducción del estado cuántico . . . . . . . . . . . . . . . 3.5 Compatibilidad. Relación de incertidumbre generalizada 3.6 El espacio de los estados de una partícula con espín . . 3.7 Evolución temporal de los estados cuánticos . . . . . . . 3.8 Evolución temporal relativa a los observables . . . . . . 3.9 Relación de incertidumbre energía-tiempo . . . . . . . . 3.10 Observables posición y momento . . . . . . . . . . . . . 3.11 Ecuaciones de Ehrenfest . . . . . . . . . . . . . . . . . . 3.12 El problema de la medida en Mecánica Cuántica() . . . 3.13 Introducción a los modelos de variables ocultas() . . . . 3.14 Entrelazamiento() . . . . . . . . . . . . . . . . . . . . . Problemas Resueltos . . . . . . . . . . . . . . . . . . . . . . .
4 LA 4.1 4.2 4.3 4.4
FUNCIÓN DE ONDA. SISTEMAS SIMPLES Introducción . . . . . . . . . . . . . . . . . . . . . . . . . La función de ondas en la representación de posiciones . La función de ondas en la representación de momentos . Propiedades generales de las autofunciones de la energía 4.4.1 Propiedades de las funciones de onda . . . . . . . 4.4.2 Espectro de energía . . . . . . . . . . . . . . . . 4.5 El pozo cuadrado innito . . . . . . . . . . . . . . . . . 4.6 Estados ligados en pozos cuadrados nitos . . . . . . . . 4.7 El oscilador armónico . . . . . . . . . . . . . . . . . . . 4.7.1 Método de operadores . . . . . . . . . . . . . . . 4.8 Reexión y transmisión por un escalón . . . . . . . . . . 4.9 Reexión y transmisión por una barrera . . . . . . . . . 4.10 Sistemas separables . . . . . . . . . . . . . . . . . . . . . Problemas Resueltos . . . . . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . .
128 138 146 151 158 165 169 171 178 183 187 192 196
. . . . . . . . . . . . . .
205 205 206 217 225 225 227 237 244 251 257 263 267 271 275
Índice de símbolos y glosario
319
Bibliografía
327
Prólogo Este libro expone el formalismo de la Mecánica Cuántica al nivel que se exige en el tercer curso de Ciencias Físicas de la UNED. Aunque, como es obvio, este texto será de gran utilidad para aquellos alumnos que siguen sus estudios en dicha Universidad, esperamos que sea también de ayuda a los estudiantes de otros centros que cursen una Mecánica Cuántica a un nivel parecido. En la UNED, el curso se articula en dos cuatrimestres, en cada uno de los cuales se estudia básicamente un libro de texto. En concreto: - En el primer cuatrimestre de la asignatura se sigue el texto Física Cuántica de E. Wichman, volumen 4 del Curso de Física de Berkeley (publicado en español por la editorial Reverté), en el cual se introduce de manera brillante la necesidad de una nueva formulación de la mecánica para el estudio de los objetos microscópicos. - En el segundo cuatrimestre se estudia el formalismo cuántico propiamente dicho. Es éste el objeto del presente libro.1 Así, en la primera parte del curso, el alumno se familiariza con aquellos conceptos claves del formalismo cuántico, como pueden ser la función de ondas, los niveles de energía o la interpretación probabilística. Sin embargo, el rigor matemático es el mínimo imprescindible. Una vez que el alumno conoce el mundo cuántico, es cuando se le exponen los principios de la Mecánica Cuántica desde una perspectiva formal, aunque adecuada a los conocimientos de un estudiante de tercer curso (o de segundo curso dentro de un programa de cuatro años) de una licenciatura de Ciencias Físicas. No podemos olvidar que la Mecánica Cuántica es, para la mayoría de los físicos, una herramienta necesaria para profundizar en otras disciplinas, como la Física Atómica y Molecular o la Física del Estado Sólido. Por esa razón, hemos preferido hacer hincapié en los aspectos metodológicos generales más 1 El
libro Introducción a la Mecánica Cuántica de Gillespie (publicado en castellano en su día por la editorial Reverté, pero actualmente descatalogado) tiene un temario también adecuado para esa parte del curso.
iii
iv
Prólogo
que en las aplicaciones concretas, puesto que éstas serán el objetivo de cursos posteriores. Acorde con estas ideas, el libro está estructurado en cuatro capítulos: - Un pequeño capítulo introductorio, que repasa someramente la necesidad de un nuevo formalismo para la descripción del mundo subatómico, cuya fenomenología ya debe ser conocida por el lector. - Un amplio resumen de la teoría de espacios de Hilbert, con la que el Alumno ya está familiarizado tras el estudio previo de la asignatura de Análisis Matemático II de la licenciatura en CC. Físicas de la UNED (o de otras asignaturas equivalentes en otras universidades). El material que aquí se presenta pretende establecer una notación matemática consistente para su uso en el texto. Además, este capítulo permitirá que nos podamos concentrar en los aspectos conceptuales del formalismo cuántico, sin tener que introducir digresiones técnicas que dicultarían la comprensión del mismo. - En el tercer capítulo se estudia el formalismo de la Mecánica Cuántica propiamente dicho. Aunque el texto sigue un enfoque postulacional, similar al que aparece en el ya citado libro de Gillespie, nuestra presentación considera desde el principio la posible degeneración de los valores espectrales de un observable y también la eventual aparición de una parte continua del espectro. Por otra parte, la formulación de los postulados de la Mecánica Cuántica que aquí presentaremos será lo más general posible. Así, no especicaremos una representación concreta de los estados cuánticos, centrándonos en los aspectos conceptuales fundamentales. - El cuarto y último capítulo es continuación natural del anterior. En él dedicamos apartados especiales a las representaciones de posiciones y momentos para una partícula no relativista que se mueve en una dimensión. A su vez, aplicaremos la teoría general a varios sistemas simples, gracias a los cuales profundizaremos en los conceptos teóricos expuestos en el tercer capítulo. Además de numerosos ejemplos intercalados a lo largo del texto, al nal de los capítulos 3 y 4 el lector encontrará una colección de problemas resueltos en detalle. El alumno debe notar que no todos los problemas son una mera aplicación de lo desarrollado a lo largo de la obra, puesto que en muchos casos los problemas suponen en sí mismos la presentación motivada de nuevas ideas. De hecho, algunos problemas constituyen, por sí solos, una presentación de aspectos de la teoría cuántica, que en otros textos podrían encontrase en los apartados teóricos. Por eso insistimos en que el lector trabaje especialmente los problemas y ejemplos resueltos de este libro.
Prólogo
v
Igualmente, hemos incluido ejercicios propuestos a lo largo del texto (excepto en el primer capítulo). Estos ejercicios, de dicultad baja o intermedia, deberían ser resueltos sin excesivo esfuerzo por parte del lector si ha sido capaz de entender y asimilar las ideas principales que queremos transmitir. Los apartados, ejemplos y problemas marcados con un asterisco puede omitirse en un primer estudio del texto, aunque contienen información interesante sobre algunos puntos importantes del formalismo. También queremos mencionar que el capítulo 2 no es completamente imprescindible para la comprensión de la teoría cuántica tal y como aquí se expone. Como hemos comentado, los conocimientos matemáticos que suponemos al lector son los correspondientes a los dos primeros años de una licenciatura en Ciencias Físicas. Ahora bien, este capítulo puede servir de referencia si el lector encuentra dicultades a la hora de entender la herramienta matemática que se utiliza habitualmente en la teoría cuántica a este nivel, pero también al nivel exigible en un curso más especialidado de segundo ciclo. Por tanto, si el lector cree que sus conocimientos sobre álgebra de espacios lineales de dimensión innita o sobre análisis funcional no es el adecuado, le recomendamos una lectura detallada de este segundo capítulo. Bien es cierto que este capítulo también sirve para entender el porqué del lenguaje empleado en el formalismo cuántico, debido a la notable correspondencia que hay en este caso entre la abstracción matemática y la información física. En denitiva, con la inclusión de este complemento matemático relativamente amplio hemos querido facilitar la comprensión de la teoría cuántica, no entorpecerla. Por tanto, no es nuestro deseo que el alumno dedique una parte sustancial de su tiempo a asimilar una cantidad excesiva de información, que rara vez va realmente a necesitar. No está de más el recordar que, para un físico, las matemáticas son una herramienta que cumple su labor en tanto en cuanto proporciona el lenguaje requerido para describir con precisión la realidad física. Por ello no hemos incluido aspectos tan interesantes como la teoría de la medida de Borel, espacios de distribuciones o un tratamiento exhaustivo de las técnicas de resolución de ecuaciones diferenciales. Todos ellos deben de formar parte del bagaje intelectual de cualquier licenciado en Ciencias Físicas, pero su ubicación natural está en otras asignaturas especícas. Por igual motivo hemos relajado bastante el rigor en la exposición. Así, el lector observará que hemos omitido muchos detalles formales y que algunas armaciones no son enteramente rigurosas. En otras palabras, la exposición que hacemos sobre la teoría de espacios de Hilbert en ningún modo debe considerarse como un sustituto de monografías dedicadas al respecto, sino como una ayuda que sirva al lector a cubrir la distancia que hay entre el planteamiento matemático formal y su aplicación a la Física. En esta segunda edición hemos hecho varios cambios con respecto a la primera edición de esta obra. Además de corregir y reescribir aquellas secciones que podían resultar confusas o poco detalladas, hemos realizado modicaciones
vi
Prólogo
sustanciales que afectan a la estructura general del texto. En primer lugar, el capítulo dedicado a la teoría de espacios de Hilbert ha sido rehecho por completo. Algunos aspectos formales han sido eliminados y, por el contrario, otros que no habían sido comentados sucientemente en la primera edición se abordan ahora con más profundidad. Se ha ampliado la descripción del espectro continuo de operadores autoadjuntos y la mayoría de los problemas resueltos que antes aparecían al nal del capítulo se han situado ahora intercalados como ejemplos a lo largo del mismo. La exposición de los fundamentos de la teoría cuántica se mantiene como tercer capítulo, pero en esta nueva edición aparece un capítulo dedicado especícamente al estudio de sistemas simples. Estas aplicaciones del formalismo se abordaban en la primera edición mediante un enfoque “constructivo” a través de la resolución detallada de problemas. A su vez, se presta más atención al ejemplo paradigmático de los estados de espín 1/2 y a la resolución de sistemas en varias dimensiones, aunque separables en sistemas simples unidimensionales. Aun así, seguimos omitiendo conscientemente un tratamiento completo del momento angular, de la resolución de problemas tridimensionales con simetría esférica y de los rudimentos de la mecánica estadística cuántica (tópicos habituales en muchos cursos introductorios a la Mecánica Cuántica). Creemos que dichos temas deben abordarse detalladamente en cursos especializados de segundo ciclo. No queremos cerrar esta presentación sin agradecer a todas aquellas personas que nos han hecho llegar sus comentarios y sugerencias y, sobre todo, a nuestros compañeros del Departamento de Física Fundamental, especialmente a los Dres. Elka Koroutcheva, David García Aldea y Miguel Ángel de la Casa, que nos han ayudado a intentar corregir los errores y las erratas, que son casi imposibles de evitar en cualquier texto.
Capítulo 2
ESPACIOS DE HILBERT 2.1
Introducción
• La teoría de espacios de Hilbert no es sólo la principal herramienta matemática de la Mecánica Cuántica, sino que ocupa un lugar cada vez mayor en cualquier rama de la Física teórica. En este capítulo presentaremos un amplio resumen de la misma que, además de establecer una notación matemática consistente, sirva para una mejor comprensión del formalismo de la Mecánica Cuántica. Muchas de las ideas aquí expuestas ya deberían ser conocidas, puesto que han sido el contenido de la asignatura de Análisis Matemático II de la licenciatura en CC. Físicas de la UNED1 (u otra equivalente en otros centros). Sin embargo, el alumno encontrará algunas diferencias, tanto en el enfoque como en la terminología, con respecto a dicha asignatura. Una buena referencia para profundizar en la teoría de estos espacios es el libro de L. Abellanas y A. Galindo Espacios de Hilbert (Eudema Universidad). • Esencialmente, los espacios de Hilbert son espacios vectoriales en los que se ha denido un producto escalar y en los que, en caso de tener dimensión innita, sus propiedades topológicas garantizan la extensión del concepto de combinación lineal nita a un número innito de sumandos. Por ello, la parte más delicada de su formulación, y a la que dedicaremos mayor atención, está en la generalización de los resultados típicos del Álgebra Lineal para espacios de dimensión nita a otros conjuntos, como los espacios de funciones, de dimensión innita. En todo caso, el lector no debe preocuparse excesivamente por las “sutilezas” propias de una formulación matemática estricta. Éstas no son necesarias para entender los principios básicos de la teoría cuántica, que es el obje1 Véase,
por ejemplo, el libro de Linés Escardó Análisis Matemático II, publicado por la UNED en la colección de Unidades Didácticas.
15
16
ESPACIOS DE HILBERT
tivo de este texto. Por ello, aun a nuestro pesar, no seremos completamente rigurosos. Tampoco discutiremos temas, como el concepto de medida de Borel, esenciales para una formulación consistente de la teoría. Por último, omitiremos las demostraciones o las sustituiremos por meras justicaciones, a no ser que éstas ilustren resultados importantes, usen técnicas de aplicación habitual en Mecánica Cuántica, o sirvan para profundizar en algunos conceptos. • Como comentamos en el Prólogo, a lo largo del capítulo hay intercalados un número bastante amplio de cuestiones y problemas, bien resueltos en detalle (“ejemplos”) o bien propuestos al lector (“ejercicios”). Los ejemplos aclaran la teoría, pero también la complementan. Así, no es en absoluto conveniente su omisión incluso en una primera lectura. Muchos de los ejemplos que aparecen en este capítulo están directamente relacionados con la Mecánica Cuántica. Sin embargo, para facilitar la asimilación por parte del lector de las herramientas matemáticas, estos ejemplos se presentarán en un sistema de unidades en el que las constantes físicas relevantes sean igual a uno.2 Evidentemente, como se corresponde a un texto introductorio, en el próximo capítulo recuperaremos el sistema usual de unidades. • Para terminar esta introducción, es pertinente anticipar algunos detalles referidos a la notación que vamos a utilizar. En las sumas nitas PN se indicarán expresamente los valores que toma el índice P del sumatorio: i=1 . Procede4 remos de igual modo para sumas innitas: i=1 . Ahora bien, en aquellos resultados válidos indistintamente para sumas Pnitas e innitas omitiremos los límites del sumatorio, usando simplemente i . Seguiremos el mismo convenio a la hora de denotar conjuntos nitos e innitos. Así, simbolizaremos un conjunto nito de N objetos {a1 , a2 , ..., aN } por {ai }N i=1 ; un conjunto innito 4 numerable {a1 , a2 , ...}, mediante {ai }i=1 ; y si es irrelevante que el conjunto sea nito o innito usaremos simplemente {ai }. En algunos casos tendremos que nombrar conjuntos continuos, es decir, conjuntos no numerables de cardinal innito. Cada elemento del conjunto quedará entonces caracterizado por un parámetro perteneciente a un subintervalo D de la recta real R y, así, a estos conjuntos los nombraremos mediante {a }5D . Por ejemplo {sin kx}k5[0,] representa el conjunto formado por todas las funciones sin kx con número de onda k dentro del intervalo [0, ]. Por último, el lector sabe que a los elementos de un espacio lineal se les denomina vectores, por lo que la notación ~v se reservará para los elementos de un espacio lineal. Cuando sea necesario notar un “vector” del espacio euclídeo ndimensional En (por ejemplo el vector de posición de una partícula) o enfatizar el carácter vectorial de una magnitud física usaremos letras en negrita (así, para una partícula que se mueve en tres dimensiones usaremos x o r para indicar su vector de posición y p para expresar su momento lineal). 2 Siempre,
claro está, que no se llegue a una inconsistencia dimensional.
2.2 Espacios vectoriales o lineales
2.2
17
Espacios vectoriales o lineales
• Empecemos recordando la denición de espacio vectorial o lineal: DEFINICIÓN: Un espacio vectorial o lineal complejo 3 U es un conjunto de elementos, llamados vectores, dotado de dos leyes de composición: 1. Una ley de composición interna (suma de vectores) que denotaremos por el símbolo “ +”, que asocia unívocamente a cada par de elementos ~u, ~v U un elemento ~u + ~v U. Esta ley debe satisfacer, para todo ~u, ~v , w ~ U, las propiedades siguientes: (a) Asociativa: ~u + (~v + w) ~ = (~u + ~v ) + w. ~ (b) Conmutativa: ~u + ~v = ~v + ~u. (c) Existencia de un elemento nulo, denotado por ~0, tal que ~v + ~0 = ~v . (d) Existencia, para ¡cada¢ ~v U, de un elemento opuesto, denotado por ~ = ~0. ~v , tal que ~v + v 2. Una ley de composición externa (multiplicación por un escalar complejo), que asocia a cada par ~v U, C un vector ~v U.4 Esta ley debe satisfacer, para todo ~u, ~v U y , C, las propiedades siguientes: (a) Distributiva respecto a elementos de U: (~u + ~v ) = ~u + ~v . (b) Distributiva respecto a elementos de C: ( + )~v = ~v + ~v . (c) ( ~v) = ( ) ~v . (d) 1 ~v = ~v ( 1 es el elemento unidad de C). (e) 0 ~v = ~0 ( 0 es el elemento nulo de C). DEFINICIÓN: Un subconjunto W U es un subespacio lineal de U si es cerrado respecto a las dos leyes de composición; es decir, para cualquier par ~u, ~v W, y , C, se tiene ~u + ~v W. Como consecuencia, W es un espacio lineal en sí mismo.5 • Los tres ejemplos siguiente nos servirán para conocer los espacios lineales más habituales en Mecánica Cuántica.
3O
espacio vectorial sobre el cuerpo de los números complejos. una denición más general de espacio vectorial, el cuerpo usado en la ley de composición externa no tiene por qué ser el de los números complejos C. Así, si sustituyésemos C por el cuerpo de los números reales R, tendríamos un espacio vectorial real. Supondremos siempre (como hemos hecho en la denición) que los espacios lineales a los que nos referimos en este texto son complejos. 5 Nótese que la condición es equivalente a ~ u + ~v W y ~v W. 4 En
18
ESPACIOS DE HILBERT
Ejemplo 2.1. Consideremos el conjunto CN formado por todas las N -tuplas (conjuntos ordenados de N elementos) ~a = (a1 , a2 , ..., aN ) N es un {ai }N i=1 con ai C. Es sencillo demostrar (inténtese) que C espacio vectorial si denimos la suma y el producto por un escalar complejo en la forma usual: ~a + ~b = (a1 + b1 , a2 + b2 , ..., aN + bN ) ~a = (a1 , a2 , ..., aN ) Demuestre que el subconjunto de CN formado por los vectores de la forma ~c = (c1 , c2 , 0, 0, ..., 0) es un subespacio vectorial.6 Solución: Basta aplicar la denición. Sean ~c = (c1 , c2 , 0, ..., 0) y d~ = (d1 , d2 , 0, ..., 0) dos vectores de este subconjunto y , dos complejos cualesquiera. Así: ~c + d~ = (c1 + d1 , c2 + d2 , 0, 0, ..., 0) que es un vector del subconjunto en cuestión. Ejemplo 2.2. Consideremos el conjunto L2 (Rn ) formado por todas las funciones complejas (x1 , x2 , ..., xn ) de n variables reales que cumplen Z | (x)|2 dn x < Rn
(es decir, son de cuadrado integrable), donde hemos usado la notación x (x1 , x2 , ..., xn ) x y dn x dx1 dx2 ...dxn . En dicho conjunto se dene la suma de funciones y el producto por un escalar complejo en la forma habitual: ( + ) (x) = (x) + (x) () (x) = (x) . a) Demuestre que dadas dos funciones de L2 (Rn ), (x) y (x), se verica la llamada desigualdad de Schwarz ¯Z ¯ sZ Z ¯ ¯ 2 n ¯ ¯ | (x)| dn x | (x)|2 dn x , ¯ n (x) (x) d x¯ n n R
R
R
b) Como consecuencia, demuestre que L2 (Rn ) es un espacio lineal.7 6 Es
habitual escribir la N-tupla en columna (no en la, como en este ejemplo). ~ primero para evitar la (improbable) confusión con que hemos escrito (x) (y no ) una función vectorial y, en segundo lugar, para enfatizar que este espacio lineal está formado por funciones. Por este segundo motivo, muchas veces usaremos los términos “espacios funcionales” o “espacios de funciones”. 7 Nótese
2.2 Espacios vectoriales o lineales
19
Solución: a) Denamos la función accesoria (x) = (x) + (x), donde Z (x) (x) dn x n . = ZR 2 n | (x)| d x Rn
Entonces Z Z 2 n | (x)| d x =
Z =
Rn
2
Z
| (x)| d x + || | (x)|2 dn x Rn Rn Z Z n (x) (x) d x + (x) (x) dn x +
Rn
2
n
Rn
| (x)|2 dn x
¯R ¯
Rn
¯ n ¯2 (x) (x) d x Rn . R 2 n | (x)| d x n R
Esta cantidad es mayor o igual que cero, ya que es la integral de una función estrictamente positiva. Por tanto: ¯ sZ ¯Z Z ¯ ¯ 2 2 ¯ (x) (x) dn x¯¯ | (x)| dn x | (x)| dn x , ¯ Rn
Rn
Rn
que es el resultado deseado. b) Las propiedades de la suma y el producto por un escalar se satisfacen trivialmente porque se reducen a propiedades equivalentes en números complejos. Así, basta probar que la suma de dos funciones de L2 (Rn ) y el producto de una función de L2 (Rn ) por un escalar complejo es siempre es una función de L2 (Rn ). Esto es inmediato para el producto por un escalar, por lo que nos centraremos en la suma. Así, sean (x) y (x) dos funciones de cuadrado integrable. Entonces Z 2 | (x) + (x)| dn x Rn Z ³ ´ 2 2 = | (x)| + | (x)| + (x) (x) + (x) (x) dn x Rn μZ ¶ Z Z 2 n 2 n n | (x)| d x + | (x)| d x + 2 Re (x) (x) d x . = Rn
Rn
Rn
Ahora bien, la parte real de un número complejo es menor o igual que su módulo. De esta forma Z Z Z 2 n 2 n 2 | (x) + (x)| d x | (x)| d x + | (x)| dn x Rn Rn Rn ¯Z ¯ ¯ ¯ + 2 ¯¯ (x) (x) dn x¯¯ , Rn
20
ESPACIOS DE HILBERT
y usando el resultado anterior Z Z 2 n | (x) + (x)| d x
2
| (x)| dn x + n R sZ
Rn
Z Rn
2
+2
Rn
2
| (x)| dn x
| (x)| dn x
Z Rn
| (x)|2 dn x ,
que es un número nito porque (x) y (x) son funciones de cuadrado integrable. Ejemplo 2.3. Sea el conjunto C4 2 formado por los conjuntos ordenados de cardinal innito de escalares complejos8 ~a = (a1 , a2 , a3 , ...) P4 4 2 (ai )i=1 , tales que j=1 |aj | < .9 Deniendo la suma y el producto por un escalar complejo en la forma ~a + ~b = (a1 + b1 , a2 + b2 , a3 + b3 , ...) c~a = (ca1 , ca2 , ca3 , ...) demuestre que C4 2 es un espacio vectorial. Solución: Las propiedades de la suma de vectores y el producto por un escalar complejo se cumplen como consecuencia directa de las de la suma y multiplicación de números complejos. Así, nos limitamos a demostrar que para todo ~a, ~b C4 2 y para todo C, los elementos ~a + ~b y ~a pertenecen a C4 2 . En primer lugar se puede probar el resultado accesorio ¯4 ¯ v 4 4 ¯X ¯ u X X ¯ ¯ u 2 t an bn ¯ |an | |bm |2 ¯ ¯ ¯ n=1
n=1
m=1
P siguiendo el procedimiento del ejemplo anterior. De esta forma, | 4 n=1 an bn | los elementos de C 2 está formado por sucesiones convergentes (no todas) de números complejos. Sin embargo, como verá inmediatamente, no usamos este término al denir los elementos de C 2 para evitar confusiones. 9 Recuerde que una suma innita debe entenderse como un límite: 8 Evidentemente
X j=1
j = lim
n X
n
j .
j=1
O, equivalentemente, como el límite de una sucesión cuyo término general es Zn =
n X j=1
j .
2.3 Base lineal de un espacio vectorial
21
es nito para todos los vectores de C4 2 . A continuación evaluamos 4 X
4 ³ 4 ´ X X 2 2 |an + bn | = an bn |an | + |bn | + 2 Re 2
n=1
n=1 4 ³ X n=1
¯ 4n=1 ¯ ¯ ¯X ´ ¯ 2 2 ¯ |an | + |bn | + 2 ¯ an bn ¯ , ¯ ¯ n=1
y, haciendo uso del resultado accesorio ya mencionado, v u4 4 4 4 4 X X X X uX 2 2 2 2 t |an + bn | |an | + |bn | + 2 |an | |bm |2 , n=1
n=1
n=1
n=1
m=1
que es nito: ~a + ~b C4 2 . Por último, 4 X n=1
2
2
|an | = ||
4 X
|an |
2
n=1
también es nito, por lo que ~a C4 2 . Queda así demostrada la armación. Ejercicio 2.1. Demostrar que la intersección de dos subespacios lineales es también un subespacio lineal. (Nótese que dos subespacios lineales no pueden ser disjuntos puesto que el vector ~0 forma parte de todo subespacio vectorial. A su vez, {~0} es un subespacio lineal en sí mismo).
2.3
Base lineal de un espacio vectorial
• En esta sección deniremos los importantes conceptos de base lineal y dimensión de un espacio vectorial U, lo que nos permitirá distinguir entre espacios lineales de dimensión nita e innita. DEFINICIONES: Sea U un espacio lineal. Una combinación lineal es toda suma nita de elementos de U, cada uno de ellos multiplicado por un escalar complejo: N X
i~vi con i C y ~vi U .
i=1
Un subconjunto nito A, formado por elementos no nulos de U, es linealmente independiente si la única combinación lineal de elementos de A igual al vector nulo es aquella en la que todos los coecientes escalares son iguales a cero, es decir: N X i=1
i~vi = ~0 con ~vi A
i = 0.
22
ESPACIOS DE HILBERT
Nótese cómo el concepto de combinación lineal está siempre restringido a un número nito de términos en la suma. Un subconjunto innito A, formado por elementos no nulos de U, es linealmente independiente si todo subconjunto nito de A es linealmente independiente. Sea W un subconjunto cualquiera (nito o no) del espacio U. Llamamos lin (W) a la envolvente lineal de W, denida como el conjunto formado por todos los elementos de U obtenidos mediante una combinación lineal de elementos de W. Un conjunto B de vectores linealmente independientes de un espacio lineal U se denomina base lineal (o de Hamel) si su envolvente lineal, lin (B), es todo el espacio U. Un espacio vectorial U tiene dimensión nita si existe una base lineal formada por un número nito de elementos. Puede demostrarse que, en este caso, todas las bases lineales tienen igual número de vectores. A este cardinal se le denomina dimensión del espacio vectorial U, dim (U), Algunas propiedades para espacios vectoriales U de dimensión nita, que enunciaremos sin demostración, son las siguientes: 1. Un conjunto linealmente independiente no puede tener un número de vectores mayor que dim (U). 2. Si el cardinal de un conjunto linealmente independiente es igual a dim (U), dicho conjunto es una base lineal de U. 3. Si la envolvente lineal de un conjunto W es igual a todo el espacio vectorial U, el número de vectores de W es mayor o igual que dim (U). En el caso de que el número de vectores de este conjunto W sea igual a la dimensión del espacio, W será también linealmente independiente y, por tanto base lineal. Como consecuencia de las anteriores propiedades, una base lineal puede entenderse como un conjunto máximo de vectores linealmente independientes o, alternativamente, como un conjunto mínimo cuya envolvente lineal sea igual todo el espacio vectorial. Además, ya tiene sentido la siguiente denición: DEFINICIÓN: Un espacio vectorial U tiene dimensión innita si existen conjuntos linealmente independientes con cardinal arbitrariamente grande.
2.4 Producto escalar
23
Ejemplo 2.4. Sea el espacio vectorial C3 . Demostrar que el conjunto10 0
0 1 0 1 0 , , B = {~e1 , ~e2 , ~e3 } = 1 0 0 es una base lineal de C3 . Solución: 3 El problema es trivial. En primer lugar es evidente que los tres vectores {~ej }j=1 son linealmente independientes. A su vez, un vector cualquiera u1 ~u = u2 u3 se puede escribir como combinación lineal de los elementos de B en la forma ~u =
3 X
uj ~ej .
j=1
Así, el espacio lineal C3 tiene dimensión 3. Ejemplo 2.5. Demostrar que el espacio de funciones L2 (R), formado por todas las funciones complejas (x) de una variable real de cuadrado integrable, tiene dimensión innita. Solución: Basta comprobar que existe un conjunto arbitrariamente grande de funciones linealmente independientes, como por ejemplo el formado por las funciones ¡ 2¢ n n (x) = x exp x con n = 1, 2, 3, .... Ejercicio 2.2. Demuestre que C4 2 es un espacio lineal de dimensión innita.
2.4
Producto escalar
• Empecemos con unas deniciones fundamentales, aplicables tanto a espacios lineales de dimensión nita como de dimensión innita. DEFINICIÓN: Un producto escalar (o producto interno) en un espacio lineal complejo U es una aplicación U × U C, que asocia a cada par ~u, ~v U un escalar complejo, que designaremos por (~u, ~v ), de modo que se satisfacen las siguientes condiciones para todo ~u, ~v , w ~ U: este caso (y en general para CN si N es pequeño) sí seguimos el convenio habitual de escribir la N-tuplas en columna. 1 0 En
24
ESPACIOS DE HILBERT
1. (w, ~ (~u + ~v )) = (w, ~ ~u) + (w, ~ ~v ). 2. (~u, ~v ) = (~u, ~v ) para todo C. 3. (~u, ~v ) = (~v , ~u) (por tanto, (~v , ~v ) R). 4. (~v , ~v) 0, y (~v , ~v ) = 0 si y sólo si ~v = ~0. Se dice entonces que al espacio lineal se le ha dotado de un producto escalar o que es un espacio pre-Hilbert. A partir de estas propiedades, se deducen fácilmente las siguientes: 5. (~u, w) ~ = (~u, w) ~ para todo C . 6. Dado un vector ~u, si (~u, ~v ) = 0 ~v U , entonces ~u = 0. 7. Dados dos vectores ~u y ~v, si (~u, w) ~ = (~v , w) ~ w ~ U, entonces ~u = ~v . 8. Dado w ~ U, se cumple que N N X X w, j ~uj = j (w, ~ ~uj ) ~ j=1 N
j=1 N
para cualquier conjunto {~uj }j=1 U y {j }j=1 C. Esto es, la linealidad del producto escalar (propiedades 1 y 2) se extiende a cualquier combinación lineal. Implícitamente, el producto escalar de dos vectores cualesquiera de U ha de tener módulo nito. En consecuencia, una denición de un producto escalar tal que existan vectores ~u para los que (~u, ~u) sea innito no es admisible. DEFINICIÓN: Un par de vectores ~u, ~v U son ortogonales (y escribiremos ~v w) ~ si (~u, ~v ) = 0. DEFINICIÓN: Un subconjunto W U es un conjunto ortogonal si todos sus elementos son ortogonales dos a dos. TEOREMA: Todo conjunto ortogonal W U es linealmente independiente. Evidentemente la recíproca no siempre es cierta. Intente demostrar este importante teorema. Para ello pruebe la contrarrecíproca, esto es, demuestre que todo conjunto que no sea linealmente independiente no puede ser ortogonal. DEFINICIÓN: Dos subconjuntos W1 , W2 U son ortogonales ( W1 W2 ) si cualquier vector de W1 es ortogonal a cualquier vector de W2 (es decir, si para todo par ~v1 W1 , ~v2 W2 , se cumple que (~v1 , ~v2 ) = 0). A su vez, dado el subconjunto W U, un vector ~v U es ortogonal a W, escribiéndose ~v W, si ~v es ortogonal a todos los vectores de W (esto es, si ~v w ~ para todo w ~ W). DEFINICIÓN: Dado un subconjunto W U, se denomina complemento ortogonal al conjunto, simbolizado por W B , formado por todos los vectores que son ortogonales a W.
2.4 Producto escalar
25
Ejemplo 2.6. Demuestre que el complemento ortogonal de un subconjunto W es un subespacio vectorial. Solución: Basta aplicar la denición de subespacio vectorial y demostrar que si ~u y ~v pertenecen a W B entonces ~u + ~v W B siendo , dos complejos cualesquiera. Esto es inmediato, ya que para cualquier w ~ W: (~u + ~v , w) ~ = (~u, w) ~ + (~v , w) ~ =0
~u + ~v W B
donde hemos usado que ~u, ~v W B . • A partir del producto escalar se puede denir la longitud o norma11 de un vector y también la distancia entre dos vectores (como haremos a continuación). En rigor, es posible hacer estas deniciones sin recurrir a un producto escalar. Sin embargo, nos ceñiremos a la construcción mencionada puesto que será lo habitual en Mecánica Cuántica. Así: DEFINICIONES: Sea U un espacio pre-Hilbert. Denimos la norma k~uk de un vector ~u U como el número real p k~uk = (~u, ~u) . Dados dos vectores ~u, ~v U, la distancia entre los mismos es la norma de la diferencia: dist {~u, ~v } = k~u ~v k . Un vector ~u se dice normalizado si su norma es igual a la unidad: k~uk = 1. Así, todos los vectores del espacio pre-Hilbert son “normalizables”, ya que basta dividirlos por su norma para obtener un vector normalizado. Por último un subconjunto {~un } U, con un número nito o innito de elementos, es un conjunto ortonormal si es ortogonal y está formado por vectores normalizados, esto es, para todos los pares i, j se cumple que (~ui , ~uj ) = ij , siendo ij la delta de Kronecker. La norma así denida cumple las cuatro propiedades básicas siguientes (pruébelas como ejercicio). Para todo ~u, ~v U y para todo escalar C: 1. k~uk 0. 2. k~uk = 0 ~u = 0. Por tanto ~u = ~v k~u ~v k = 0 3. k~uk = || k~uk. 4. k~u + ~vk k~uk + k~v k (desigualdad triangular). Ejemplo 2.7. Demostrar la desigualdad de Schwarz: |(~u, ~v )| k~uk k~v k. Solución: 1 1 Aunque
el término módulo sólo debe aplicarse a números complejos, es muy habitual usar norma y módulo como sinónimos.
26
ESPACIOS DE HILBERT
El lector observará que ya hemos introducido dicha desigualdad, aunque restringida a espacios de funciones, en el ejemplo 2.2. Aquí demostraremos que es un resultado general aplicable a todos los espacios pre-Hilbert. Para su demostración seguimos un procedimiento completamente similar al del ejercicio mencionado. Supongamos primero que ~v 6= ~0. Así, construyamos el vector w ~ = ~u + ~v, donde = (~u, ~v ) / (~v , ~v ). Entonces (w, ~ w) ~ = (~u + ~v , ~u + ~v ) = (~u, ~u) + (~u, ~v ) + (~u, ~v ) + (~v , ~v )
(~u, ~v ) (~u, ~v ) . = (~u, ~u) (~v , ~v ) Como, por denición, (w, ~ w) ~ 0 tenemos
2
2
2
(~u, ~u) (~v , ~v ) (~u, ~v ) (~u, ~v ) k~uk k~v k |(~u, ~v)| , que es esencialmente la expresión que queríamos demostrar. Si ~v es igual a ~0, la desigualdad de Schwarz se reduce a la igualdad trivial 0 = 0. Ejemplo 2.8. Demostrar que la norma denida a partir de un producto escalar cumple a) |k~uk k~v k| k~u + ~v k k~uk + k~v k . b) |k~uk k~v k| k~u ~v k k~uk + k~vk . Solución: a) Por denición p p k~u + ~v k = (~u + ~v , ~u + ~v ) = (~u, ~u) + (~v , ~v ) + (~u, ~v) + (~v , ~u) q = k~uk2 + k~v k2 + 2 Re (~u, ~v) . Ahora bien, |Re (~u, ~v )| |(~u, ~v )|, lo que implica que |(~u, ~v)| Re (~u, ~v ) + |(~u, ~v )|. Usando ahora la desigualdad de Schwarz |(~u, ~v )| k~uk k~v k, tenemos que k~uk k~v k Re (~u, ~v ) + k~uk k~v k . Así llegamos fácilmente al resultado deseado: q k~u + ~v k k~uk2 + k~v k2 + 2 k~uk k~v k = k~uk + k~v k , q k~u + ~v k
k~uk2 + k~v k2 2 k~uk k~v k = | k~uk k~v k | . b) La demostración es idéntica. Basta sustituir ~v por ~v .
2.4 Producto escalar
27
• A partir de ahora consideraremos que en un espacio pre-Hilbert U se ha denido también la norma asociada a su producto escalar. Diremos entonces que U es espacio normado. Igualmente, la denición de la distancia asociada a la norma se da por supuesta, y entonces diremos que U es también un espacio métrico. • Terminemos esta sección resolviendo algunos ejemplos importantes en los que se denen los productos escalares que usaremos a partir de ahora. Ejemplo 2.9. Consideremos el espacio vectorial C4 2 , ya denido en el ejemplo 2.3. El producto escalar de dos vectores ~a, ~b C4 2 se dene como: 4 ³ ´ X ~ ~a, b = ai bi . i=1
a) Demuestre que, efectivamente, esta denición cumple las cuatro propiedades de un producto escalar. b) Compruebe que este producto escalar no es admisible en el espacio vectorial C4 , formado por todos los conjuntos ordenados de innitos escalares complejos Solución: a) En primer lugar cabría preguntarse si el producto escalar está bien denido en el sentido de que sea nito 12 para dos elementos de C4 2 . Ahora bien, como consecuencia de la denición de producto escalar, los elementos de C4 2 son todos los vectores para los cuales la norma asociada al producto escalar es nita, es decir, todos los elemento de C4 normalizables. Así, si se cumplen las cuatro propiedades básicas de un producto escalar, entonces se cumple la desigualdad de Schwarz (véase el ejemplo 2.7) y esto garantiza el carácter nito del producto escalar. Dicho esto, probemos la propiedad 1. Sean ~a, ~b, ~c C4 2 , entonces 4 4 ³ ´ X X ~ ~a, b + ~c = ai (bi + ci ) = (ai bi + ai ci )
=
i=1 4 X i=1
ai bi +
4 X
i=1
ai ci = (~a, ~b) + (~a, ~c)
i=1
(en este paso hemos usado implícitamente que una suma innita es un límite y la propiedad conocida en series de números complejos de que el límite de la suma es la suma de los límites). 1 2 En
rigor no debemos usar la palabra nito para un número complejo, pero se sobrentiende que un escalar complejo es nito si su módulo lo es.
28
ESPACIOS DE HILBERT
De similar manera se prueban las otras tres: ! Ã4 4 4 ³ ´ X ³ ´ X X ~ ~a, b = ai bi = (ai bi ) = ai bi = ~b, ~a . (~a,~a) =
4 X i=1
i=1
ai ai =
4 X
i=1
i=1
2 |ai | 0, e implica (~a,~a) = 0 ~a = ~0 .
i=1
4 4 ³ ´ X ³ ´ X ~ ai (bi ) = ai bi = ~a, ~b . ~a, b = i=1
i=1
b) Es evidente que no es admisible. Baste considerar el vector (1, 1, 1, ....) C4 , que no es normalizable. Ejemplo 2.10. Sea el espacio de funciones L2 (D), formado por todas las funciones complejas de una variable real dentro del intervalo cerrado D que cumplen Z 2 | (x)| dx < D
(funciones de cuadrado sumable). En este espacio se dene el producto escalar como:13 Z (, ) = (x) (x) dx . D
a) Demuestre que el producto escalar cumple las cuatro propiedades que lo caracterizan. Limitémosnos ahora al caso particular en el que D es el intervalo cerrado nito [a, b]. Además de L2 [a, b], consideremos los conjuntos P [a, b] (formado por los polinomios de coecientes complejos denidos en [a, b]) y C [a, b] (el conjunto de las funciones continuas denidas en [a, b]). b) Pruebe que P [a, b] C [a, b] L2 [a, b] . c) Demuestre que P [a, b] y C [a, b] son subespacios lineales de dimensión innita. Solución: a) En primer lugar, nótese que al ser D cualquier intervalo cerrado esta denición también contempla el caso D = R. La resolución de este apartado es idéntica al ejemplo anterior, excepto que las sumas han de sustituirse por integrales. b) Si D = [a, b], todos los polinomios (que son una suma nita de monomios) 1 3 Por
el motivo señalado ³ en ´ una nota anterior, en espacios de funciones no escribiremos el producto escalar como ~ , ~ , sino como (, ) o también como ( (x) , (x)) .
2.5 Espacios de Hilbert
29
son de cuadrado integrable. A su vez, los polinomios son funciones continuas y toda función continua es de cuadrado integrable en un intervalo cerrado nito. Queda así probado que P [a, b] C [a, b] L2 [a, b]. c) La suma de dos polinomios es un polinomio, el producto de un polinomio por un escalar es un polinomio. Por otra parte, la suma de dos funciones continuas es continua, y el producto de una función continua por un escalar es continuo. Así queda probado que P [a, b] y C [a, b] son subespacios lineales. Un ejemplo© de conjunto ª linealmente independiente en P [a, b] arbitrariamente 2 3 grande es 1, x, x , x , ... , lo que por denición demuestra que P [a, b] es un espacio lineal de dimensión innita. Como P [a, b] está contenido en C [a, b], entonces este espacio lineal es también de dimensión innita. Ejercicio 2.3. Consideremos el espacio lineal CN . Sobre este espacio se dene el producto escalar como N ³ ´ X ~a, ~b = ai bi . i=1
Demuestre que, efectivamente, esta denición cumple las cuatro propiedades del producto escalar.
2.5
Espacios de Hilbert
• Los espacios de Hilbert son espacios lineales con producto escalar que, además, cumplen unas determinadas propiedades topológicas que son fundamentales para la construcción consistente del formalismo cuántico. Para proceder a su caracterización, empezaremos deniendo la convergencia de sucesiones de vectores de un espacio pre-Hilbert. DEFINICIÓN: Sea U un espacio pre-Hilbert. Dada la sucesión de vectores 4 {~uj }j=1 U, dicha sucesión es convergente si existe un vector ~u U tal que lim k~un ~uk = 0 .
n$4
Al vector ~u se le denomina límite de la sucesión, escribiéndose lim ~un = ~u .
n$4
De este modo hemos denido el límite (si existe) de una sucesión de vectores relacionando ese límite, a través de la norma, con las propiedades de convergencia de los números reales. Se pueden demostrar las siguientes propiedades relativas a sucesiones convergentes de vectores en un espacio pre-Hilbert U:
30
ESPACIOS DE HILBERT 1. El límite de una sucesión, de existir, es único. 2. El producto de un escalar por el límite de una sucesión es igual al límite del producto de la sucesión con el escalar. 4 Sea {~un }n=1 U una sucesión convergente. Para cualquier C, 4 la sucesión {~un }n=1 también converge y limn$4 (~un ) = limn$4 ~un . Como consecuencia, si es un complejo no nulo y la sucesión {~un }4 n=1 4 U converge, entonces la sucesión {~un }n=1 también converge y, entonces, limn$4 (~un ) = 1 limn$4 (~un ). 3. La suma de los límites de dos sucesiones es igual al límite de la suma de las sucesiones. Sean {~un }4 ~ n }4 n=1 , {w n=1 U dos sucesiones convergentes. Entonces la 4 sucesión {~un + w ~ n }n=1 también es convergente y limn$4 (~un + w ~ n) = limn$4 (~un ) + limn$4 (w ~ n ). 4. El producto escalar del límite de dos sucesiones es igual al límite del producto escalar de las dos sucesiones.14 4 Sea {~un }n=1 U una sucesión convergente. Entonces, para cualquier ~v 4 U la sucesión de números complejos {(~v , ~un )}n=1 converge, cumpliéndose que limn$4 (~v , ~un ) = (~v , limn$4 ~un ). Como consecuencia, dada una segunda sucesión convergente {w ~ n }4 n=1 , entonces limn,m$4 (w ~ n , ~um ) = (limn$4 w ~ n , limm$4 ~um ). Estas propiedades son importantes, ya que las expresiones del tipo 4 X
n ~un , con ~un U y n C
n=1
son muy habituales. Esta expresión no es una combinación lineal sino el límite 1 4 Las
demostraciones formales, aunque sencillas, son siempre algo técnicas puesto que sólo podemos usar las propiedades que cumple, por denición, el producto escalar (y la norma) y reglas asociadas a sucesiones de números complejos. Como ejemplo demostremos esta propiedad: Sea ~ u el límite de la sucesión {~ un } n=1 . Así, ³ ³ ´ ´ ~ ~ un ) = lim w, u + lim ~ um = lim (w, ~ ~ un ~ u) + w, ~ lim ~ um , ~ ~ un ~ lim (w, n
n
m
n
m
u)| tiende a cero. Usando la desigualdad por lo que basta probar que la sucesión |(w, ~ ~ un ~ de Schwarz 0 |(w, ~ ~ un ~ u)| kwk ~ k~ un ~ uk n , un ~ uk tiende a cero. Entonces pero, como la sucesión {~ un } n=1 es convergente, k~ ~ ~ un ~ u)| 0 0 lim |(w, n
y queda demostrada la propiedad.
2.5 Espacios de Hilbert
31
de una sucesión formada por combinaciones lineales: 4 X
n ~un = lim ~sm , con ~sm = m$4
n=1
m X
n ~un .
n=1
P Por tanto, no hay ningún problema en escribir 4 un si converge a un n=1 n ~ vector ~u del espacio pre-Hilbert. Por igual motivo, las igualdades
4 X n=1
~un = Ã
4 X
~un
4 X
;
n=1 4 X
n=1
n ~un ,
~un +
4 X
w ~n =
n=1
4 X
! nw ~n
=
n=1
n=1 4 4 X X
4 X
(~un + w ~ n)
n=1
n m (~un , w ~ m)
n=1 m=1
son válidas siempre y cuando todas y cada una de las sumas converjan por separado. Ahora bien, siempre hay que tener cierto cuidado con la manipulación de sumas innitas. Por ejemplo, la expresión 4 X
(~un + w ~ n ) = ~v U
n=1
P4 P4 no garantiza que las sumas n=1 ~un y n=1 w ~ n converjan por separado: puede ocurrir que al sumar las dos sucesiones, posibles elementos divergentes se cancelen entre sí. Por igual motivo, si existe un vector w ~ U para el que la expresión 4 X
(w, ~ ~un ) = C
n=1
sea cierta, esto no garantiza que la sucesión espacio pre-Hilbert.15
P4
un n=1 ~
converja a un vector del
• Aun teniendo en mente todas estas precauciones, no todos los espacios lineales con producto escalar son adecuados para la formulación matemática ¡ ¢ ¡ 2 ¢ un = n con n = 1, 2, 3... ejemplo, en C2 consideremos w ~ = 10 y los vectores ~ n1 Por un lado X X 2 1 (w, ~ ~ un ) = = n2 6 n=1 n=1 1 5 Por
pero X n=1
cuya segunda componente diverge.
un = ~
³ 2 ´ X n n1 n=1
32
ESPACIOS DE HILBERT
P4 del formalismo cuántico. Puede suceder que una expresión del tipo n=1 n~vn “parezca” Pm que converge, en el sentido de que la sucesión de término general ~sm = n=1 n~vn tiende a estabilizarse. En este caso, todas las sucesiones de complejos formadas por productos escalares del tipo (w, ~ ~sm ) convergen. Sin embargo, si el espacio lineal no es cerrado (en sentido topológico), es posible que la sucesión {~sm }4 m=1 tienda a un objeto fuera del espacio lineal (y, por tanto, que no converja en sentido estricto). Ya hemos visto en el capítulo introductorio que, en Mecánica Cuántica, las propiedades físicas se determinan mediante productos escalares, mientras que los estados físicos se representan por vectores. Malo sería que en el formalismo se diesen situaciones en el que las todas las propiedades que caracterizan un estado estén bien denidas, ¡pero no el propio estado! Así, es imprescindible que los espacios lineales que representan los estados físicos sean topológicamente cerrados. Estos son los espacios de Hilbert, cuya denición formal es la siguiente: DEFINICIÓN: Sea H un espacio lineal con producto escalar. Una sucesión 4 {~un }n=1 H es una sucesión de Cauchy (o una sucesión que va estabilizándose) si se cumple lim (~un+i ~un ) = ~0 , para cualquier i N .
n$4
(o, equivalentemente, limn$4 k~un+i ~un k = 0 para cualquier i N). H es un espacio de Hilbert si y sólo si toda sucesión de Cauchy converge a un vector ~u del espacio lineal H (es decir, si H es topológicamente cerrado bajo la métrica asociada a la norma). Análogamente, si H es un espacio de Hilbert, un subespacio lineal W H es un subespacio de Hilbert si toda sucesión de Cauchy formada por vectores de W converge a un vector de W. Veamos algunos ejemplos y ejercicios importantes: Ejemplo 2.11. Demuestre que todo espacio pre-Hilbert de dimensión nita N es un espacio de Hilbert. Solución: Sean N la dimensión del espacio lineal U, {~e1 , ~e2 , ..., ~eN } una base lineal del 4 mismo, y {~un }n=1 una sucesión de Cauchy en U. Cada vector ~un puede escribirse como ~un =
N X
un,i ~ei .
i=1 4
Por tanto, las N sucesiones de números complejos {un,i }n=1 i = 1, 2, ..., N son sucesiones de Cauchy en C, y por tanto convergentes (el cuerpo de los complejos es cerrado). Como los N coecientes de la combinación lineal convergen, la 4 sucesión {~un }n=1 converge. Nótese que esta demostración exige que N sea nito.
2.5 Espacios de Hilbert
33
Ejemplo 2.12. Sea U un espacio lineal con producto escalar, no necesariamente de Hilbert. Dada una sucesión de Cauchy {~un }4 n=1 U, 4 demuestre que la sucesión de números reales {k~un k}n=1 es convergente. Solución: Si {~un }4 n=1 es una sucesión de Cauchy, para cualquier i: lim k~un+i ~un k = 0 .
n$4
Usando el resultado del ejemplo 2.8 0 = lim k~un+i ~un k lim |k~un+i k k~un k| , n$4
n$4
de donde no queda más remedio que lim |k~un+i k k~un k| = 0 ,
n$4
que es el criterio de convergencia de Cauchy para una sucesión de números reales. Por tanto, la sucesión {k~un k}4 n=1 es convergente. Ejemplo 2.13. Sea el espacio vectorial C4 2 con el producto escalar habitual 4 ³ ´ X ~ ~a, b = an bn . n=1
Demuestre que es un espacio de Hilbert. Solución: Consideremos una sucesión de Cauchy {~aJ }4 aJ = (aJ,1 , aJ,2 , ...). Por J=1 , con ~ tanto, jado un I arbitrario lim (~aJ+I ~aJ ) = ~0
J$4
lim |aJ+I,n aJ,n | = 0 n = 1, 2, ...
J$4
Todas las componentes de los vectores de la sucesión convergen por separado, pues cumplen el criterio de Cauchy para sucesiones de números complejos: lim aJ,n = an C .
J$4
Sin embargo esto no basta. Ahora hay que probar que la -tupla ~a = (a1 , a2 , ...) efectivamente pertenece a C4 2 , para lo que usamos el resultado del ejemplo anterior. Así, como la norma de los vectores de una sucesión de Cauchy convergen a un valor nito, la norma de ~a es nita y esto garantiza, por denición, que ~a C4 2 .
34
ESPACIOS DE HILBERT
Ejemplo 2.14. Consideremos el espacio de funciones L2 (R) con el producto escalar habitual Z (, ) =
+4 4
(x) (x) dx . 4
Dada de vectores {gn (x)}n=1 con término general gn (x) = ¡ la2 sucesión ¢ 2 exp n x /2 , calcule la norma del n-ésimo elemento de la sucesión. ¿Cuál es el límite de dicha sucesión? Solución: Por denición de norma: sZ s Z +4 1/4 1 +4 u2 2 (nx) kgn k = e dx = e du = . n n 4 4 De este modo, puesto que limn$4 kgn k = 0, el límite de la sucesión es la función nula de acuerdo con la denición estricta de límite. Ahora bien, si nos jamos en los valores que toma gn (x) para cada x, vemos que gn (0) = 1 cualquiera que sea el valor de n. Así, si ahora calculamos el límite a partir de los valores que toman las funciones de la sucesión en cada punto, el resultado sería ½ 0 si x 6= 0 lim gn (x) = u (x) = 1 si x = 0 n$4 que, en principio, no es la función nula. Esta paradoja no es tal. Al denir un norma estamos también deniendo cuál es nuestro concepto de límite y, en concreto, la convergencia de una sucesión se entiende siempre como convergencia bajo la norma en cuestión. El segundo cálculo no ha sido entonces correcto, ya que hemos tomado como criterio de convergencia la “convergencia puntual” y no la convergencia asociada a la norma. Aun así, la respuesta no es totalmente satisfactoria, puesto que parece que hay una diferencia entre la convergencia puntual (aquella que parece ser más intuitiva) y la convergencia asociada a la norma. Esta aparente contradicción se soluciona acudiendo a la teoría de la medida (desarrollada, entre otros, por Borel y Lebesgue) y redeniendo el concepto de integral denida. Sin entrar en detalles, la norma de la función anterior u (x) debería evaluarse como sigue: s μZ ¶ Z kuk =
lim
$0
4
|u (x)|2 +
+4
+
|u (x)|2 ,
límite que, evidentemente, es cero. Luego la función u (x) es la función nula al ser su norma igual a cero. En rigor, cuando consideramos un espacio de funciones, dos funciones serán iguales si los valores que toman coinciden
2.5 Espacios de Hilbert
35
excepto para un conjunto de valores aislados de la variable (técnicamente, si son iguales salvo en un conjunto de medida nula). Como consecuencia, un vector de L2 (R) no es realmente una función sino una clase (un conjunto) de funciones. Esto sugiere que en Mecánica Cuántica la información física de una función no dependerá de los valores que toma en puntos especícos, sino de cantidades integradas obtenidas a partir de la función. Ejemplo 2.15. Dado un intervalo cerrado D R, demuestre que L2 (D) es un espacio de Hilbert. Solución: Consideremos una sucesión de Cauchy en L2 (D) formada por las funciones 4 { n (x)}n=1 . Por tanto, para cualquier i, ° ° lim ° n+i n ° = lim
n$4
n$4
ÃsZ D
! ¯2 ¯ ¯ n+i (x) n (x)¯ dx = 0 .
Como el integrando es siempre positivo, necesariamente ¡ ¢ lim n+i (x) n (x) = 0 , x D n$4
salvo en puntos aislados. Sin embargo esto no es relevante (recuerde el ejemplo anterior). Para cada x D, la anterior igualdad es el criterio de convergencia de Cauchy para la sucesión de números reales { n (x)}4 n=1 . Por tanto, existe una función (x) tal que lim n (x) = (x) , x D
n$4
salvo en puntos aislados. Así, la sucesión de Cauchy converge a una función (x) pertenece a L2 (D) puesto que su norma es nita (al ser el límite de una sucesión de Cauchy de L2 (D)). Ejercicio 2.4. Considere el subconjunto de C4 2 formado por las -tuplas con un número nito de elementos no nulos. Demuestre que este subconjunto es un subespacio lineal, pero que no es un subespacio de Hilbert. Ejercicio 2.5. Sea el subespacio vectorial P [a, b] de los polinomios con coecientes complejos dentro del espacio de Hilbert L2 [a, b]. Demuestre que este subespacio vectorial no es un subespacio de Hilbert. Pm Sugerencia: Considere la sucesión de término general sm (x) = n=0 xn /n!. Pruebe que esta sucesión de polinomios es de Cauchy, pero su límite estricto es la función exp (x) que no es un polinomio. Ejercicio 2.6. Sea el subespacio vectorial C [a, b] de las funciones continuas de L2 [a, b]. Demuestre que C [a, b] no es un subespacio de Hilbert.
36
ESPACIOS DE HILBERT
Sugerencia: Considere la sucesión de término general
1 1+n n (x) = 0
si x ¡a+b 2 2n a+b a+b x si x a+b 2 , 2 + a+b si x 2 + a+b 2n
a+b 2n
¢
Pruebe que esta sucesión de funciones continuas es de Cauchy, pero que su límite es una función discontinua.
2.6
Bases ortonormales en espacios de Hilbert
• En esta sección deniremos el importante concepto de base ortonormal en un espacio de Hilbert. Sin embargo, en la denición es importante distinguir entre espacios de dimensión nita e innita. DEFINICIÓN: Sea H un espacio de Hilbert de dimensión nita. Un conjunto ortonormal B = {~e1 , ~e2 , ..., ~eN } es una base ortonormal de H si todo vector ~u H puede escribirse como una combinación lineal de los elementos de B: ~u =
N X
uj ~ej .
j=1
A los números complejos {uj }N u en la j=1 se les denomina coordenadas de ~ base ortonormal B. Dada la denición, observamos que una base ortonormal es simplemente una base lineal (o de Hamel) ortonormal. En espacios de dimensión innita, aunque existan, las bases lineales no son cómodas de usar (y, además, su utilidad práctica es limitada). En su lugar es preferible utilizar las llamadas bases de Fourier: DEFINICIÓN: Sea H un espacio de Hilbert de dimensión innita. Un conjunto ortonormal BF = {~e1 , ~e2 , ...}, de cardinal innito, es una base ortonormal o de Fourier de H si todo vector ~u H puede escribirse como un desarrollo de Fourier a partir de los elementos de BF , esto es, como ~u = lim
N $4
N X j=1
uj ~ej
4 X
uj ~ej .
j=1
Los números complejos {uj }4 u en la base j=1 son las coordenadas del vector ~ de Fourier BF . Nótese la diferencia. En el caso de dimensión nita la envolvente lineal de la base ortonormal es todo el espacio de Hilbert, pero no en el caso de
2.6 Bases ortonormales en espacios de Hilbert
37
dimensión innita. Esta distinción puede parecer articial, pero gracias a ella las propiedades de las bases ortonormales son siempre las mismas y el concepto de base de Fourier engloba, de manera natural, al de base lineal ortonormal en un espacio de dimensión nita. Así: TEOREMA: Sea H un espacio de Hilbert y B = {~e1 , ~e2 , ...} una base ortonormal de H. Sean ~u, w ~ H y {un }, {wn } las coordenadas de ~u y w ~ en la base B, respectivamente. Entonces: 1. Las coordenadas de ~u en la base B están dadas por X (~en , ~u) ~en . un = (~en , ~u) ~u = n
2. La norma de ~u puede calcularse como s X k~uk = |un |2 . n
3. Las coordenadas de la suma y del producto por un escalar son: (~u + w) ~ n = un + wn
;
(~u)n = un .
4. El producto escalar (~u, w) ~ puede calcularse como X (~u, w) ~ = un wn . n
Demostración: Demostraremos sólo los puntos 1 y 4 (dejando como ejercicio la de los puntos 2 y 3). Para probar el punto 1, partimos del desarrollo de Fourier (que se reduce aPuna combinación lineal si la dimensión del Hilbert es nita) ~u = n un~en . Multiplicando escalarmente por ~em y usando la linealidad del producto escalar (ya garantizada incluso para sumas innitas) ! Ã X X (~em , ~u) = ~em , un~en = un (~em , ~en ) . n
n
Como (~em , ~en ) = mn , queda (~em , ~u) = um . Para probar el punto 4, basta desarrollar el producto escalar y usar la ortonormalidad de los elementos de la base: Ã ! X X X (~u, w) ~ = un~en , wm~em = un wm (~en , ~em ) n
=
X n,m
m
un wm nm =
X n
n,m
un wn .
38
ESPACIOS DE HILBERT
• Naturalmente podemos extender el concepto de base ortonormal a subespacios de Hilbert. De nuevo distingamos los casos de dimensión nita e innita: DEFINICIÓN: Sea H un espacio de Hilbert y W H un subespacio de Hilbert. 1. Si W es de dimensión nita N , entonces un conjunto ortonormal B = {~e1 , ~e2 , ..., ~eN } W es una base ortonormal de W si todo vector ~u W puede escribirse como una combinación lineal de los elementos de B: ~u =
N X
ui ~ei =
i=1
N X
(~ei , ~u) ~ei
i=1
y, por tanto, todo vector que se pueda escribir como combinación lineal de elementos de B, pertenece a W. 2. Si W es de dimensión innita, entonces un conjunto ortonormal de cardinal innito BF = {~e1 , ~e2 , ...} W es una base ortonormal o de Fourier de W si todo vector ~u W puede escribirse como un desarrollo de Fourier de los elementos de BF : ~u =
4 X
ui ~ei =
i=1
4 X
(~ei , ~u) ~ei
i=1
y, por tanto, todo vector que se pueda escribir como desarrollo de Fourier de elementos de BF , pertenece a W.16 Recordemos que pueden haber subespacios lineales de H que, siendo de dimensión innita, no sean subespacios de Hilbert (por ejemplo el subespacio lineal de las funciones continuas de L2 [0, 1]). Entonces, el concepto de base de Fourier no tiene sentido (observe la frase con la que hemos cerrado las deniciones anteriores). Recíprocamente (pruebe a demostrarlo): TEOREMA:17 Sea H un espacio de Hilbert y Gort = {w ~ n } H un conjunto ortonormal. Deniendo el conjunto ( ) X X lin (Gort ) = ~u H tal que ~u = un w ~ n con |un |2 < , n
n
entonces 1. lin (Gort ) es un subespacio de Hilbert. 1 6 Esta
armación es consecuencia inmediata del hecho de que W es un subespacio de
Hilbert. 1 7 Deberíamos haber incluido este teorema al principio de la sección, estableciendo así un paralelismo entre el proceso de construcción de bases lineales en espacios de dimensión nita y de bases de Fourier en espacios de dimensión innita. Sin embargo, el objetivo fundamental de la sección es la denición de estas últimas, por lo que hemos preferido posponer el teorema hasta este momento.
2.6 Bases ortonormales en espacios de Hilbert
39
2. un = (w ~ n , ~u) , con n = 1, 2, 3, ... 3. Si el cardinal de Gort es nito, lin (Gort ) = lin (Gort ) • El lector, legítimamente, puede preguntarse si en todo espacio de Hilbert de dimensión innita existen bases de Fourier numerables, tal y como las hemos denido en los puntos anteriores. En todos los casos de interés físico la respuesta es armativa y se dice, entonces, que el espacio de Hilbert es separable. Puede entonces demostrarse que todas sus bases de Fourier son numerables y que todos sus subespacios de Hilbert son separables. Nótese la analogía entre esta armación y el hecho de que en un espacio vectorial nito todas las bases lineales poseen el mismo número de elementos y todos los subespacios lineales son de dimensión nita. Desde una perspectiva puramente matemática se admite la existencia de espacios de Hilbert en los que las bases de Fourier no son numerables, sino continuas, pero puesto que van a carecer de interés, supondremos sin excepción que el espacio de Hilbert H es separable. • Consideremos ahora un subconjunto linealmente independiente G de un espacio de Hilbert H. En muchos casos será importante transformar dicho subconjunto en otro, Gort , que sea ortonormal y tal que los elementos de Gort sean combinación lineal de los de G. Ello es posible, siempre y cuando G sea numerable, gracias al siguiente teorema (cuya demostración, meramente operativa, dejamos como ejercicio): TEOREMA: Sea H un espacio de Hilbert y G = {~u1 , ~u2 , ~u3 , ...} = {~un } un subconjunto numerable de H formado por vectores linealmente independientes. Resulta entonces posible construir un conjunto ortonormal Gort = {w ~ n }, con igual cardinal que el de G, tal que sus elementos son todos combinación lineal de los elementos de G. La regla para construir dicho conjunto ortonormal está dada por el llamado método de ortonormalización Gram-Schmidt, de modo que los vectores {w ~ n } están dados por: w ~1
=
w ~2
=
w ~n
1 ~u1 k~u1 k
1 [~u2 (w ~ 1 , ~u2 ) w ~ 1] k~u2 (w ~ 1 , ~u2 ) w ~ 1k .. . " # n1 X 1 ° ~un = ° (w ~ i , ~un ) w ~i Pn1 ° ° ~ i , ~un ) w ~ i° °~un i=1 (w i=1 .. .
• El método de Gram-Schmidt puede utilizarse para construir bases ortonormales a partir de conjuntos linealmente independientes G tales que su envol-
40
ESPACIOS DE HILBERT
vente lineal sea densa en el Hilbert (o todo el Hilbert si éste es de dimensión nita). Esto es, si dado un vector cualquiera del Hilbert w, ~ siempre podemos encontrar un vector ~u lin (G) tal que la norma kw ~ ~uk sea arbitrariamente pequeña. Aplicando el método de Gram-Schmidt a G tenemos la garantía de que el conjunto resultante, Gort , es una base de Fourier del Hilbert. Naturalmente, este comentario también es válido si nos restringimos a un subespacio de Hilbert. Veamos un ejemplo: Ejemplo 2.16. Sea el espacio de Hilbert L2 [1, 1] y el conjunto G = © ª 1, x, x2 , x3 , ... . Es evidente que lin (G) = P [1, 1], el subespacio de los polinomios denidos en [1, 1]. Como hemos visto, P [1, 1] no es un subespacio de Hilbert, pero puede demostrarse que es denso en L2 [1, 1]. Usando el método de Gram-Schmidt, construya una base ortonormal Gort = {P0 (x) , P1 (x) , P2 (x) , ...} del espacio de Hilbert a partir del conjunto G. Solución: Denotemos por un (x) = xn , n = 0, 1, 2, ... los elementos de G.18 Aplicando Gram-Schmidt: r 1 u0 (x) P0 (x) = = ku0 (x)k 2 Ahora construyamos la función accesoria 1 (x) = u1 (x)(P0 (x) , u1 (x)) P0 (x), que una vez normalizada, nos dará P1 (x): Z 1 1 1 x dx = x
1 (x) = u1 (x) (P0 (x) , u1 (x)) P0 (x) = x 2 1 2 (lógico, puesto que x y 1 son ortogonales al ser funciones impar y par denidas en un intervalo simétrico). Así, r
1 (x) 3
1 (x) = P1 (x) = =³ x. ´ 1/2 R +1 k 1 (x)k 2 2 | 1 (x)| dx 1 Pasemos ahora a P2 (x). Igualmente, construyamos la función accesoria
2 (x) = u2 (x) (P0 (x) , u2 (x)) P0 (x) (P1 (x) , u1 (x)) P1 (x) . Como P1 (x) es par y P0 (x) es impar
2 (x) = u2 (x) (P0 (x) , u2 (x)) P0 (x) Z +1 1 1 1 x2 dx = x2 = x2 3 2 1 2 1 8 Empezar
a contar desde cero o desde uno no es más que un criterio de conveniencia.
2.6 Bases ortonormales en espacios de Hilbert
41
y normalizando esta función,
2 (x)
1 P2 (x) = ³ = ´ 1/2 R +1 2 2 |
(x)| dx 2 1
r
¢ 5¡ 2 3x 1 . 2
Análogamente, para obtener P3 (x) usemos la función accesoria 3 (x) dada por
3 (x) = u3 (x)
2 X
(Pn (x) , u3 (x)) Pn (x)
n=0
y, operando (sólo hacen falta evaluar las integrales con n impar), 3
3 (x) = x3 x, 5 de donde P3 (x) = ³ R +1 1
3 (x)
´1/2 2 | 3 (x)| dx
1 = 2
r
¢ 7¡ 3 5x 3x . 2
Procediendo de igual manera para el resto:
i (x) = ui (x) μZ Pi (x) = obtenemos
i1 μZ X
1
n=0
+1 1
+1
¶ Pn (x) ui (x) dx Pn (x)
¶1/2 | i (x)| dx
i (x) 2
r ¢ 1 9¡ P4 (x) = 35x4 30x2 + 3 8 2 r ¢ 1 11 ¡ P5 (x) = 63x5 70x3 + 15x 8 2 r ¢ 1 13 ¡ P6 (x) = 231x6 315x4 + 105x2 5 16 2 etc.
Estas funciones son los polinomios normalizados de Legendre, importantes en el estudio formal del momento angular en Mecánica Cuántica. Además de ser una base de Fourier de L2 [1, 1], tienen una serie de propiedades interesantes. n 1. Pn (x) = (1) Pn (x)
42
ESPACIOS DE HILBERT
q 2. Pn (1) = n + 12 3. Pn (x) tiene n ceros, todos diferentes, en el intervalo (1, 1) . 4. Pn (x) es solución de la ecuación diferencial ¸ ¡ 2 ¢ d2 d x 1 + 2x Pn (x) = n (n + 1) Pn (x) . dx2 dx 5. Pueden obtenerse directamente mediante una “fórmula de Rodrigues”: r ¢n 1 2n + 1 dn ¡ 2 Pn (x) = 1 . x n! 2n 2 dxn
• Terminemos esta sección dando (sin demostración) otros ejemplos de bases ortonormales en espacios de Hilbert: 1. En un espacio de dimensión N , cualquier conjunto de N vectores ortonormales. 2. En C4 e1 , ~e2 , ~e3 , ...} con ~e1 = (1, 0, 0, ...) , ~e2 = 2 , la base canónica BF = {~ (0, 1, 0, ...) , ... 3. En L2 [0, L]: © ª (a) BF = 0 (x) , 1 (x) , 1 (x) , 2 (x) , 2 (x) , ... (base exponencial de Fourier ), con r 1 n (x) = exp (i2nx/L) . L (b) BF = { 0 (x) , 1 (x) , 2 (x) , 3 (x) , ...} (base de cosenos de Fourier ), con r r 1 2 ; n (x) = cos (nx/L) para n = 1, 2, 3, ... 0 (x) = L L (c) BF = { 1 (x) , 2 (x) , 3 (x) , ...} (base de senos de Fourier ), con r 2
n (x) = sin (nx/L) . L 4. En L2 (R+ ), R+ = [0, +): BF = {L0 (x) , L1 (x) , L2 (x) , ...} (base de funciones de Laguerre), con Ln (x) exp (x/2) · Ln (x) =
1 dn (xn exp (x)) exp (x/2) , n! dxn
siendo Ln (x) los polinomios de Laguerre.
2.6 Bases ortonormales en espacios de Hilbert
43
5. En L2 (R): BF = {H0 (x) , H1 (x) , H2 (x) , ...} (base de funciones de Hermite), con ¡ 2 ¢ 1 exp x /2 · Hn (x) 1/2 n (2 n! ) ¡ ¢ ¡ 2 ¢ dn exp x2 1 n , = (1) 1/2 exp x /2 dxn (2n n! ) Hn (x)
siendo Hn (x) los polinomios de Hermite. Debemos mencionar que las bases de senos de Fourier, Laguerre y Hermite se usan en el tratamiento cuántico del pozo cuadrado innito, el átomo de hidrógeno y el oscilador armónico, respectivamente. Igualmente, la base exponencial de Fourier se utiliza en la descripción cuántica de sistemas periódicos.
Ejercicio 2.7. Un conjunto ortonormal G es maximal cuando resulta imposible encontrar un vector normalizado del espacio de Hilbert ortogonal a G . Demuestre que una base ortonormal es un conjunto ortonormal maximal y que, recíprocamente, todo conjunto ortonormal maximal es una base ortonormal. Ejercicio 2.8. Demuestre que dado un conjunto ortonormal numerable W , siempre es posible encontrar una base ortonormal B ’ que contenga a W . Ejercicio 2.9. La base de funciones de Hemite se puede obtener a partir del método de Gram-Schmidt aplicado al conjunto de funciones linealmente independiente
© ¡ ¢ª4 G = xn exp x2 /2 n=0 De acuerdo con esto, obtenga las cuatro primeras funciones de Hermite. Ayuda: necesitará usar las siguientes integrales: Z
+
x2
e
dx =
Z ;
+
2 x2
x e
dx = 2
Z ;
+
4 x2
x e
3 dx = 4
Ejercicio 2.10. En el estudio mecano-cuántico del oscilador armónico es necesario resolver la siguiente ecuación diferencial
¸ d2 2 2 + u 2n 1 (x) = 0 dx
Demuestre que su solución es, salvo constante multiplicativa, la n-ésima función de Hermite.
44
2.7
ESPACIOS DE HILBERT
Operadores lineales en un espacio de Hilbert
• Resulta necesario, como ya se apuntó en el primer capítulo, hablar de los operadores lineales denidos en un espacio de Hilbert. En esta sección y la siguiente presentaremos unas deniciones generales, válidas para espacios de dimensión nita o innita indistintamente. b es cualquier apliDEFINICIÓN: Sea H un espacio de Hilbert. Un operador A b H, llamado cación de un subespacio lineal (no necesariamente de Hilbert) D(A) b le hace corresponder un dominio del operador, en H tal que a cada vector ~v D(A) b ~v H. segundo vector A b es el subconjunto R(A) b H denido como El recorrido de A n ³ ´ o b b b R(A) = ~ u H tal que existe w ~ D A de forma que ~u = A w ~ , b a todos los vectores de su esto es, el conjunto de resultados de la aplicación de A dominio. Nota importante: Conviene recordar siempre que para denir un operador no basta con indicar su regla de actuación, sino que además hay b Si al denir un operador omitimos esque establecer su dominio D(A). pecicar su dominio, implícitamente suponemos que éste es el más amplio compatible con la regla de actuación. b un DEFINICIÓN: Sea A un operador lineal si, para b (~ b ~u + A b ~v y que A u + ~v ) = A
b es operador de un espacio de Hilbert H. Se dice que A b y para todo complejo , se cumple que todo ~ u, ~v D(A), b (~ b~ A u) = A u.
Nota: Al haber impuesto que el dominio es siempre un subespacio lineal, la denición es consistente. • La denición de linealidad de un operador sólo se aplica a combinaciones lineales b es un operador lineal en un espacio de Hilbert H, nitas. Es decir, si A b A
N X
n~vn =
n=1
N X
bvn (N nito) . n A~
n=1
Surge ahora de manera natural la siguiente pregunta. Si P en un espacio de Hilbert de en a partir de una dimensión innita tenemos el desarrollo de Fourier ~ u= n=1 un~ base ortonormal ¿podemos armar que bu = A~
X
³ ´ b ~en , un A
n=1
b un operador lineal cuyo dominio contiene a la base ortonormal? La respuesta siendo A P b en ) converja, pero la convergencia es sí, siempre y cuando la expresión n=1 un (A ~ de esta suma no puede garantizarse a priori. Por tanto la extensión de la linealidad de un operador lineal a una suma de innitos términos está siempre condicionada a
2.8 Operaciones con operadores lineales
45
que se cumpla dicha convergencia. Veamos un ejemplo en el que converge.
P n=1
b ~en ) no un (A
Ejemplo 2.17. Consideremos el espacio L2 [0, 1] y la base de Fourier de senos BF = {1 , 2 , ...} con n (x) = 2 sin (nx). Denimos el operador lineal Pbx = d con dominio el conjunto formado por todas las funciones continuas i dx denidas en [0, 1] y cuya derivada es de cuadrado integrable en [0, 1]. Dada la función u (x) = 1 es obvio que Pbx u (x) = 0
Intente calcular este resultado a partir de las coordenadas de u (x) en la base de Fourier de senos. Solución: Las coordenadas de u (x) en dicha base son: Z un = (n , u) =
1 0
2 sin (nx) dx =
½
23/2 / (n) 0
n impar n par
Así Pbx u (x) = Pbx
X n=1
?
un n (x) =
X
un Pbx n (x) = 4
n=1
X
cos (nx) ,
n impar
expresión que no converge. De hecho¡el resultado es una ¢ función cuyas coordenadas en la base de Fourier de cosenos son 0, 2 2, 0, 2 2, ... y que, evidentemente, es de norma innita. El paso indicado con una interrogación no es correcto. Dado que en Mecánica Cuántica, el operador Pbx está relacionado con el momento lineal de una partícula, este resultado parece “preocupante”. Sin embargo, hay que mencionar otra vez que la información de interés físico se obtiene a partir de productos escalares. Así, esta “preocupación” no debe ser tal y, además, puede evitarse tal y como veremos en un ejemplo posterior ( ejemplo 2.25) b un operador lineal en H. Demuestre que R(A) b es un subesEjercicio 2.11. Sea A pacio lineal de H. b un operador en H. Demuestre que A b es lineal si y sólo si para Ejercicio 2.12. Sea A b todo ~u, ~v D(A) y para todo , C se cumple que b (~u + ~v ) = A b ~u + A b ~v A
2.8
Operaciones con operadores lineales
• En esta sección presentaremos deniciones importantes relativas a operaciones byB b son operadores lineales en entre operadores. En general, consideraremos que A un espacio de Hilbert H y un número complejo. Ahora bien, supondremos siempre
46
ESPACIOS DE HILBERT
que el dominio de los operadores contiene una base de Fourier de H,1 9 puesto que es lo que sucede en Mecánica Cuántica. Como consecuencia, el dominio de los operadores en un espacio de Hilbert de dimensión nita será siempre todo el espacio de Hilbert. • Empecemos con las operaciones más simples (suma, producto por un escalar, composición) y con la denición del operador inverso. b + B, b suma de A b y B, b se dene como DEFINICIONES: El operador lineal A ´ ³ b b bu + B~ bu . A+B ~ u = A~ b producto de A b por el escalar complejo , se A su vez, el operador lineal A, dene mediante ³ ´ ³ ´ b ~u = A~ bu . A TEOREMA: El conjunto de todos los operadores lineales denidos en un espacio vectorial U posee estructura de espacio lineal. Pruebe este importante teorema. Fíjese que implica que para cualesquiera operadores b B, b C b y para todo , C se cumple: lineales A, b+B b y A b son operadores lineales. 1. A ³ ´ ³ ´ b b b b b b b+B b=B b + A. b 2. A + B + C = A + B + C ; A b+b b 3. Existe el operador nulo b 0, tal que b 0~ u = ~0 ~u U, y A 0 = A. ³ ´ b tal que A b + A b = 0. 4. Existe el operador A ³ ´ b b ; ( + ) A b = A b + A. b b b + B 5. A + B = A ³ ´ b b ; 1A b=A b ; 0A b=b 6. () A = A 0 b donde Ib Por otra parte, a todo escalar C le corresponde un operador b = I, bu = ~u, para todo ~ es el operador unidad denido como I~ u H. Aunque pueda llevar b a alguna confusión, es muy habitual escribir b = , en lugar de b = I. b B, b producto o composición de los operadores DEFINICIÓN: El operador lineal A b b A y B, se dene como ³ ´ ³ ´ bB b ~u = A b B~ bu . A El producto de operadores cumple las siguientes propiedades (pruébense como ejercicio): ³ ´ ³ ´ b B bC b = A bB b C b (propiedad asociativa). 1. A 1 9 Se
dice, entonces, que los operadores son de dominio denso. Sin embargo, esto no quiere decir que el dominio del operador sea todo el espacio de Hilbert. Basta pensar en el operador derivada en L2 (R) con dominio restringido a funciones continuas de L2 (R) pero que incluye, por ejemplo, la base ortonormal de Hermite.
2.8 Operaciones con operadores lineales
47
³ ´ ³ ´ ³ ´ b b b b b b 2. A B = A B = A B . ³ ´ ³ ´ b+B b C b=A bC b+B bC b;A b B b +C b =A bB b+A b C. b 3. A Sin embargo, el producto de operadores no es conmutativo, es decir, en general bB b 6= B b A. b Por tanto, a la hora de manipular productos de operadores es esencial A respetar el orden en el que aparecen DEFINICIÓN: La potencia n-ésima (siendo n un número natural) del operador b consigo mismo n veces: b es el operador lineal A bn resultado de componer A lineal A b A... b A b (n veces) bn = A A b0 = I. b Por convenio: A b se dice invertible si para cualquier par ~u, ~v DEFINICIÓN: Un operador lineal A b con ~ bu 6= A~ bv . Si A b es invertible se puede denir el operador D(A) u 6= ~v , entonces A~ b cuya regla de actuación es b1 , con dominio igual al recorrido de A, inverso A bw b1 ~ u = w, ~ donde A ~ =~ u. A b sea TEOREMA: La condición necesaria y suciente para que un operador lineal A invertible es que bv = 0 ~v = 0 . A~ Intente probar este importante teorema. A su vez, demuestre las siguientes propiedades relativas al operador inverso (sin prestar atención a los problemas que puedan surgir debidos a los diferentes dominios de denición de los operadores): b1 es lineal. 1. A ³ ´1 b1 . b b b 1 A 2. AB =B ´1 ³ 1 b b = A. 3. A ³ ´1 b b1 (si 6= 0). 4. A = (1/) A • El llamado conmutador de dos operadores lineales se utiliza muy frecuentemente en Mecánica Cuántica. Además de su denición, es muy importante que recuerde una serie de propiedades relacionadas (que probaremos a continuación de la denición como ejemplos resueltos). b y B b se dene su conmutador DEFINICIÓN: Dados dos operadores lineales A como el operador lineal b B] b =A bB bB b A. b [A, by B b conmutan o que son compatibles si su conmuSe dice que dos operadores A bB b=B b A. b tador es igual a cero, lo cual implica que A
48
ESPACIOS DE HILBERT
bB, b C] b =A b [B, b C] b + [A, b C] b B. b Ejemplo 2.18. Demostrar la relación [A Solución: Por denición, i h bB, b C b =A bB bC bC bA bB b A bC bB b resulta y sumando y restando A h i h i h i b b b b b b b b b b b b b b b b b b b b b AB, C AB C AC B + AC B C AB = A B, C + A, C B. De modo análogo se puede demostrar h i h i h i b B bC b = A, b B b C b+B b A, b C b . A,
Ejemplo 2.19. Demostrar que, dado un conjunto cualquiera de operadores bk , sus conmutadores satisfacen la propiedad distributiva; es bi , B lineales A decir # "M N h N M X i X X X bk . bi , B bi , bk = A A B i=1
i=1 k=1
k=1
Solución: La demostración es inmediata aplicando la propiedad distributiva de los propios operadores lineales "M # ÃM !Ã N ! ÃN !Ã M ! N X X X X X X bi , bk = bi bk bk bi A B A B B A i=1
=
N M X X i=1 k=1
k=1
bi B bk A
N M X X
i=1
k=1
bk A bi = B
i=1 k=1
N ³ M X X
k=1
´ bk A ck B bi = bi B A
i=1 k=1
i=1 N h M X X
i bk . bi , B A
i=1 k=1
• DEFINICIÓN: Sea g (x) una función analítica de variable compleja, siendo P n b g (x) = su desarrollo en serie de Taylor. Dado un operador lineal A, j=0 n x b mediante la regla de actuación denimos formalmente el operador g(A) N ³ ³ ³ ´ ´ X ´ X n b bn ~ b g A ~u = lim n A ~ u n A u N
n=0
n=0
b estará implícitamente compuesto por aquellos vectores El dominio del operador g(A) para los que la anterior expresión converja.2 0 Este tipo de operadores son muy corrientes en Mecánica Cuántica, por lo que conviene profundizar algo más mediante los siguientes ejemplos. b u es formalmente el límite de la sucesión de término general este caso tenemos que g(A)~ PN bn ~ = n=0 n ( A u ).
2 0 En
w ~N
2.8 Operaciones con operadores lineales
49
Ejemplo 2.20. Demuestre que dada la función analítica g (x) el operador b es lineal. g(A) Solución: b De acuerdo con la denición Sean ~u, ~v dos vectores del dominio de g(A). N ³ ´ h i X b (~ bn (~u + ~v ) = g A n A u + ~v ) = lim N
lim
N
N X
bn ~u + lim nA
N
n=0
n=0
N X
³ ´ ³ ´ bn~v = g A b ~ b ~v nA u+g A
n=0
b (~u) = g(A) b ~ Análogamente se demuestra que g(A) u. b y B b dos operadores lineales. Demostrar que, en Ejemplo 2.21. Sean A b b b b general, eA eB 6= eA+B . ¿Cuándo será cierta la igualdad? Solución: Formalmente b
eA =
X 1 bn A , n! n=0
b0 = 1. Así, donde A X X 1 1 bn b m e e = A B . n! m! n=0 m=0 b B b A
Haciendo un cambio en los índices b B b A
e e =
N X X N =0 m=0
à ! N X 1 bN m b m 1 1 X N bN m b m B = B , A A m (N m)! m! N! m=0 N =0
donde aparece explícitamente la fórmula del binomio de Newton. Por otro lado b B b A+
e
X 1 ³ b b ´N A+B = . N! N =0
by B b no conmutan, por lo que no podemos armar que 2 1 Sin embargo, en general A Ã ! N X N bN m b m ³ b b ´N B = A+B A m m=0 2 1 Por
ejemplo ³ ´3 b +A bB bA b+B bA b2 + B b+B bA bB b +A bB b2 + B b+B b b3 + A b2 B b2A b3, A =A
que no es igual a b2 B b3. b + 3A bB b2 + B b3 + 3A A
50
ESPACIOS DE HILBERT
b b b b b + B) b N se y, entonces no se cumple que eA eB = eA+B . La igualdad sólo es cierta si (A PN ¡N ¢ bN m b m puede desarrollar usando la expresión del binomio de Newton m=0 m A B , b b lo cual es sólo posible si A y B conmutan, ya que entonces podemos reordenar los b + B) b N. términos que aparecen en la expansión directa de (A
• Es bastante habitual la construcción y manipulación de operadores dependientes de un parámetro. Es por ello por lo que la siguiente denición y los ejemplos que la siguen son importantes. b DEFINICIÓN: Dado un operador A() que depende de un parámetro , se dene la derivada del operador con respecto al parámetro en la forma b b + ) A() b dA() A( = lim . 0 d b (), B b () dependientes del mismo Ejemplo 2.22. Dados dos operadores A parámetro , demuestre la relación ´ b b d ³b b () = dA () B b () + A b () dB () A () B d d d b () es invertible, demuestre que A su vez, si A ´ b d ³b b ()1 dA () A b ()1 A ()1 = A d d Solución: Para demostrar la primera relación partimos de b + )B( b + ) A() b B() b A( = b + )B( b + ) A( b + )B() b b + )B() b b B() b A( + A( A() = i h h i b + ) A() b b + ) B( b b + ) B() b A( A( B() + y tomando el límite 0 obtenemos la relación pedida. b A() b 1 = Ib y apliquemos la fórmula anterior. Consideremos ahora la identidad A() Puesto que el operador identidad no depende evidentemente de ningún parámetro, resulta b b 1 dA() dA() 1 b b = 0, A() + A() d d b ()1 , de donde, actuando por la izquierda con A b 1 b dA() b 1 dA() A() b 1 . = A() d d
2.8 Operaciones con operadores lineales
51
Nótese que no podemos escribir el miembro de la derecha en la forma i2 ³ ´ h b b 1 dA()/d A() b b 1 conmute con dA()/d. pues, en general, no está garantizado que A() Pensemos 2 b con [B, b C] b 6= 0. Entonces b b + C, por ejemplo, en un operador de la forma A() =B b b que evidentemente no conmuta con A, b pues hemos dicho que C b no dA()/d = 2C, b conmuta con B. Ejemplo 2.23. Calcular las derivadas con respecto a de los operadores b b b eA y eA eB . Solución: b El operador eA se puede desarrollar formalmente en serie de potencias como ³ ´ X bn n A b = exp A n! n=0
y, derivando término a término, tenemos ³ ´ d b exp A d
= =
X X bn bn1 nn1 A n1 A b = A n! (n 1)! n=0 n=1 ! Ã ³ ´ n n X A b b exp A b . b =A A n! n=0
Aplicando ahora la regla de derivada del producto que hemos visto en el problema anterior ³ ´ ³ ´´ deAb ³ ´ ³ ´ deBb d ³ b b b b exp A exp B = exp B + exp A d d d ³ ´ ³ ´ b b B B b Be b b exp A b e + exp A =A ³ ´ ³ ´ ³ ´ b · A b+B b · exp B b = exp A Hemos escrito la última teniendo en cuenta que ³ ´expresión en forma más³ compacta, ´ b conmuta con exp A b y B b conmuta con exp B b . Sin embargo, hemos de tener A ³ ´ b b b . siempre en cuenta que en general A no conmutará con B ni con exp B b1 existe, encontrar una expresión en serie Ejemplo 2.24. Suponiendo que A ³ ´1 b b de potencias de para el operador A B . Particularice el resultado b = I. b para B Solución: Escribamos ³
b B b A
´1
=
X n=0
bn , n C
52
ESPACIOS DE HILBERT
bn son operadores a determinar. Para ello, multiplicamos a la izquierda por donde C ³ ´ b B b , de modo que A Ib =
X
n
³
³ ´ ´ X b b bC bn1 b b bC bn B b A B Cn = AC0 + n A
n=0
n=0
e igualando ahora los coecientes de las sucesivas potencias de obtenemos bC b0 A bC bn1 bC bn B A
=
Ib
=
0
b0 = A b1 C bn = A b1 B bC bn1 , C
de manera que ³
b B b A
´1
=
bA b1 + 2 A b1 B bA b1 B bA b1 b1 + A b1 B A b1 B bA b1 B bA b1 B bA b1 + · · · +3 A
b1 y B b Es importante tener en cuenta el orden en el que aparecen los operadores A 1 b b en cada término del pues en general A y B no conmutan. En el caso i h desarrollo, 1 b = 0 podemos reordenar los operadores y entonces b ,B particular en que A ³
b B b A
´1
b2A b3 + 3 B b3A b4 + · · · b1 + B bA b2 + 2 B =A
b = I, b tendremos Si ahora particularizamos al caso B ³
³ ´n ´1 Y 1 2 2 b3 1 b1 . b b b b b A = A + A + A + ... = A A I n=0
Ejercicio 2.13. Conscientemente, hemos omitido el dominio de los operadores suma, producto por un escalar y composición. Indique cuáles son los dominios máximos b + B, b A byA bB b en función de los dominios de A b y B. b posibles de A Ejercicio 2.14. De igual manera que podemos construir un operador dependiente de un cierto parámetro , es posible construir vectores que también dependan de dicho b () y w parámetro. De esta forma, si A ~ () son un operador y un vector dependientes de un parámetro, demuestre que ´ b () dA ~ () d ³b b () d w A () w ~ () = w ~ () + A d d d donde w( ~ + ) w() ~ d w() ~ = lim . 0 d
2.9 Operador adjunto. Representación matricial
2.9
53
Operador adjunto. Representación matricial
• Empecemos deniendo el llamado operador adjunto. b un operador lineal en un espacio de Hilbert H. El operador DEFINICIÓN: Sea A b b† , se dene mediante la regla de actuación adjunto de A, al que llamaremos A ´ ³ ³ ´ b† ~ b ~v , ~u , ~v D(A) b y ~u D(A b† ) u = A ~v , A bv ). b† ~u, ~v ) = (~ o, equivalentemente, tomando complejos conjugados, (A u, A~ † b ), será siempre el más extenso posible Por denición, el dominio del adjunto, D(A 22 compatible con la regla de actuación. Algunas propiedades del operador adjunto son (demuéstrense como ejercicio sin prestar atención a posibles problemas relacionados con los dominios de denición): ³ ´† b + B b = A b† + B b † , donde y son números complejos. 1. A ³ ´† b† A b† (¡atención al cambio de orden!). b b 2. A B = B ³ ´† ³ ´1 b1 = A b† 3. A . ³ ´† bv , ~v D(A). b b† ~v = A~ 4. A ´ P ³b b b† ~ 5. A u = n A~ en , ~u ~en , con {~en } una base ortonormal contenida en D(A). • El operador adjunto tiene una importancia especial en Mecánica Cuántica, pero de momento podemos utilizarlo para obtener una relación sencilla que nos permite bu en una base de Fourier en términos de las coordenadas calcular las coordenadas de A~ de ~ u en dicha base. Denamos, en primer lugar, la llamada representación matricial de un operador y, a continuación, pasaremos a describir el procedimiento. b un operador lineal en un espacio de Hilbert H y BF = DEFINICIÓN: Sea A b Denimos los elementos de {~e1 , ~e2 , ...} una base ortonormal contenida en D(A). b en la base BF como el conjunto de números complejos matriz del operador lineal A ´ ³ b ~en Akn = ~ek , A Los complejos Akn denen una “matriz” cuyo elemento en la columna k-ésima y la la n-ésima es Akn . A esta matriz recibe el nombre de representación matricial b en la base BF .2 3 del operador A b sea un operador de dominio que la denición tenga sentido es imprescindible que A denso en H. Como ya hemos supuesto que este es el caso, no hemos incluido esta importante restricción en la denición. 2 3 Hemos entrecomillado matriz porque en un espacio de Hilbert de dimensión innita dicha matriz tendrá innitas las y columnas. En un espacio lineal de dimensión N, la representación matricial de un operador lineal será siempre una matriz N × N. 2 2 Para
54
ESPACIOS DE HILBERT
b un operador lineal en un espacio de Hilbert H y BF = {~e1 , ~e2 , ...} TEOREMA: Sea A b como en D(A b† ). Si {uk } son las couna base ortonormal contenida tanto en D(A) b~ u en ordenadas de un vector ~ u en la base BF , entonces la n-ésima coordenada de A dicha base está dada por ´ X ³ b ~en , A ~u = Ank uk k
bek ) el elemento de matriz n, k del operador A b en la base BF . con Ank = (~en , A~ Demostración: La idea de la demostración es evitar la actuación del b sobre un desarrollo de Fourier, ya que hemos visto en un operador A ejemplo anterior que esto puede dar lugar a inconsistencias. Así, en un b primer paso, usamos el operador adjunto para “mover” el operador A, haciendo que actúe sobre el término de la izquierda en el producto escalar: ! Ã ! Ã ³ ´ X X † b~ b b ~en , ~en , A u = ~en , A uk~ek = A uk~ek k
k
b† )). Ahora podemos usar la linea(fíjese cómo es necesario que ~en D(A lidad del producto escalar para transformar el último miembro: ³ ´ X ³ ´ b ~u = b†~en , ~ek ~en , A uk A k
y usando de nuevo la denición de adjunto “movemos” otra vez el operador para que, esta vez, actúe sobre el término de la derecha en el producto escalar: ³ ´ X ´ X ³ b b uk ~en , A~ek = Ank uk , ~en , A ~u = k
k
llegando al resultado deseado. b podemos reEn denitiva, usando la representación matricial de un operador A escribir su regla de actuación sobre un vector ~ u de manera que podamos trabajar con ella en términos de coordenadas, es decir, usando solamente los escalares Amn y un . La única condición especial que hemos impuesto es que la base ortonormal pertenezca tanto al dominio del operador como al de su adjunto, lo que siempre sucede en aplicaciones prácticas. Enunciemos algunas propiedades de la representación matricial (muy sencillas de probar) que usaremos en muchas ocasiones: b + B) b nk = Ank + Bnk 1. (A b nk = Ank 2. (A) bB) b nk = P Anj Bjk 3. (A j b† = Akn : la matriz de A b† es la traspuesta conjugada de la de A. b 4. A nk
2.9 Operador adjunto. Representación matricial
55
Finalicemos la sección retomando el ejemplo 2.17 en el que vimos que no se podía extender la linealidad de un operador lineal a un desarrollo de Fourier. Observaremos en este ejemplo que usando la representación matricial ya no hay problema alguno. (Debemos indicar que hay algún paso técnico asociado a la manipulación de series numéricas): d Ejemplo 2.25. Sea el operador lineal Pbx = i dx en el espacio de Hilbert 2 L [0, 1] con dominio las funciones contínuas C [0, 1] tales que su derivada pertenece a L2 [0, 1]. a) Calcule su representación matricial en la base de Fourier de senos BF = {1 , 2 , ...} con n (x) = 2 sin (nx). b) Calcule Pbx u (x), siendo u (x) = 1, usando dicha representación matricial. Solución: a) Los elementos de matriz Pmn se obtienen directamente: Z 1 ´ ³ Pmn = m , Pbx n = 2in sin (mx) cos (nx) dx = 0 ½ m2imn si n + m es impar 2 n2 = 0 si n + m es par
y así la “matriz” innita que P11 P12 P13
P P22 P23 ³ ´ 21
Pbx = P31 P32 P33
P41 P42 P43 .. .. .. . . .
representa a Pbx en la base BF es: 4 0 P14 ... 0 3i 4 12
P24 ... 0 i 5 3i 12
5i P34 ... = 0 0 8 24
15 P44 ... i 0 7 i .. .. .. .. .. . . . . .
b) Las coordenadas de u (x) en la base de senos son ½ 3/2 Z 1 2 / (n) un = (n , u) = 2 sin (nx) dx = 0 0 Por tanto, la coordenada k-ésima de Pbx u (x) es 0 ´ ³ ¶ 3/2 X X μ b 2ikn 2 Pmn un = Px u = 2 k 2 k n n n=1 n impar
8 15 i
0
24 i 7
0 .. .
... ... ... ... .. .
n impar . n par
si k es impar si k es par
.
Ahora bien, para k par impar μ
X n
2ikn 2 k n2
¶
impar ³ ´ k X 23/2 1 = i8 k , ¡ k ¢2 = i tan n 2 n 2 n2 4 2 2
donde en el último paso hemos usado el desarrollo en fracciones parciales de la función tangente.2 4 Como k es par, i tan (k/2) = 0 y, como era de esperar, todas las 2 4 Véase,
por ejemplo, la obra Fórmulas y tablas de matemática aplicada de M.R. Spiegel, J. Liu y L. Abellanas (Ed. McGraw-Hill, Serie Schaum, 2000).
56
ESPACIOS DE HILBERT
coordenadas son nulas:
³
´ Pbx u = 0 , k . k
Por consiguiente, Pbx u (x) = 0.
2.10
Operadores hermíticos y autoadjuntos
• De todos los operadores lineales posibles en un espacio de Hilbert, en el formalismo cuántico tienen especial importancia los llamados operadores autoadjuntos, ya que son estos los que, precisamente, estarán asociados a las magnitudes físicas medibles. Pasemos a denirlos y enunciar algunas de sus propiedades (todas ellas de uso frecuente en Mecánica Cuántica). b es hermítico DEFINICIONES: Se dice que un operador lineal A ³ ´ ³ ´ ³ ´ bw bv , w b , ~v , A ~ = A~ ~ , ~v , w ~ D A
25
si
b y su adjunto A b† coinciden para es decir, si las reglas de actuación del operador A b todos los vectores del dominio de A. b Además, un operador hermítico A es autoadjunto si, además, cumple que ³ ´ ³ ´ b =D A b† , D A b=A b† (coincidencia de las reglas de actuación y de los dominios) lo que implica que A Como acabamos de decir, los operadores de interés en Mecánica Cuántica son autoadjuntos. En espacios de dimensión nita, en los que hemos impuesto que el dominio de los operadores lineales es todo el espacio de Hilbert, los operadores hermíticos son también autoadjuntos. Sin embargo, en espacios de Hilbert de dimensión innita no es difícil encontrar operadores hermíticos que no son autoadjuntos, ya que el dominio del operador adjunto resulta ser más amplio. Discernir rigurosamente si un operador es autoadjunto o simplemente hermítico no es a menudo una labor fácil, ya que requiere un análisis detallado del dominio de denición del operador. Veamos un ejemplo que ilustra esta situación. d Ejemplo 2.26. Sea el operador Pbx = i dx de L2 [a, b]. Determine si Pbx es autoadjunto dependiendo de que su dominio D(Pbx ) sea: a) C1 = {las funciones contínuas C [a, b] tales que su derivada pertenece a L2 [a, b]}. b) Las funciones de C1 tales que (a) = (b). c) Las funciones de C1 tales que (a) = (b) = 0. Solución: Por denición, el operador Pbx será hermítico si y sólo si se cumple el criterio: ³ ´ ³ ´ ³ ´ , Pbx = Pbx , , (x) , (x) D Pbx . 2 5 También
se dice hermitiano o simétrico.
2.10 Operadores hermíticos y autoadjuntos Sustituyendo Pbx por su expresión Z ´ Z b ³ b b (x) Px (x) dx = i , Px = a
57
b
(x)
a
d (x) dx , dx
e integrando por partes Z b ³ ´ d (x) b
(x) dx i [ (b) (b) (a) (a)] , Px = i dx a Z b d [i (x)]
(x) dx i [ (b) (b) (a) (a)] = dx a ¶ Z bμ d [i (x)]
(x) dx i [ (b) (b) (a) (a)] = dx a Z bh i Pbx (x) (x) dx i [ (b) (b) (a) (a)] . = a
En denitiva
³
´ ³ ´ , Pbx = Pbx , i [ (b) (b) (a) (a)] ,
independientemente del dominio de denición del operador. Así, en el caso a) el operador no es hermítico (y, por tanto, tampoco autoadjunto) ya que el término (b) (b) (a) (a) no tiene por qué anularse para todo par de funciones en su dominio. Sin embargo, en los casos b) y c) dicho término sí se anula, por lo que el operador Pbx es, como mínimo, hermítico. Ahora bien, el operador será autoadjunto si todos los vectores (x) H que veriquen las dos condiciones ¸ ¸ Z b Z b ³ ´ d d i (x) (x) dx = (x) i (x) dx , (x) D Pbx dx dx a a ¯2 Z b¯ ¯ ¯ ¯i d (x)¯ dx < ¯ ¯ dx a
pertenecen a D(Pbx ). En este ejemplo, dichas funciones son las funciones continuas con derivada de cuadrado integrable y para las que (a) = (b), esto es, el dominio del operador Pbx en el caso b). En resumen: caso a): Pbx no es hermítico ni autoadjunto (dominio demasiado extenso). caso b): Pbx es autoadjunto (y por tanto, hermítico). caso c): Pbx es hermítico, pero no autoadjunto (dominio demasiado restringido) Resulta evidente que una preocupación excesiva relacionada con los dominios de los operadores puede interferir en la comprensión y aplicación de los principios fundamentales de la teoría cuántica. Esto sólo tiene su importancia en tratamientos mucho más formales, que están muy por encima del nivel de este libro. Por ello, a partir de ahora damos por supuesto que el dominio de un operador hermítico
58
ESPACIOS DE HILBERT
es tal que el carácter autoadjunto del operador esté garantizado, por lo que usaremos indistintamente los términos hermítico y autoadjunto. Empero, hemos querido incluir el ejemplo anterior como nota de atención: no es excesivamente difícil plantear situaciones en las que haya una aparente contradicción con algunos de los importantes resultados que veremos en las siguientes secciones. En denitiva: b es autoadCRITERIO PRÁCTICO: En Mecánica Cuántica, un operador A † b=A b , si y sólo si junto, es decir A ³ ´ ³ ´ ³ ´ bw bv , w b . ~v , A ~ = A~ ~ , ~v , w ~ D A
Dicho esto, enunciemos las siguientes propiedades de los operadores autoadjuntos “en Mecánica Cuántica” (demuéstrense como ejercicio): byB b son autoadjuntos y a, b R, entonces aA b + bB b es autoadjunto. 1. Si A b es autoadjunto, entonces A bn , con n un número natural, es también auto2. Si A adjunto. 3. Si BF es una base ortonormal dentro del dominio de un operador autoadjunto b la representación matricial de A b en esa base cumple Ank = Akn . Es decir, A, la representación matricial coincide con su compleja conjugada. b es autoadjunto, (~ bu) = (A~ bu, ~ b 4. Si A u, A~ u)D ER para todo ~u D(A). A esta b cantidad, simbolizada muchas veces por A , se le denomina valor medio o b para el vector ~ valor esperado del operador autoadjunto A u. Usando esta última propiedad, se tiene la siguiente denición: ³ ´ b DEFINICIÓN: Un operador autoadjunto es positivo si ~u, A~ u 0 para todo b ~u D(A). Ejemplo 2.27. Sea el espacio de Hilbert L2 (D), siendo D R un intervalo cerrado. Dada una función real de variable real f (x), denimos el operador b mediante la siguiente regla de actuación para cualquier función (x) f (X) perteneciente a su dominio ³ ´ b (x) = f (x) (x) f X En Mecánica Cuántica, estos operadores estarán relacionados con magnitudes físicas dependientes de la posición. b es un operador lineal. a) Probar que f (X) b es autoadjunto. b) Probar que f (X) b sea un operador poc) ¿Qué condición ha de cumplir f (x) para que f (X) sitivo? Solución: b es el máximo a) Nótese que, de acuerdo con nuestro convenio, el dominio de f (X) posible. Es decir, ¾ Z ³ ³ ´´ ½ 2 2 2 b f (x) | (x)| dx es nito . D f X = (x) L (D) tal que D
2.10 Operadores hermíticos y autoadjuntos
59
b y , escalares complejos. Entonces, Sean (x) y (x) dos funciones de D(f (X)) ³ ´ b ( (x) + (x)) = f (x) ( (x) + (x)) f X ³ ´ ³ ´ b (x) + f X b (x) = f (x) (x) + f (x) (x) = f X b es lineal. por lo que el operador f(X) b) Por denición, f (x) es real, y esto implica Z ³ ³ ´ ´ b = (x) f (x) (x) dx , f X ZD ³ ³ ´ ´ b , , = [f (x) (x)] (x) dx = f X D
b es autoadjunto de donde f (X) c) Ha de cumplirse, para cualquier (x), que ³ ³ ´ ´ Z b = , f X f (x) | (x)|2 dx 0 , D
para lo que es necesario y suciente que f (x) 0 para todo x D. Ejemplo 2.28. Sea el espacio de Hilbert L2 (R). Denimos el operador d Pbx = i dx , con dominio las funciones continuas con derivada de cuadrado integrable. Este operador está relacionado la representación del momento lineal en Mecánica Cuántica. Demuestre que es autoadjunto. Solución: Según el criterio práctico, dadas dos funciones (x) , (x) D(Pbx ) hay que probar que ´ ³ ´ ³ b b , Px = Px , . Para ello basta tener en cuenta que las funciones de cuadrado integrable necesariamente se anulan en x = ±: μ ¶ ³ ´ Z + d , Pbx = (x) dx (x) i dx ¶ Z + Z + μ ³ ´ d (x) d b i (x) (x) dx = Px , =i (x) dx = dx dx y queda así demostrado que Pbx es autoadjunto. byB b dos operadores autoadjuntos en un espacio de Ejemplo 2.29. Sean A b B] b es autoadjunto. Hilbert H. Demuestre que el operador i[A, Solución: b B] b usando las propiedades del operador adjunto vistas Calculemos el adjunto de i[A, en la sección 2.9 ³ h ³ ´† ³ ´† ³ ´† i´† b B b bB b iB bA b = iA bB b iB bA b i A, = iA ³ ³ ´† ´† b†A b† B b† + iA b†. bB b +i B bA b = iB = i A
60
ESPACIOS DE HILBERT
by B b son autoadjuntos: Como A ³ h ³ ´ h i´† i bA b+ iA bB b=i A b B b bB bB bA b = i A, b B b , i A, = i B quedando así demostrada la armación. b un operador autoadjunto y Ejercicio 2.15. Sea A X g (x) = n xn ; n R n
b existe, demuestre que también es autoadjunto. Análogamente Si el operador g(A) b existe, entonces demuestre que si el operador g(iA) ³ ³ ´ ´ ³ ³ ´ ´ b ~v = g iA b ~ ~ u, g iA u, ~v .
2.11
Operadores unitarios. Cambios de base
• En Mecánica Cuántica, los llamados operadores unitarios aparecen al estudiar la evolución temporal de un sistema físico y también están relacionados con las posibles simetrías del sistema. b es unitario si U bU b† = U b †U b = 1 (es decir, el DEFINICIÓN: Un operador lineal U inverso coincide con el adjunto). Ejemplo 2.30. Sean Uji los coecientes de la representación matricial de b en una base ortonormal {~en }. un operador unitario U b es unitario, entonces a) Demostrar que si U X |Uji |2 = 1 j
para todo i. b es unitario, entonces b) Probar que si U ° ° °b ° °U~v ° = k~v k para todo ~v D (U ). Solución: a) La demostración es operativa: ´ ³ ´ X³ ´³ ´ X X X³ b ei b ei = b ei b ei , ~ej ~ej , U~ ~ej , U~ ~ej , U~ |Uji |2 = Uji Uji = U~ j
j
³
b ei , U~ b ei = U~
´
j
³ ´ b ei = (~ei , ~ei ) = 1. b † U~ = ~ei , U
j
b) Es consecuencia inmediata de la denición: ° ° r³ ´ p ´ r³ °b ° † b b b b U ~v , U ~v = ~v , U U ~v = ( ~v , ~v ) = k~v k . °U ~v ° =
2.11 Operadores unitarios. Cambios de base
61
b1 y U b2 son dos operadores lineales uniEjemplo 2.31. Demostrar que si U b2 es unitario. b1 U tarios, entonces U Solución: b1 U b1 U b2 )† (U b2 ). Usando las propiedades del operador adjunto, la propieEvaluemos (U b2 son unitarios, b1 y U dad asociativa del producto de operadores, y el hecho de que U ´† ³ ´ ³ ´ ³ b2† U b2† U b1 U b1† U b2 = U b2 b2 = U b1 U b2 = 1 . b1 U U U ³ De igual forma se demuestra que
b1 U b2 U
´³
b2 b1 U U
´†
= 1.
b es autoadjunto, entonces el operador Ejemplo 2.32. Demuéstrese que si A b eiA es unitario. Solución: En primer lugar tengamos en cuenta que b iA
e
N X in bn A = lim N n! n=0
implica que ³
b iA
e
´†
N X (i)n ³ bn ´† = lim A N n! n=0
b es autoadjunto, A bn también lo es. Por tanto, Como A ³
b
eiA
´†
N X b (i)n bn A = eiA . N n! n=0
= lim
b
b
b y iA b conmutan y, usando Ahora necesitamos evaluar eiA eiA . Evidentemente iA el resultado derivado en el ejemplo 2.21 b
b
eiA eiA b
b
eiA eiA
b
b
=
eiAiA = e0 = 1
=
eiA+iA = e0 = 1.
b
b
b
Como consecuencia, eiA es unitario. • Por otro lado, los operadores unitarios están relacionados con los cambios de base. Dadas dos bases ortonormales, existe un operador unitario gracias al cual podemos obtener las coordenadas de un vector y la representación matricial de un operador en la segunda base a partir de las coordenadas del vector y la representación matricial del operador en la primera base, respectivamente. Los siguientes ejemplos ilustran el procedimiento. Ejemplo 2.33. Sea {~ei } una base ortonormal de un espacio de Hilbert H y b un operador unitario tal que su dominio contiene a la base ortonormal U {~en }.
62
ESPACIOS DE HILBERT
P P b~ b en . a) Demostrar que si ~ u = n un~en H, entonces U u = n un U~ b) Demostrar que, salvo restricciones articiales, el dominio de un operador unitario es todo el Hilbert. b es c) Si {f~i } es el transformado de la base {~en } mediante la actuación de U, b ei , probar que la condición necesaria y suciente para que {f~i } decir f~i = U~ b sea unitario. sea también una base ortonormal de H es que el operador U Solución: a) Si el espacio de Hilbert es de dimensión nita, la igualdad es simple consecuencia de la linealidad del operador. Si el espacio de Hilbert es de dimensión innita debemos probar que la linealidad de un operador unitario se puede extender a una P suma innita. Para ello basta probar que si ~ u = n un~en es un vector cualquiera P b en converge (ya que de converger lo hace al vector “correcto”). del Hilbert, n un U~ Tomemos las sucesiones {w ~ I } sI } I=1 y {~ I=1 de término general w ~I =
I X
un~en
;
bw b ~sI = U ~I = U
n=1
I X
un~en =
n=1
I X
b en . un U~
n=1
b es unitario, para todo I, J Como U ° ° °b ° ~I w kw ~I w ~ J k = °U (w ~ J )° = k~sI ~sJ k . Ya que (evidentemente) w ~ es una sucesión de Cauchy, la anterior igualdad implica PI I b que la sucesión ~sI = n=1 un U~en también es de Cauchy, y por tanto convergente.2 6 b) Es consecuencia inmediata de lo anterior. b es unitario, entonces c) Veamos primero la condición suciente. Supongamos que U ³ ´ ³ ´ ³ ´ †b ~ ~ b b b fi , fj = U~ei , U~ej = ~ei , U U~ej = (~ei , ~ej ) = ij , y el conjunto {f~i } es ortonormal. Probemos ahora que {f~i } es una base de Fourier. b †~v pertenece al dominio Para ello consideremos un vector cualquiera ~v H; entonces U b que, acabamos de ver, es todo el Hilbert. Por consiguiente, el desarrollo de de U Fourier X b †~v = U ci~ei . i
b a esta igualdad y usando el resultado del apartado a): existe. Aplicando U X X X b ei = b bU b †~v = U ci~ei = ci U~ ci f~i . ~v = U i
i
i
Esto es, cualquier n o vector ~v H puede expresarse como desarrollo de Fourier con los vectores de f~i , por lo que este conjunto es una base ortonormal. Veamos ahora la condición necesaria, es decir, demostremos que si {f~i } es una base b a una suma innita que en ningún momento hemos extendido la linealidad de U (ya que es lo que, precisamente, queremos demostrar). Por otra parte, este ejemplo demuestra cuan importante es la necesidad de que el espacio lineal sea de Hilbert. 2 6 Nótese
2.11 Operadores unitarios. Cambios de base
63
b debe ser necesariamente unitario. Para ello basta demostrar ortonormal, entonces U † ~ b b b †U bU b† = U b †U b f~j ) = ij pues entonces U b = 1. Esto es que (~ei , U U ~ej ) = (fi , U inmediato: ³ ´ ³ ´ ³ ´ b † U~ b ej = f~i , f~j = ij b ej = U~ b ei , U~ ~ei , U ³ ´ ³ ´ ³ ´ ³ ´ bU b † f~j = f~i , U bU b †U b ~ej = f~i , f~j = ij . bU b 1 f~j = f~i , U f~i , U
Ejemplo 2.34. Sean {~en } , {f~n } dos bases ortonormales de un espacio de b el operador unitario que transforma la base {~en } en la base Hilbert y U {f~n }. Relacionar las coordenadas de un vector en ambas bases. Solución: P P 0 ~ 0 Sea un vector ~v = en = n vn~ n vn fn . Para obtener las coordenadas {vn } en función de las coordenadas {vn } escribamos vn0
³
´
Ã
= f~n , ~v =
b en , U~
X
! vi~ei
=
i
X³
´ ´ X³ b b ~ei , U~en vi . U~en , ~ei vi =
i
Introduciendo el elemento de matriz Uin vn0 =
X
i
³ ´ b = ~ei , U~en llegamos al resultado pedido:
Uin vi =
i
X
† Uni vi ,
i
b †. donde hemos usado también la representación matricial de U Ejemplo 2.35. Sean Aij los coecientes de la representación matricial de b en la base {~ei } . Obtener la representación matricial A0ij de un operador A dicho operador en una base {f~i } relacionada con la anterior mediante el b (es decir f~i = U~ b ei ). operador unitario U Solución: Los coecientes de la representación matricial en la nueva base son ´ ³ ´ ³ ´ ³ ³ ´ bf~j = U~ bU~ b ej = ~ei , U b †A bU~ b ej = U bU b b ei , A b† A A0ij f~i , A
ij
Es decir, A0ij =
X m,n
† Uim Amn Unj =
X
Umi Amn Unj .
m,n
Fíjese, por otro lado, que Unj
´ ³ ´ ³ ~ b ~en , U ~ej = ~en , fj ,
lo que permite obtener rápidamente el operador unitario que conecta ambas bases.
64
ESPACIOS DE HILBERT
2.12
Proyectores ortogonales
• Terminemos nuestra discusión sobre tipos especiales de operadores lineales con los llamados proyectores ortogonales. DEFINICIÓN: Un operador lineal Pb con dominio todo el espacio de Hilbert H , es un proyector ortogonal 2 7 si es autoadjunto y además Pb 2 = Pb Pb = Pb . Los proyectores están relacionados con el siguiente teorema (imprescindible para establecer aspectos esenciales del formalismo cuántico): Teorema (de la proyección ortogonal): Sea H un espacio de Hilbert y W un subespacio de Hilbert de H. Entonces: 1. El complemento ortogonal de W, W , es también un subespacio de Hilbert. 2. Todo vector ~v H puede escribirse de forma única como ~v = ~vW + ~vW ; con ~vW W y ~vW W 3. El vector ~vW , denominado proyección ortogonal de ~v sobre el subespacio W, está dado por ´ X³ ~vW = f~n , ~v f~n , n
donde BW
n
o ~ ~ = f1 , f2 , ... es una base ortonormal de W.
Demostración: 1. Puesto que H es un espacio es de Hilbert, toda sucesión de Cauchy converge en H. Basta demostrar que el vector w ~ al {w ~ n } n=1 W que converge la sucesión pertenece a W , lo que es inmediato: si ~v es un vector cualquiera de W, entonces (~v , w) ~ = (~v , limn w ~ n) = ~ n ) = limn 0 = 0. limn (~v , w 2. Supongamos que hay dos posibles soluciones al problema de la proyección ortogonal ~v
=
~v
=
~vW + ~vW
0 0 ~vW + ~vW ,
que es equivalente a escribir 0 0 ~vW ~vW = ~vW vW . ~ ¢ ¡ 0 0 Como, por hipótesis, (~vW ~vW ) ~vW vW , tendremos ~
° ° ¡ ¢ ¡ 0 °2 0 0 ¢ 0 0 °~vW ~vW = ~vW ~vW = ~vW ~vW , ~vW ~vW , ~vW vW = 0 ~ 0 de donde no queda más remedio que ~vW ~vW = ~0 y la descomposición ~v = ~vW + ~vW es única. 2 7 Por
abuso del lenguaje, se omite muchas veces el término ortogonal.
2.12 Proyectores ortogonales
65
3. Por construcción, el vector ~vW entonces demostrar que
P ³~ ´ ~ = n fn , ~v fn pertenece a W. Basta
~vW = ~v ~vW = ~v
X³
´ f~n , ~v f~n
n
es ortogonal a W. Para ello hay que tomar un vector cualquiera w ~ = P ~ w de W y comprobar que ( w, ~ ~ v ) = 0. En efecto: f W n n n ! Ã ! Ã ´ ´ X X³ X³ f~n , ~v f~n = f~n , ~v f~n ~ ~v wm f~m , ~v (w, ~ ~vW ) = w, =
X m
=
X m
³
n
´
X
´
X
f~m , ~v wm
³
m,n
wm f~m , ~v
³
m
f~n , ~v wm
´³
f~m , f~n
´
n
³ ´ wm f~n , ~v mn = 0 ,
m,n
y queda así demostrada la igualdad. La proyección ortogonal sobre un subespacio de Hilbert W puede expresarse mediante la actuación de un proyector ortogonal PbW . En efecto, denamos un operador PbW cuyo dominio es todo el Hilbert y su regla de actuación es ´ X³ ~ b PW ~v = ~vW = fn , ~v f~n , n
donde {f~n } es una base ortonormal de W. Es fácil comprobar (inténtese) que PbW satisface las condiciones que denen a un proyector ortogonal: es lineal, autoadjunto, 2 y PbW = PbW . • A la vista del resultado anterior, podemos nalizar esta sección deniendo el importante concepto de suma directa de subespacios. DEFINICIÓN: Sea H un espacio de Hilbert y W1 , W2 ,... un conjunto de subespacios de Hilbert ortogonales entre sí. Se dice que H es suma directa de estos subespacios de Hilbert (simbolizándose como H = W 1 W2 W3 ...) si cualquier vector ~u H puede escribirse como ~u = ~uW1 + ~ uW2 + ~ uW3 + ... , donde ~ uWn = PbWn ~u es la proyección ortogonal de ~ u sobre Wn . Esta relación entre subespacios se traduce en la relación siguiente para sus proyectores asociados Ib = PbW1 + PbW2 + PbW3 + ... Ejemplo 2.36. Consideremos el espacio de Hilbert L2 (R) y los subespacios lineales L2+ (R) y L2 (R) formados por todas las funciones pares e impares,
66
ESPACIOS DE HILBERT
respectivamente. a) Demuestre que son subespacios de Hilbert ortogonales entre sí. b) Compruebe que L2 (R) = L2+ (R) L2 (R), halle el proyector ortogonal Pb+ sobre el subespacio L2+ (R), y el proyector ortogonal Pb sobre el subespacio L2 (R) b (x) para cualquier b = Pb+ Pb . Obtenga c) Denamos el operador paridad función del Hilbert. Solución: a) Si + (x) es una función par y (x) una impar Z + ¢ ¡
+ (x) (x) dx = 0 ,
+ . =
ya que el integrando es impar. La igualdad se cumple para todas las funciones pares e impares y, entonces, L2+ (R) L2 (R). Por otra parte, L2+ (R) es un subespacio de Hilbert ya que toda sucesión convergente de funciones pares converge a una función par.2 8 Análogamente se ve que L2 (R) es un subespacio de Hilbert. b) De acuerdo con un resultado bien conocido de Análisis Matemático, toda función
(x) puede escribirse de forma única como suma de una función par y otra impar: μ ¶ μ ¶
(x) + (x)
(x) (x)
(x) = + (x) + (x) = + , 2 2 lo que demuestra que L2 (R) = L2+ (R) L2 (R). Los proyectores respectivos se obtienen inmediatamente a partir de la igualdad anterior: Pb+ (x)
=
Pb (x)
=
(x) + (x) 2
(x) (x)
(x) = 2
+ (x) =
c) Aplicando la denición b (x) = Pb+ (x) Pb (x) = (x) b (x) = + (x) si y sólo si (x) es par. Igualmente, b (x) = (x) Observamos que si y sólo si (x) es impar. Ejercicio 2.16. unitario.
Demuestre que el operador paridad es autoadjunto y, a la vez,
Ejercicio 2.17. Sea BW una base ortornormal del subespacio de Hilbert W. Como el complemento ortogonal W es también un subespacio de Hilbert, el teorema de la proyección ortogonal implica que H = W W . Demuestre que si BW es una base ortonormal de W , entonces BW BW es una base ortonormal de todo el espacio de Hilbert. ¿Cuál será la representación matricial del proyector PbW en esta base? ¿Y la del proyector PbW = 1 PbW ? Generalice los dos últimos resultados al caso de una descomposición del espacio de Hilbert en una suma directa de un número arbitrario (pero nito) de subespacios de Hilbert ortogonales entre sí. 2 8 Salvo,
quizás, para valores aislados de la variable, lo que es irrelevante como ya sabemos.
2.13 Espectro puntual. Autovalores y autovectores
2.13
67
Espectro puntual. Autovalores y autovectores
• Pasemos ahora a denir los conceptos de autovalor y autovector, que tienen una importancia capital en el formalismo cuántico. Consideraremos, como ya es habitual, b cuyo su domino contiene una base un espacio de Hilbert H y un operador lineal A ortonormal de H. b un operador lineal de H. Denimos su espectro puntual, DEFINICIÓN: Sea A b como el conjunto formado por todos los escalares a C tales denotándose por p (A), b aI) b 1 no existe. Por tanto,2 9 existe un vector no nulo ~ uH que el operador (A que es solución de la ecuación de autovalores ³ ´ b aIb ~u = 0 A bu = a~ o, equivalentemente, que cumple A~ u. b y que ~u es un autoDiremos que a es un autovalor o valor propio del operador A b vector o vector propio de A (o autofunción o función propia si estamos en un espacio de funciones) con autovalor a. b de un espacio de Hilbert H y un autovalor TEOREMA: Sea un operador lineal A a del operador. El conjunto Ea formado por todos los autovectores asociados al autovalor a es un subespacio lineal. b con autoDemostración: Basta probar que si ~ u, ~v son autovectores de A valor a, y , dos complejos arbitrarios, entonces ~ u + ~v también es b autovector de A con igual autovalor. Así, b (~u + ~v ) = A~ bu + A~ bv = a~ A u + a~v = a (~ u + ~v ) , quedando demostrada la armación. Consecuencia de este teorema, tenemos las siguientes deniciones: b al subespacio lineal Ea formado por DEFINICIONES: Dado un operador lineal A, los autovectores asociados a un autovalor a se le denomina espacio propio 3 0 asociado al autovalor en cuestión. A la dimensión g de dicho subespacio lineal se le llama degeneración o multiplicidad del autovalor. Si la degeneración del espacio propio asociado a un autovalor es la unidad, se dice que el autovalor es no degenerado.3 1 Por el contrario, si g > 1 se dice que el autovalor es g-degenerado (o que tiene degeneración o multiplicidad g). Veamos tres ejemplos interesantes. En el primero relacionamos los autovalores b con los de A. b En los dos últimos ilustramos el cálculo de un operador lineal g(A) de autovalores y autovectores en un espacio funcional y en un espacio de Hilbert de dimensión nita, respectivamente. 2 9 Recuerde
el teorema de caracterización de invertibilidad de un operador. veces se dice “subespacio propio” para enfatizar que estamos hablando de un subespacio del Hilbert. 3 1 La expresión equivalente “degeneración uno” apenas se utiliza. 3 0 Muchas
68
ESPACIOS DE HILBERT
b un operador lineal en un espacio de Hilbert. Ejemplo 2.37. Sea A b demuestre que an es valor propio de A bn , a) Si a es un valor propio de A, siendo n un número natural. b) Como consecuencia, dada una función analítica g (x), pruebe que g (a) b es valor propio del operador g(A). (No preste atención a problemas derivados del dominio de denición). Solución: ³ ´ n b b b b b a) Sea a un autovalor de A y ~u un vector propio y A ~ u = A A...A ~u. Aplicando b al vector ~ b se obtiene sucesivamente A u y teniendo en cuenta el carácter lineal de A, inmediatamente bn ~u = an ~ A u, bn con autovalor an . por lo que, además, ~ u es vector propio de A P n b) Dado que g es analítica, g (x) = limN N n=0 gn x y ³ ´ b ~ g A u
à =
lim
N
à =
lim
N
N X
! bn ~ gn A u
n=0 N X
à = lim
N
! gn an
N X
! gn an ~u
n=0
~u = g (a) ~u ,
n=0
³ ´ b con autovalor g (a). y por tanto ~ u es vector propio de g A Ejemplo 2.38. Sea el espacio de Hilbert L2 [0, 1] y consideremos el operador d . Calcule p (Pbx ) si su dominio es: Pbx = i dx a) El conjunto de funciones continuas C [0, 1]. b) Las funciones de C [0, 1] tales que (0) = (1). c) Las funciones de C [0, 1] tales que (0) = (1) = 0. Solución: Recordemos que el ejemplo 2.26 vimos que la denición del dominio de Pbx era fundamental a la hora de determinar su carácter autoadjunto. Este segundo ejemplo continua en la línea de enfatizar la importancia de los dominios de denición, ya que ilustraremos cómo un cambio en el dominio del operador puede hacer variar completamente su espectro puntual. a) Para calcular el espectro del operador planteemos la ecuación de autovalores d Pbx p (x) = p p (x) i p (x) = p p (x) dx Para un p C dado, su solución general es
p (x) = Aeipx con A una constante arbitraria. Todas las funciones solución de la ecuación de autovalores pertenecen al dominio de Pbx , luego no hay restricción alguna y
p (Pbx ) = C .
2.13 Espectro puntual. Autovalores y autovectores
69
Así, el espectro puntual p (Pbx ) llena todo el conjunto de los números complejos.3 2 b) En este caso, la ecuación de autovalores Pbx p (x) = p p (x) tendrá como solución
p (x) = Aeipx , pero con la restricción
p (0) = p (1) . Esto implica que ya no todas las soluciones son válidas, sino sólo aquellas que cumplen 1 = eip Por tanto, los autovalores han de vericar p = 2n, con n cualquier número entero:
p (Pbx ) = {2n ; n = 0, ±1, ±2, ...} Las autofunciones correspondientes (ya normalizadas) son
n (x) = e2inx que resultan ser los elementos de la base exponencial de Fourier. c) En este último caso, ninguna solución p (x) = Aeipx pertenece al dominio del operador, por lo que p (Pbx ) = . Fíjese que en espacios lineales de dimensión innita puede ocurrir que un operador hermítico no tenga autovalores, algo completamente imposible en espacios de dimensión nita. Ejemplo 2.39. En la descripción del momento magnético intrínseco o espín del electrón aparece con frecuencia el operador lineal sby del espacio 2 de Hilbert matricial de este operador en la base © C . ¡1La ¢ representación ¡1¢ª canónica ~e1 = 0 , ~e2 = 0 es ¶ μ 0 i [b sy ] = . i 0 Así, dado un vector ~ u = u1~e1 + u2~e2 , las coordenadas de w ~ = sby ~u en la esta base están dadas por ¶ μ ¶ μ ¶ μ ¶μ w1 0 i iu2 u1 = = . w2 u2 iu1 i 0 a) Demuestre que sby es autoadjunto. b) Obtenga los autovalores de sby y los vectores propios correspondientes. c) Evalúe exp (iab sy ) ~e1 , con a R. Solución: a) La representación matricial de sb†y es la traspuesta conjugada de la de sby : h i μ 0 i ¶+ μ 0 i ¶ sb†y = = = [b sy ] . i 0 i 0 Así, las reglas de acutación de sb†y y sby coinciden. Como estamos en un espacio de dimensión nita no hay problema alguno con los dominios y sb†y = sby . 3 2 Esto
parece sugerir que el nombre “espectro puntual” es particularmente desafortunado.
70
ESPACIOS DE HILBERT
b) De acuerdo con la denición, será un autovalor de sby si el operador sby Ib no es invertible. Aplicando resultados típicos del Álgebra lineal, la no invertibilidad de un operador queda caracterizada por el hecho de que el determinante de su representación matricial es cero y obtenemos la llamada ecuación característica ¯ ½μ ¶ μ ¶¾ ¯ ¯ i ¯ 0 i 1 0 ¯ = 2 1 = 0. ¯ det =¯ i ¯ i 0 0 1 Los autovalores son p (b sy ) = {1, +1}. Llamemos ¶ μ 1 ~ = , 2
μ ~ = +
a los autovectores correspondientes. Así, μ ¶μ ¶ μ ¶ 0 i ±1 ±1 =± ±2 ±2 i 0
+1 +2 ½
¶
i ±2 = ± ±1 i ±1 = ± ±2 .
Este sistema de ecuaciones tiene innitas soluciones, pero todas ellas proporcionales entre sí. Tomando ±1 = 1, inmediatamente tenemos μ ¶ 1 ~ ± ±i y, normalizando estos vectores, ~ = 1 (~e1 i~e2 ) 2
;
~ = 1 (~e1 + i~e2 ) . + 2
c) Para calcular exp (iab sy ) ~e1 conviene escribir ~e1 como una combinación lineal de los autovectores ~ ± . A partir del resultado del apartado anterior tenemos que ´ 1 ³ ~e1 = ~ + ~ + , 2 de modo que 1 1 1 1 exp (iab sy ) ~e1 = exp (iab sy ) ~ + exp (iab sy ) ~ + = eia~ + e+ia~ + 2 2 2 2 Escribiendo ahora ~ ± en términos de la base canónica, llegamos al resultado nal: i 1 h ia exp (iab sy ) ~ey = (~e1 i~e2 ) + e+ia (~e1 + i~e2 ) = cos (a) ~e1 sin (a) ~e2 . e 2 • La mayoría de los operadores de interés en Mecánica Cuántica son bien autoadjunto o bien unitarios. Es por ello por lo que, a continuación, procederemos a enunciar propiedades importantes del espectro puntual de estos operadores. b un operador autoadjunto en un espacio de Hilbert H. TEOREMA: Sea A 1. Su espectro puntual es real.
2.13 Espectro puntual. Autovalores y autovectores
71
b son ortogonales entre sí. 2. Los espacios propios de A 3. Su espectro puntual es numerable 3 3 y, por tanto, los valores propios de un operador autoadjunto están aislados en la recta real. Demostración: 1. Es consecuencia inmediata del carácter autoadjunto del operador. Si b yw a p (A) ~ 6= ~0 es un autovector con dicho autovalor, entonces ³ ´ bw w, ~ A ~ = (w, ~ aw) ~ = a kwk ~ 2. Por otro lado, usando las propiedades del producto escalar y el carácter b autoadjunto de A ´ ³ ´ ³ ´ ³ ´ ³ b† w bw bw bw, ~ A ~ = w, ~ A ~ = a kwk ~ 2. w, ~ A ~ = A ~ w ~ = w, Como kwk ~ 6= 0, no queda más remedio que a = a , de donde a es real: los valores propios de un operador autoadjunto son reales. b con autovalores a y b, 2. Sean w ~a y w ~ b autovectores no nulos de A respectivamente. Por un lado ³ ´ b ~ a, b w w ~ a, A w ~ b = (w ~ b ) = b (w ~ a, w ~ b) , b autoadjunto y a R) y por otro (usamos A ³ ´ ³ ´ bw bw w ~ a, A ~ a, w ~ a, w ~b = A ~ b = (a w ~ b ) = a (w ~ a, w ~ b) . Por tanto ~ b ) = a (w ~ a, w ~ b ) (b a) (w ~ a, w ~ b) = 0 b (w ~ a, w y si a 6= b, entonces (w ~ a, w ~ b ) = 0. Esto es, autovectores asociados a autovalores distintos son ortogonales, quedando demostrada la armación. 3. Imaginemos que no lo sea. De acuerdo con el punto anterior podemos construir un conjunto ortonormal sin más que tomar un autovector normalizado asociado a cada autovalor. Así tendríamos un conjunto ortonormal innito no numerable al que llamaremos Bn.n. , lo que es imposible en un espacio de Hilbert en el que todas las bases ortonormales (conjuntos ortonormales máximos) son numerables y, por tanto, todos los conjuntos ortonormales. b un operador unitario en un espacio de Hilbert H. TEOREMA: Sea U b b †) 1. Si p (U), entonces || = 1 y p (U b son ortogonales entre sí. 2. Los espacios propios de A 3. Su espectro puntual es numerable. 3 3 Por
tanto, el nombre espectro puntual sí está plenamente justicado para un operador autoadjunto.
72
ESPACIOS DE HILBERT Demostración: b con autovalor C: 1. Sea ~v un vector propio de U b ~v = ~v . U b es unitario: Como U
° ° °b ° k~v k = °U ~v °
y entonces ° ° °b ° k~v k = °U ~v ° = k ~v k = || k~v k . Esto implica necesariamente, ya que k~v k 6= 0, que || = 1. Esto es, los valores propios de un operador unitario tienen módulo unidad. b con autovalor Por otro lado, si ~v es un autovector del operador unitario U tenemos que b† U b †~v b ~v = U b † (~v ) = U ~v = U
b †~v = 1~v U
b † . Ahora bien, como es un complejo por lo que 1 es autovalor de U de módulo unidad, 1 = , y queda demostrada la armación. b con autovalores y , 2. Sean ~v y ~v autovectores no nulos de U respectivamente. Entonces ´ ³ ´ ³ b † U~ b vb = (~v , ~v ) = (~v , ~v ) b vb = U~ b v , U~ (~v , ~vb ) = ~v , U La igualdad sólo puede ser cierta si = 1 o si (~v , ~v ) = 0. Sin embargo, ya que || = || = 1, = 1 implica necesariamente = . Así, si tenemos dos autovectores asociados a autovalores diferentes, su producto escalar es cero, quedando demostrada la armación. 3. Idéntica a la del punto 3 del teorema anterior. Los espectros puntuales de operadores autoadjuntos y unitarios cumplen muchas otras propiedades, aunque las más importantes son las que hemos enunciado en los dos teoremas anteriores. Otra propiedad, que tiene su interés en formulaciones matemáticas más estrictas de la teoría de espacios de Hilbert, es la que presentamos en el siguiente ejemplo (un tanto técnico) que, además, sirve para recordar al lector que los espacios de Hilbert de dimensión innita son muy diferentes a los de dimensión nita. b de un espacio de Ejemplo 2.40. (*) Consideremos un operador lineal A Hilbert H de dimensión nita. Si se cumple la siguiente condición: ³ ³ ´ ´ ³ ´ b Ib ~u = 0 para todo ~ b , existe w ~ 6= ~0 tal que w, ~ A uD A b entonces p (A). a) Demuestre la armación anterior. b) Compruebe que sigue siendo cierta en espacios de Hilbert de dimensión
2.13 Espectro puntual. Autovalores y autovectores
73
b es autoadjunto o unitario. innita si el operador A c) Sin embargo, hay otros operadores en espacios de Hilbert de dimensión innita para los que tal condición deja de ser suciente y, aunque se cumpla, no podemos armar que sea un autovalor. Un caso típico es el del operador lineal Tb+ de C 2 , con dominio todo el Hilbert, cuya regla de actuación sobre una -tupla (u1 , u2 , u3 , ...) es Tb+ (u1 , u2 , u3 , u4 ...) = (0, u1 , u2 , u3 , ...) . Demuestre que este operador no tiene espectro puntual, pero que todos los complejos de módulo menor que uno cumplen la condición dada al principio del enunciado. Solución: b† ). En a) La condición dada en el enunciado es equivalente a armar que p (A b efecto, si se cumple la condición tenemos que para cualquier ~ u D(A) ¶ μ³ ³ ³ ³³ ´ ´ ´ ´ ´† † b b b b b b w, ~ A I ~ ~ ~u = 0 ~ ~u = 0. A I w, u =0 A I w, Ahora bien, estamos suponiendo que siempre existe una base B = {~en } contenida en b Así, D(A). ³ ´ ´ ´ X³ ³ † b† Ib w b Ib w ~ = ~ ~en ~en , A A n
=
X ³³ n
´ ´ X b† Ib w, 0~en = ~0 ~ ~en ~en = A n
b† ). Por tanto, lo que tenemos que demostrar y como w ~ 6= ~0, tenemos que p (A b† ), entonces p (A b† ) para cualquier operador en un espacio es que si p (A de Hilbert de dimensión nita y, en general, para todos los operadores autoadjuntos y unitarios. b la matriz N × N representación En espacios de Hilbert de dimensión nita N, sea [A] b en la base ortonormal B. A su vez, la representación mamatricial del operador A † b b a la que llamaremos [A] b +. tricial de A es la matriz traspuesta conjugada de [A], b† ), es solución de la ecuación característica Entonces, si p (A μh i μh h i´ h i¶ ³h i i+ ¶ + † b b b b b b = 0. det A I = 0 det A I = det A I Ahora bien, es conocido que el determinante de una matriz es el complejo conjugado del de su traspuesta conjugada, por lo que ³h i´ ³ ´ b b b det A I = 0 p A b en un Hilbert de dimensión nita.3 4 para cualquier A b es autoadjunto, entonces A b† = A b e, independientemente b) Si ahora suponemos que A b I. b una demostración mucho más simple que se basa en la no invertibilidad de A Sin embargo, hemos preferido esta demostración para recordar al lector algunas propiedades del cálculo matricial en espacios de Hilbert de dimensión fínita que, en mucho casos, son útiles en Mecánica Cuántica. 3 4 Hay
74
ESPACIOS DE HILBERT
de la dimensión del Hilbert
³ ´ ³ ´ b† p A b p A
y como el espectro puntual de un autoadjunto es real, entonces = y, por tanto, b p (A). b . Naturalmente, si U b es unitario, U b† Consideremos ahora un operador unitario U † † b ) y si w b con también lo es. Entonces si p (U ~ 6= ~0 es un autovector de U autovalor : ´ ³ ³ ´ ´ ³ † † b b b b b b , b b ~ =U U w ~ Uw ~ = w ~ p U ~ = U ( w) ~ = Uw w ~ = UU w donde hemos usado = 1/ ya que | | = 1. Nótese, además, que este resultado muestra que el espectro del adjunto de un operador unitario es el complejo conjugado del espectro del operador. c) Veamos que para el operador de C 2 Tb+ (u1 , u2 , u3 , u4 ...) = (0, u1 , u2 , u3 , ...) el espectro puntual es vacío. Para ello planteemos la ecuación de autovalores u = ~ u Tb+ ~ que implica la siguiente regla de recurrencia para las componentes del vector: 0
=
u1
u1
=
u2
u2
=
u3
u3
=
u4 .. .
Si = 0 inmediatamente ui = 0 para todo i. Si 6= 0 entonces por la primera ecuación u1 = 0, por la segunda u2 = 1 u1 = 0, por la tercera, u3 = 1 u2 = 0, etc. Es decir, para cualquier la ecuación de autovalores tiene únicamente la solución trivial ~ u = ~0, por lo que p (Tb+ ) = . Sin embargo veamos que hay escalares complejos para los que existe un vector w ~ = ~0 no nulo que satisface la condición (wn ) = 6 n=1 ³ ³ ´ ´ b b w, ~ T+ I ~u = 0 para todo ~ u C 2 . Para un ~u genérico ³ ³ por lo que
´ Tb+ Ib ~u = (0 u1 , u1 u2 , u2 u3 , ...) ,
³ ´ ´ w, ~ Tb+ Ib ~u = 0 implica que w1 (0 u1 ) + w2 (u1 u2 ) + w3 (u2 u3 ) + ... =
(w2 w1 ) u1 + (w3 w2 ) u2 + (w4 w3 ) u3 = 0 ,
2.13 Espectro puntual. Autovalores y autovectores
75
Recordemos que la igualdad ha de cumplirse para todo (un ) n=1 , por lo que la condición se cumplirá si la regla de recurrencia w2
=
w1
w3
=
w2
w4
=
w3 .. .
admite soluciones no nulas pertenecientes al espacio de Hilbert. Si tomamos w1 = 1, entonces ¡ ¢ w ~ = 1, , 2 , 3 , ... y este vector w ~ pertenecerá a C 2 si X X ¯ n1 ¯2 ¡ 2 ¢m ¯ ¯ || kwk ~ = =1+ R. 2
n=1
m=1
La suma innita es la suma de todos los términos de una progresión geométrica de razón ||2 , la cual converge si y sólo si ||2 < 1. En denitiva, la condición se cumple para todos los complejos { C tal que || < 1} que era lo que queríamos demostrar.3 5 • Sin embargo, la diferencia fundamental entre espacios de Hilbert de dimensión b en un espacio de nita y de dimensión innita es la siguiente. Dado un operador A dimensión nita, siempre es posible encontrar una base lineal formada por autovecb y, en el caso particular de que A b sea autoadjunto (o también unitario), tores de A una base ortonormal. Sin embargo, este importante resultado deja de ser cierto en b autoadjunto de espacios de dimensión innita. Si nos restringimos a un operador A un Hilbert de dimensión innita H se pueden dar tres situaciones: b 1. Hay una base ortonormal de H formada por autovectores de A. b 6= , no es posible construir una base ortonormal de H formada 2. Siendo p (A) b Se dice entonces que el conjunto de los autovectores no por autovectores de A. es completo. b 6= y A b no tiene autovectores. 3. p (A) 3 5 Esta situación ilustra la existencia del llamado espectro residual de un operador lineal b B, denido como el conjunto de los escalares complejos que, sin pertenecer al espectro puntual, cumplen la condición: ³ ³ ´ ´ ³ ´ b Ib ~ b existe w ~ 6= ~0 tal que w, ~ B u = 0 para todo ~ uD B
Fíjese, entonces, que en el apartado a) hemos demostrado es que ni los operadores autoadjuntos ni los unitarios tienen espectro residual.
76
ESPACIOS DE HILBERT
Ahora bien, es esencial para la interpretación adecuada de la teoría cuántica que se cumpla la primera situación. Esto lleva a la necesidad de generalizar el concepto de autovalor y autovector, para lo que el precio que hay que pagar es la inclusión en el formalismo de vectores de norma innita. Esta inclusión puede (y debe) evitarse en un tratamiento matemático riguroso, pero entonces el procedimiento (que, de por sí no es nada sencillo) resulta mucho más difícil de entender. Por ello, en la siguiente sección “incorporaremos” al formalismo estos vectores de norma innita, además de introducir la llamada función delta de Dirac y la transformada de Fourier, de utilización habitual en Mecánica Cuántica. Hecho esto, ya podremos generalizar el concepto de autovalor y autovector.
2.14
Vectores no normalizables
• Hasta ahora, buena parte del aparato matemático que hemos desarrollado se fundamentaba en el hecho de que un espacio de Hilbert es un espacio lineal con producto escalar y cerrado bajo la topología asociada al producto escalar. Esto garantizaba que el producto escalar de dos vectores siempre es un número complejo y que las sucesiones de Cauchy (las sucesiones que tienden a estabilizarse) siempre convergen a un vector del espacio de Hilbert. Si no hubiésemos tomado estas precauciones, prácticamente nada de lo que hemos estado exponiendo se podría sostener. Sin embargo resulta conveniente para nuestros propósitos “ampliar” el espacio de Hilbert. Así, daremos cabida a otros objetos y extenderemos a los mismos el cálculo del producto escalar, aunque no exista garantía de que éste sea siempre nito. Por ejemplo, si C es el conjunto formado por todas las -tuplas w ~ = (wn ) n=1 de números complejos, el producto escalar entre dos -tuplas cualesquiera w ~ y ~u será (w, ~ ~u) =
X
wn un
n=1
Igualmente, si F (R) es el conjunto de todas las funciones complejas de variable real, tendremos que, para dos funciones de F (R): Z ( (x) , (x)) =
R
(x) (x) dx ;
y, salvo que estemos haciendo un tratamiento muy abstracto, esta ampliación se podrá hacer siempre sin problemas para un espacio de Hilbert dado. ~ de norma Ahora bien, vamos a imponer una única condiciones a estos vectores
innita (o no normalizables), y es que exista una base ortonormal del espacio de ~ con todos los vectores de la base sea nito. Hilbert tal que el producto escalar de
~ es igual a un desarrollo Por tanto, si {~en }n=1 es la mencionada base tenemos que
de Fourier generalizado ~ =
X n=1
³ ´ ~ ,
n~en con n = ~en ,
2.14 Vectores no normalizables
77
donde n es, entonces, la n-ésima coordenada del vector en la base ortonormal.3 6 Gracias a esta imposición las propiedades del producto escalar se preservan. Así, si ~ independientemente y , { n } n=1 y { n }n=1 son las coordenadas de dos vectores ~ de que sean de norma nita o no, se cumple que ³ ´ X ~ ~ , = n n . n=1
b a vectores de norma • También debemos extender la actuación de un operador A innita, es decir, ampliar su dominio. Esto será siempre sencillo conocida la regla de actuación del operador. Sin embargo hemos de tener cuidado al tratar con operadores ~ aunque la expresión A ~ tenga b
autoadjuntos. Dado un vector de norma innita , formalmente sentido, no hay garantía de que estemos manteniendo el carácter del operador autoadjunto al ampliar su dominio. Por tanto la igualdad ³ ´ ³ ´ ~ A ~ w bw b ,
, ~ = A ~ no es a priori válida si están involucrados vectores de norma innita. Afortunadab siempre podremos garantizar mente, si somos cuidadosos al ampliar el dominio de A que la anterior igualdad será cierta si al menos uno de los vectores pertenece al espa~ A ~ w) ~ b w) b , cio de Hilbert. Esto es, si w ~ H, ( , ~ = (A ~ independientemente de que
sea de norma nita o no. Lo que en ningún caso podremos garantizar es la anterior igualdad si los dos vectores son de norma innita. Veamos un ejemplo. Ejemplo 2.41. Sea el espacio de Hilbert L2 (R) y (x) una función de norma innita y acotada. Por construcción, el dominio del operador autoadjunto d es el formado por las funciones continuas de L2 (R) con derivada Pbx = i dx de cuadrado integrable. Sin embargo, podemos extender la actuación de Pbx sobre estas funciones de norma innita simplemente respetando la regla de actuación: d Pbx (x) = i (x) . dx a) Demuestre que si w (x) L2 (R) ´ ³ ´ ³
(x) , Pbx w (x) = Pbx (x) , w (x) . b) ¿Sigue siendo cierta la igualdad anterior si w (x) es un vector de norma innita? Solución: a) Sea w (x) L2 (R). Entonces ¶ μ ³ ´ Z + d b
(x) , Px w (x) =
(x) i w (x) dx. dx 3 6 En
este caso, la convergencia de la suma innita no debe entenderse bajo la norma ~ es innita) sino componente a componente asociada al producto escalar (ya que la norma de en C y punto a punto (salvo para valores aislados de la variable) en un espacio funcional.
78
ESPACIOS DE HILBERT
Integrando por partes y operando ¶ Z + μ ³ ´ d
(x)
(x) , Pbx w (x) = w (x) dx i dx ¸ +i lim (x) w (x) lim (x) w (x) . x+
x
Necesariamente limx± w (x) = 0 al ser ésta una función de cuadrado integrable pero, además, estamos imponiendo que (x) sea acotada. Por tanto, los dos límites de la igualdad anterior son cero y, en denitiva, ³ ´ Z + μ d (x) ¶ ´ ³
(x) , Pbx w (x) = w (x) dx = Pbx (x) , w (x) . i dx c) En general no, ya que no hay garantía de que limx± w (x) = 0 y entonces no podemos armar que lim (x) w (x) = lim (x) w (x) .
x+
x
Piense, por ejemplo, en el caso limx+ (x) = limx+ w (x) = 1 pero, sin embargo, limx w (x) = 0. • Naturalmente conceptos como independencia lineal y ortogonalidad se aplican ~ son ortogonales si directamente a estos nuevos vectores. Así, dos vectores ~ y
³ ´ ~ = 0; un conjunto de vectores es ortogonal si todos sus elementos son ortogo~,
nales dos a dos; etc. Ejemplo 2.42. Sea el espacio de Hilbert L2 (R) y las “ondas planas” k (x) = Ak exp (ikx) con k R y Ak una constante multiplicativa nita. a) Demuestre que las ondas planas son funciones no normalizables “admisibles”. b) Compruebe que el conjunto de todas las ondas planas es ortogonal. Solución: a) Que la norma es innita es obvio, ya que, extendiendo la denición operativa del producto escalar Z + Z + 2 2 (k , k ) = |k (x)| dx = |Ak | dx = .
Para que sean “admisibles” hay demostrar que se pueden escribir como un desarrollo de Fourier generalizado en una base ortonormal de L2 (R). Si escogemos la base de Hermite BF = {H0 (x) , H1 (x) , H2 (x) , ...} con Hn (x)
¡ 2 ¢ 1 exp x /2 · Hn (x) 1/2 (2n n! )
siendo Hn (x) los llamados polinomios de Hermite, hemos de comprobar que Z + Hn (x) Ak eikx dx C , n = 0, 1, 2, 3, ...
2.14 Vectores no normalizables
79
Ello es inmediato si tenemos en cuenta la siguiente propiedad de las funciones de Hermite +i 2Hn (k) si n = 1, 5, 9, ... Z + i2Hn (k) si n = 3, 7, 11, ... eikx Hn (x) = 2ein/2 Hn (k) = +2Hn (k) si n = 0, 4, 8, ... 2Hn (k) si n = 2, 6, 10, ... por lo que k (x) =
X
³ ´ X (Hn , k ) Hn (x) = 2Ak ein/2 Hn (k) Hn (x) ,
n=0
n=0
que está bien denido para todo k y para todo n. b) Hay que demostrar que el producto escalar (k , q ) = 0 si k 6= q. Ahora bien, la integral asociada está indeterminada, por lo que multiplicaremos el integrando por una función dependiente de un parámetro a que se convierte en la función unidad cuando a 0. Una función de este tipo es exp (a |x|) con a 0, por lo que Z + (k , q ) = lim Ak Aq eikx eiqx ea|x| dx a0+
= Ak Aq lim =
Ak
μZ Aq lim
a0+
a0+
+
+ i(qk)x a|x|
Z
e
e
a|x|
cos [(q k) x] e
Z dx + i
+
dx
sin [(q k) x] e
a|x|
¶ dx .
La segunda integral es nula, puesto que el integrando es impar, y como el integrando de la primera integral es par Z + (k , q ) = 2Ak Aq lim cos [(q k) x] eax dx a0+
=
2Ak
Aq lim
a0+
0
a =0 a2 + (q k)2
ya que, por hipótesis, q k 6= 0. • Lo que ya no resulta claro es cómo extender el importante concepto de ortonormalidad a vectores de norma innita. Consideremos un conjunto W formado por vectores de norma innita “asociados” a un espacio de Hilbert H.3 7 No tiene n sentido decir o ~ ~ ~ que el conjunto W es ortonormal si éste es discreto, es decir, si W = 1 , 2 , 3 , ... . Sin embargo, supongamos que W no es discreto, pero que sus elementos se pueden “etiquetar” de acuerdo con un parámetro continuo perteneciente a un intervalo ~ W y, recíprocamente, D R. Esto es, a cada D le corresponde un vector
todo vector de W tiene asociado un valor del parámetro . A efectos de notación escribiremos n o ~ W=
. D
3 7 Está
claro que no debemos decir “en” un espacio de Hilbert.
80
ESPACIOS DE HILBERT
De acuerdo con esto,
n o ~ DEFINICIÓN: Sea W =
un subconjunto continuo de funciones de norma D
innita asociadas a un espacio de Hilbert H. W es ortogonal si ³ ´ ~ 0 = 0 si 6= 0 ~ ,
y, además, es ortonormal (en sentido generalizado) si Z ³ ´ ~ ~
, 0 d = 1 , 0 D. D
La denición3 8 no es tan extraña. {~vn } H es un conjunto ortonormal si se cumplen simultáneamente las condiciones X
(~vn , ~vm )
=
0 si n 6= m
(~vn , ~vm )
=
1, m
n
ya que si se cumple la primera, la segunda garantiza inmediatamente que todos los vectores están normalizados. En el caso que nos ocupa, simplemente hemos tomado esta denición y la hemos adaptado sustituyendo la suma sobre el índice discreto por una integral sobre el índice continuo. Sin embargo, el precio que hay que pagar en esta generalización es que la condición de ortonormalidad depende del método de asignación, es decir, de la manera en la que relacionamos el parámetro con los vectores no normalizables del conjunto W. Como dicha asignación es siempre arbitraria, si queremos que el conjunto sea ortonormal debemos multiplicar los vectores por un factor adecuado (llamado constante de normalización) pero que obviamente dependerá de la asignación. En otras palabras, denido el producto escalar, el carácter ortogonal de un conjunto de vectores no normalizables es absoluto pero el carácter ortonormal es relativo. Ilustremos este hecho mediante el siguiente ejemplo: Ejemplo 2.43. Sea el conjunto ortogonal W formado todas las ondas planas Aq exp (iqx) , q R. a) Compruebe que W es ortonormal de acuerdo el siguiente método de asignación: ½ ¾ 1 W = q (x) = exp (iqx) . 2 qR b) (*) Si cambiamos el método de asignación hay que cambiar también la constante de normalización si queremos que el conjunto siga siendo ortonormal. Obtenga las constantes de normalización A para el caso más general W = { (x) = A exp (iq () x)}D , 3 8 Naturalmente
no hay contradicción con el hecho de que sea imposible construir un conjunto ortonormal continuo con vectores del espacio de Hilbert, ya que estos vectores de norma innita no lo son.
2.14 Vectores no normalizables
81
donde q () es una función creciente y que recorre toda la recta real. Solución: Este ejemplo se puede resolver de manera muy sencilla teniendo en cuenta las propiedades de la llamada función delta de Dirac, que veremos un poco más adelante. Sin embargo vamos a seguir aquí un procedimiento más general. a) Ya hemos visto en el ejemplo anterior que las ondas planas son ortogonales. Para que sean ortonormales ha de cumplirse Z μZ
+
R
q
¶ (x) q0 (x) dx dq = 1 , q 0 R,
y en este caso tenemos que comprobar que Z μZ R
¶ £ ¡ 0 ¢ ¤ 1 exp i q q x dx dq = 1 , q 0 R . 2
+
La integral en x no está denida, por lo que volvemos a hacer uso de la función accesoria exp (a |x|) que permite efectuar la integral como un límite. 1 lim 2 a0+
¶ Z 1 2a lim e e dx d = dq 2 a0+ R a2 + (q q 0 )2 Z 1 1 2a = lim lim (2) = 1. du = 2 2 + 2 a0 R a + u 2 a0+
Z μZ R
+
a|x| i(q 0 q)x
El resultado conrma que el conjunto es ortonormal, es decir, que la constante de normalización adecuada es 1 Aq = . 2 b) Ahora tenemos que hallar A para que Z μZ
+
D
¶ (x) 0 (x) dx d = 1
esto es, para que Z D
A A0
μZ
+
i(q ( 0 )q())x
e
¶ dx d = 1 , 0 D.
Introduciendo, de nuevo, la función accesoria exp (a |x|): Z μZ D
= =
+
Z
lim
a0+
lim
a0+
Z
D
D
¶ (x) 0 (x) dx d
A A0 A A0
μZ
+
a|x| i(q( 0 )q())x
e
e
2a 2 d, a2 + (q () q ( 0 ))
¶ dx d
82
ESPACIOS DE HILBERT
y, haciendo un cambio de variables de modo que la variable de integración sea q(), llegamos a ¶ Z μZ + (x) 0 (x) dx d D
=
Z
lim
a0+
R
A A0
2a 2 a2 + (q () q ( 0 ))
μ
dq () d
¶1 dq()
(nótese el cambio en los límites de integración, ya que q() recorre todos los posibles valores del número de ondas). Ahora bien, lim
a0+
a2
2a 2 + (q () q ( 0 ))
se hace cero en el momento en que q () q ( 0 ) 6= 0, esto es, cuando 6= 0 .3 9 Esto implica que el integrando sólo contribuye al resultado nal cuando ' 0 , lo que nos permite escribir ¶ Z μZ + (x) 0 (x) dx d D μ ¶1 # Z + " 0 dq ( ) 2a |A0 |2 = lim 0 2 dq() d a0+ a2 + (q () q ( 0 )) y podemos sacar el corchete de la integral, ya que 0 y q() son variables independientes. Basta, por último, hacer el cambio u = q () q(0 ), que no varía los límites de integración, para llegar a ¶ Z +/2 μZ + (x) 0 (x) dx d 2
μ
= |A0 |
/2
dq ( 0 ) d0
¶1
Z
lim
a0+
+
2a du = 2 |A0 |2 2 a + u2
μ
dq(0 ) d0
¶1 .
Como esta cantidad ha de ser uno, la constante de normalización A debe cumplir s μ ¶ 1 dq () |A | = 2 d En resumen, en la asignación más general posible, las ondas planas escritas como s ) ( μ ¶ 1 dq () exp (iq()x) W = (x) = 2 d D
forman un conjunto ortonormal. 3 9 Naturalmente
no hay dos valores diferentes del parámetro que den el mismo número de ondas, ya que de lo contario el método de asignación sería incorrecto.
2.14 Vectores no normalizables
2.14.1
83
Delta de Dirac
• Lógicamente, las ondas planas no son el único conjunto ortonormal formado por funciones de norma innita en L2 (R). Otro ejemplo importante es el conjunto de las llamadas funciones delta de Dirac, que presentamos en el siguiente ejemplo Ejemplo 2.44. Sea B = {e1 (x) , e2 (x) , e3 (x) , ...} una base ortonormal del espacio de Hilbert L2 (R). Dado un escalar real a, denamos la “función” a (x), denominada delta de Dirac centrada en a, a partir del desarrollo de Fourier generalizado a (x) =
X
(en (x) , a (x)) en (x) =
n=1
X
en (a) en (x)
n=1
esto es, a partir del producto escalar (en (x), a (x)) = en (a). a) Demuestre que para cualquier función continua (x), se cumple que Z + ( a (x) , (x)) = a (x) (x) = (a) .
b) Como consecuencia del punto anterior, pruebe que a (x) es real. ¿Qué valores toma la “función” a (x)? c) Demuestre que, dado un intervalo cerrado D R, ½ Z 0 si a /D a (x) dx = 1 si a D. D Solución: a) Supongamos que la función (x) admite un desarrollo de Fourier
(x) =
X
(en (x) , (x)) en (x) =
n=1
X
n en (x) .
n=1
Por tanto ( a , ) =
X
( a (x) , en (x)) (en (x) , (x)) =
n=1
X
en (a) n = (a)
n=1
(no hay problema formal en el último paso puesto que la función (x) es continua). b) De acuerdo con el punto anterior, para cualquier función real (x) se tiene Z + ( a , ) = a (x) (x) dx = (a) R ( a , )
Z =
+
a (x) (x) dx = (a) R
y restando miembro a miembro Z + Im ( a (x)) (x) dx = 0 . 2i
84
ESPACIOS DE HILBERT
Como esto es cierto para cualquier función real (x), no queda más remedio que Im ( a (x)) = 0, por lo que la delta de Dirac es real. Podemos entonces escribir Z + a (x) (x) = (a) ,
siendo (x) cualquier función continua. Esta última igualdad implica que los valores que toma a (x) para x 6= a deben ser cero. Por otra parte, a (a) no puede ser nito puesto que entonces el producto escalar anterior sería cero (recuerde la discusión en la que comparábamos convergencia puntual con convergencia asociada a la norma). En denitiva, ½ 0 si x 6= a a (x) = si x = a R + pero un “innito” que garantiza que a (x) (x) = (a). A la vista de esta discusión, no es necesario imponer que la función (x) sobre la que actúa la delta de Dirac se pueda escribir como un desarrollo de Fourier, basta que sea continua en x = a. c) Escojamos la función ½ 0 si a /D FD (x) = 1 si a D y, de acuerdo con el punto anterior, ½ Z + 0 a (x) FD (x) dx = FD (a) = 1
si a /D si a D.
Por la propia denición de FD (x) Z + Z a (x) FD (x) dx = a (x) dx ,
de donde
D
½
Z D
a (x) dx =
0 1
si a /D si a D.
Si tomamos D = R, la anterior expresión se transforma en Z + a (x) dx = 1 , a R .
Como acabamos de ver, la delta de Dirac a (x) no es una función en sentido ordinario, ya que su valor en x = a no está denido. Sin embargo hemos observado que los productos escalares en los que aparece a (x) sí lo están (y esto, recordemos, es lo que realmente interesa): Z
+
a (x) (x) dx = (a) .
2.14 Vectores no normalizables
85
Esta última igualdad es la que se suele tomar como denición de delta de Dirac. Sin embargo, al escribir en el ejemplo anterior la delta como un desarrollo de Fourier, hemos preferido presentarla como el límite de una sucesión de funciones. Siguiendo con esta idea, consideremos la sucesión de término general gn (x) ½ 0 si |x a| 1/ (2n) gn (x) = n si |x a| < 1/ (2n) , que está formada por funciones cuyas grácas son un rectángulo de base 1/n y altura n simétrico respecto al punto a y área, evidentemente, la unidad. Dada una función f (x) continua, se cumple que ¸ Z a+1/(2n) Z 1 1 ,a + f (a) gn (x)dx = n f (x) dx = f (), con a , 2n 2n a1/(2n) donde el último paso se sigue del teorema del valor medio para funciones continuas. Entonces, cuando n , Z lim f (x) gn (x) dx = f (a) n
y, de este modo, la sucesión {gn (x)} tiende a la delta de Dirac a (x), que puede así entenderse como el límite de un rectángulo de área unidad cuya base tiende a cero. Tenemos también que ¶ μ (x a)2 1 a (x) = lim exp 0 (2)1/2 2 2 (la delta es el límite de una gaussiana de área unidad y cuya anchura tiende a cero) y que μ ¶ 1 sin [r (x a)] a (x) = lim r r (x a) μ ¶
1 . a (x) = lim 0 (x a)2 + 2 Si a = 0 se omite el subíndice a, por lo que (x) simboliza la delta de Dirac centrada en cero. Evidentemente, a (x) = (x a) y, aunque (x a) sea la manera más común de escribir la delta de Dirac centrada en a, nosotros usaremos ambas formas indistintamente. Ejemplo 2.45. Demuestre las siguientes propiedades relativas a la delta de Dirac: a) (x) = (x). b) (kx) = |k|1 (x) con k R y k 6= 0. c) ( a , b ) = (a b). d) g (x) (x a) = g (a) (x a), para cualquier función g (x). Solución: a) Hay que demostrar que para cualquier función (x) Z + Z + (x) (x) dx = (x) (x) dx = (0) .
86
ESPACIOS DE HILBERT
En efecto, haciendo el cambio de variable u = x tendremos: Z Z + Z + (x) (x) dx = (u) (u) du = (u) (u) du = (0) .
+
b) Se demuestra de similar manera haciendo el cambio u = kx. Si k > 0, Z Z + ³u´ 1 + du (kx) (x) dx = (u)
k k Z 1 + 1
(0) = = (x) (x) dx, k k de donde (kx) = k1 (x). Si k < 0, Z Z + ³u´ 1 du (kx) (x) dx = (u)
k + k Z Z ³u´ 1 + 1 1 + du = (0) = = (u)
(x) (x) dx, k k k k y así (kx) = k1 (x). c) Aplicando la denición de delta Z + ( a , b ) = (x a) (x b) dx = (b a) = (a b) .
Por consiguiente, el conjunto de todas las deltas de Dirac X = { (x)}R es ortonormal (bajo la asignación que nombra cada delta por su centro), ya que se cumplen las dos condiciones siguientes: ¡ ¢ ( , 0 ) = 0 = 0 si 6= 0 Z Z ¢ ¡ ( , 0 ) d = 0 d = 1 , 0 R. R
R
d) Dada una función arbitraria (x) Z + [g (x) (x a) g (a) (x a)] (x) dx Z = =
+
Z g (x) (x) (x a) dx g (a)
+
(x a) (x) dx
g (a) (a) g (a) (a) = 0.
Como esto es cierto para cualquier función (x), entonces g (x) (x a) g (a) (x a) = 0 ,
2.14 Vectores no normalizables
87
quedando demostrada la propiedad. Ejemplo 2.46. Aunque al demostrar que Z + (x a) (x) dx = (a)
supuesto que la función (x) es continua en x = a, la integral R hemos + (x a) (x) dx tiene un valor denido incluso en el caso de que (x) no sea continua en x = a. Pruebe que, en general, ¶ μ Z + 1 (x a) (x) dx = lim (x) + lim (x) . 2 xa xa+ Solución: Basta recordar que la delta de Dirac es un límite, por lo que es legítimo escribir Z + Z + (x a ) + (x a + )
(x) dx (x a) (x) dx = lim 2 0+ 1 = lim [ (a + ) + (a )] , + 0 2 que es el resultado al que queríamos llegar.4 0 Ejemplo 2.47. La derivada usual de una función discontinua en un punto no está denida en ese punto. Sin embargo, con la ayuda de la delta de Dirac podemos generalizar el concepto de derivada de manera que contemple esta situación. Demuestre que si una función es discontinua en x = a ½ 0 d si x 6= a £ (x) ¡ +¢ ¡ ¢¤
(x) =
a a (x a) si x = a, dx ¡ ¢ donde 0 (x) es la derivada en sentido usual y a± limxa± (x). Esta forma de derivar una función se denomina “derivación en sentido de distribuciones”. Solución: Recordemos que dos funciones y son iguales si, para cualquier otra función g, se cumple (g (x) , (x)) = (g (x) , (x)) . Así, sea g (x) una función genérica de L2 (R) que vamos a suponer continua, entonces tenemos μ ¶ ¡ ¢ d (x) g (x) , = g 0 (x) , (x) , dx 4 0 Nótese
Z
que no podemos escribir Z +
(x a) (x) dx = lim
0+
a
Z
(x a) (x) dx +
¸
(x a) (x) dx
a+
porque toda la función delta de Dirac está “concentrada” en el intervalo lim0+ (, +).
88
ESPACIOS DE HILBERT
donde hemos hecho una integración por partes y tenido en cuenta que g (x) se anula en ±. Desarrollando el producto escalar Z a ¸ Z + ¡ 0 ¢ 0 0 g (x) , (x) = lim g (x) (x) dx + g (x) (x) dx , 0+
a+
e integrando por partes cada una de las integrales Z a Z ¡ 0 ¢ 0 g (x) , (x) = lim g (x) (x) dx + 0+
+
¸ g (x) (x) dx 0
a+
lim [g (a ) (a ) g (a + ) (a + )] . 0+
Como la función g (x) es continua, podemos escribir ¶ μ ¢ ¡ d (x) = g 0 (x) , (x) g (x) , dx ¸ Z a Z + £ ¡ ¢ ¡ ¢¤ 0 0 g (x) (x) dx + g (x) (x) dx + g (a) a+ a = lim 0+
Z
= lim
0+
Z
a+ a
0+
Z
+
g (x) (x) dx +
¸ g (x) (x) dx 0
a+
a+
+ lim
0
¡ ¢¤ £ ¡ ¢ g (x) a+ a (x a) dx,
a
donde hemos introducido la delta de Dirac centrada en x = a. Este es el resultado que queremos obtener, ya que tomando el límite 0+ la última expresión es el producto escalar ¶ μ d (x) g (x) , dx con d
(x) = dx
½
0 £ (x) ¡ ¢ ¡ ¢¤
a+ a (x a)
si x 6= a si x = a.
Ejemplo 2.48. Considérese la delta de Dirac (x a). Aunque no sea una función de L2 (R), evalúe su derivada en sentido de distribuciones e interprete el resultado. Solución: Como hemos visto, la delta de Dirac a (x) = (x a) sólo puede interpretarse cuando aparece dentro de un producto escalar: ( a (x) , (x)) = (a) . De esta manera, a debe entenderse realmente como una aplicación de L2 (R) en C tal que a cada función (x) le hace corresponder su valor en x = a. Así, tras esta reexión, ya tiene algo más de sentido el preguntarse por la derivada de la delta de Dirac, ya que siempre podremos interpretar el resultado usando los
2.14 Vectores no normalizables
89
d mismo términos. Así, si dx a (x) es la derivada de la delta de Dirac en el sentido de distribuciones del ejemplo anterior, para cualquier función (x) podemos escribir ¯ μ ¶ μ ¶ ¯ d d d . a (x) , (x) = a (x) , (x) = (x)¯¯ dx dx dx x=a d Por tanto dx a es la aplicación de L2 (R) en C tal corresponder el valor de su derivada en x = a o, d (x) está denida mediante la expresión dx a ¸ Z + d (x a) (x) dx = dx
que a cada función (x) le hace en otras palabras, la “función” ¯ ¯ d (x)¯¯ . dx x=a
• La delta de Dirac nos sirve para escribir de manera más compacta la condición ~ }D formado por vectores no normalizables de ortonormalidad de un conjunto {
asociados a un espacio de Hilbert H. En efecto, si dicho conjunto es ortonormal podemos escribir ³ ´ ¡ ¢ ~ ~
, 0 = 0 , ya que si 6= 0 el producto escalar es cero y, además, Z ¡ ¢ 0 d = 1 , 0 D. D
Por ejemplo, el producto escalar de las ondas planas “normalizadas” (en sentido generalizado) cumple4 1 ¶μ ¶ Z + μ Z + 1 iqx 1 ikx 1 e e dx = ei(kq)x dx = (k q) , 2 2 2 igualdad que usaremos muchas veces en el texto.
2.14.2
La transformación de Fourier
• La última igualdad, equivalente a Z + 1 eikx dx = 2 (k) , 2 es un caso particular de aplicación de la llamada transformada de Fourier, que denimos a continuación. DEFINICIÓN: Dada una función g(x) L(R), donde L(R) designa a las funciones complejas de variable real cuyo módulo es integrable (funciones absolutamente integrables), la expresión Z + 1 ge(k) = g(x) exp (ikx) dx , k R 2 4 1 La
siguiente igualdad se ha demostrado implícitamente al demostrar que las ondas planas constituyen un conjunto ortonormal.
90
ESPACIOS DE HILBERT
está siempre bien denida. A ge(k) se le denomina transformada de Fourier de la función g (x).4 2 . Si relajamos la denición y consideramos que g(x) L2 (R), entonces ge(k) está denida para todo k excepto para valores aislados lo que, como ya sabemos, no debe preocuparnos. Además: TEOREMA: Sea el espacio de Hilbert L2 (R). La transformada de Fourier, entendida como un operador lineal que a cada g (x) L2 (R) le hace corresponder la función Fb {g(x)} =
1 2
Z
+
g(y) exp (ixy) dy,
es un operador unitario. El operador inverso Fb 1 = Fb† , dominado transformada inversa de Fourier, viene dado por Fb† {g(x)} =
1 2
Z
+
g(y) exp (+ixy) dy
Demostración: Sean g (x) y h (x) dos funciones cualesquiera de L2 (R). Por la denición de producto escalar en L2 (R) μ ¶ Z + ³ ´ Z + 1 g (x) h (y) exp (ixy) dy dx. g(x), Fb {h(x)} = 2 Reordenando el integrando dentro de la integral doble, esto se puede escribir como ¶ ³ ´ Z + μ 1 Z + b g(x), F {h(x)} = g(x) exp (ixy) dx h (y) dy 2 e intercambiando las variables x e y ¶ ³ ´ Z + μ 1 Z + b g(y) exp (ixy) dy h (x) dx. g(x), F {h(x)} = 2 Por tanto, el operador adjunto de Fb es Z + 1 † b g (y) exp (ixy) dy. F {g (x)} = 2 4 2 De
una forma intuitiva, aunque no muy rigurosa, la transformada de Fourier puede entenderse como un paso al límite del desarrollo en serie de Fourier. Hemos visto que una función g (x) denida en un intervalo nito [L/2, L/2], puede escribirse como un desarrollo de Fourier en la base (r ) r 1 inx/L 1 inx/L e e , L L n=0
y sabemos que que el desarrollo converge a la función g(x) salvo puntos aislados. Cuando L la suma de la serie se transforma en la denominada integral de Fourier.
2.14 Vectores no normalizables
91
Obtenido el operador Fb† , probemos ahora que Fb es unitario. Dada una función (x) L2 (R) cualquiera μ ¶ Z + n o 1 † † b b b F F (x) (y) exp (ixy) dy = F 2 ¶ Z + μ Z + 1 1 izy = (y) e dy eixz dz 2 2 ¶ Z + μ Z + 1 1 exp (iz (x y)) dz (y) dy = 2 2 Z + 1 (x y)(y)dy = (x), = 2 b de b De similar forma se demuestra que FbFb† = I, de modo que Fb† Fb = I. donde queda probado que Fb es unitario. • Como consecuencia del teorema anterior, observamos que la transformada de Fourier conserva la norma: Z Z 2 |e g(k)| dk = |g(x)|2 dx R
R
(resultado conocido como teorema de Plancherel). Otras propiedades de la transformación de Fourier, cuya demostración dejamos como ejercicio, son las siguientes: 1. Si dg (x) /dx L (R), entonces F {dg (x) /dx} = xF {g(x)}. En general, si dn g (x) /dxn L(R), entonces ¾ ½ n d g (x) = (ix)n F {g(x)} . F n dx 2. Si g(x), xg(x) L(R), entonces F {xg(x)} = i dF {g(x)} /dx, En general, si g(x), xn g(x) L (R) , con n un número natural, entonces F {xn g(x)} = in
dn F {g(x)} . dxn
3. Dadas dos funciones g(x), h(x) L (R) se denomina producto de convolución a la función (g h) (x) Z + (g h) (x) = g(s) h(x s) ds.
Entonces, F {(g h) (x)} = F {g (x)} F {h (x)} , es decir, la transformada de Fourier de un producto de convolución es el producto ordinario de las transformadas de Fourier.
92
ESPACIOS DE HILBERT 4. Algunas transformadas de Fourier sencillas son: F {k (x)} = k (x), con k (x) = exp (ikx) / 2; es decir, la transformada de Fourier de una onda plana es una delta de Dirac. Recíprocamente, F { k (x)} = k (x) y la transformada de Fourier de una delta de Dirac es una onda plana. Por último, n
x2 /a2
F e
o
1 = 2
Z
+
ey
2 /a2
a2 x2 a eiyx dy = e 4 , 2
esto es, la transformada de Fourier de una gaussiana de anchura a es una gaussiana de anchura proporcional a 1/a. Estos ejemplos muestran que cuanto más localizada está una función g(x), menos localizada está su transformada ge(x) y viceversa. • Si k (x) = exp (ikx) / 2 es una onda plana normalizada,4 3 la transformada de Fourier de una función g (x) puede entenderse también como 1 ge (k) = 2
Z
+
eikx g (x) dx = (k , g) ,
esto es, como el producto escalar de la onda plana de número de onda k con la función. Haciendo ahora uso de la transformada inversa de Fourier Z Z Z 1 ikx g (x) = e ge (k) dk = ge (k) k (x) dk = (k , g) k (x) dk. 2 R R R Esto es, cualquier función de L2 (R) puede expresarse como una “especie” de desarrollo de Fourier en términos de las ondas planas, sólo que en este caso la suma habitual se ha sustituido por una integral sobre el parámetro k que etiqueta a las ondas planas. Por otro lado, Z g (x) =
Z R
g (a) a (x) da =
R
( a , g) a (x) da,
por lo que sucede exactamente lo mismo con el conjunto formado por las deltas de Dirac. 4 3 En
sentido generalizado, naturalmente. A partir de ahora cuando digamos que un vector de norma innita está normalizado daremos por supuesto que forma parte de un conjunto ortonormal (en sentido generalizado) de vectores de norma innita.
2.15 Espectro continuo
2.14.3
93
Bases ortonormales generalizadas
Los dos casos anteriores son los dos casos particulares más importantes de bases ortonormales (de nuevo en sentido generalizado) formadas cada uno de ellos por vectores de norma innita. En esta breve subsección hablaremos de la denición más general de base ortonormal. DEFINICIÓN: Sea H un espacio de Hilbert y el conjunto ortonormal de vectores de norma innita B = {~v }D . Dicho conjunto es una base ortonormal (generalizada) si todo vector w ~ H puede escribirse como Z Z w ~= w~v d = (~v , w) ~ ~v d. D
D
A los números complejos w dependientes del parámetro continuo se les denomina coordenadas del vector w ~ en la base ortonormal B.4 4 De esta manera, dada una función g (x) L2 (R), su transformada de Fourier ge (k) es la coordenada k en la base ortonormal de ondas planas {k (x)}kR , mientras que el valor que toma la propia función g (a) es la coordenada a en la base ortonormal de deltas de Dirac { a (x)}aR . A su vez, la transformada de Fourier, entendida como un operador unitario en L2 (R), es el operador que relaciona ambas bases. Nótense, así, los evidentes paralelismos con lo que sucede para bases ortonormales “ordinarias”. Por último, puede haber bases ortonormales mixtas, formadas por vectores del Hilbert y por vectores no normalizables. Cerremos entonces esta sección con la denición más general posible de base ortonormal: DEFINICIÓN: Sean H un espacio de Hilbert, el conjunto B1 = {~en } H de vectores normalizables, y el conjunto de vectores no normalizables B2 = {~v }D . El conjunto mixto B = B1 B2 es una base ortonormal (generalizada) de H si se cumplen las cuatro condiciones siguientes: 1. B1 es ortonormal: para todo ~em , ~en B1 se cumple (~em , ~en ) = mn . 2. B2 es ortonormal: para todo ~v , ~v0 B2 se cumple (~v , ~v0 ) = ( 0 ). 3. B1 B2 : para todo ~en B1 y ~v B2 se cumple (~v , ~en ) = 0. 4. Todo vector w ~ H puede escribirse como el desarrollo de Fourier generalizado Z Z X X w ~= wn~en + w~v d = (~en , w) ~ ~en + (~v , w) ~ ~v d, n
D
n
D
donde {wn } {w }D son las coordenadas de w ~ en la base B.
2.15
Espectro continuo
• Tras la discusión de las secciones anteriores ya estamos en disposición de explicar las propiedades del espectro de un operador en espacios de Hilbert de dimensión 4 4 La
denición no excluye la posibilidad de que para un aislado el producto escalar (~v , w) ~ diverja. Sin embargo lo que tiene que converger es la expresión Z (~v , w) ~ ~v d . D
94
ESPACIOS DE HILBERT
b de un espacio de Hilbert H y innita. Empecemos considerando un operador lineal A b si la ecuación de autovalores recordando que a es un valor propio del operador lineal A b I)~ b u = ~0 admite soluciones ~u 6= ~0. Así, dado un vector ~ (Aa u normalizado, la cantidad real y positiva ° °³ ´ ° ° ° ° °b ° b ~u a ~u° aIb ~ u° = °A ~u (a) = ° A b con autovalor nos sirve para cuanticar lo cerca que está ~u de ser un vector propio de A b~ a ya que, en caso de que lo sea, se cumple que u~ (a) = 0. A su vez, si A u no es exactamente a~ u, pero sí un vector del Hilbert bastante parecido, tendremos que b ~u y a ~u son muy diferentes, la cantidad ~u (a) es muy pequeño. Por último, si A ~u (a) es netamente distinta de cero. Así, la búsqueda de autovalores y autovectores se puede hacer jando el escalar a y buscando vectores normalizados ~ u que anulen ~u (a).4 5 En espacios de Hilbert de dimensión innita es posible que existan escalares tales que u~ () alcance valores arbitrariamente pequeños, pero sin llegar nunca a b H. Excluida así la posibilidad de que sea un anularse para vectores ~ u D(A) autovalor, el hecho de que dentro del espacio de Hilbert “casi” se pueda satisfacer la ecuación de autovalores sugiere la existencia un elemento no perteneciente al espacio de Hilbert que sí la satisfaga. Así, se puede decir que es un “autovalor”, pero en un sentido generalizado, y que dicho elemento (de existir) es un “autovector” en igual sentido. Por construcción, el espacio de Hilbert está formado por todos los vectores de norma nita. Entonces ese “autovector” ha de ser un vector de norma innita. Finalmente, ya que la ecuación de autovalores “casi” se satisface para un valor es razonable pensar que muy probablemente suceda lo mismo para un valor + , donde a es un innitesimal. Es por este motivo por el que al conjunto formado por estos autovalores generalizados se le denomina espectro continuo. b un operador en un espacio de Hilbert H de dimensión inDEFINICIONES: Sea A b denotándose por c (A), b como nita. Se dene el espectro continuo del operador A, el conjunto formado por todos los escalares complejos , no pertenecientes al espectro puntual, tales que existe una sucesión de vectores normalizados 4 6 {~un } n=1 b D(A) que cumple °³ ´ ° ° b ° b lim ° A I ~un ° lim ~un () = 0.
n
n
A los elementos del espectro continuo se les llama autovalores del continuo o impropios. A los autovalores, impropios o no, se les denomina genéricamente valores espec4 5 La
función ~u (a) se puede generalizar inmediatamente a cualquier otro vector del espacio °³ ´ ° ° b ° b de Hilbert sin mas que redenirla como ~u (a) = ° A aI ~ u° / k~ uk. Así, para cualquier escalar complejo , ~u (a) = ~u (a) . 4 6 Esta sucesión {~ un } n=1 no es convergente, ya que en caso de que convergiese, su límite sería un autovector del operador con autovalor , en contradicción con la imposición de que b / p (A).
2.15 Espectro continuo
95
b = p (A) b c (A), b formado por todos los valores espectrales, trales. Al conjunto (A) se le denomina espectro del operador. 4 7 Veamos dos teoremas que caracterizan el espectro continuo de operadores autoadjuntos y unitarios: b un operador autoadjunto de H. TEOREMA: Sea H un espacio de Hilbert y A b cumple las siguientes propiedades: De existir, su espectro continuo c (A) b R, esto es, el espectro continuo es real. 1. c (A) b puede poseer valores no aislados. Esto es, c (A) b es, en general, continuo. 2. c (A) Demostración: 1. Procedamos por reducción al absurdo y supongamos que existe un b tal que su parte imaginaria Im es no nula. De acuerdo c (A) con la denición, siempre podemos encontrar un vector normalizado del b b u sea arbitrariamente pequeña. Hilbert ~u tal que la norma de ~ = (A I)~ b es Evaluemos la cantidad = (~, ~u) (~ u, ~) usando el hecho de que A autoadjunto: ³³ ´ ´ ³ ³ ´ ´ b Ib ~ b Ib ~u = A u, ~ u ~u, A ³ ´ ³ ´ bu + ~ bu = = 2i Im () . = + ~u, A~ u, A~ Como la norma de ~ se puede hacer arbitrariamente pequeña, también podemos hacer arbitrariamente pequeña = 2i Im (), en contradicción con el hecho de que Im es no nula. Por tanto ha de ser real. 2. Basta con encontrar un operador autoadjunto con espectro continuo no discreto, y eso lo haremos en un ejemplo posterior. Análogamente (aunque lo admitiremos sin demostración): b un operador unitario. De existir, TEOREMA: Sea H un espacio de Hilbert y U b su espectro continuo c (U ) cumple las siguientes propiedades: 1. Los autovalores del continuo son siempre complejos de módulo unidad. b puede poseer valores no aislados. Esto es, c (U) b es, en general, continuo. 2. c (U) Estrictamente hablando, hay muchos operadores autoadjuntos y unitarios con espectro continuo que posee una parte discreta, e incluso que tienen espectro continuo puramente discreto.4 8 Por ello hemos escrito “es, en general, continuo”. Sin embargo, 4 7 Excluimos
de la denición el espectro residual, el cual no existe para operadores autoadjuntos y unitarios. 4 8 Piénsese, por ejemplo, en el operador lineal B b cuya regla de actuación sobre una base ortonormal {~en }n=1 es ¢ ½ ¡ 1 2 n ~en si n es par b ~en = B 1 ~ e si n es impar n n A partir de la denición de espectro continuo, no es difícil ver que los dos escalares reales 0 b = {0, 2}. En lenguaje técnico, si un operador y 2 forman parte del mismo y, de hecho, c (B) b y la sucesión de números autoadjunto tiene innitos valores propios (pertenecientes a p (B)) reales formada estos valores propios tiene uno o varios puntos de acumulación, éstos son autovalores del continuo.
96
ESPACIOS DE HILBERT
estos autovalores discretos del espectro continuo no van a jugar ningún papel fundamental en el formalismo cuántico y, como consecuencia, obviaremos su existencia de aquí en adelante. Por tanto, la frase “el espectro continuo de un operador autoadjunto, de existir, es continuo” aunque en rigor no sea correcta, desde una perspectiva física la podemos dar por válida. • A la vista de la denición de espectro continuo, puede pensarse que su obtención para un operador dado va a ser una labor ardua. Veremos que no es así (precisamente para ello introdujimos en la sección anterior los vectores de norma innita). Terminemos este punto dando dos teoremas bastante útiles, ya que caracterizan la existencia del espectro continuo en función de la naturaleza del espectro puntual. b un operador autoadjunto o unitario en un espacio de Hilbert H. TEOREMA: Sea A b Si existe una base ortonormal del espacio de Hilbert formada por autovalores de A, entonces: b en esa base es diagonal. 1. la representación matricial de A 2. el operador carece de espectro continuo.4 9 Demostración: Nos restringiremos al caso de un operador autoadjunto, dejando la demostración para un operador unitario como ejercicio. 1. Es inmediato. Sea {~en } la base ortonormal del Hilbert formada por b de modo que A b ~en = an ~en , con an R.5 0 Entonces, autovalores de A, b serán los elementos de matriz del operador A ´ ³ b Amn = ~em , A ~en = (~em , an ~en ) = an (~em , ~en ) = an nm y, por tanto, la representación matricial es diagonal. Además, el n-ésimo elemento de la diagonal es autovalor an . Por abuso del lenguaje se dice, b es diagonal en esta base. entonces, que el operador A 2. Demos un argumento de plausibilidad. Consideremos P un escalar real b / p (A). Dado un vector genérico normalizado ~ u = i ui~ei tenemos, de acuerdo con el punto 1, que X b ~u = A ui ai~ei , i
de donde ³
´ X b Ib ~u = ui (ai ) ~ei , A i
por lo que °³ ´ ° sX ° b ° (ai )2 |ui |2 . ~u () = ° A Ib ~u° = i 4 9 Salvo,
como veremos en la demostración, una posible parte discreta que ya hemos dicho que no va a ser físicamente relevante. 5 0 No excluimos la posibilidad de que a = a n m con m 6= n, ya que el espacio propio asociado a un autovalor puede ser degenerado.
2.15 Espectro continuo
97
b la cantidad |ai | es estrictamente positiva y, por Como / p (A), tanto, existe un 0 tal que |ai | > . Así tenemos que sX 2 |ui |2 = , u~ () > i
donde hemos usado la condición de normalización de ~u. La función ~u () está, entonces, acotada inferiormente por , y la única manera de que sea un valor del espectro continuo es que = 0, esto es, que siempre podamos encontrar un valor propio a una distancia arbitrariamente pequeña de . Sin embargo, esta es la denición de punto de acumulación de una sucesión de números reales. En denitiva, si la sucesión formada por los valores propios tiene puntos de acumulación, el espectro continuo está exclusivamente formado éstos. Un resultado topológico bien conocido señala que, de existir, los puntos de acumulación de una sucesión son siempre discretos,5 1 por lo que el único espectro continuo compatible con la hipótesis es un espectro continuo formado por valores reales discretos. Como ya hemos señalado, éstos carecen de interés y queda justicada la armación. TEOREMA: Dado un espacio de Hilbert H, si Pb es un proyector ortogonal no trivial,5 2 entonces p (Pb ) = {0, 1} y c (Pb ) = . El subespacio propio asociado al autovalor 1 es el subespacio de Hilbert W sobre el que proyecta Pb , mientras que el subespacio propio asociado al autovalor 0 es el complemento ortogonal W . Demostración: Es consecuencia directa del teorema anterior y del de la proyección ortogonal. • En la discusión previa a la denición de espectro continuo hemos mencionado la posibilidad de que exista un “autovector” de norma innita asociado al autovalor del continuo. Sin embargo esto no es cierto para muchos operadores y, en particular, para esos valores discretos del espectro continuo que ya hemos descartado. Sin embargo (afortunadamente) sí podemos generalizar el concepto de autovector a valores espectrales del continuo en operadores autoadjuntos y unitarios. Aunque lo admitiremos sin demostración, tenemos el siguiente teorema. b un operador, autoadjunto o unitario, TEOREMA y DEFINICIONES: Sean A b un autovalor impropio en un espacio de Hilbert H de dimensión innita, c (A) y B = {~ei }i=1 una base ortonormal de H. Entonces, es posible encontrar un vector de norma innita ~ =
X
i ~ei
i=1 5 1 Es
intuitivo: sería absurdo pensar que si una sucesión (que por denición es un conjunto numerable de innitos elementos) se divide en ramas, entonces el número de ramas fuese continuo. 5 2 Esto es, excluimos el operador nulo y el operador identidad que, formalmente, son proyectores.
98
ESPACIOS DE HILBERT
que sea, formalmente, solución de la ecuación de autovalores ³ ´ b b ~ = ~0. A I ~ es un autovector impropio o de norma innita del opeSe dice, entonces, que b rador A con autovalor . El conjunto formado por todos los autovectores con autovalor impropio tiene estructura de espacio lineal, y se le denomina espacio propio asociado al autovalor , denotándose por E . Se cumple, además, que espacios propios asociados a autovalores del continuo distintos son ortogonales entre sí (en sentido generalizado). Hagamos unos comentarios: 1. Recordemos que en espacios de Hilbert de dimensión nita, el único espectro de un operador es el puntual. 2. La nomenclatura se suele relajar, denominando “autovalor” a cualquier valor espectral y “autovector” a todos los autovectores, incluidos los no normalizables. 3. Podemos extender la denición de degeneración a los espacios propios E del espectro continuo sin más que tener en cuenta que en este caso no son subespacios del Hilbert. 4. La recíproca del teorema no es cierta. Que exista un vector de norma innita b I) b ~ = ~0 no implica necesaque satisfaga la ecuación de autovalores (A b es autovalor del continuo si y sólo si satisface la riamente que c (A). denición dada al principio de la sección. b 5 3 el método práctico de cálculo de autova5. Dado un operador autoadjunto A, lores y autovectores está basado en la resolución de la ecuación de autovalores: ³ ´ b b A aI ~ = ~0 ; a R. Si para un a dado hay un vector de norma nita ~ que satisface la ecuación, b Si el vector solución es de norma innita, a es un candidato entonces a p (A). a formar parte del espectro continuo, pero habría que conrmarlo buscando una sucesión de vectores normalizados {~un } n=1 del Hilbert que cumpla la condición: °³ ´ ° ° b ° aIb ~un ° = 0 lim ° A n
o, comprobando que si ~u es un vector normalizado, la norma °³equivalentemente, ´ ° ° b ° u° se puede hacer arbitrariamente pequeña. Afortunadamente, con° A aIb ~ sideraciones físicas nos permitirán discriminar las soluciones válidas sin necesidad de hacer un estudio matemático detallado. En concreto, para el espacio de Hilbert L2 (Rn ) la discusión del capítulo anterior sugiere que las autofunciones de norma innita (x) con interés físico deben ser acotadas cuando |x| . 5 3 Sólo
en aplicaciones más avanzadas de la Mecánica Cuántica tendremos que obtener el espectro de un operador unitario, por lo que a partir de ahora nos restringiremos al caso de un operador autoadjunto.
2.15 Espectro continuo
99
6. Puede hacerse una caracterización completamente rigurosa del espectro de un operador (consúltese la bibliografía especializada citada al nal del libro). Aquí sólo hemos esbozado los aspectos importantes, aun a costa de sacricar rigor matemático. • Finalicemos esta sección con algunos ejemplos importantes que ilustran el cálculo del espectro en situaciones de interés. b = (1/2) d2 /dx2 del espacio de Ejemplo 2.49. Sea el operador lineal K Hilbert L2 [0, 1], con dominio las funciones que se anulan en 0 y 1 y con derivada segunda de cuadrado integrable. Este operador está relacionado con la energía cinética de una partícula. a) Demuestre que es autoadjunto. b) Calcule su espectro y las autofunciones correspondientes. Solución: b es autoadjunto hay que comprobar que para dos funciones a) Para demostrar que K cualesquiera g (x) y h (x) pertenecientes a su dominio se tiene Z
1 0
b h (x) dx = g (x) K
Z
1 0
³
´ b g (x) h (x) dx . K
b por su expresión e integrando por partes Sustituyendo K Z 1 Z 1 1 d2 b g (x) K h (x) dx = g (x) 2 h (x) dx 2 0 dx 0 ¸1 Z 1 1 d h (x) d g (x) d h (x) 1 dx g (x) = 2 0 dx dx 2 dx 0 Z 1 1 d g (x) d h (x) dx, = 2 0 dx dx b se anulan en los extremos. donde hemos usado que las funciones del dominio de K Integrando de nuevo por partes y usando la misma restricción Z 1 Z Z 1³ ´ 1 1 d2 g (x) b b g (x) h (x) dx , g (x) K h (x) dx = h (x) dx = K 2 0 dx2 0 0 b es hermítico. A su vez, K b es autoadjunto con el quedando así demostrado que K dominio indicado aunque, como señalamos en su momento, el carácter autoadjunto lo daremos por supuesto. b) Para obtener su espectro planteemos la ecuación de autovalores: 2 b (x) = (x) 1 d (x) = (x) , R, K 2 dx2
b La solución general de esta ecuación (en el donde es un autovalor real de K. intervalo [0, 1]) es
(x) = Aei
2 x
+ Bei
2 x
.
100
ESPACIOS DE HILBERT
Ahora bien, (0) = (1) = 0, por lo que A+B
i 2
i 2
Ae
+ Be
=
0
=
0.
De esta manera, A = B y, por tanto,
2
= ei 2 . Esta última igualdad se cumple sólo si 2 = n con n un número natural. Como b es consecuencia, el espectro puntual de K ¾ ³ ´ ½ 2 2 b = =
p K n , n = 1, 2, ... R 2 ei
(nótese que n 6= 0 ya que entonces (x) sería la función nula), con todos los valores propios no degenerados. Los autovectores correspondientes son i h inx inx (x) = A e = sin (nx) , e y tomando = 2, la autofunción (x) está normalizada. Naturalmente, los autob son ortonormales entre sí y, además, constituyen la base ortonormal vectores de K de senos de L2 [0, 1]. Por tanto, no es necesario buscar el espectro continuo ya que b = en L2 [0, 1]. tenemos la seguridad de que c (K) Ejemplo 2.50. Sea el espacio de Hilbert L2 (R) y el operador autoadjund to Pbx = i dx , con dominio las funciones continuas de L2 (R) con derivada de cuadrado integrable. Como ya hemos mencionado, este operador está relacionado con la representación del momento lineal en Mecánica Cuántica. Obtenga su espectro y las autofunciones correspondientes. Solución: La ecuación de autovalores i
d (x) = k (x) , k R dx
tiene como solución (x) = A exp (ikx) k (x) , con A una constante multiplicativa arbitraria. Sin embargo, sea cual sea el valor de k, la función k (x) / L2 (R) (ya que no es normalizable). Por tanto: ³ ´
p Pbx = . Ahora bien, la onda plana k (x) es una solución no normalizable a la ecuación de autovalores con autovalor k. Esto sugiere que c (Pbx ) = R, con todos los autovalores k no degenerados y siendo k (x) la autofunción con autovalor k. Puesto que k (x) no crece indenidamente cuando |x| , podemos armar que lo anterior es
2.15 Espectro continuo
101
cierto. Si normalizamos (en sentido generalizado) las autofunciones tomando como asignación el propio autovalor k llegamos al resultado: ³ ´ = {k R} = R
c Pbx gk
=
k (x)
=
1 (los valores propios poseen multiplicidad uno) 1 exp (ikx) (las funciones propias son las ondas planas). 2
Observamos no sólo que las autofunciones con autovalores diferentes son ortogonales entre sí, sino que además, existe una base ortonormal (generalizada) formada por autovectores del operador: la base ortonormal de ondas planas. En todo caso, aunque nunca lo haremos en la práctica, vamos a comprobar que cualquier k R es, efectivamente, autovalor del continuo. Para ello tomemos la función normalizada (compruebe que lo es) μ g (x) =
1 2
¶1/4
μ
ikx
e
x2 exp 2 2
¶ ,
> 0,
que es una gaussiana de anchura proporcional a multiplicada por el término eikx . Así ¸ ix b Px g (x) = + k g (x) 2 y, entonces, ³
´ ix b b Px kI g (x) = 2 g (x) sZ μ ¶ 1/4 °³ ° ´ + 2 1 x x2 /2 ° ° ° Pbx kIb g (x)° = dx 2 4e sZ + 1 1 = u2 eu2 du = , 1/4 2 que puede hacerse arbitrariamente pequeño haciendo que tienda a innito (es decir, aumentando la anchura de la gaussiana). b de L2 (R) cuya Ejemplo 2.51. Consideremos el operador autoadjunto X b (x) = x (x) y su dominio todas las funciones regla de actuación es X 2 (x) de L (R) tales que x (x) es de cuadrado integrable. En Mecánica Cuántica este operador representará la posición de un partícula. Obtenga su espectro y las autofunciones correspondientes. Solución: Planteemos la ecuación de autovalores b (x) = x (x) = a (x) , X
a R.
La única forma de que se cumpla la misma es que la función (x) sea nula en todo R excepto en x = a. Ahora bien, como ya vimos en un ejemplo anterior, dos funciones
102
ESPACIOS DE HILBERT
de L2 (R) son iguales si coinciden excepto para un conjunto de valores aislados de la variable x. Por tanto la ecuación de autovalores sólo tiene la solución trivial (x) = 0 y, entonces ³ ´ b = .
p X Para calcular el espectro continuo tendremos que contemplar posibles soluciones no normalizables a la ecuación, y estas van a ser las deltas de Dirac. En efecto, recordando que para cualquier función g (x) se cumple g (x) a (x) = g (a) a (x) , la delta de Dirac a (x) es solución formal a la ecuación de autovalores con autovalor a: b a (x) = x a (x) = a a (x) . X Como, además, lim|x| a (x) = 0, podemos concluir que: ³ ´ b = {a R} = R ,
c X que todo autovalor a es no degenerado, y que la autofunción correspondiente es a (x). Al igual que sucedía en el ejemplo anterior, el conjunto formado por las autofunciones, { a (x)}aR , constituye una base ortonormal (generalizada) de L2 (R). El lector puede comprobar que, en efecto, cualquier valor real a verica la denición de autovalor del continuo. Para ello basta considerar la función normalizada ¶1/4 ¶ μ μ 1 (x a)2 , >0 h (x) = exp 2 2 2 y comprobar que ° °³ ´ ° ° b lim ° X aIb h (x)° = lim k(x a) h (x)k = 0.
0
0
b = Pbx2 /2 = (1/2) d2 /dx2 , pero Ejemplo 2.52. Sea el operador autoadjunto K 2 ahora en L (R), con dominio todas las funciones con derivada segunda de cuadrado integrable. b es positivo. a) Demuestre que K b) Calcule su espectro y las autofunciones correspondientes. Solución: b Como limx± (x) = 0, se tiene a) Sea (x) una función del dominio de K. ³
´ b , K
= =
Z 1 + d2 (x) 2 (x) dx 2 dx ¯2 ¯ Z + Z d (x) d (x) 1 + ¯¯ d (x) ¯¯ 1 dx = dx 0. 2 dx dx 2 ¯ dx ¯
2.15 Espectro continuo
103
b planteemos formalmente la ecuación de autovalores b) Para calcular el espectro de K b (x) = (x) 1 d (x) = (x) , R. K 2 dx2 La solución general de dicha ecuación es una combinación lineal de dos funciones
(x) = A ei
2 x
+ B ei
2 x
,
donde A y B son constantes arbitrarias. A diferencia de lo que sucedía en L2 [0, 1], la autofunción (x) nunca es normalizable. Por tanto ³ ´ b = .
p K Analicemos ahora las soluciones no normalizables. Si < 0, la autofunción es (x) = 2|k|x + 2|k|x Ae +Be que, para cualquier combinación de A y B (excepto A = B = 0) crece indenidamente, lo que daría lugar a soluciones de norma innita no admisibles. Por tanto ³ ´ b = { 0} = R+ ,
c K y la forma general de la autofunción correspondiente es
(x) = A ei
2 x
+ B ei
2 x
,
que, excepto cuando = 0, depende de dos constantes arbitrarias. Así, la multiplicidad de cada autovalor impropio es igual a dos (excepto, como ya se ha dicho, para = 0, que es no degenerado). Si ahora establecemos la siguiente asignación para los autovalores del continuo en términos de un parámetro q ¾ ³ ´ ½ 1 2 + b
c K = q = q con q R , 2 entonces las funciones propias q,j , ya normalizadas (en sentido generalizado), son 1 exp (+iqx) si j = 1 2 q,j (x) = 1 exp (iqx) si j = 2, 2 donde j es un índice asociado a la degeneración del autovalor. De nuevo, observamos que podemos construir una base ortonormal (generalizada) del espacio de Hilbert a partir de las autofunciones del operador autoadjunto. Ejercicio 2.18. En el ejemplo anterior hemos observado que el espectro del operador b es positivo. Demuestre que este es siempre el caso, es decir, autoadjunto positivo K ³ ´ b es un operador positivo, entonces A b [0, ). que si A Ejercicio 2.19. Demuestre que las funciones de Hermite son autofunciones del operador transformada de Fourier. Como consecuencia, pruebe que su espectro puntual es {0, 1, i, i} y que carece de espectro continuo.
104
ESPACIOS DE HILBERT
2.16
Descomposición espectral
• En los ejemplos que cerraban la sección anterior hemos visto que resultaba posible construir una base ortonormal del espacio de Hilbert formada por autovectores (normalizables o no) de operadores autoadjuntos. Este es un resultado general que, aunque no demostraremos, conviene analizar en detalle puesto que sobre el descansa buena parte de la interpretación física de la Mecánica Cuántica. b en un espacio de • Para jar la notación, consideremos un operador autoadjunto A Hilbert H. Para el espectro puntual: b = {a1 , a2 , a3 , ...} = {an } es el espectro puntual del operador (es irrele1. p (A) vante que sea nito o innito numerable, lo que importa es que es discreto). b con 2. En H es el subespacio propio formado por todos los autovectores de A autovalor an . Llamamos gn a la multiplicidad del autovalor an , es decir, la dimensión de En . n 3. {~un,i }gi=1 es una base ortonormal de En . Es decir, ~un,i es un autovector norb con autovalor an , siendo i = 1, ..., gn un índice asociado a la malizado de A b con autovalor an multiplicidad de an . Por tanto, todo autovector ~ ua de A se puede escribir como un desarrollo de Fourier (combinación lineal, si gn es n un,i }gi=1 : nito)5 4 de los vectores {~
b ~ua = a ~ua ~ua = A
gi X
(~un,i , w) ~ ~un,i .
i=1
b con Por abuso del lenguaje se dice que ~ un,i es el i-ésimo autovector de A autovalor an , aun sabiendo que hay innitos autovectores para un autovalor dado. 4. De esta forma, considerando todos los posibles espacios propios (~ un,i , ~um,j ) = nm ij . La delta de Kronecker nm nos recuerda que autovectores con autovalores distintos son ortogonales. La segunda delta de Kronecker ij señala que hemos construido una base ortonormal de cada subespacio propio de acuerdo con el punto anterior. 5. Por último, Pbn es el proyector ortogonal sobre el subespacio En . De acuerdo con el teorema de la proyección ortogonal Pbn w ~=
gn X
(~ un,i , w) ~ ~ un,i ,
w ~ H.
i=1
• Consideremos ahora el espectro continuo, para el que seguiremos el mismo esquema: 5 4 En
ningún momento hemos dicho que la multiplicidad de un autovalor haya de ser nib cuyos autovalores, -1 y +1, tienen ta. Un ejemplo sencillo es el del operador paridad , multiplicidad innita.
2.16 Descomposición espectral
105
b son continuos,5 5 podemos 1. Como los autovalores del espectro continuo c (A) etiquetarlos de acuerdo con un parámetro perteneciente a un intervalo D R. Así ³ ´ b = {a con D} = {a }
c A D , ganando de esta forma mayor exibilidad. Nada impide, por supuesto, que el parámetro de asignación sea el propio autovalor (como hemos hecho al caracb y Pbx en L2 (R)). Sin embargo, al describir el terizar el espectro continuo de X b en L2 (R) en el ejemplo 2.52, asignamos los autovalores espectro continuo de K © 2 ª b = /2 mediante c (K) . El motivo era, simplemente, que resultaba R+ más sencillo normalizar las autofunciones con esta asignación (véase el ejemplo 2.43). 2. E es el espacio propio (no perteneciente al Hilbert y, por tanto, sin estructura de espacio de Hilbert) formado por todos los autovectores de norma innita del b con autovalor a . g es la multiplicidad de a , esto es, la dimensión operador A de E , que supondremos nita. 3. {~,i }gi=1 es una base lineal ortogonal de E , en el sentido de que todo autovector impropio ~ E puede escribirse como combinación lineal de los vectores {~,i }gi=1 :
b~ ~ ~ = A = a
gi X
i~ ,i .
i=1 un conjunto ortogonal, Al ser {~,i }gi=1 ½ 0 (~,i , ~,j ) =
si i 6= j si i = j
b con autovalor a , y, entonces, ~,i es un autovector de norma innita de A siendo i = 1, ..., g un índice asociado a la multiplicidad de a . Por abuso del b con autovalor lenguaje se dice que ~ ,i es el i-ésimo autovector impropio de A a , aun sabiendo que hay innitos autovectores para un autovalor dado. ª © están normalizados de acuerdo con la regla de 4. Los vectores {~,i }gi=1 D asignación asociada al parámetro . Es decir ¢ ¡ (~ ,i , ~ 0 ,j ) = 0 ij , donde la delta de Kronecker es consecuencia de la ortogonalización previa en cada espacio propio. 5. Por último, construyamos el operador lineal Pb : H E dado por Pb w ~=
g X
(~,i , w) ~ ~ ,i ,
w ~ H.
i=1 5 5 Lo
cual no quiere decir que estén contenidos en un único intervalo continuo. Un ejemplo típico aparece en física del estado sólido en el que los autovalores del operador asociado a la energía de un electrón forman “bandas”, entendidas como intervalos continuos en R, separados entre sí por una distancia conocida como “gap” o “banda prohibida”.
106
ESPACIOS DE HILBERT ~ H Pb no es un operador lineal del espacio de Hilbert, ya que a cada vector w le hace corresponder un vector no normalizable perteneciente al espacio propio E , por tanto la expresión Pb (Pb w) ~ no tiene sentido ya que, formalmente, va a b ~ diverger si P w ~ 6= 0.
• Establecida la notación tenemos (algunos resultados ya son conocidos): TEOREMA (de descomposición espectral de un operador autoadjunto): b un operador autoadjunto en un espacio de Hilbert H. Entonces: Sea A 1. Los espacios propios asociados a autovalores distintos son ortogonales entre sí. b Esto es, si ~ 2. Cada espacio propio es invariante bajo la acción de A. u En b b entonces A ~ u En , y si ~ E , entonces A ~ E . 3. Cualquier vector w ~ del espacio de Hilbert puede escribirse como Ãg ! Z Ãg ! n X X X w ~= wn,i ~ un,i + w,i~ ,i d, n
D
i=1
i=1
siendo wn,i = (~ un,i , w) ~
;
w,i = (~ ,i , w) ~ .
Es decir, existe una base ortonormal generalizada del espacio de Hilbert b formada por autovectores del operador autoadjunto A. 4. La igualdad anterior puede escribirse en términos de los proyectores ortogonales Pbn y de los operadores Pb como Z X b w ~= Pn w ~ + Pb w ~ d, D
n
lo que implica Ib =
X
Pbn +
Z
n
Pb d. D
Esta expresión es conocida como descomposición espectral de la identidad. b sobre cualquier vector w 5. La actuación del operador A ~ H está dada por Ãg ! Z Ãg ! n X X X bun,i + bu,i d bw wn,i A~ w,i A~ A ~ = =
n
i=1
n
i=1
Ãg n X X
D
! wn,i an ~un,i
+
i=1
Z ÃX g D
! w,i a ~ u,i
d.
i=1
Es decir, podemos extender la linealidad del operador autoadjunto a cualquier desarrollo de Fourier (generalizado) construido a partir de b puesto que el operador A b es diagonal en la base de autovectores de A autoestados.
2.16 Descomposición espectral
107
6. Podemos escribir formalmente Z X b b an Pn + a Pb d, A= D
n
b igualdad denominada descomposición espectral del operador A. • El teorema espectral indica la forma natural de tratar operadores autoadjuntos en b podemos calcular su espectro y Mecánica Cuántica. Dado un operador autoadjunto A autovectores, y construir una base ortonormal (puede que generalizada si el operador tiene espectro continuo) en la cual puede expresarse cualquier vector w. ~ En esta base b b está dado la actuación del operador A es sencilla, y, por ejemplo, el valor medio de A simplemente por Ãg ! Z Ãg ! n D E ³ ´ X X X 2 2 b bw A = w, ~ A ~ = an |wn,i | + a |w,i | d w ~
n
D
i=1
i=1
b (donde hemos hecho uso del carácter ³ ´ ortonormal de la base asociada al operador A). b se tiene (siempre que se cumplan propiedades No sólo eso; dado el operador g A de convergencia que daremos por supuestas) Ãg ! Z Ãg ! n ³ ´ X X X b w g A ~= wn,i g (an ) ~un,i + w,i g (a ) ~ u,i d, n
D
i=1
i=1
por lo que Ãg ! Z Ãg ! n D ³ ´E X X X 2 2 b g A = g (an ) |wn,i | + g (a ) |w,i | d. w ~
n
D
i=1
i=1
A su vez, la norma del vector se expresa fácilmente a partir de sus coordenadas como Ãg ! Z Ãg ! n X X X kwk ~ 2= |wn,i |2 + |w,i |2 d n
i=1
D
i=1
y, dado un segundo vector ~, el producto escalar (~ , w) ~ está dado por Ãg ! Z Ãg ! n X X X (~, w) ~ = n,i wn,i + ,i w,i d , n
i=1
D
i=1
siendo n,i , ,i las coordenadas de ~. Ejemplo 2.53. Hemos visto que el espectro del operador Pbx = id/dx de L2 (R) es toda la recta real R y sus autofunciones son las ondas planas k (x) = exp (ikx) / 2, donde el factor 1/ 2 garantiza la relación de ortonormalidad generalizada (k , q ) = (k q). a) Dada una función g (x) L2 (R), halle sus coordenadas en la base de autoestados de Pbx .
108
ESPACIOS DE HILBERT
b) Usando este resultado obtenga la actuación del operador Pbx y del operador Pbx2 = d2 /dx2 sobre dicha función sin necesidad de derivar. c) Dado el escalar real a, construimos el operador unitario exp(iaPbx ). Evalúe exp(iaPbx )g (x). Solución: a) Como ya sabemos, la coordenada k de la función g (x) en la base de ondas planas es Z + Z + 1 gk = k (x) g (x) dx = eikx g (x) dx = ge (k) , 2 esto es, la transformada de Fourier ge (k) . b) De acuerdo con el teorema espectral: Z + Z + 1 Pbx g (x) = ge (k) Pbx k (x) dk = ke g (k) eikx dk 2 y, análogamente, Z
+
1 ge (k) Pbx2 k (x) dk = 2 ´ ³ c) La actuación de exp iaPbx es inmediata: Pbx2 g (x) =
Z ´ b exp iaPx g (x) = ³
+
bx iaP
ge (k) e
Z
+
1 k (x) dk = 2
Z
k2 ge (k) eikx dk
+
ge (k) eiak eikx dk .
Agrupando las exponenciales, ³
exp iaPbx
´
1 g (x) = 2
Z
+
ge (k) eik(x+a) dk ,
pero la integral es la transformada inversa de Fourier siendo la variable x + a. En denitiva, ´ ³ exp iaPbx g (x) = g (x + a) , ´ b por lo que el operador exp iaPx es la traslación de valor a. ³
• Todo el teorema de descomposición espectral descansa en su punto 3 (la posibilidad de encontrar una base ortonormal generalizada), ya que a partir de este punto los siguientes se demuestran sin problema. Por otro lado, la dicultad principal radica en los operadores Pb que, al escribir la descomposición de la identidad y del propio operador, siempre aparecen dentro de una integral sobre el parámetro . Sin embargo, podemos reescribirlos olvidándonos completamente de los autovectores impropios, como veremos a continuación. En efecto, consideremos sin pérdida de generalidad que el todo el espectro es no degenerado y que el parámetro continuo de asignación es el propio autovalor. Así,
2.16 Descomposición espectral
109
escojamos un autovalor del continuo y un valor positivo > 0 todo lo pequeño que se quiera, pero distinto de cero. Denamos el operador Pb =
Z
+/2
Pba da,
/2
£ ¤ resultado de la integral de Pba sobre el intervalo 2 , + 2 D. Este nuevo operador es un proyector ortogonal del espacio de Hilbert. En efecto, para cualquier vector w ~ del Hilbert Z +/2 Pb w ~= (~a , w) ~ ~ a da , /2
de manera que Z ° ° ° b °2 ~° = °P w
+/2
|(~a , w)| ~ 2 da < kwk ~
/2
ya que, en este caso 2
kwk ~ =
X
Z
2
|(~ un , w)| ~ +
n
b) c (A
~ 2 da. |(~ a , w)|
Por tanto, Pb transforma vectores del Hilbert en vectores de norma nita, que son del Hilbert. A su vez, ³
Pb
´2
Z w ~
+/2
= Z
/2 +/2
³ ´ ~ a , Pb w ~ ~ a da Ã
Z
+/2
~ a ,
= /2
! (~ a 0 , w) ~ ~a 0 da 0
~a da
/2
y agrupando términos y usando la ortonormalidad de los autovectores ~a ³
Pb
´2
Z w ~
+/2
Z
+/2
= Z
/2
+/2 Z
/2 +/2
= Z
/2 +/2
=
(~a 0 , w) ~ (~ a , ~ a 0 ) ~a da 0 da = ¢ ¡ (~a 0 , w) ~ a a 0 ~a da 0 da =
/2
(~a , w) ~ ~a da = Pb w. ~
/2
Por último, no es difícil probar (hágase) que Pb es autoadjunto. De este modo podemos construir proyectores ortogonales asociados a un rango, todo lo pequeño que se quiera pero nito, del autovalor del continuo. El subespacio de Hilbert sobre el que proyecta Pb será, en sentido formal, Z
+/2
E = /2
Ea da
110
ESPACIOS DE HILBERT
~ que se pueden escribir como y estará formado por todos los vectores
Z +/2 ~ =
a~a da .
/2
~ está normalizado, esto es, Imaginemos ahora que
Z +/2 | a |2 da = 1 /2
(si es muy pequeño, | a |2 será muy grande, pero siempre nito y de orden 1/ ). Si ahora evaluamos la función
~ (), tenemos ° ° °³ ° ´ ° °Z +/2 ° ° b ° ° ~ b
= ° A I ° = ° (a ) a~ a da° = ~ () ° /2 ° sZ sZ +/2 +/2 1 1 2 2 = (a ) | a | da ' (a )2 da = , 32 /2 /2 esto es,
~ () es del orden de . Por tanto, podemos interpretar E como el subespacio de Hilbert que contiene a todos los vectores para los cuales
~ () es del orden de o menor. Así, podemos escribir la descomposición espectral de la identidad como X X Ib = Pbn + Pb , n b) c (A que es equivalente a escribir el espacio de Hilbert como suma directa de subespacios M M H= En + Ea , n b c (A) y donde los autovalores del continuo que escogemos para la suma están separados una distancia . La descomposición espectral del operador será: Z X X X b b b b a Pba da A= an Pn + lim an Pn + P = 0 b c (A) n n b) c (A Bajo esta forma de ver las cosas ya podemos entender cómo surgen los autovectores del continuo. Si consideramos el subespacio de Hilbert E y construimos el vector Z 1 +/2 ~ ~ a da, = /2 ° ° °~ ° cuya norma es ° ° = 1/ , observamos que la norma del vector crece indenidamente a medida que disminuimos . En el límite 0 tendremos, naturalmente ~ a = ~ a , lim
0
esto es, el autovector impropio.
2.17 Conjunto compatible de operadores
111
Ejercicio 2.20. Particularice el teorema de descomposición espectral al caso de que todos los autovalores sean no degenerados. A su vez, particularice el teorema espectral para operadores autoadjuntos con espectro puramente puntual.
2.17
Conjunto compatible de operadores
• En la sección anterior hemos visto que es posible construir una base ortonormal b (puede que generalizada) formada por autovectores de un operador autoadjunto A. Si todos los autovalores son no-degenerados dicha base es única salvo cambios triviales (permutación de los elementos de la base y multiplicación de los vectores por un escalar de módulo unidad). Sin embargo, en la situación más general los autovalores son degenerados y la base ya no es única, puesto que podemos transformarla mediante combinaciones lineales entre autovectores asociados al mismo autovalor. En Mecánica Cuántica es conveniente obtener bases ortonormales cuyos elementos sean autovectores a la vez de una serie de operadores autoadjuntos, de manera que cada elemento de la base quede unívocamente determinado por los autovalores asociados. En esta sección describiremos el procedimiento para conseguir este objetivo. Para ello empecemos dando dos teoremas relativos a la conmutabilidad entre dos operadores. by B b conmutan si y solo si existe una TEOREMA: Dos operadores autoadjuntos A base ortonormal del Hilbert formada por vectores que son simultáneamente autovecb y de B. b tores de A Demostración: Para evitar complicaciones adicionales, nos limitaremos byB b tengan espectro puramente puntual al caso en que los operadores A (aunque la extensión al caso general es inmediata). Así supongamos que existe una base de Fourier de H tal que cada uno de sus elementos b y de B b con autovalores ai y bi respectivamente. ~ei es autovector de A P Cualquier vector ~v H puede escribirse como ~v = i vi~ei . Entonces ! Ã X X X X bB~ b ei = b i~ei = bB~ bv = A bB b A vi~ei = vi A vi Ab vi ai bi~ei . i
i
i
i
b A~ bv = P vi bi ai~ei ; de donde A bB~ bv = B b A~ bv para Análogamente se tiene B i bB b=B b A. b todo ~v H por lo que A h i b con b B b = 0 y sea ~ Supongamos ahora que A, ui un autovector de A autovalor ai . Entonces ´ ³ ´ ³ ´ ³ b B~ b A~ b ui = B bui = ai B~ b ui , A ³
b ui de modo que B~
´
b con el mismo autoes también un autovector de A ´ ³ b valor ai . Si ai no es degenerado es evidente que ~ui y B~ ui deben ser b ui = bi ~ui , y así ~ proporcionales; es decir, B~ ui es también autovector de b con autovalor bi . B
112
ESPACIOS DE HILBERT Si ai es gi -degenerado, le corresponderá un subespacio de dimensión gi . b actuando sobre vectores de este subespacio da vectores del Entonces, B b que constituirán mismo subespacio. Así pues, habrá gi autovectores de B una base ortonormal del mismo. La unión de todas estas bases constituirá una base del espacio total H (c.q.d.).
by B b dos operadores autoadjuntos y sean TEOREMA: Sean A b= A
X n
an Pban
;
b= B
X
bm Pbbm
m
by B b conmutan si y sólo si todo proyector espectral sus formas espectrales. Entonces A b conmuta con todo proyector espectral Pbb de B. b (La demostración es sencilla Pba de A y queda propuesta como ejercicio). • Debe notarse que el hecho de que haya una base formada por autovectores de by B b no quiere decir que todo autovector de A b sea necesariamente autovector de A b Lo que sí es cierto es que si denimos Ean ,b como el subespacio formado por los B. k b b autovectores simultáneos de A y B, el espacio de Hilbert puede escribirse como suma directa de todos estos subespacios Ean ,bk . Puede ocurrir que cada subespacio Ean ,bk tenga dimensión unidad. Esto quiere b decir que, salvo constantes multiplicativas, sólo hay un autovector simultáneo de A b con autovalores an y bk . Como consecuencia (excepto cambios triviales) la base yB by B b es única, y cada vector de la misma ortonormal de autovectores comunes de A está determinado unívocamente por los autovectores correspondientes a an y bk . Ahora bien, también puede suceder que hayan subespacios Ean ,bk con dimensión mayor que uno. Entonces, el par de valores an , bk no basta para caracterizar un autovector b y B. b Para discriminar una de las posibles bases ortonormales de Ean ,b común de A k b (y, por consiguiente, de todo H) necesitaríamos un tercer operador autoadjunto, C, b como con B. b Con este tercer operador podremos construir que conmute tanto con A b B byC b con autovasubespacios Ean ,bk ,cj formados por autovectores simultáneos de A, lores an , bk , cj . Si todos los Ean ,bk ,cj tienen dimensión unidad existe una única base ortonormal del Hilbert caracterizada por los autovalores de sus vectores referidos a un conjunto de operadores que conmutan entre sí. Si existe algún Ean ,bk ,cj con dimensión mayor que uno, habrá que añadir un cuarto operador, y así sucesivamente. En resumen: b B, b C, b . . . } es un conDEFINICIÓN: Un conjunto de operadores autoadjuntos {A, junto compatible si todos ellos conmutan entre sí. b B, b C, b . . . } es compatible TEOREMA: Un conjunto de operadores autoadjuntos {A, b B, b C, b ... si y sólo si existe una base de Fourier de H formada por autovectores de A, simultáneamente. b B, b C, b ...} DEFINICIÓN: Un conjunto de operadores autoadjuntos compatibles {A, es completo (CCOC) si la base ortonormal formada por autovectores simultáneos de todos los operadores es única, salvo permutaciones y multiplicaciones por escalares de
2.17 Conjunto compatible de operadores
113
módulo unidad. Cada uno de los vectores de dicha base queda unívocamente determinado por el conjunto de sus autovalores {a, b, c, . . . } para cada uno de los operadores del CCOC. b = Ejemplo 2.54. En el espacio de Hilbert L2 (R), sean los operadores K b cuya actuación sobre una función (1/2) d2 /dx2 y el operador paridad b (x) = (x). (x) es, recordemos, a) Demostrar que ambos operadores conmutan. b) Obtener una base ortonormal (impropia) de L2 (R) formada por autob y . b funciones de K Solución: b y b conmutan. Así, sea una función (x) L2 (R). a) Empecemos probando que K Entonces, 1 d2 (x) 2 dx2 ¶ μ 2 d 1 d2 1 d2 1 b b b (x) = (x) = (x) . K (x) = 2 dx2 2 d (x)2 2 dx2 h i b K b = 0. b b = bK b , Como esto es cierto para cualquier función (x), entonces K b b (x) K
=
b) Pasemos ahora a la construcción de la base ortonormal. Sabemos que el operador b tiene asociada una base ortonormal de autofunciones (en sentido generalizado) K dada por ¾ ½ exp (iqx) exp (iqx) BKb = , 2 2 q 0 siendo el autovalor correspondiente q 2 /2. Esta base que para no es única puesto cada q podemos combinar linealmente exp (iqx) / 2 y exp (iqx) / 2. Nuestro objetivo es obtener a partir de estas dos funciones otras dos que sean autofunciones de la paridad. Esto es inmediato, puesto que
q,+1 (x)
=
q,1 (x)
=
1 exp (iqx) 1 1 exp (iqx) + = cos (qx) 2 2 2 2 1 exp (iqx) 1 exp (iqx) 1 = sin (qx) 2i 2 2i 2
b con autovalor q 2 /2, pero además siguen siendo autofunciones normalizadas de K b
q,+1 (x)
=
q,+1 (x) = q,+1 (x)
b q,1 (x)
=
q,1 (x) = q,1 (x)
(el coseno es una función par y el seno es impar). Así, q,+1 (x) es autofunción de la paridad con autovalor +1, mientras que q,1 (x) lo es con autovalor 1. En denitiva, ½ ¾ 1 1 cos (qx) , sin (qx) BK, b b = q 0
114
ESPACIOS DE HILBERT
b y b simultáneaes una base ortonormal de L2 (R) formada por autovectores de K b es {1, 1}, siendo las funciones propias mente. Nótese, además, que el espectro de las funciones impares y pares, respectivamente.
2.18
Formas lineales. Notación de Dirac()
• El concepto de forma lineal, que deniremos a continuación, sirve para ayudar a comprender la llamada notación de Dirac, que es la que se utiliza de manera habitual en tratamientos formales de la Mecánica Cuántica. Además, las formas lineales permiten denir de manera más rigurosa los “vectores no normalizables” que introdujimos en la sección 2.14. DEFINICIÓN: Sea H un espacio de Hilbert. Una forma lineal o “bra” h | es cualquier aplicación de un subespacio lineal (no necesariamente de Hilbert) D (h |) H, llamado dominio de la forma lineal, en C, tal que a cada vector ~u D (h |) le hace corresponder un número complejo h | ~ u: h | : D (h |) C ~ u h | ~ u que cumple las dos propiedades siguientes: 1. h | (~u1 + ~ u2 ) = h | ~u1 + h | ~u2 , ~ u1 , ~u2 D (hu|) . 2. h | (~ u) = h | ~ u, C y ~ u D (hu|). Como consecuencia h | ~0 = 0, para cualquier forma lineal. Al igual que hacíamos con operadores, podemos operar con las formas lineales de la siguiente manera: Denición: Sea H un espacio de Hilbert. Dadas las formas lineales h | , h| y el escalar complejo , denimos la suma de formas lineales, h | + h|, y el producto de una forma lineal por un escalar complejo, h | , mediante las reglas de actuación siguiente: 5 6 1. (h | + h|) ~ u = h | ~u + h| ~ u 2. (h | ) ~ u = h | ~u Además, cada vector del espacio de Hilbert ~u tiene unívocamente asociada una forma lineal hu| construida mediante el siguiente teorema (muy fácil de demostrar): TEOREMA: Sea ~ u un vector de un espacio de Hilbert H. La aplicación hu| de H en C denida mediante la regla de actuación hu| w ~ = (~u, w) ~ es una forma lineal con dominio todo el espacio de Hilbert. A dicha forma lineal se le denomina forma dual del vector ~ u (o asociada a ~u). Sean ahora dos vectores ~u1 , ~u2 del espacio de Hilbert, hu1 | y hu2 | los correspondientes bras asociados, y un escalar complejo . Entonces TEOREMA: El bra hu1 | + hu2 | es el bra dual del vector del Hilbert ~u1 +~ u2 , mientras que el bra hu1 | es el bra dual del vector ~ u1 . 5 6 Mientras
no sea realmente imprescindible, no prestaremos atención a las restricciones asociadas a los dominios de denición.
2.18 Formas lineales. Notación de Dirac()
115
Demostración: En efecto, dado un vector w ~ cualquiera del Hilbert (hu1 | + hu1 |) w ~
~ (hu1 | ) w
=
hu1 | w ~ + hu2 | w ~ = (~u1 , w) ~ + (~u2 , w) ~ = (~u1 + ~ u2 , w) ~
=
hu1 | w ~ = (~ u1 , w) ~ = (~ u1 , w) ~ ,
de donde queda demostrada la armación. • El teorema anterior parece sugerir que existe una correspondencia biunívoca entre vectores del espacio de Hilbert y bras, construida a partir del producto escalar. Sin 57 embargo, pueden existir formas lineales h|, incluso con dominio ³ ´denso, pero para las que no existe un vector del Hilbert ~ tal que h| w ~ = ~, w ~ para todo vector w ~ del dominio de h|. Veremos inmediatamente que esta es una forma más rigurosa de denir los “vectores no normalizables” que ya conocemos. Empecemos con una denición. DEFINICIÓN: Sea h | una forma lineal delpespacio de Hilbert H. Denimos la norma de la forma lineal, denotándose por h | i, como p
h | i =
max
uD(h |)
|h | ~ u| . k~ uk
(Sep excluye de la denición ~u = 0, ya que en este caso el cociente estápindeterminado). Si h | i = 1 diremos que la forma lineal está normalizada; si h | i p R, que la forma lineal es normalizable (o de norma nita); por último, si h | i = (es decir, si |h | ~u| / k~uk no está acotada superiormente) diremos que la forma lineal tiene norma innita o que no es normalizable. A partir de esta denición de norma se tiene el siguiente teorema: TEOREMA: Sea hu| una forma lineal del espacio de Hilbert H con dominio denso. La condición necesaria y suciente para que exista un vector ~ u H tal que hu| sea el bra dual de ~up es que la norma de la forma lineal sea nita. En este caso se cumple, además, que hu|ui = k~ uk. Demostración: Veamos la condición necesaria. Supongamos que hu| es el bra dual de un ~ u H. Entonces, usando la desigualdad de Schwarz p
hu|ui = max wH ~
|hu| w| ~ (~ u, w) ~ k~uk kwk ~ = max max = k~uk , wH ~ wH ~ kwk ~ kwk ~ kwk ~
p es decir, hu|ui k~uk, por lo que la norma del bra p es nita. Además, si hacemos w ~ =~ u la desigualdad se satura, de donde hu|ui = k~uk. p Demostremos la condición suciente, suponiendo que la norma hu|ui es nita. Esto implica que si {~en } es una base de Fourier contenida en el dominio de hu| p |hu| ~en | |un | hu|ui. 5 7 Es
decir, existe una base ortonormal del Hilbert “no generalizada” perteneciente al dominio de la forma lineal.
116
ESPACIOS DE HILBERT P De esta manera, dado un vector w ~ = n wn~en , X X X hu| w ~ = hu| wn~en = wn hu| ~en = wn un = (~ u, w) ~ n
n
donde el vector ~ u=
X
un~en =
n
X
n
(hu| ~en ) ~en
n
pertenece al Hilbert ya que para cualquier w, ~ hu| w ~ es, por hipótesis, nito. hu| es, por tanto, el bra dual de ~ u. La denición de forma lineal es lo bastante general para que pueden existir formas lineales h | que no estén asociadas a ningún vector del espacio de Hilbert y que, de acuerdo con el teorema anterior, no sean normalizables. En este contexto, estas formas lineales de norma innita no son en absoluto patológicas, ya que lo que importa de una forma lineal es el resultado de su aplicación sobre un vector del espacio de Hilbert. Veamos un par de ejemplos: Ejemplo 2.55. Consideremos el espacio de Hilbert L2 (R) y la forma lineal hq |, con q un escalar real, denida mediante la expresión Z + 1 e (q) . hq | = exp (iqx) (x) dx
2 Demostrar que hq | tiene norma innita. Solución: Dada una función (x), hq | no es otra cosa que la transformada de Fourier con número de onda q. Para ver que esta forma lineal es de norma innita basta encontrar una función (x) normalizada para la que |hq | | sea tan grande como se quiera. Si escogemos la familia de funciones normalizadas μ μ ¶1/4 ¶ x2 1 iqx
(x) = e exp 2 , 2 2 con > 0, entonces 1 hq | = 2
Z
+
μ
1 2
¶1/4
μ
x2 exp 2 2
¶
μ dx =
2
¶1/4
que se puede hacer arbitrariamente grande aumentando . Ejemplo 2.56. Consideremos el espacio de Hilbert L2 (R) y la forma lineal h a |, con a un escalar real, denida mediante la expresión h a | = (a) . Demostrar que h a | tiene norma innita. Solución: Observamos que si (x) es una función, Z + h a | = (x a) (x) dx = (a) .
2.18 Formas lineales. Notación de Dirac()
117
Es decir, la delta de Dirac es, en rigor, una forma lineal. Si ahora consideramos la familia de funciones normalizadas ¶1/4 ¶ μ μ (x a)2 1
(x) = , exp 2 2 2 con > 0, tenemos que μ h a | =
1 2
¶1/4 ,
que se puede hacer arbitrariamente grande a medida que hacemos tender a cero. De esta forma, si h| es una forma lineal de norma innita, uno puede verse ~ pero ya no perteneciente a un espacio de tentado a intentar encontrar un vector , Hilbert, tal que se cumpla ³ ´ ~ h| w ~ = , w ~ , w ~ D (h|) H. Estos son, precisamente, los vectores no normalizables. En el caso del bra h q |, la función no normalizable “asociada” a esta forma lineal es, simplemente, la onda plana k (x). Para la forma lineal h a | la “función” correspondiente es la delta de Dirac (x a). b del Hilbert H, • De acuerdo con lo anterior, consideremos ahora un operador lineal A no necesariamente autoadjunto. A este operador le podemos asignar unívocamente b+ pero que en lugar de actuar sobre los vectores otro operador, al que llamaremos A del Hilbert, actúa sobre los bras. Así, dada una forma lineal hw|, independientemente b+ está denida mediante la regla de que sea de norma nita o no, la forma lineal hw| ~ A de actuación ³ ´ ³ ´ + † b b hw| ~ A ~u = hw| ~ A ~u , b y que resulta válida para cualquier vector del Hilbert b† es el adjunto de A, donde A ´ ³ b† ~ u C. De acuerdo con esto, si w ~ es un vector del para el que la expresión hw| ~ A b el bra dual de A bw b+ . En efecto, para Hilbert perteneciente al dominio de A, ~ es hw| ~ A cualquier ~ u, ³ ´ ³ ´ ´ ³ ´ ³ b w, b† ~ b† ~ b+ ~ A ~ ~u = w, ~ A u, u = hw| A u = hw| ~ A b+ y A b† si interpretamos el adjunto de un por lo que resulta absurdo distinguir entre A b (“adjunto de A”) b que actúa en el espacio de operador como el operador asociado a A los bras. A su vez, los paréntesis ya no son necesarios y podemos escribir ³ ´ ³ ´ b w, b† ~u = hw| A b† ~u. A ~ ~ u = w, ~ A De igual forma ³
´ ³ ´ bu = hw| A b~ b† w, ~ ~ u = w, ~ A~ u, A
118
ESPACIOS DE HILBERT
b como el operador que al actuar en el espacio de los bras y podemos interpretar A b† w. sobre la forma lineal hw| ~ da, como resultado, la forma lineal dual del vector A ~ • Dirac llamó vectores ket (o simplemente kets) a los elementos de H, y los representaba en la forma |ui. Es decir, en la notación de Dirac la actuación de la forma lineal h| sobre un vector ~ u |ui H se puede escribir como h| ~ u h| |ui , y es costumbre escribir una única barra en el medio: h| ~ u h | ui . A su vez, dados dos vectores del Hilbert |ui y |wi, su producto escalar es (~u, w) ~ = hu | wi , esto es, la actuación del bra hu| dual del vector |ui sobre el vector |wi. Con esta b se escribe como notación, el elemento de matriz de un operador cualquiera A ³ ´ bu = hw| A b |ui w, ~ A~ b se puede interpretar indistintamente como un operador actuando hacia y, entonces, A la derecha sobre kets (vectores) o hacia la izquierda sobre bras (formas lineales). • Lo interesante de la notación de Dirac es que todo resulta más compacto. Así, el desarrollo de un vector de H como combinación lineal de vectores de una base de Fourier {|ei i} es simplemente X X |vi = |ei ihei |vi. = vi |ei i i
i
donde vi es la i-ésima coordenada de |vi en la base ortonormal {|ei i}. Esto sugiere escribir la descomposición de la identidad X |ei ihei | , Ib = i
en términos de los kets de una base ortonormal y de sus bras correspondientes. De igual modo, si W es un subespacio de Hilbert y {|wi i} una base ortonormal del mismo, la proyección ortogonal de |vi sobre W es X X |wi ihwi |vi PbW = |wi ihwi | PbW |ui = i
i
A su vez, usando la descomposición de la identidad llegamos fácilmente a la exbv ) en términos de la representación matricial de A b y las coordenadas presión de (~ u, A~ de los vectores en la base de Fourier: X X b = hu|Ib A b I|vi b = b k ihek |vi = hu|A|vi hu|ei ihei |A|e ui Aik vk . i,k
i,k
2.18 Formas lineales. Notación de Dirac()
119
b con • En notación de Dirac, se suelen designar a los autovectores de un operador A el mismo símbolo que el autovalor, esto es, b |ai = a |ai A b con autovalor y |ai se entiende como el autovector (o autoket) del operador lineal A a. Análogamente, si ha| es el bra dual de |ai, b = ha| a ha| A b sea autoadjunto o no, esto es, el bra dual del autovector independientemente de que A de un operador es “auto-bra” del operador lineal. Si fuera necesario un índice de degeneración, se añade a la derecha de a: b |a, ji = a |a, ji , A
j = 1, 2, ...ga ,
con ga la multiplicidad del autovalor a. De acuerdo con esto, dado un operador autob la descomposición espectral de la identidad se escribe, en el caso más adjunto A, general, como Ib =
ga X X
Z |a, ii ha, i| +
g X b) c (A i=1
a p i=1
|, ii h, i| d,
donde ya hemos introducido los kets no normalizables |, ii entendidos como que sus b es, por tanto, bras duales son los h, i|. La descomposición espectral de A b= A
ga X X
Z a |a, ii ha, i| +
a p i=1
g X b) c (A i=1
|, ii h, i| d .
Así, un vector |wi se puede escribir como |wi =
ga X X
Z |a, ii ha, i|wi +
g X b) c (A i=1
a p i=1
|, ii h, i|wi d ,
y su norma al cuadrado se obtiene simplemente haciendo actuar el bra dual de |wi sobre la expresión anterior: hw|wi
=
ga X X
Z hw|a, ii ha, i|wi +
a p i=1
=
ga X X a p i=1
2
|ha, i|wi| +
Z
g X b) c (A i=1 g X
b) c (A i=1
hw|, ii h, i|wi d
|h, i|wi|2 d.
Análogamente, b |wi A ~ =
ga X X a p i=1
Z a |a, ii ha, i|wi +
g X b) c (A i=1
|, ii h, i|wi d ,
120
ESPACIOS DE HILBERT
b será y el valor medio de A b |wi hw| ~ A ~
=
ga X X
Z a hw|a, ii ha, i|wi +
a p i=1
=
ga X X
2
a |ha, i|wi| +
a p i=1
Z
g X b) c (A i=1 g X
b) c (A i=1
hw|, ii h, i|wi
|h, i|wi|2 d .
En general,
³ ´ b |wi hw| ~ h A ~ = Z ga g X X X h (a) hw|a, ii ha, i|wi + h () hw|, ii h, i|wi d = b A ( ) c a p i=1 i=1 Z ga g X X X 2 = h (a) |ha, i|wi| + h () |h, i|wi|2 d . b) c (A a p i=1 i=1
2.19
Isomorsmos entre espacios de Hilbert()
• En esta sección deniremos el concepto de isomorsmo. Siendo bastante técnico, explica claramente la equivalencia entre la formulación ondulatoria de la Mecánica Cuántica Ondulatoria de Schrödinger y la Matricial de Heisenberg y colaboradores. DEFINICIÓN: Sean H(1) y H(2) dos espacios de Hilbert. Se dicen que son isomorfos si existe una aplicación biyectiva entre H(1) y H(2) , llamada isomorsmo, (2) (2) tal que a cada vector ~v (1) H(1) le hace corresponder un ´ ³~v H ´ de ³ vector(1)único (1) ~ (2) ~ (2) = ~v , . forma que se conserva el producto escalar, esto es, que ~v , TEOREMA (de Reisz-Fisher): Todos los espacios de Hilbert con igual dimensión nita son isomorfos entre sí. Si el espacio de Hilbert es de dimensión innita y posee bases de Fourier numerables, entones es isomorfo a C2 . Por ejemplo, consideremos por un lado la base canónica BF = {~e1 , ~e2 , ~e3 , ...} de 2 0 C 2 y, por el otro, el espacio de funciones L (R) y una de sus bases de Fourier BF = {1 (x) , 2 (x) , 3 (x) , ...} (por ejemplo, la base de funciones de Hermite). Tomemos un vector de (x) L2 (R) que escribimos como (x) =
X
j j (x) ,
¡ ¢ siendo j = j (x) , (x) .
j=1
Establezcamos ahora la aplicación (x) ~u =
X
j ~ej C 2 ,
j=1 que nos da un vector ~ u de C 2 , cuyas componentes en la base BF de C2 coinciden con las componentes de (x) en la base BF0 de L2 (R). Es inmediato comprobar (hágase)
2.20 Producto tensorial de espacios de Hilbert()
121
que esta aplicación cumple las propiedades de isomorsmo (biyección y conservación del producto escalar). • A la vista de lo anterior, que dos espacios sean isomorfos no quiere decir que el isomorsmo que los conecte sea único. En el caso que hemos planteado, el isomorsmo depende de la base concreta BF0 utilizada pero, una vez construido el isomorsmo, hay una correspondencia entre vectores de un espacio y otro. Así, la formulación matricial de la Mecánica Cuántica realizada por Heisenberg y colaboradores trabaja en C 2 . 2 En cambio, la mecánica ondulatoria de Schrödinger trabaja en L (R) que, de acuerdo con el teorema de Reisz-Fisher, es un espacio de Hilbert isomorfo a C 2 .
2.20
Producto tensorial de espacios de Hilbert()
• Finalicemos el capítulo comentando brevemente una última construcción matemática que resulta particularmente útil al estudiar la evolución de partículas con momento magnético intrínseco (espín). Imaginemos el conjunto formado por los pares ordenados de funciones de L2 (R) μ ¶ 1 (x) [ (x)] = , 2 (x) donde la suma y el producto por un escalar complejo se denen como μ ¶ 1 (x) + 1 (x) [ (x)] + [ (x)] = 2 (x) + 2 (x) ¶ μ 1 (x) . [ (x)] = 2 (x) Se puede introducir el producto escalar deniéndolo como Z ([ (x)] , [ (x)]) = (1 (x) 1 (x) + 2 (x) 2 (x)) dx , R
y puede entonces demostrarse que este conjunto de pares ordenados tiene una estructura de espacio de Hilbert, llamada producto tensorial de L2 (R) y C2 , simbolizándose por L2 (R) C2 . Nótese que cualquier elemento de este espacio de Hilbert puede escribirse como μ ¶ μ ¶ 1 0 [ (x)] = 1 (x) + 2 (x) , 0 1 esto es, como suma de productos directos de una función de L2 (R) y de un¡ vector ¢ de C2 . En este caso, existe un cierto paralelismo entre el producto 1 (x) 10 y el producto de un vector de C2 por un escalar; sin embargo desde un punto de vista matemático dicho paralelismo no equivale a una denición de producto directo y es mejor escribir μ μ ¶ ¶ 1 0 [ (x)] 1 (x) + 2 (x) . 0 1
122
ESPACIOS DE HILBERT
Esta es una denición, y el producto directo 1 (x) objeto matemático en sí mismo.
¡1¢ 0
debe entenderse como un
• Tras esta discusión ya es más fácil entender la siguiente denición más general de producto directo. [1] DEFINICIÓN: Sean H1 y H2 dos espacios de Hilbert. Simbolicemos por ~ los [2] [1] vectores de H1 y por ~ los de H2 . El producto directo o tensorial de ~ y ~[2] es el objeto matemático ~[1] ~[2] perteneciente al espacio de Hilbert H1 H2 , formado por todos los productos directos de vectores de H1 con vectores de H2 y todas sus posibles combinaciones lineales.
Evidentemente, para que H1 H2 sea un espacio vectorial habría que denir una suma y un producto por un escalar. Si estas dos operaciones se denen de forman que veriquen ~[1] ~[2] + ~[1] ~ [2] ´ ³ [1] [2] ~ ~
=
´ ³ ~[1] ~[2] + ~ [2]
=
[1] [2] [1] [2] ~ ~ = ~ ~ ,
entonces tendremos la seguridad de que H1 H2 “hereda” la estructura de espacio vectorial de H1 y H2 . Para dotarlo de estructura de espacio de Hilbert, el producto escalar en H1 H2 ha de denirse como ´ ³ ´ ³ ´ ³ [1] ~ ~[2] , ~ [1] ~ [2] = ~[1] , ~ [1] · ~[2] , ~[2] supuesto para el mismo las propiedades de linealidad del producto escalar. Dos comentarios. En primer lugar, seguimos la costumbre de no simbolizar de manera distinta el producto escalar, la suma o el producto por un escalar de cada uno de los distintos espacios; sólo hemos incluido explícitamente el signo “·” para indicar el producto de dos números complejos. En segundo lugar, la frase “supuesto para el mismo las propiedades de linealidad del producto escalar” permite denir el producto escalar de vectores de H1 H2 que no sean productos directos, sino una combinación lineal de éstos. • La construcción de una base ortonormal de H1 H2 es sencilla a partir de sendas bases ortonormales B1 y B2 de los espacios de Hilbert H1 y H2 . En concreto: n o [1] [1] TEOREMA: Sean H1 y H2 dos espacios de Hilbert, B1 = ~e1 , ~e2 , ... una base n o [2] [2] ortonormal de H1 y B2 = ~e1 , ~e2 , ... una base ortonormal de H2 . Entonces B1 2
n [1] [2] = ~ej ~ei
es una base ortonormal de H1 H2 .
o ;
j = 1, 2, ... i = 1, 2, ...
2.20 Producto tensorial de espacios de Hilbert()
123
DEFINICIÓN: Los operadores lineales de H1 y H2 de cada uno de los espacios de b[1] un operador de Hilbert se incorporan directamente a H1 H2 . En efecto, sea A b[1] opera sobre los vectores de H1 H2 de la manera siguiente: H1 ; entonces A ³ ´ ³ ´ b[1] ~[1] ~[2] = A b[1]~[1] ~[2] . A b[2] de H2 , opera sobre los vectores de H1 H2 como: Análogamente, un operador A ³ ³ ´ ´ [2] [1] [2] ~ [1] [2] ~ [2] ~ ~ b b A = A . A partir de la denición anterior, que extiende la actuación de los operadores de cada espacio de Hilbert al espacio producto tensorial, podemos construir sumas, productos por un escalar y composiciones de operadores de H1 y H2 . Por ejemplo ³ ´ ³ ´ ³ ´ [2] [1] b[2] ~ [1] [1] ~ [1] [2] ~ [2] ~ b b b A A = A A ³ [1] ´ ³ ´ [2] [2] [1] b [1] ~ [1] b [1] ~ [1] ~ b b = ~ A B A B ³ ´ ³ [1] ´ ³ ´ ´ ³ [2] [2] [2] [1] [1] [1] ~ [1] [1] ~ [1] ~ ~ ~ b b b b A +B = A + B ~ ³ ´ ³ [1] ´ ³ ´ ´ ³ [2] [2] [1] [1] [2] [1] ~ [1] [2] ~ [2] ~ ~ ~ ~ b b b b = + B . A +B A b[1] y B b [2] , Por otra parte, para cualesquiera A h i b [2] = 0, b[1] , B A [1] b[1] con autovalor a, se cumple que y, además, si ~ es autovector de A ³ ´ ³ ´ b[1] ~[1] ~[2] = a ~[1] ~[2] A [2] [1] [2] b[1] con igual autovalor a para cualquier ~ . Esto es, ~ ~ es autovector de A [1] [2] (pero ahora ~ ~ es un vector de H1 H2 ). Naturalmente, lo mismo ocurre con los operadores del espacio de Hilbert H2 .
Índice de símbolos y glosario CONJUNTOS, NÚMEROS Y FUNCIONES . : conjunto vacío. N : conjunto de los números naturales. R y C : son los conjuntos de los números reales (recta real) y complejos (plano complejo), respectivamente. R+ : recta real positiva, esto es [0, ). Re (. . . ) o Im (. . . ) son las partes real e imaginaria de la expresión encerrada entre los paréntesis. es el complejo conjugado de C. ij : delta de Kronecker, con valores ii = 1 y ij = 0 si i 6= j. hf (x)i es el valor medio o esperado de la función f (x). Pn (x) son los polinomios de Legendre, denidos en el intervalo [1, 1], págs. 40 a 43. Ln (x) son los polinomios de Laguerre, denidos en [0, ), págs. 40 a 43. Ln (x) son las funciones de Laguerre, págs. 40 a 43. H n (x) son los polinomios de Hermite, denidos en (, ), págs. 40 a 43. Hn (x) son las funciones de Hermite, págs. 40 a 43. ESPACIOS VECTORIALES O LINEALES . U es un espacio vectorial complejo, cuyos subconjuntos denotamos por D, R, W, W1 , W2 , etc., pág. 17. En : espacio euclídeo n-dimensional. Rn : espacio real n-dimensional, R × R × R × . . . R. P [a, b] es el espacio de los polinomios con coecientes complejos, denidos en el intervalo [a, b]. C [a, b] es el espacio de las funciones continuas y acotadas, denidas en el intervalo [a, b].
319
320
Símbolos y glosario
Cn [a, b] es el espacio de las funciones continuamente derivables n veces, denidas en el intervalo [a, b]. L (R) R: conjunto de funciones complejas de variable real denidas en R que verican | (x) |dx < (esto es, las funciones son absolutamente integrables en R). R L2 ([a, b]) : conjunto de funciones complejas de variable real denidas en el intervalo R cerrado [a, b] R que verican [a,b] | (x)|2 dx < (esto es, las funciones son de cuadrado sumable en [a, b]).
L2 (Rn ) : espacio de las funciones complejas de variable real (denidas en Rn ) cuyo cuadrado es sumable o integrable en Rn . C : conjunto de las sucesiones de números complejos ~a = (a1 , a2 , a3 , ...), 2 P convergentes 2 con ai C, tales que |a | < . j j=1 Combinación lineal : es una suma nita de elementos del espacio vectorial U, pág. 21. Subespacio vectorial (o lineal) : es un subconjunto del espacio vectorial U que es a su vez un espacio lineal. dim (U) es la dimensión del espacio vectorial U, pág. 22. lin (W) es la envolvente lineal de W, esto es, el conjunto formado por todos los elementos de U que son combinación lineal de elementos de W (esto es, se pueden expresar como una suma nita de ellos), pág. 22. B es una base lineal de un espacio vectorial U, de dimensión N, pág. 22. (~u, ~v ) : producto escalar de los vectores ~u y ~v de un espacio vectorial (es un escalar, en principio C) , pág. 23. ( (x) , (x)) : producto escalar de las funciones y (o vectores y de un espacio de funciones) es un escalar C, pág. 28. Conjunto ortogonal : es un subconjunto de U cuyos elementos son ortogonales dos a dos. W : es el complemento ortogonal de un subespacio de Hilbert W, esto es, es el conjunto de todos los vectores de H que son ortogonales a todos los vectores del subespacio W H, pág. 24. Espacio pre-Hilbert : espacio vectorial en el que se ha denido un producto escalar, pág. 24. k~uk : norma del vector ~ u de un espacio vectorial (es un escalar R), pág. 25. Sucesión de Cauchy : es una sucesión de vectores {~ un } n=1 U que cumple ~ limn (~ un+i ~un ) = 0, para cualquier i N, pág. 32. Espacio de Hilbert, H : es un espacio lineal pre-Hilbert en el que las sucesiones de Cauchy son convergentes, bajo la norma asociada al producto escalar, pág. 32. Desarrollo de Fourier : P límite innitoP de combinación lineal de elementos de U, u ~ e ej . esto es, ~ u = limN N j=1 j j j=1 uj ~ BF : es una base ortonormal o de Fourier de un espacio de Hilbert H, esto es, todo vector ~u H puede escribirse como un desarrollo de Fourier con los elementos de BF , pág. 36.
Símbolos y glosario
321
H(1) H(2) : es el espacio de Hilbert suma directa de los dos subespacios H(1) y H(2) , pág. 65. H(1) H(2) : es el espacio de Hilbert producto tensorial de los dos subespacios H(1) y H(2) , pág. 122.
OPERADORES . b es un operador, esto es, una aplicación de un subespacio D(A) b H en H tal A b le hace corresponder un segundo vector A b ~v que que a cada vector ~v D(A) pertenece al espacio H, pág. 44. b es el dominio del operador A, b esto es, el conjunto de vectores de H sobre los D(A) que actúa el operador, pág. 44. b es el recorrido del operador A, b esto es, el conjunto de aquellos vectores de H R(A) ³ ´ b , que son el resultado de la actuación del operador sobre los vectores de D A pág. 44. Operador lineal es un operador de un espacio de Hilbert H que, para todo ~ u, ~v b (~ b y para todo complejo , cumple que A b (~ b ~u + A b ~v y que A u) = D(A) u + ~v ) = A b ~u, pág. 44. A byB b dos operadores lineales de un espacio de Hilbert Suma de operadores. Sean A ³ ´ b b b b b b H. El operador A + B, suma de A y B, se dene de la forma A + B ~u = bu + B~ b u, siendo su dominio D(A) b D(B), b pág. 46. A~ bb Producto de operadores El operador ³ ´ o composición de los ope³ A´B, producto b u y su dominio es el subconbB b ~u = A b B~ b y B, b se dene como A radores A b formado por aquellos vectores ~ b u D(A), b pág. u tales que B~ junto de D(B) 46. b1 ~ b1 : es aquel cuya regla de actuación es A u = w, ~ donde Operador inverso A b b Aw ~ =~ u (su dominio es el recorrido de A), pág. 47. b pág. 56. b† es el operador adjunto de A, A Elementos de ³ matriz´ de un operador lineal : conjunto de números complejos b Estos números constituyen una b ~en , para el operador lineal A. Akn = ~ek , A b en la base “matriz” que se denomina representación matricial del operador A BF . b=A b† , Operador hermítico o autoadjunto : es el que coincide con su adjunto, A pág. 56. Operador unitario es el que, al multiplicarlo por su adjunto, da como resultado el b = I, b pág. 60. bU b† = U b †U operador unidad U Proyector es un operador Pb hermítico e idempotente (esto es, que Pb 2 = Pb Pb = Pb ), pág. 64. Proyector ortogonal PbW es un proyector que nos da la proyección ortogonal de cualquier vector sobre un subespacio W, pág. 65.
322
Símbolos y glosario
Operadores dependientes de un parámetro se tratan en la pág. 50 y siguientes.
h
b B b Conmutador de dos operadores A,
i
bB bB b A, b págs. 47 y 165. =A h i b B b = 0, pág. 47. Operadores compatibles son los que conmutan, esto es A, CCOC es un conjunto completo de observables (u operadores) compatibles, pág. 112. b se dice que un vector ~ Autovector (o vector propio) de un operador A: u es un b (o autofunción si estamos en un espacio de funciones) con autovector de A b~ autovalor complejo a si se cumple A u = a~ u, pág. 67.
b el número complejo a es un autoAutovalor (o valor propio) de un operador A: b si existe un vector ~u (autovector de A) b que verique la ecuación de valor de A b ~u = a ~u, pág. 67. autovalores A ³ ´ b es el espectro puntual (conjunto de autovalores) del operador A, b pág. 67. p A ³ ´ b del operador lineal Autovalor impropio: si existen valores complejos / p A b para los que, no existiendo ningún vector ~ A u que satisfaga estrictamente la b~ expresión A u = ~u, es posiblen³ encontrar una sucesión de vectores normalizados ´ o b ~ A un tiende a cero, entonces se dice que ~ un de H tales que la sucesión ³ ´ b es un autovalor impropio, pág. 94. el número complejo / p A ³ ´ b es el espectro continuo (conjunto de autovalores impropios) del operador c A b pág. 94. A, ³ ´ b es el espectro (el conjunto total de los autovalores y de los autovalores im A b pág. 95. A los valores propios del espectro se les llama propios) del operador A, valores espectrales.
DELTA DE DIRAC Y TRANSFORMACIÓN DE FOURIER . a (x) o (x a) : función delta de Dirac, pág. 83. Fb es el operador que efectúa la transformación de Fourier de una función dada, pág. 90. ge (k) = Fb {f (x)} es la transformada de Fourier de la función f (x), pág. 90. Teorema de Plancherel : nos dice transformada de Fourier conserva la norR R que la 2 2 ma, esto es, R |e g(y)| dy = R |g(x)| dx, pág. 91.